OpenSuperWhisper:macOS 上的语音听写应用
原标题:Starmel/OpenSuperWhisper
Swift★ 1,696 stars+494 本周
速览
基于 OpenAI Whisper 模型,支持离线语音识别,延迟低,可自定义快捷键和语言模型,适用于笔记、写作、编程等场景,无需联网即可准确听写。
AI 深度解读
这是什么
OpenSuperWhisper 是一款运行在 macOS(Apple Silicon / ARM64)上的开源桌面应用,主语言为 Swift,当前在 GitHub 上获得 ★1696。它的核心能力是基于 OpenAI 的 Whisper 模型实现实时音频转录,同时内置了 Parakeet 作为第二转录引擎。用户可以通过应用内直接下载模型文件(.bin),无需手动配置深度学习环境。项目采用 MIT 许可证,支持通过 Homebrew 一键安装(brew install opensuperwhisper),也提供 GitHub Releases 页面直接下载。
解决的问题
传统音频转录场景通常面临三个痛点:一是离线场景下缺乏低延迟的实时转录方案;二是用户需要自行安装和配置模型、依赖,技术门槛较高;三是多麦克风(内置、外接、蓝牙、iPhone Continuity)切换和快捷键操作不够灵活。OpenSuperWhisper 将 Whisper 模型封装为 macOS 原生应用,通过全局键盘快捷键和菜单栏交互,让用户在任何前台应用中都能随时开始录音并实时获取转写文字,无需切换窗口或手动启动脚本。同时支持拖放音频文件进行批量转写,解决了录音文件后期处理效率低的问题。
核心功能
- 实时录音与转录:点击快捷键即开始录制麦克风音频,松开或再次点击停止,转录结果实时显示。
- 双转录引擎:内置 Whisper(OpenAI)和 Parakeet(NVIDIA)两种模型引擎,用户可在应用内直接下载不同尺寸的模型(如 tiny、base、small、medium、large),并随时切换。
- 全局键盘快捷键:支持组合键(如 ⌘+⌥+F)或单修饰键(如 Left ⌘、Right ⌥、Fn)触发录音/停止,甚至支持「长按录制,松开停止」的 hold-to-record 模式。
- 麦克风选择:从菜单栏可直接切换内置麦克风、外接 USB 话筒、蓝牙耳机、iPhone Continuity 摄像头麦克风等音频输入源。
- 文件拖放与队列转录:将 WAV/MP3/M4A 等音频文件拖入应用窗口,自动加入队列并按顺序转录,支持多文件并发处理。
- 多语言自动检测:转录时自动识别语言(包括日语、中文、韩语等亚洲语言),并提供亚洲语言自动纠错(autocorrect)功能。
- 模型管理:首次启动自动复制默认模型,用户也可从 Whisper.cpp 的 Hugging Face 仓库下载
.bin文件放入指定目录以扩展模型库。
亮点 / 与同类相比
相比其他 macOS 转录工具(如 MacWhisper、Whisper Transcription、或命令行版的 whisper.cpp),OpenSuperWhisper 的差异化在于:
- 无缝的实时体验:无需打开独立窗口,全局快捷键在任何应用中都生效,适合会议记录、听课、采访等场景。
- 双引擎灵活切换:Parakeet 引擎在某些场景下(特别是 NVIDIA GPU 加速的 Mac 上)可能提供更好的性能或精度,用户可根据任务选择。
- 菜单栏集成:整个交互集中在菜单栏,不占用 dock 空间,启动即后台运行,符合 macOS 用户习惯。
- 亚洲语言优化:内置自动纠错,对日语、中文、韩语的转录准确性有针对性改进,这是很多基于纯 Whisper 的工具未提供的。
- 活跃社区与 Roadmap:项目明确列出了 Streaming transcription、Custom dictionary / keyword boosting、Intel macOS 兼容性、Agent 模式、后台应用模式等开发计划,表明持续维护意愿。
适合谁用 / 上手
- 内容创作者 / 记者:需要将采访、会议录音快速转为文字稿,可搭配全局快捷键实现「听到即转写」。
- 远程工作者:在视频会议中记录发言要点,或使用 iPhone Continuity 麦克风拾音进行实时转录。
- 语言学习者:利用亚洲语言自动纠错功能,辅助听力练习和词汇记录。
- 开发者 / 技术用户:希望基于开源项目进行二次开发(如增加自定义词典、流式转录),项目提供清晰的本地构建步骤(
git submodule update --init --recursive; brew install cmake libomp rust ruby; ./run.sh build)和 CI workflow 参考。
上手步骤:
- 确保 macOS 设备为 Apple Silicon(ARM64),安装 Homebrew。
- 执行
brew install opensuperwhisper或从 GitHub Releases 下载 DMG。 - 首次启动时应用会自动下载默认 Whisper 模型(tiny 或 base),也可在设置中选择下载更大模型。
- 在系统偏好设置中为应用授予「麦克风」「辅助功能」权限。
- 自定义快捷键(如设置 Fn 为录音键),点击菜单栏图标即可开始使用实时转录或拖放文件转录。
查看原文 →github.com
