Buzz 是一款开源的实时语音转文字工具,基于 OpenAI Whisper 的开源音频转文字模型。多操作系统支持包括 Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。

功能特性:

  • 实时语音转文字、实时翻译(多国语言,包括中文)
  • 导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)

Buzz支持离线进行解析翻译。使用时,选择Whisper 通用语音识别模型。根据质量要求,语音识别模型的体积大小不同。最小可选择tiny模型。

源代码:https://github.com/chidiwilliams/buzz