语音转文字开源工具-Buzz
Buzz 是一款开源的实时语音转文字工具,基于 OpenAI Whisper 的开源音频转文字模型。多操作系统支持包括 Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。
功能特性:
- 实时语音转文字、实时翻译(多国语言,包括中文)
- 导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)
Buzz支持离线进行解析翻译。使用时,选择Whisper 通用语音识别模型。根据质量要求,语音识别模型的体积大小不同。最小可选择tiny模型。
源代码:https://github.com/chidiwilliams/buzz
发表回复