一款可以自动识别语音为文本字幕的软件工具,基于 OpenAI 开源的 Whisper 自动语音识别模型,可以批量将音频或者是视频中的内容自动转化为带有时间的字幕,可导出TXT、SRT、VTT格式文件,速度非常快,是一款能极大提高效率的生产力小工具。
功能
- 实时语音转文字、实时翻译(需麦克风权限)
- 导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)
开源地址https://github.com/chidiwilliams/buzz
下载最新https://github.com/chidiwilliams/buzz/releases
123盘 Buzz-0.8.3-windowshttps://www.123pan.com/s/YscKVv-IQMVv.html