功能
转录和翻译音频离线在您的个人计算机。由的提供动力。
可以简单理解为QT的前端界面,语言构建服务端,使用语言模型进行计算语音转文字的软件。
痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化
应用场景
学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取
相较于命令行 版 速度更快,有 GUI 对普通用户更友好。
由于支持离线,所以…尺寸是一个很大的问题,目前的安装包吃吃:
还是很可观的。
是什么?
是一种通用语音识别模型。它利用各种大型数据集上的音频进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
在第一次使用 Buzz 的时候,会下载 的模型,根据不同的质量要求,模型尺寸也非常可观:
质量尺寸-only model必需的显存行对速度 Mtiny.~1 GB~ Mbase.~1 GB~ .~2 GB~ .~5 GB~ MN/~10 GB1x
模型存储在电脑中:
模型下载:
夸克网盘分享/s/
当卸载的时候,别忘记把模型也删掉。
Buzz 也相当于是一个 的可视化界面版本。
Buzz 提供了两个任务:
如果想要从文件转录,需要单击“文件”菜单上的“导入”(或在 Mac 上单击 + O,在 上单击按 Ctrl + O)
支持的格式:“mp3”,“wav”,“m4a”,“ogg”,“mp4”,“webm”,“ogm”
导出的格式:“TXT”、“SRT”、“VTT”
转换过程根据电脑性能有快有慢,最终会直接给出文件,效果还是非常不错的。对中文的识别也很好。
软件下载
网盘:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...