ai字幕翻译软件 Buzz:基于 OpenAI Whisper

AI资讯1年前 (2024)发布 fengdao
49 0

功能

转录和翻译音频离线在您的个人计算机。由的提供动力。

可以简单理解为QT的前端界面,语言构建服务端,使用语言模型进行计算语音转文字的软件。

痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化

应用场景

学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取

相较于 功能更单一,专注于语音转文字、字幕生成。

相较于命令行 版 速度更快,有 GUI 对普通用户更友好。

由于支持离线,所以…尺寸是一个很大的问题,目前的安装包吃吃:

字幕翻译软件有哪些_字幕翻译软件_ai字幕翻译软件

还是很可观的。

是什么?

是一种通用语音识别模型。它利用各种大型数据集上的音频进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。

在第一次使用 Buzz 的时候,会下载 的模型,根据不同的质量要求,模型尺寸也非常可观:

质量尺寸-only model必需的显存行对速度 Mtiny.~1 GB~ Mbase.~1 GB~ .~2 GB~ .~5 GB~ MN/~10 GB1x

模型存储在电脑中:

模型下载:

夸克网盘分享/s/

ai字幕翻译软件_字幕翻译软件_字幕翻译软件有哪些

当卸载的时候,别忘记把模型也删掉。

Buzz 也相当于是一个 的可视化界面版本。

Buzz 提供了两个任务:

如果想要从文件转录,需要单击“文件”菜单上的“导入”(或在 Mac 上单击 + O,在 上单击按 Ctrl + O)

支持的格式:“mp3”,“wav”,“m4a”,“ogg”,“mp4”,“webm”,“ogm”

导出的格式:“TXT”、“SRT”、“VTT”

转换过程根据电脑性能有快有慢,最终会直接给出文件,效果还是非常不错的。对中文的识别也很好。

软件下载

网盘:

© 版权声明

相关文章

暂无评论

暂无评论...