福利:基于 OpenAI 家 Whisper 技术的免费离线语音转文本工具 Whisper Batch Transcriber
Reactorcore 推出了一款名为 Whisper Batch Transcriber 的新免费工具,为 Windows 用户带来专业级的语音转文本功能,而且可以离线本地运算使用,无需互联网连接或支付订阅费。
该工具利用 OpenAI 的 Whisper AI 技术自动将音频文件转换为干净、格式化的文本文档。与基于云的转换服务不同,它在用户的计算机上完全离线运行,确保了隐私和无限制使用,且不会产生经常性成本。
主要特点:
- 100 离线操作 —— 设置后无需互联网。
- 支持多种音频格式:MP3、WAV、FLAC、OGG、M4A、AAC。
- 包括两个 AI 模型:Small_en(2GB VRAM,准确率 96)和 Large_v3_Turbo(6GB VRAM,准确率 99.8)。
- 多文件的批处理功能。
- 干净、格式化的输出,具有适当的标点符号和大小写。
该工具对于需要转录采访、语音备忘录、排练录音或其他音频内容的音乐家、播客、内容创建者和音频专业人士特别有用。处理时间因硬件而异,通常每分钟音频需要 2-10 分钟。
系统需求:
- Windows 7 或更高版本。
- Python 3.10+(包括自动安装程序)。
- 最低 2GB GPU 显存(建议 6GB 以上以获得最佳准确性)。
- 2GB 存储空间。
虽然该工具最初加载需要 5-15 分钟,但这是正常的操作。为了获得最佳性能,最好事先将音频文件转换为 16kHz 采样率的单声道 WAV 格式。
Python 源代码也包含在下载中。如果您已安装 Python,则可以通过双击 .py 文件而不是 .exe 来稍微加快应用程序的运行速度。
Whisper Batch Transcriber 可从开发人员的 itch.io 页面免费下载,也感谢广大用户提供捐赠支持。
免费下载地址:https://reactorcore.itch.io/whisper-batch-transcriber
转载新闻请注明出自 Midifan.com