本文更新于: 2024年4月26日
Insanely Fast Whisper 是一个基于 OpenAI Whisper Large v3 模型的音频转文字工具,它以其高速转录能力而著称。这个工具能够在极短的时间内处理大量音频数据,具体来说,能够在不到98秒的时间内转录长达300分钟(5小时)的音频。这一突破性的速度得益于使用了先进的深度学习技术和优化算法。
演示截图
安装使用
- 安装:可以通过pipx安装Insanely Fast Whisper,具体命令为
pipx install insanely-fast-whisper
。 - 运行:安装完成后,可以通过命令
insanely-fast-whisper --file-name <filename or URL>
运行转录。 - 参数调整:如果需要调整转录参数,可以通过CLI提供的各种选项进行设置,例如
--model-name
、--language
、--batch-size
等。 - API使用:如果选择使用Whisper API,可以通过在线请求发送音频文件,并获取转录结果。
网站地址
演示地址:https://replicate.com/vaibhavs10/incredibly-fast-whisper
GitHub:https://github.com/Vaibhavs10/insanely-fast-whisper
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。
貌似没界面的么