本文更新于: 2024年7月17日
APP喵前言:由网易出品的一款多音色提示控制的文本到语音(TTS)技术。支持根据文本内容和上下文,选择不同的音色进行语音合成,以适应不同的场景和需求。
项目简介
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
EmotiVoice提供一个易于使用的web界面,还有用于批量生成结果的脚本接口。
截图
Docker镜像
尝试EmotiVoice最简单的方法是运行docker镜像。你需要一台带有NVidia GPU的机器。先按照Linux和Windows WSL2平台的说明安装NVidia容器工具包。然后可以直接运行EmotiVoice镜像:
1 |
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest |
Docker镜像更新于2024年1月4号。如果你使用了老的版本,推荐运行如下命令进行更新:
1 2 |
docker pull syq163/emoti-voice:latest docker run -dp 127.0.0.1:8501:8501 -p 127.0.0.1:8000:8000 syq163/emoti-voice:latest |
现在打开浏览器,导航到 http://localhost:8501 ,就可以体验EmotiVoice强大的TTS功能。从2024年的docker镜像版本开始,通过 http://localhost:8000/ 可以使用类OpenAI TTS的API功能。
完整安装
1 2 3 4 |
conda create -n EmotiVoice python=3.8 -y conda activate EmotiVoice pip install torch torchaudio pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict |
项目地址
https://github.com/netease-youdao/EmotiVoice
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。
啥是Docker镜像?软件不能直接打包成exe程序吗