实时语音交互数字人项目:支持端到端语音方案与音色克隆功能,实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS

本文更新于: 2024年11月14日

APP喵前言:大家好,我是阿喵!今天想和大家分享一个非常酷的项目——实时语音交互数字人。这个项目不仅支持端到端的语音解决方案,还能实现音色克隆,用户可以自定义数字人的形象和声音,操作起来简单方便,适合对语音交互感兴趣的开发者和研究者。

项目简介

该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至3秒,适合各种应用场景。

截图

实时语音交互数字人项目:支持端到端语音方案与音色克隆功能,实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS

特色

  • 端到端语音解决方案:支持GLM-4-Voice及级联方案(ASR-LLM-TTS)。
  • 可自定义形象与音色:用户可根据需求自由设置数字人的外观和声音。
  • 音色克隆支持:通过上传参考音频生成个性化语音。
  • 低延迟响应:首包延迟仅为3秒,提升用户体验。
  • 无需训练:简化使用流程,适合快速部署和开发。
  • 多种技术选型:集成ASR、LLM、TTS等模块,灵活应对不同需求。

项目地址

https://github.com/Henry-23/VideoChat

下载权限
查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
本文链接:Click here to view the current URL

声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。

给TA打赏
共{{data.count}}人
人已打赏
智能AI网站

AI Voice Lab:免费文本转语音工具,轻松生成热门声音,如东北普通话、伤心御姐等,可以一次性生成最多300字的语音,每天有5次免费生成机会

2024-11-14 10:08:34

资源

PDFMathTranslate:实现完整排版的PDF文档双语翻译工具,支持多种翻译服务的开源项目

2024-11-14 15:26:31

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索