本文更新于: 2024年3月15日
介绍一个超酷的 AI python 脚本,叫做 text2video。如其名,她能帮你把文字变成视频哦,想象一下,你写的小说或者故事,不再只是文字,而是变成了有画面、有声音的视频。
效果截图
工作原理
这个工具的工作原理是这样的:首先,它会根据句号把文本分成一句一句的;然后,每一句话都会变成一张图片,同时还会有对应的声音。图片用的是一个叫 stable-diffusion
的开源方案,声音则是用 edge-tts
这个工具来生成的。
接下来,用一个叫 opencv
的库把图片串成视频,视频下面会有字幕,目前输出的是 .mp4
格式。音频可以控制画面的播放时间,最后用 ffmpeg
把声音和视频合成到一起,就大功告成啦!
安装步骤
如果你想自己玩玩这个工具,需要在 macOS 系统上装好 Python 3.10.12
,然后用 pip
安装依赖包。还需要去 huggingface 网站上申请一个 API key
,这个 key
是用来调用他们家的文生图模型的。如果你用有道翻译,那就更方便了,翻译质量也会提高一些。最后,别忘了安装 ffmpeg
,这个是合成视频和声音用的。
一切准备就绪后,运行 app.py
,然后在浏览器里输入 http://127.0.0.1:5000/
,就可以开始你的创作啦!快去试试吧,让你的文字活起来!
开源地址
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。