震惊了,抖音上祁博士一天卖 50w 的数字人 agent,我2 分钟就开发完成了。
用的就是Pixelle-Video这个项目,已经22k stars。包括数字人口播、动作迁移、图生视频全支持。
支持ComfyUI,输入主题,从写脚本到加 BGM 到出片,一条龙自动跑视频。
老王部署到本地,做了个简短的视频,属于插图式的视频,如果你需要更复杂的视频,需要自己配置云端模型比如 seedance2,kling 等等。
Pixelle-Video 最厉害的地方,是它把视频生产完全做成了可配置,支持本地部署模型和云端大模型。
文案、画面、配音、剪辑,它拆成四个可替换的模块,每块后面都能换模型,可以自由切换模型,使用非常方便
>文案层:LLM 读主题,吐出带时间戳的结构化脚本,每>句对应一段画面。
>画面层:脚本每句转生图提示词,扔给 ComfyUI 或直连 DashScope 出图,图生视频和数字人口播也走这一层。
>语音层:脚本原文走 TTS 合成,多语言加音色克隆,不用自己录音。
>合成层:画面对齐语音时间轴,叠上 BGM,输出 MP4。
仓库:
github.com/AIDC-AI/Pixelle-V…
P.S. 想到了就能出片,懂一点 AI 编程,这个项目就能自己做成适合各行业的数字人 agent。