Today we're releasing ZONOS2, our next-generation real-time TTS model with high-fidelity voice cloning.
ZONOS2 is the most expressive open-source TTS model, released under Apache 2.0 and available on Zyphra Cloud on @AMD. 🧵
十九世纪的数学家卡尔·雅各比(Carl Gustav Jacob Jacobi)有一句口头禅:"反过来想,总是反过来想。"查理·芒格(Charlie Munger)把这句话引用了一辈子,并称它是自己最重要的思维工具之一。
贝索斯在亚马逊内部把它做成了制度——"逆向工作法"(Working Backwards):任何新产品立项之前,团队必须先写一份假想的发布新闻稿和客户 FAQ。
产品还不存在,新闻稿先写好。Kindle、AWS、Prime,都是这么孵出来的。
当前的 AI,连一个杯子都还没"真懂"。
极客公园「今夜科技谈」这期,Aether AI 创始人黄碧薇教授(@huang_biwei)举了个特别戳的例子:
让今天的视频生成模型去"抓一个杯子" 手还没真碰到,杯子自己就飞起来了。
画面看着挺顺,但它只学到了"相关性",没学到"因果"。它知道"手靠近杯子,杯子常常会动",却不知道"为什么动、我这一抓会发生什么"。
这就是下一代 AI 的关键分野:
聊天里说错一句,改了就行;可一旦进入物理世界,机器人、自动驾驶、生物医药:一个变量算错,后果是真实的。
所以问题不是把世界"预测得更像",而是"理解世界为什么这样运行"。
这正是因果世界模型(Causal World Model)想解决的事:让 AI 不只识别表象,更理解机制。
🔗 完整对谈值得一听:极客公园「今夜科技谈」· 因果大模型:下一场 AI 范式之争?
weixin.qq.com/sph/AuNNpbY1ew
Aether AI | 黄碧薇教授 | Causal World Models for Real-World Intelligence | aetherlabs.ai
Last night @huang_biwei joined @GeekPark founder Jack Zhang to make the case for causal world models.
The short version: scaling correlation hits a wall in the physical world. Causal structure — knowing why, not just what next — changes the economics of robotics.
Our benchmarks vs conventional world models: 25–50% higher success rates, 5–10× fewer samples. Same data, deeper structure.
One brain. Many robots. That's the bet.
Full conversation → [weixin.qq.com/sph/AuNNpbY1ew]