🚨AMD 首席执行官苏姿丰(Lisa Su)用一个价值 1,499 美元的“午餐盒”,干掉了英伟达 4,000 美元的 AI 机箱。
她走上舞台,单手举起这个设备,在现场直接运行了一个2350 亿参数的大模型。没有数据中心,没有云端,也没有租用的 GPU。
里面的芯片超出了所有人的预料。AMD 的 Ryzen AI Max 395是首款 CPU 和 GPU 共享128GB 统一内存的 x86 架构硅片。正是这一绝活,让一台台式机能够运行过去需要一整条服务器机架才能跑得动的模型。
在这 128GB 的内存中,Linux 系统直接分给了 GPU110GB供其尽情挥霍。作为对比,英伟达 RTX 5090 的显存是 32GB,4090 是 24GB。而这个只有厚笔记本大小的机箱,给到的显存是它们中任何一款的三倍以上。
引爆全场的基准测试数据是:在 DeepSeek R1 的推理测试中,这颗芯片的速度超过了英伟达 RTX 5080 的 3 倍。一个售价 1,499 美元的“午餐盒”,在实际的 AI 工作负载中,跑赢了一张售价 1,000 美元的独立显卡。
英伟达花了十年时间让全世界相信,搞严肃 AI 必须用他们的硬件;而 AMD 刚刚以一半的价格,把这种能力直接拍在了你的办公桌上。
以下是那些人没有告诉你的真相:
目前,一个 AI 重度用户每个月要为 Claude Code Max 支付 200 美元,为 ChatGPT Pro 支付 200 美元,为 Cursor 支付 20 美元,为 Gemini 支付 20 美元。这意味着你每年有 5,280 美元从账户中溜走。而这个小盒子在 9 个月内就能帮你收回成本,此后的余生里,它都将免费为你运转。
操作极其简单:安装 Ollama,拉取 Qwen3 235B 动态模型,然后将 Claude Code 的本地路径(localhost)指向它。
体验完全一致:还是你习惯使用的那个界面,不同的是,现在没有任何数据会离开你的机器,不再按请求次数收费,当你在凌晨 3 点终于有时间搞开发时,也不会再有任何公司对你进行限流。
这是一个转折点
这一刻起,所有的 AI 订阅服务都变成了可选,而非必选。
律师们不再需要害怕 OpenAI 的泄密风险。
开发者们不用再时刻盯着 Token(字符)计数器。
创业团队也不用再为了那些因为高昂账单而不敢交付的原型产品去租用 H100 显卡。
率先看懂这一趋势的前 1000 个人,将主导未来两年的私有化 AI 咨询服务市场。