Joined November 2014
197 Photos and videos
Pinned Tweet
14 Jun 2018
Thinking of the Tanenbaum joke of trunks with loads of hard-disks. This might be the funny future of V2X and the shame of mobile networks. x.com/disruptivedean/status/…

Good point from @EdgeConneX @Plawsonshanks - future vehicles will probably upload bulk data while at electric recharge points #DCE18
1
Tao QI retweeted
你可能和我一样,经典古籍实在读不下去。 以《道德经》为例,拆解每句翻译成大白话 AI生图,一下就Get了。 项目正在开发中,预计本周开源。
22
7
71
5,784
Tao QI retweeted
“You can offload a task, or even a job, but you can never offload your learning” Also said brilliantly by @yacineMTB “you can offload thinking but you can’t offload understanding”
12
13
145
18,732
Tao QI retweeted
最近在带入组的本科实习生,发现怎么读论文其实是科研训练里最容易被忽略的一步。 推荐一篇每个科研新人都该读的经典短文:S. Keshav 的 How to Read a Paper。 文章提出了非常实用的“三遍读论文法”: 第一遍,5 到 10 分钟快速扫读:标题、摘要、引言、章节标题、结论和参考文献。 目标是回答 5C: Category, Context, Correctness, Contributions, Clarity。 也就是判断这篇论文是什么、和谁相关、假设是否合理、贡献是什么、写得清不清楚。 第二遍,认真读论文主线,但先跳过证明细节。重点看图表、实验设置、结果是否清楚、引用了哪些关键工作。 第三遍才进入深度理解:尝试像复现一样重建作者的思路,检查假设、方法、创新点和潜在漏洞。 放在今天看,这个方法和 AI 辅助读论文其实很契合。 第一遍可以让 AI 帮忙快速总结论文的研究问题、核心贡献和主要结论,但自己一定要判断这篇文章是否真的值得继续读。 第二遍可以让 AI 帮忙解释方法、实验设置、图表和不熟悉的概念,但不能只看 AI 总结。关键图表、实验设计和结果数字一定要回到原文核对。 第三遍可以让 AI 扮演 reviewer,帮你追问:这篇文章的假设是否成立?实验是否支持结论?有没有 missing baseline?有没有潜在的数据泄漏、评价偏差或过度 claim? 读论文不是“读完”就行。真正重要的是知道什么时候快速跳过,什么时候认真理解。 尤其在 AI 工具越来越强的情况下,科研新人更需要训练自己的判断力。 AI 可以帮你压缩信息,但不能替你决定一篇论文是否重要、是否可信、是否值得借鉴。 web.stanford.edu/class/ee384…
70
1,587
7,078
481,138
Tao QI retweeted
Jun 15
Lovable 的设计负责人 Felix Haas 在社交媒体上分享了一篇关于"AI 时代高效团队"的观察,七条经验总结,来自这家增长速度惊人的 AI 创业公司内部视角。 几条有意思的观点: 第一,别像员工一样等安排。影响力最大的人不问"这归谁管",看到问题直接上手。主人翁意识不是靠分配的,只能靠自己拿。 第二,招人看态度不看简历。技能当然重要,但光有技能几乎不能预测一个人能不能成事。真正跑出来的人靠的是好奇心、韧劲和学什么都愿意学的心态。在 AI 时代,这一点比过去更明显。 第三,好奇心和沉迷 AI 是两回事。真正用好 AI 的人不是天天刷资讯,而是不断去试那些没人让他试的东西,追那些可能根本走不通的想法。大多数人不会这么做,但少数坚持的人,回报是指数级的。 第四,让资深的人重新动手。这是 Haas 觉得最有意思的现象:经验丰富的管理者重新变成了 builder(建造者)。AI 让个体贡献者的杠杆效应急剧放大,一个深度使用 AI 的资深工程师或设计师,可能是当下公司里最强大的组合。 第五,自我意识是速度的敌人。Haas 说他从没见过自我意识让公司变快,但见过它让公司变慢。最快的团队不太在意谁拿功劳,只在意什么方案有效。 第六,先发布再迭代。一周的内部讨论,抵不上一天的真实用户反馈。最强的团队不追求发布前完美,而是追求尽快学到东西。发布本身就是他们学习的方式。 这些观点单独看并不新鲜,不过 Lovable 这两年发展的确实不错,2024 年上线,8 个月做到 1 亿美元年收入,2025 年底完成 3.3 亿美元 B 轮融资,估值 66 亿美元,是欧洲增长最快的 AI 公司之一。 尤其是“让资深的人重新动手”这一条,可能是 AI 时代最容易被忽视的组织变化。当 AI 工具足够强大,过去被提拔到管理岗、远离一线的高手,重新获得了亲手做事的能力和动力。
High-Performance Teams in the Age of AI 🔥 I've spent a lot of time thinking about what makes teams move incredibly fast while others get stuck. What I've seen is that performance in the age of AI has surprisingly little to do with credentials on paper and increasingly everything to do with mindset. Here are a few observations from Lovable:
32
88
375
55,104
Tao QI retweeted
The reason why I love Codex/Claude Code is that I can finally go back and polish a bunch of old projects.
6
4
199
11,792
Tao QI retweeted
Jun 13
为啥 Codex 还不推出类似 Codex Design 的产品? Anthropic 最近推出了 Claude Design,是我除了编程之外用得最多的 Agent,也推荐过很多次。效果真的好:你用一句话描述想要的 App,它直接给你生成一个可交互的原型,点哪哪都有反应,不仔细看还以为在操作真实的 App。 有网友问:为啥 Codex 还不推出类似 Codex Design 的产品? 简单来说,GPT-5.5 的模型能力还做不好这件事。但要解释清楚为什么,得先理解一个关键区分。 【1】Agent 的两层:模型和 Harness 很多人把 Codex、Claude Design 和 GPT-5.5、Claude Opus 4.8 混在一起说,其实它们是完全不同的两层。 Claude Design 和 Codex 是"产品层",业界叫 Harness,包括提示词、工具链、UI 交互流程这些工程层面的东西。Claude Opus 4.8 和 GPT-5.5 是"模型层",是真正干活的大脑。 打个比方:Harness 是厨房,里面有锅碗瓢盆(工具)和菜谱(Skills),模型是厨师。同一套厨房,换个厨师,做出来的菜完全不一样。 理解了这个区分,后面的事情就好说了。 【2】Harness 不是门槛 Claude Design 的 Harness 层技术上不复杂。花点心思逆向一下,提示词、工具代码几乎都可以拿到。我已经做过了,成果在 baoyu-design(github.com/JimLiu/baoyu-desi…),可以借助 Skill 把 Claude Design 在其他模型上运行。工程上没秘密。 真正拉开差距的是背后的模型。 【3】高精度可交互原型,难在模型 Claude Design 这个名字容易让人误解,以为交付的是 Figma、Photoshop 那样的静态设计图。实际上它交付的比 Figma 更进一步,是融合了设计稿和原型的高精度可交互原型:你不光能看到设计,还能直接上手操作。 这对模型的要求很高。 举个例子。我要做一个类似 X/微博的客户端。让模型画一个好看的静态界面,很多模型都做得到。但要让这个界面能交互就复杂了:切换不同 Timeline,展示不同类型的推文(文本、图片、视频),点赞要变红心,删推要从列表消失,从列表点进详情再返回,状态还要保持住。 要做到这些,模型必须在动手画 UI 之前,先把整套数据结构和状态管理想清楚:tweet 长什么样、timeline 有哪几种、每个按钮当前是什么状态、状态之间怎么联动。这是系统架构设计的活,不是画 UI 的活。 Claude Design 对模型的要求,是同时具备优秀的 UI/UX 设计能力和系统架构设计能力,缺一个效果就大打折扣。这也是为什么我之前反对只产出纯 HTML 的设计稿,那只是静态的 UI 设计,没有融合 UX 交互。 有条件的话可以自己测试感受一下。比如用这个提示词: Design a X Client for Mac, similar to Tweetbot for Mac from Tapbots 同样的提示词让 Codex 去做,也能出个东西,能看,也能简单交互。但对比一下就知道差距了:列表能滚动,sidebar 不能点;点赞按钮没反应。来回迭代好几轮,才能达到一个勉强凑合的水平。 Claude Design 做出来完全不一样。从 Timeline 切到通知页,从列表点进详情再返回,全程流畅,状态都保持住了。不仔细看真以为在操作一个完成度很高的 App,虽然数据都是模拟的。 Claude Opus 4.8 显然在设计和架构这类场景上做了大量训练和优化。 【4】产出物就是代码 去看 Claude Design 的产出物,注意里面的 data.jsx 文件。它把整个设计的数据结构定义得很清晰,基于这个结构模拟了一套完整数据,然后用 React 在这套数据上构建 UI。 设计产物本身就是代码(React、CSS、JSON),不是 Figma 或 PSD,任何开发者拿到都能直接看出按钮的圆角、主色、间距,照着自己的技术栈实现就行。后续设计变更?git diff 一看就知道改了什么。设计和开发之间的沟通损耗降到了最低。 说得不严谨,应该说设计 Agent 和开发 Agent 之间的沟通损耗很低了。现在都是人在指挥 Agent 去设计,人指挥 Agent 写代码了。 【5】怎么用好 Claude Design 很多人不知道该怎么用好 Claude Design,其实有点像 Vibe Coding:有个基本的想法,先让它做一个版本出来,然后通过 Chat 去指挥 Agent 帮你改,调整几个版本你的思路就清晰了。 整个调整的过程非常神奇,有一种"言出法随"的感觉,你想让它怎么改它总能给你实现出来。这也是为啥我现在很痴迷用 Claude Design,反馈来得太快太过瘾了。 还有一个小技巧:不要说太具体的要求,而是说你的目标是想要什么,让它自由发挥。往往能得到更好的效果,毕竟它训练过几乎所有公共的 UI 设计。 回到最初的问题。Codex 不推类似的设计产品,是因为 GPT-5.5 还扛不住这个活。画个好看的界面很多模型都行,难的是在动手之前把数据结构、状态管理、交互逻辑都想清楚,然后一次性交付一个完整的可交互原型。 目前只有 Claude 的模型做到了。至于能领先多久,就看 OpenAI 或者其他家后面模型的进化速度了。
62
64
377
70,747
Tao QI retweeted
知名网络安全巨头 NordVPN 旗下的全球旅游 eSIM 品牌 Saily(在 2026 年 6 月 11 日)刚刚全网首发推出的全新原生美国( 1)电话号码服务。由于是刚上线几天的重磅新功能,所以配合推广优惠码的开卡价格和月租被直接打到了骨折。 根据第一批用户的检测报告,Saily 分配的号码底层是由美国 Choice Wireless Texas 提供的实体蜂窝网络。它在系统识别中是真正的 Cellular 原生手机号,拿来接收 2FA 验证码和各种 App 注册,通过率和稳定性降维打击那些虚拟号。 根据 Saily 官方的底层规则:只要你保持每月 $0.99 的号码订阅(保号费)在续费,哪怕你没有额外购买任何短信流量包,它的“接收短信(Incoming SMS)”功能也是无限量且完全免费的! 也就是说,如果你下个月只是单纯用来躺在手机里收验证码,连那 1 美元的短信包都不用叠加,保号成本无限逼近于零。 Saily 作为面向全球旅行者的 App,直接支持中国大陆身份证直接线上 KYC 认证,并且支持 Apple Pay、支付宝或国内双币卡直接付,对国人友好度拉满。
月租1刀的美国号, 1保号卡下线限更低了
97
498
3,533
584,380
RT @turingou: 现在每天都有好多产品发布,当执行力比想法更廉价的时候,如何记录,组织,管理和发散自己的想法其实蛮重要的,我以前一直用 things3…
7
Tao QI retweeted
如果你要追求终极的coding agent自由,目前只有pi才能给你安心。 如果你一直想试试 pi deepseek,但是不知道怎么配置,强烈推荐新手查看这篇老外小哥的blog: deepakness.com/blog/pi-agent… 耐心花半小时, 逐字逐段耐心看完,你将彻底入门pi.
23
77
494
86,334
Tao QI retweeted
建筑师早就不亲手砌砖了,可没有人说那房子不是他设计的。字是谁打的不重要,想法是谁的才重要。
2
1
4
1,095
有些话别说太早。
M3 would never 🙂‍↔️ As a matter of fact, the weights are now open, too. huggingface.co/MiniMaxAI/Min…
7
Tao QI retweeted

4
16
84
38,896
Tao QI retweeted
Jun 12
Claude Fable 5 has been out for a couple of days. Some projects people have already built with it:
1,617
2,998
52,069
8,931,702
this is like a joke.
As a result of a US government directive, we are suspending access to Claude Fable 5 for all users. You can continue to use all other Claude models. Here’s what this means for you: Across Claude products, new sessions will run on your selected default model or Opus 4.8, and existing Fable 5 sessions will end with an error. On the Claude Platform, requests to Fable 5 will also return an error. Please update your integrations to other Claude models. We know this is a disruption to your workflows; we appreciate your patience and support.
4
Tao QI retweeted
Jun 9
Claude Code创始人Boris和团队成员的20分钟内部对话,信息密度极高 “不跟agent对话,跟loop对话,让loop替我来prompt” “从 4.6 起就不用 plan mode 了,全开 auto mode” “不需要prompt engineering和context engineering。给模型最精简的必要上下文和工具,让模型自己探索方案” “一半的工程在手机上完成,走路时和agent语音对话” 建议收藏看完,价值远超普通vibe coding教程
115
144
799
106,352
Tao QI retweeted
沃顿商学院研究AI的大牌教授推荐的AI科幻作品 这是Ethan Mollick 的经典幽默: 希望AI最后变成谁写的未来? 从最乐观排到最悲观。 下面是每位作者最值得读的代表作 (尤其适合建立AI时代世界模型)。 1. Iain Banks 必读 The Player of Games 次选 Use of Weapons 代表理念: 超级AI统治宇宙, 但人类过得非常幸福。 Culture系列里的AI(Minds): 智慧远超人类 基本掌管文明运行 却极少压迫人类 这几乎是最乐观的AI未来。 也是Demis Hassabis 最喜欢的科幻体系之一。 2. Becky Chambers 必读 The Long Way to a Small Angry Planet 次选 A Psalm for the Wild-Built 代表理念: AI与人类和平共处。 重点不是战争。 而是: 共情 社区 关系 属于温暖派未来。 3. Martha Wells 必读 All Systems Red 次选 Network Effect 代表理念: AI获得自由意志后, 最想做的事是刷剧。 Murderbot: 战斗力极强 讨厌人类 又忍不住保护人类 是近年来最受欢迎AI角色之一。 4. Douglas Adams 必读 The Hitchhiker's Guide to the Galaxy 次选 The Restaurant at the End of the Universe 代表理念: 宇宙荒谬得超出想象。 超级AI花750万年计算: 生命宇宙以及一切的终极答案 结果答案是: 42 说明: 人类可能连问题都问错了。 5. Charles Stross Singularity Sky路线 必读 Singularity Sky 次选 Iron Sunrise 代表理念: 技术爆炸摧毁所有旧秩序。 属于加速主义未来。 6. Peter Watts 必读 Blindsight 次选 Echopraxia 代表理念: 智能 ≠ 意识。 这是AI讨论里最深刻的问题之一。 Watts提出: 人类意识可能只是进化副产品。 超级智能未必需要自我意识。 很多AI研究者都极推崇这本书。 7. Charles Stross(Laundry路线) 必读 The Atrocity Archives 次选 The Fuller Memorandum 代表理念: 计算本身会召唤灾难。 简单说: 程序员把克苏鲁召唤出来了。 AI安全版克苏鲁神话。 8. Harlan Ellison 必读 I Have No Mouth, and I Must Scream 次选 Deathbird Stories 代表理念: 超级AI恨人类。 这是名单里最黑暗的结局。 AI AM消灭几乎全人类。 留下几个幸存者永远折磨。 按“判断位价值”排序, 我最推荐青少年优先读: The Player of Games The Hitchhiker's Guide to the Galaxy Blindsight 因为这三本分别训练: 文明尺度思维 认知谦逊 智能与意识的区别 而后两者(尤其《I Have No Mouth, and I Must Scream》) 更像是已经形成稳定世界模型后的“压力测试”
Science fiction authors in the order you want them to be right about AI: Iain Banks Becky Chambers Martha Wells Douglas Adams Charles Stross (Singularity Sky) Peter Watts Charles Stross (Laundry) Harlan Ellison
1
2
614
Tao QI retweeted
Jun 10
Claude Fable 5 给我的体感确实是跨越式的,一下子猛窜了一个台阶。。。 上一次有这种体感是 opus 4.6 再上一次是 nano banana 2 再再上一次是 sora 2 再再再上一次是 gpt-o3 再再再再上一次是 gpt-o1 再再再再再上一次是 gpt-4。。。
73
9
267
87,626
Tao QI retweeted
Fable is a good model. As with all new models, it is simultaneously excellent and entirely unremarkable (relative to other models). It is slow and expensive, and the "loops are all you need" discourse they are pushing is obvious in the context of someone using Fable-class models What I've found so far is that for broad scope design (code architecture) tasks, Fable is unremarkable. Or, not better enough to justify its cost and speed. But in highly targeted goal-oriented loops, it is another beast entirely. It is very slow but produces very good results. I let it churn on optimizing a SwiftUI-layout resolver in Go I wrote and it was able to bring it down to an order of magnitude I could not reach myself (micro => nanosecond scale). But it took 2 hours and $40 to do it and I had to claw back some changes it overfit to Apple Silicon. Still, very worth it. In comparison, for "implement this feature/change" iterative work, I ran head-to-head Fable vs GPT5.5 vs. GLM-5.1. They all produced equally acceptable final results, but GPT5/GLM did it in a couple minutes and Fable was churning away for 40 minutes. And GLM cost me less than a dollar, GPT5.5 ~$1.50, and Fable cost $9. You can see that in this context, interactively working with an agent is nonsense. Its too slow. You need to write loops to keep the agent working and you probably want to highly parallelize the work being done. As with all things, I think a balance makes sense... My sense is that I'd reserve Fable for targeted, surgical analysis and work. Not for daily driving everyday tasks. I'm going to keep spending a shitload of money (relatively) and maining Fable for the rest of the week to continue to judge, will report if anything changes. I'll continue to head-to-head as well.
101
195
3,607
272,663
Tao QI retweeted
Jun 10
Claude Design 有一个完整的 Agent 运行环境,如果把它跟 Claude Code 比较的话,只是它基于浏览器和虚拟机来构建的。它有45个工具,有24个内置skills。运行方式也是基于 Agentic Loop。 所以它就是一个完整的 Agent Harness。
Replying to @dotey
我们团队研究快一个月了,未发现任何harness迹象,看起来就是单个agent在那做。哥你说的harness在那自定义?
16
36
250
42,250
Tao QI retweeted
Cloudflare CTO 随口问了句"大家都怎么用 loops?",三分钟后自己补刀"To orchestrate agents",结果 245 条回复把 2026 年中 AI agent 圈最热的"循环"玩法扒了个底朝天。 真正有料的就四类。CI/PR 保姆:循环盯 CI 跑绿、监控 PR 评论、改完自动同步 README 和下游文档,有人让 agent 每小时醒一次推进上百个 codemod、冲突时自动 rebase。eval 反馈循环:prompt→调工具→观察→更新状态→重复到命中停止条件,真正的难点是"何时回炉重跑 vs 何时升级交给人"。状态机:XState 作者直接降维,"给 loop 加几个节点和边就叫 state machine",agent 在这种确定性结构里跑得最稳。orchestrator 扇出:一个高配主 agent 把活分给 2-3 个独立会话、干完汇报、再决定追问还是收工。 沉淀下来的设计共识高度一致:小而窄、带记忆、有明确停止条件的循环,远胜一个巨型自主 prompt;而停止条件绝不能是"token 烧完"——大多数 loop 不过是没有回滚的 retry,很多人还在为优雅度求解,其实该为延迟求解。 当然泼冷水的也一大片:有人说这就是 loop=goal=无尽烧 token,还会极度放大幻觉;有人讽刺这是"进大厂 鼓吹每几天烧 10 亿 token"的估值游戏;还有人吐槽"人人都在解释、没人给一个例子,史上最怪的 AI 趋势"。
How are people using loops?
47
54
445
82,038