viralt.ai CTO|ex-Baidu|AI, product, engineering & startup — real frontline notes

Joined February 2025
78 Photos and videos
高强度用了几天 Fable 5,结果今天它被要求下架。 本以为会慌,反而松了口气。 这阵子我学到的一件事:不必急着用今天的模型解决今天的问题。有些问题,留给下一代模型,反而更划算。 等待,有时候是最高效的策略。
71
可惜了,Fable 不能用了。昨天用 Fable 做了一个游戏,完全自主生成,包括创意。 lumen.blanplan.com

383
BlanPlan retweeted
In Claude Code, run /model and select Fable from the model picker, or switch directly with: /model claude-fable-5
15
27
587
84,492
46
最近把Antropic文章都翻了一遍,总结出一些名词。 📌 一、 描述 AI 缺陷的“病理学”名词 1️⃣Agentic Laziness(智能体偷懒 / 上下文焦虑症) 当对话上下文被大量代码或长篇文档塞满时,AI 会“感到疲惫”,开始悄悄跳过某些繁琐的执行步骤,或者草草宣布任务完成。 2️⃣Self-preferential Bias(自我偏袒偏差 / 盲目自信) 模型对自己生成的产出天生带有滤镜。如果让 AI 自己检查自己写的代码,它大概率会忽略明显的 Bug 并给出极高评价。 3️⃣Goal Drift(目标漂移) 在经过多轮复杂的交互和“Context Compact(上下文压缩)”后,AI 会逐渐忘记你最初设定的硬性约束或核心架构方向。 🔧 二、 核心架构与工程化名词 1️⃣Harness / Harness Engineering(编排框架 / 编排工程) 为了让 AI 稳定工作而搭建的底层“脚手架”或工作流逻辑。在追求快速将想法转化为产品的 Vibe Coding 开发范式下,拥有一个强大的底层 Harness 是重中之重,它直接决定了自动化工程的上限。 2️⃣Dynamic Workflows(动态工作流) AI 在运行时根据任务现场,自动编写 JavaScript 脚本来编排自身工作的能力。它比像 n8n 这样的静态可视化自动化节点更进了一步,实现了根据不同任务动态生成路由。 3️⃣Context Resets(上下文重置) 定期清空 AI 的记忆窗口,只给它传递上一阶段浓缩的“交接文档”,以保持其推理能力的敏锐度,是对抗“智能体偷懒”的利器。 4️⃣SubAgent(子智能体) 在工作流中被动态拉起的、只负责极其单一目标的 AI 实例,拥有绝对干净且独立的上下文环境。 🎯 三、 六大 Agentic Patterns(智能体设计模式) 1️⃣Adversarial Verification(对抗式核查) 引入一个极为苛刻的“评委 Agent”(Evaluator),专门给“干活 Agent”(Generator)挑刺,不达标就直接打回重做。 2️⃣Fan-out & Synthesize(并行扇出与汇总) 类似于分布式计算,将大任务(如整个代码库的扫描)拆分给几十个子 Agent 并行处理,最后在 Barrier(等待屏障) 处统一等待并汇总结果。 3️⃣Tournament(锦标赛模式) 让多个 Agent 采取不同的思路生成方案,然后由裁判 Agent 进行两两 PK(Head-to-head),淘汰直至决出最优解。 4️⃣Classify & Act(分类与执行 / 路由) 先用一个 Agent 充当分发中心,判断请求类型,再将其路由给下游专门的专家 Agent 处理。 5️⃣Generate & Filter(生成与过滤) 大批量生成假设或候选方案,再通过严格的规则或验证机制进行去重和精准筛选。 6️⃣Loop Until Done(循环直至完成) 不预设执行的具体步数,而是设定一个硬性的退出条件(如代码检查 Bug 数归零),让 Agent 持续循环迭代直至满足要求。 🛠️ 四、 底层基建与安全术语 1️⃣MCP (Model Context Protocol / 模型上下文协议) 刚才提到评委 Agent 可以亲自去浏览网页(Playwright MCP)。MCP 是连接 AI 大模型与本地工具链、开发环境及外部 API 的标准化协议,是让这些子 Agent 真正拥有“手和眼”的关键基建。 2️⃣Quarantine(隔离区) 一种安全设计模式。在处理大规模工单或外部不可信数据时,将其放置在沙箱隔离区,严格限制负责读取的 Agent 的执行权限,防止遭遇恶意指令注入。 3️⃣Worktree / Workspace Isolation(工作区隔离) 为并行工作的子 Agent 分配完全独立的代码分支或临时执行环境,防止它们在同时读写文件时发生冲突或“脏数据覆盖”。
43
我最近看到一个很有意思的词,叫 Context Anxiety(上下文焦虑症)。 它来源于 Anthropic(Claude 母公司)实验室团队最新发的一篇技术博客。 讲的是模型会因为上下文马上就要爆掉了,感到非常焦虑。具体来说,当一个 AI Agent 连续工作好几个小时、去处理特别复杂的全栈开发任务时,对话框里的代码和历史记录会疯狂堆积。 这时候,大模型也会产生“心理压力”:它发现自己快记不住了,为了防止大脑过载崩溃,它会启动自我保护机制——开始悄悄偷懒(Agentic Laziness),假装任务已经完成,提早敷衍交差;或者直接把最初的核心需求给漏掉(Goal Drift)。 看完这篇技术文章我整个人都愣住了,这哪里是在写 AI?这特么简直是在实时监控我的大脑: 我们的“上下文焦虑”: 微信/Slack 消息闪个不停,浏览器挂着 50 个未关闭的 Tab,大脑疯狂在不同任务间做高成本的“上下文切换”。 我们的“自我保护”: 在高压和信息过载的崩溃边缘,我们也经常做着做着就忘了最初的底层逻辑,最后为了赶紧交差,选择“战略性偷懒”。 Anthropic 工程师给 AI 治病的方法(Harness 编排设计),对人类也完全适用: 1️⃣ Context Resets(上下文重置):别指望一个脑回路从头干到尾。完成一个阶段后,把成果固化成文档,然后彻底清空大脑、去喝杯咖啡,换个干净的“新上下文”重新开始。 2️⃣ Adversarial Verification(对抗验证):永远别让自己既当运动员又当裁判。写完方案,过半小时换个“冷酷无情”的挑刺视角去审视,或者直接拉个搭子互相 QA。 以前大家拼的是单点智商(模型参数量),未来拼的是你对“上下文”的管理和重构能力。 管 AI 是这样,管我们自己,也是如此。 #AI #Productivity #Anthropic #Claude
214
我 7 岁的女儿天天跟我抢电脑 Vibe Coding。
52
这个有点想象力哦
You can use codex within your own programs using the Python SDK. It's awesome. Built by @ah20im and friends ``` pip install openai-codex ``` developers.openai.com/codex/…
101
BlanPlan retweeted

6
33
208
33,026
Vibe coding重度成瘾者都玩过哪些模型?
1
79
BlanPlan retweeted

2
494
感受一下,深圳的少年
76
上了x 这么久,第一次感受到这么深刻的文字
临时回了趟湖南。听亲友讲现状。比 AI 更触动我的神经。几个印象深刻点: 1、老家县城没啥经济了。房地产彻底歇了,出来大量闲置人员。旅游业不如从前。餐饮店在大量减少服务员。按摩等服务业大量倒闭。不少人组队去吉尔吉斯斯坦、新疆等地谋财路。 2、县城曾经很热闹的烧烤街,现在成立了烧烤联盟。联盟是为了公平。食客流量大不如前,每家店每晚都开,意味着很多店的食材等成本很难把控,容易亏损。加入联盟后,可以你星期一开,我星期二开,联盟统一调度。这样大家勉强都有条活路。 3、公务员体系,可能是县城里唯一活得跟从前一样的。非常复杂,盘根错节。越来越多普通老百姓,跟公务员体系走得越来越远。慢慢的像是有两个阶层。可能一直存在,现在更浮出水面。 4、治安呈现出两极分化。很久没出现过的凶杀案,最近几年开始抬头。同时公安的主要精力在抓赌。之前是小罚。现在是直接罚款一万,另加拘留两周。街头小巷,干干净净、路不拾遗。各种民间麻将馆里,此起彼伏、磨刀嚯嚯。 5、最近一起凶杀案非常复杂。直接死了两个人。复杂得我有点描述不出来。可怜的是一个家庭,剩下两个孤儿。政府给办了孤儿证,每个月可以领一千补贴。 6、朝闻道、夕死可矣,现在听到这句话,总觉得是文人的自大。农村里有大量不需要闻道,就可以夕死的老人。对世间的通透程度,远甚于文人墨客。 7、很多老人家身上,有着非常强悍的中华文化。比如:不要给子女添麻烦,做时间的朋友,让万物穿过自己,日日是好日,等等。每一个领悟背后,都是一步步世界名著。 8、人一定要有事情做。有个老人家跟我说:每天种种菜,看着菜长出来,嫩绿的样子,就觉得心情里有阳光。做事,意义极大极大。AI 有可能带来的罪恶,是在没有新事发生时,夺去了老事。这会是一种民族灾难。 9、人的生命力极其顽强。生命力的底座是情绪。情绪是所有人间悲欢的因。佛就是情绪,内蕴在每一个人身中。 以上。情绪很杂乱。
86
深圳地铁到处都是
1
101
62
This feature is very useful!
If you ever get tired of managing your Codex threads, just let Codex manage itself! Codex can now create threads, search them, organize them, pin the important ones, and spin up worktrees for parallel tasks.
64
川普真是牛逼,啥都能搞
On launch day, @TrumpAccounts app hits #1 in finance and #4 overall in the App Store. Fastest growing app outside of AI.
47
当你给 AI 写一份 project.md、一条 Cursor Rule、一份 Spec、一份 Eval Set 你就是在强迫自己把最不愿意说出口的那部分,说给一个机器听。 那些话,过去只在酒后说、在复盘会上说、在带新人那顿饭桌上说、在"我也说不清楚,但我觉得不对"的感觉里说 现在必须写成机器能读的文本。
56
很多人天天在说 vibe coding 那你们知道vibe coding 是谁提出的吗
43