Joined February 2017
3,897 Photos and videos
科学前沿已经在用复杂系统理解人,而很多普通观念还在用简单标签理解人。
很多人没有明白的是,时代在变化,AI 在席卷全球,很多观念都要发生变化。 现在的最新的科学、科技已经到了一个很深的地步。由于课本上所有知识的落后性,导致很多人基本上也是落后的,完全是非常落后的。
1
138
很多人没有明白的是,时代在变化,AI 在席卷全球,很多观念都要发生变化。 现在的最新的科学、科技已经到了一个很深的地步。由于课本上所有知识的落后性,导致很多人基本上也是落后的,完全是非常落后的。
1
2
315
时间是不公平的。有些人总觉得时间不够用,有些人却闲得经常去看一些其他的东西。 如果时间可以市场化的话,那将是世界上最大的革命。
140
Rainman retweeted
我現在有個很複雜的任務,我就在gpt5.5-pro和opus4.8之間,把他們彼此的結果互相發給對方評價,然後融合修改,然後繼續,就像我和兩個AI一起工作一樣。結果兩個AI之間惺惺相惜,一邊工作一邊感嘆對方聰明,誇對方誇得天花亂墜,非常謙遜的吸收對方的建議。 我有一種很怪的感覺。
3
28
4,162
Rainman retweeted
为啥 Codex 还不推出类似 Codex Design 的产品? Anthropic 最近推出了 Claude Design,是我除了编程之外用得最多的 Agent,也推荐过很多次。效果真的好:你用一句话描述想要的 App,它直接给你生成一个可交互的原型,点哪哪都有反应,不仔细看还以为在操作真实的 App。 有网友问:为啥 Codex 还不推出类似 Codex Design 的产品? 简单来说,GPT-5.5 的模型能力还做不好这件事。但要解释清楚为什么,得先理解一个关键区分。 【1】Agent 的两层:模型和 Harness 很多人把 Codex、Claude Design 和 GPT-5.5、Claude Opus 4.8 混在一起说,其实它们是完全不同的两层。 Claude Design 和 Codex 是"产品层",业界叫 Harness,包括提示词、工具链、UI 交互流程这些工程层面的东西。Claude Opus 4.8 和 GPT-5.5 是"模型层",是真正干活的大脑。 打个比方:Harness 是厨房,里面有锅碗瓢盆(工具)和菜谱(Skills),模型是厨师。同一套厨房,换个厨师,做出来的菜完全不一样。 理解了这个区分,后面的事情就好说了。 【2】Harness 不是门槛 Claude Design 的 Harness 层技术上不复杂。花点心思逆向一下,提示词、工具代码几乎都可以拿到。我已经做过了,成果在 baoyu-design(github.com/JimLiu/baoyu-desi…),可以借助 Skill 把 Claude Design 在其他模型上运行。工程上没秘密。 真正拉开差距的是背后的模型。 【3】高精度可交互原型,难在模型 Claude Design 这个名字容易让人误解,以为交付的是 Figma、Photoshop 那样的静态设计图。实际上它交付的比 Figma 更进一步,是融合了设计稿和原型的高精度可交互原型:你不光能看到设计,还能直接上手操作。 这对模型的要求很高。 举个例子。我要做一个类似 X/微博的客户端。让模型画一个好看的静态界面,很多模型都做得到。但要让这个界面能交互就复杂了:切换不同 Timeline,展示不同类型的推文(文本、图片、视频),点赞要变红心,删推要从列表消失,从列表点进详情再返回,状态还要保持住。 要做到这些,模型必须在动手画 UI 之前,先把整套数据结构和状态管理想清楚:tweet 长什么样、timeline 有哪几种、每个按钮当前是什么状态、状态之间怎么联动。这是系统架构设计的活,不是画 UI 的活。 Claude Design 对模型的要求,是同时具备优秀的 UI/UX 设计能力和系统架构设计能力,缺一个效果就大打折扣。这也是为什么我之前反对只产出纯 HTML 的设计稿,那只是静态的 UI 设计,没有融合 UX 交互。 有条件的话可以自己测试感受一下。比如用这个提示词: Design a X Client for Mac, similar to Tweetbot for Mac from Tapbots 同样的提示词让 Codex 去做,也能出个东西,能看,也能简单交互。但对比一下就知道差距了:列表能滚动,sidebar 不能点;点赞按钮没反应。来回迭代好几轮,才能达到一个勉强凑合的水平。 Claude Design 做出来完全不一样。从 Timeline 切到通知页,从列表点进详情再返回,全程流畅,状态都保持住了。不仔细看真以为在操作一个完成度很高的 App,虽然数据都是模拟的。 Claude Opus 4.8 显然在设计和架构这类场景上做了大量训练和优化。 【4】产出物就是代码 去看 Claude Design 的产出物,注意里面的 data.jsx 文件。它把整个设计的数据结构定义得很清晰,基于这个结构模拟了一套完整数据,然后用 React 在这套数据上构建 UI。 设计产物本身就是代码(React、CSS、JSON),不是 Figma 或 PSD,任何开发者拿到都能直接看出按钮的圆角、主色、间距,照着自己的技术栈实现就行。后续设计变更?git diff 一看就知道改了什么。设计和开发之间的沟通损耗降到了最低。 说得不严谨,应该说设计 Agent 和开发 Agent 之间的沟通损耗很低了。现在都是人在指挥 Agent 去设计,人指挥 Agent 写代码了。 【5】怎么用好 Claude Design 很多人不知道该怎么用好 Claude Design,其实有点像 Vibe Coding:有个基本的想法,先让它做一个版本出来,然后通过 Chat 去指挥 Agent 帮你改,调整几个版本你的思路就清晰了。 整个调整的过程非常神奇,有一种"言出法随"的感觉,你想让它怎么改它总能给你实现出来。这也是为啥我现在很痴迷用 Claude Design,反馈来得太快太过瘾了。 还有一个小技巧:不要说太具体的要求,而是说你的目标是想要什么,让它自由发挥。往往能得到更好的效果,毕竟它训练过几乎所有公共的 UI 设计。 回到最初的问题。Codex 不推类似的设计产品,是因为 GPT-5.5 还扛不住这个活。画个好看的界面很多模型都行,难的是在动手之前把数据结构、状态管理、交互逻辑都想清楚,然后一次性交付一个完整的可交互原型。 目前只有 Claude 的模型做到了。至于能领先多久,就看 OpenAI 或者其他家后面模型的进化速度了。
33
42
223
33,260
现在的人生目的需要考究一下。以前就是要去旅行、去散心,但现在AI 变化这么快,要做的事情就是在家。 除了日常的吃饭、睡觉和锻炼,剩下的时间应该这样分配: 1. 使用 AI 来优化生活。 2. 使用 Claude Code 和 CodeX 来编程,写自己的项目。 3. 使用 Cloud Design 来进行设计。 其他的社交时间和旅行时间都应该减少。至于旅行,最好是等自己没什么可写了之后再去。
465
很多人觉得自己年龄不大,但实际上按预期寿命 90 岁来算,这个年纪大概已经走过人生的三分之一了。 人生的壮年可能也就到 35 或 45 岁左右。剩下的最后二三十年,或者说最后那一二十年,我觉得大概率不会过得那么好,那时候记忆衰退、行动不便,不再像现在这样风华正茂了。 所以我觉得,过去的人生并不幸福,也并不富有。
5
597
首先这个 Skill 很好,另外提供一个额外选择:可以试试 Claude Resume。 github.com/deusyu/claude-res… 它更偏「结构化经历素材库 面向 JD 的定制化简历生成」,不是单纯美化排版。把原始经历用 Markdown 准备好之后,可以针对不同岗位自动筛选重点、调整表达角度,并生成 LaTeX/PDF。适合经常投不同方向、需要维护多版本简历的人。
首先这个 Skill 很好,另外提供一个额外选择: 可以试试用 Claude Design 生成一份简历试试,也许你会喜欢
5
813
Github 可以连接Patreon 来打赏了
86
PostgreSQL 就用Neon
1
184
gstack 那个brower 也不错,claude code 调用起来写东西会自己看。
Codex 操作浏览器有两种模式,一种是 Chrome 插件,一种是内置浏览器。用了一段时间之后,我总结一下两者的差异和各自适合的场景。 【1】先说一个被低估的用法:拿 Codex 当爬虫 传统爬虫用 requests 或者 Playwright 无头模式去请求页面,现在风控越来越严,指纹检测、行为分析、验证码轮番上阵,很多网站一看你是程序化请求直接拦截。Codex 的浏览器不一样,它操作的是真实浏览器,有完整的渲染引擎、真实的用户代理、正常的 JavaScript 执行环境,在网站看来就是一个普通用户在浏览页面。 配合 /goal 模式,你设定一个目标(比如“把这个网站上所有产品的名称、价格、评分抓下来存成 CSV”),Codex 会自己规划步骤、翻页、处理异常,不需要你一步步指挥。这比自己写爬虫脚本省事得多。 但 Codex 有两种浏览器模式,特性完全不同,选对了事半功倍。 【2】Chrome 插件模式:能力强,但吃资源 用 @Chrome 调用的 Chrome 插件模式,核心优势是一个字:登录态共享。 它直接运行在你自己的 Chrome 浏览器里,继承你所有的 Cookie、登录会话、已安装的扩展。那些需要登录才能访问的内容,比如付费订阅的文章、企业内部的管理后台、CRM 系统里的客户数据、需要登录的社交平台,Chrome 插件都能直接访问,因为对网站来说,就是你本人在操作浏览器。 Codex 在 Chrome 里工作时会把任务放进独立的标签页分组,不会打断你正在看的页面。它还支持 DevTools 协议,能抓性能数据、看网络请求、调试 Console 错误。 但代价也很明显:资源消耗相当大。Chrome 本身就是内存大户,每个标签页都是独立进程。Codex 的 Chrome 插件在上面再加一层操控逻辑,截图、DOM 解析、指令交互全在跑,内存和 CPU 占用会非常高。机器配置不行的话(比如 8G 内存的笔记本),跑起来能明显感觉到卡顿,拿来做批量爬虫任务就更难受了。长时间运行还容易出现截图延迟、状态不同步的问题。 另外 Chrome 插件目前只支持 macOS 和 Windows,Linux 用户暂时用不了。它也不支持无头模式,Chrome 窗口必须保持打开状态。 适合的场景:需要登录态的短期任务。比如登录某个平台抓一批数据、在内部工具上批量操作、从 CRM 导出信息。 【3】内置浏览器模式:轻快,但有局限 用 @Browser 调用的内置浏览器,是 Codex 自带的沙盒浏览器环境。 它最大的优势是轻量。不需要启动整个 Chrome,资源消耗小很多,响应速度快,适合需要频繁操作浏览器的场景。 但它有一个根本性的限制:没有你的登录态。不继承 Cookie、不继承浏览器扩展、不继承已保存的会话。打开一个需要登录的页面,你得在内置浏览器里重新登录。而且有些反爬严格的网站,对这种非标准浏览器环境的检测更敏感。我试过在内置浏览器里登录 X,反复失败,大概率是因为 X 的风控识别出了异常的浏览器指纹。 内置浏览器真正出彩的地方是前端开发调试。它有一个标记模式(Annotation Mode),你可以直接在渲染好的页面上选中某个元素或者框选一个区域,写上“这个按钮往上移”“字体加粗”“这个间距太大了”之类的批注,Codex 会把这些批注当作可执行指令来处理。这比用文字描述“第三行第二个按钮的 margin-top 减少 8px”直观太多了。 配合 Developer Mode,内置浏览器还能跑性能分析、抓网络请求、看 Console 输出,对本地开发服务器的调试非常友好。 适合的场景:公开页面的数据抓取、本地开发调试、不需要登录态的网页操作。 【4】怎么选 简单说:需要登录的用 Chrome 插件,不需要登录的用内置浏览器。如果你的机器配置有限又需要大量抓取公开数据,内置浏览器是更好的选择。如果目标网站必须登录才能看到内容,或者反爬很严需要真实浏览器指纹,那只能用 Chrome 插件,但要有心理准备面对资源消耗。 Codex 自己也会根据任务判断应该用哪种浏览器。它的优先级是:有专用插件(比如 Jira、GitHub 的集成)就用插件,需要登录态就用 Chrome,其余情况用内置浏览器。 当然浏览器的用途远不止爬虫。我觉得内置浏览器做前端调试的体验比很多专门工具都好,标记模式配合 Codex 的理解能力,几乎是“指哪改哪”。Chrome 插件在自动化操作企业内部工具方面也很实用,比如定期从后台导数据、批量更新记录。这些场景还有不少值得挖掘的空间,大家可以根据自己的实际需求去试试。
1
1
623
这个是用的一套本地 Chromium 自动化运行时
301
今天问她,她说已经很久没跟家里要钱了。 我看这工作都5-6 年了。。。
2
1
598
她问我说想要什么? 我说:迈巴赫 她:太low 了 我:G63 她:太low 了 我:小米su7 她:买不起。。。
1
1
233
一般来说,我都会告诉现在的,前任是比你好看的(QAQ 我在倒退啊😭😭😭
1
2
475
Rainman retweeted
Replying to @xiongchun007

Talk is cheap. Code is cheap. Show me what's in production.
1
1
535
今天准备调研一下CI/CD 工具的技术选型。 为了我的项目和今后巨多的项目。
1
272
我发现很多人就是需要被领导的,很难让他们有自律和自驱地去做事。 现在我感觉我要转途径了,我要转成“战争途径”、“红祭司途径”了。 唉,难呐。
196
发给你们的Crush
上次坐地铁接了个电话,我一直在说 code 叉 code 叉 旁边美女小姐姐说那叫 co代克斯,不懂能不能问问豆包啊
1
2
742
人和人不同,像是富家小姐算是阶层没有动,甚至有所下降。 而推友经过自己的努力至少跨越了一个等级,而且完全是靠自己的。
215