Joined March 2025
305 Photos and videos
Pinned Tweet

96
517
2,671
1,159,190
第一次感受到Codex也有BUG。。。 我昨晚开了一个/goal,本来想着今天早上起来收菜。 发现Codex进入了一个很奇怪的Plan Mode的限制,怎么都取消不了。我从来没有开过plan模式,一直是完全访问。 刚开始只能换一个线程继续开发了。。。 但是我越思考越不对劲,然后回到老线程,开了一次计划模型,取消,再发送提示词,结果就好了。。。 很神奇的经历。
1
454
真是国产败笔,@Zai_org 智谱出息大发了,丢人丢到国外。。。运营团队简直了。。。 别说外国人了,就中国人,飞书客户群,平均100条内容可能回复一两条吧,然后评论区就被冲烂了。 明明算力就不够,老模型都用的不丝滑,推新模型有个屁用。。。客户投诉退款当看不见,零人应答,运营团队和没人一样。。。真是不把用户当人,除了A➗就属你最牛逼。
GLM has a serious token leakage / caching-accounting issue on Z.ai I tested this across Claude Code, Hermes Agent, Zcode, and OpenCode, so it does not look like one harness behaving badly. This has been consistent since the start of my subscription, during normal off-peak usage. My read: repeated context is being billed as fresh input instead of cached input. That’s not max reasoning. That’s a server-side caching/accounting problem. The screenshots show the issue clearly: Zcode used around 270K tokens, but I was billed for nearly 5M tokens. Cached tokens are clearly not working. I contacted support, escalated this, and tried everything, but got no real response. This is not how you treat paying customers. Please fix this. @ZixuanLi_ @Zai_org
20
4
89
72,973
用了好久的Codex、Claude Code这些Agent,但是其实我不是很了解其中的原理,自己也从来没开发过一款生产级Agent,对AI的理解完全不足以支撑我长期的发展。 所以最近打算继续打磨上次打黑客松获奖的“书镜”(一款问题导向制的读书Agent),稍微深入了解一些Agent的原理:把Session读写、工具调用、工具沙箱、记忆系统、自动压缩上下文、状态管理......这些基础概念先学会,然后用到开发里面。 本地开发好之后,再加上登录系统、用户隔离、历史对话、模型网关,部署到云平台。 之后,如果我成功把这款Agent部署上线,就好好梳理一下这些基础概念和开发部署的全流程,做一期视频,不知道这种教程有没有需求🤔(小白第一次上手这么高难度开发项目)
May 23
“AI时代,是读大学重要,还是学AI更重要?” “AI时代,如果工作影响了我学AI,我应该放弃这份工作吗?” 这些问题,如果你问大模型,可能只能得到唯一的答案,但是如果你去问了多本不同种类的书,就能够得到不同视角的不同答案。 让Agent读书去帮你解答心中的疑问,是AI时代能提高十倍效率的超级读书方法! “带着你的问题,让书给出答案”,所以我开发了“书镜”:一款能够用书籍帮你从多维度解答问题的App。 目前电脑和手机的网页端都能访问使用,API充足,大家随便造:shujing-385c8fb6.eazo.dev/ 如果大家体验下来,对这个产品比较感兴趣,也可以帮我投上十票,我都会有红包感谢滴~ 具体投票方法如下:👇
2
1
4
3,284
刚刚!GLM5.2发布了!但是我劝你不要着急买套餐。 我从GLM4.5就买了Coding plan Lite、到GLM4.7退订了套餐,又到GLM5升级了Coding Plan Pro、最后到GLM5.1再次选择退订。 可能没人比我更清楚智谱到底干了啥。。。 当时GLM4.5一发布,为了支持国产,我买了Lite套餐。 到了GLM4.7一发布,服务器被挤爆,根本用不了,甚至GLM4.5正常使用都成问题,然后退订了。 又到了GLM5发布,我选择再次相信,怀疑是自己充钱充少了,又买了Pro套餐,果然,上午和半夜能够正常使用GLM5了,但是下午和晚上服务器又爆了,只能用用GLM4.7。 又到了GLM5.1,这个时候已经不想挣扎了,懒得和智谱对线(客服群都被骂穿了,所有运营装死),刚好GLM改套餐限额和Codex升级,直接退订了。 国产模型是越来越好了,GLM5.2、Kimi2.7、Minimax3、DeepSeek4,但是说实话,我只在GLM这里遭受到了最大的恶意,真的是不把用户当人看。
Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now available to all GLM Coding Plan users, including Lite, Pro, Max, and Team plans. docs.z.ai/devpack/latest-mod… As our new flagship model, GLM-5.2 delivers powerful coding capabilities, usable 1M-context support, and continued strengths in long-horizon tasks. API and Chatbot services will launch next week. The model will also be officially open-sourced next week under the MIT License. The future of AI is open, and it belongs to the people.
86
9
293
88,678
Jun 12
我的天,Higgsfield已经进化到这种程度了吗? 一年前我 YouTube 做到 15 万订阅,还多亏了 Higgsfield 的帮助。那时候它还只能凑合生成视频,现在竟然已经开始进入游戏开发领域了。。。 ​ ​ 在Claude里面调用Fable 5写代码,再接入Higgsfield MCP生成角色、场景和道具,就能直出任何类型的多人2D/3D游戏!​ ​ 这件事放在以前真的很难想象。​ ​ 过去对我们普通人来说,涉及到复杂代码和角色道具图,开发游戏基本是可望而不可即的事情。 ​ ​ 但是Higgsfield Games 真的在把“做游戏”的门槛压到前所未有的低:一个完整的游戏可以用一句提示词就生成了。​ ​ 比如下面这个哥特悬疑画风的游戏,就是由Fable 5 Higgsfield 用简单提示词生成出来的。。。​ ​ 所以,任何人,只要有一个好的游戏想法,都可以借助 Fable 5 Higgsfield 先把它做成一个能玩的版本,然后快速发布出来验证市场。
Meet Higgsfield Games. For the first time, build and deploy multiplayer games from one prompt, in any genre, 2D or 3D, with best-in-class characters, props, and settings generated by Higgsfield MCP. Powered by Claude Fable 5. Try on Claude via MCP and on our Supercomputer.
14
15
110
29,101
逸尘 retweeted
Meet Higgsfield Games. For the first time, build and deploy multiplayer games from one prompt, in any genre, 2D or 3D, with best-in-class characters, props, and settings generated by Higgsfield MCP. Powered by Claude Fable 5. Try on Claude via MCP and on our Supercomputer.
222
268
2,049
838,490
Jun 12
我在做鸿蒙App上架的时候清楚的意识到:Codex已经比我贵了! 理论上Codex能够帮我完成所有的备案操作,但是,有一些操作,我用人类的肢体可以用更短时间完成:上传压缩包、上传App截图、输入路径。(Codex会打开访达,输入路径或者慢慢computer use点击,真实环境里面真的各种报错,虽然最后能解决,但是极其浪费Token) 所以,我现在使用Agent最大的问题不是“我不会指挥”,而是“我比较便宜,别让宝贵Token这样消费”。。。特别是Computer Use,我光是解决六个小问题,就把Pro5小时限额用光了。。。
人生第一款App完成了网站、App备案,终于到最后一步华为审核了。全程都使用Codex完成信息填写、备案,我坐在一边刷短视频的感觉太爽了啊! 这款App已经有上百位付费用户支持,但是作为我第一款上架到应用市场的App,如果成功,就将免费开放给大家。 这是一款直接把待办记录在手机锁屏上的App,目前仅限安卓。但是是Flutter框架,我自用版本还有Mac App,以后也会拓展到iphone。
4
1
10
8,374
Jun 12
我们这代00后,是历史上第一批"同时吃红利和黑利"的人。 昨天和我高中最好的兄弟聊了“未来怎么办”这个话题。他是C9临床医学在读,热恋中,花费高,家庭几乎无助力,医学课程多,考试多,爱打游戏。 他的title和面临的处境绝对能反映这个时代绝大多数大学生的缩影——把所有套牢自己的因素全部拉满了:不健康的恋爱;不健康的项目;不健康的专业;不健康的爱好。 如果他继续按照既定的路线走下去,考研、考公,都是绝境。唯一的可能性就是转专业,去人工智能或者自媒体。但即使他能在我的帮助下走出来,还有大量的大学生在大厂小厂都疯狂裁员的当下,前途一片迷茫,这波00后必定吃尽时代的黑利。 但是这个时代也是我这一波00后最好的红利时代。虽然三五年内,没有绝对稳定的工作,而且我们要和现在三四十岁阅历、资源和经验最丰富的大佬们同台竞争有限的资源,不稳定性会成为我们的家常便饭。 但是AI赋予能我们超能力,我们可以拼命地学习,跨领域学习,深度学习,在短短几年时间内就能超过白活了几十年的中老登,贯穿自媒体、AI、出海、硬件、金融、合规等多个领域。 我们这批00后会享受到这个时代真正的红利——无限的资源倾斜:真正有能力的前辈会赏识我们,给人脉、给资源;作为稀缺的年轻AI人才,会被政府宣传,会被大厂倾斜大量资源快速提升;我们视角独特,不再局限于单一的职位,我们会整合前端客户和后端产品,快速迭代。 最后,我们选择成为了OPC和加入顶尖初创,真正一飞冲天。 当然,起飞之前会有比较长的磨炼期和蛰伏期。这段时间多走走、多看看、多读读、多想想、多做做,走过的每一步,都算数,只要不偏离AI这条主线就行。
7
7
50
8,182
Jun 11
要做出海的朋友们都要注意了,有一个稳定的上网环境真的很重要,其中用VPS来搭建自用最为稳定。 我用过的三家VPS给大家参考一下: 1.DMIT 三网回国路线优化,延迟在165-170ms左右。价格最低12.9USD,但是现在已经售罄了,绝版了。 2.Akilecloud 三网回国路线优化,我在用的是60.99rmb的这款(链接直达我说的这款),延迟在150-200ms左右: akile.ai/shop/server?type=tr… 3.Voyracloud 之前我推荐的时候还没有三网回国路线优化,我买了一个二三十rmb的,延迟大概在700-800ms左右。满足日常上网需求足矣,但是晚高峰没有前两者丝滑。 之前我有篇推文详细地推荐了产品以及配置方案: x.com/gengdaJ/status/2036803… 总结一下: DMIT售罄,估计几个月会补货,预算充足的朋友可加入官方群(官网应该有tg群)等通知; Akilecloud适合对网络要求高且预算充足的朋友,DMIT平替; Voyracloud适合对网络独立性有要求但无特别高速度要求、且预算有限的朋友。

Jun 11
分享一下海外上网环境方案,“低价 纯净 高速”。 如果你用的是✈️,必然会遇到网络不稳定、账号风控等等的问题。 我目前使用的是住宅IP VPS,就是一台带有真实住宅IP的海外服务器,各种海外服务就像当地正常用户,不会触发风控,而且延迟很低!!! 这一台机器能干的事: 1、代理节点:住宅IP出口,Claude/Google/X/TK 体验都正常 2、Claude Code、Codex 远程环境:环境更干净,用起来更省心 3、跑 Bot、OpenClaw、AI自动化任务 我之前所用的方案是 VPS 节点加上 住宅 IP 做一层链式代理,并且那个 VPS 还没有回国线路优化,导致整个延迟非常非常高,换上这个住宅IP VPS之后明显感受到网速快了一倍,晚上 Youtube 4k秒开不卡顿,含金量不必多说。 价格的话基础款一个月几十块,@voyracloud 刚好在搞活动,很香: voyracloud.com/?ref_code=MK8… #VoyraCloud #住宅IP #海外环境
14
25
163
34,894
Jun 11
分享下我作为Codex元老级用户觉得最好用的插件: ⓵Computer Use 电脑操控,Codex独一家的神级功能,毫无疑问,给到夯爆了,具体的十多种玩法可以看我这篇: x.com/gengdaJ/status/2061824… ⓶Playwright 打开新的浏览器, 模拟人类操作。有些Computer Use操控不了的网页Playwright可以,比如电商后台、公众号后台等等。 ⓷Gmail 打通谷歌邮箱,可以给Codex设置一个定时化的邮箱日报; 也可以给开源仓库做贡献,设置Codex定时化查看仓库管理者返回的修改意见并继续修改代码。 ⓸Github Codex连接Github仓库,这个好处不多说了,AI时代人人都必须装。 ⓹Google Drive 安装了谷歌云盘插件,就和安装了飞书CLI差不多,保存在谷歌云盘的谷歌文档等等资料,都可以很方便地被Codex读取。做内容创作和资料归档必备。 ⓺Remotion/Hyperframes 做动画视频很方便。适合给已经做好的自媒体口播视频加上一些特效,最近抖音上很火的柱子哥,很明显能看到它的视频全是Remotion做的特效,让视频动感更佳。 ⓻Vercel Codex没办法像Google AI Studio、扣子、飞书Aily这些一样,内部直接集成了部署上线功能。如果你想要把做好的网站分享给朋友或者客户,必须要先把网站部署,这时候免费部署到Vercel是一个很不错的选择,比Cloudflare还方便。 温馨提醒: Codex内置的四件套插件很垃圾,建议使用各种Skills替代,比如PPT的话用藏师傅或者zara老师的PPT Skills做一下平替。 Chrome插件几乎没用,相信我,你想自动化操作的场景chrome插件只会报错,这时候优先用Computer Use代替,最后再使用Playwright。 Build iOS app 、 Figma 、 Notion 、 product design 、 Supabase 这些插件在垂直领域用途也不错,大家可以按需安装。
22
207
1,066
153,367
Jun 10
看大家吹了一天Claude Fable 5了,但是感觉更多是在当玩具用:开发Windows的、开发我的世界的、开发各种游戏的。。。 还有一部分大佬可能触及真实用途了,但是只敢用Claude Fable5找BUG、写计划,一点不敢直接让它写代码。以Claude Fable5的昂贵程度,产品的收益估计cover不了支出的百分之一。。。 所以,目前看来,Claude Fable5虽然没有缺点,但是各位有缺点啊,咱们烧不起啊,这玩意儿没法进入到真实工作流里面,就像那水中月镜中花,可望而不可即。 真要赋能工作,还是老老实实用Codex吧。
61
1
84
40,026
Jun 10
看了下卡神的 Claude Fable5 测评,带给我最直观的感受是:非常贵,但也非常强。 AI hot 那个案例可以看出来 Fable 在执行大任务上面的连续性和准确性,以及不错的审美。 但是我依旧不打算切换从 Codex 切换到 Claude,原因无他,Codex 本身比 cowork 好用太多,我的工作流已经固定,很难因为一个模型的些许优势而改变工作习惯(我不是专业开发者)。 保持冷静客观,不盲目追热点徒增焦虑,也是 AI 时代一项重要的能力。 所以@openai 加油吧,期待 GPT5.6。 卡神测评直达: mp.weixin.qq.com/s/DPqAc9vrO…

Introducing Claude Fable 5: a Mythos-class model that we’ve made safe for general use. Its capabilities exceed those of any model we’ve ever made generally available.
13
1
7
5,990
Codex现在已经在Agent产品里面独领风骚了。 自动化、Skill、computer use、GPT2-image、线程管理、插件生态、UI风格、注释修改已经做到了当世顶级。 但是美中不足的是,ChatGPT的Deep Research功能没有很好集成到Codex,当我想要在Codex调研某一个产品/行业/热点的时候,使用“超高”智能,搜索到的答案依旧不够准确全面。 所以非常希望@thsottiaux 能够看到我这条帖子,把ChatGPT强大的搜索功能内置到Codex里面,或者直接把两者结合成一个ChadGPT,谢谢! 当然,如果能把网页版大量的额度分一部分给Codex,用于简答的问答和搜索,那就再好不过了,毕竟我目前不止用Codex进行开发,我更多的使用场景是对话,并把精华的对话内容保存到Obsidian。我相信绝大多数人和我一样。
Codex打通了微信、飞书、自身线程之后,在整理信息归档这块太猛了。 涉及到一些商务合作,有很多合同、BF、打款情况、交付物都需要归档,直接让Codex去相应的地方搜集整理,最后归档到Obsidian,真的是太丝滑了。 微信:github.com/mcncarl/yichen-sk… 飞书CLI:github.com/larksuite/cli 自身线程:直接让Codex找对应的Codex对话即可。
91
21
164
42,571
Codex打通了微信、飞书、自身线程之后,在整理信息归档这块太猛了。 涉及到一些商务合作,有很多合同、BF、打款情况、交付物都需要归档,直接让Codex去相应的地方搜集整理,最后归档到Obsidian,真的是太丝滑了。 微信:github.com/mcncarl/yichen-sk… 飞书CLI:github.com/larksuite/cli 自身线程:直接让Codex找对应的Codex对话即可。

127
132
676
107,970
前几天和一位很厉害的大佬聊天的时候,才发现很多人其实都不知道Gemini是众多顶级大模型里面唯一一家原生多模态识别视频的模型。。。 GPT和Claude都是抽帧分析视频,速度比Gemini慢上五倍不止。很多做AI视频的人用的最多的不是GPT和Claude,而是Gemini、Flow和Google Ai Studio。但是谷歌似乎也只有视频方面还算可以了。。。哦,可能还有个Nano Banana。。。 所以说,兄弟们觉得Gemini 3.5 Pro能反超吗???
不会还有人不知道吧:Gemini在分析视频这一块(尤其是YouTube视频),无人能出其右!御三家唯一“看视频”的真神! Claude是没法看视频,chatgpt是必须把YT视频上传给他,而且chatgpt是采用关键帧分析的办法,不是原生的“看视频”的办法。 但是gemini是能真的把爆款视频进行像素级拆解,它本身就具备“看视频”的能力。 而且gemini和youtube的生态结合得特别好,youtube的视频复制到gemini和google ai studio都能够直接分析。 国内很多套壳的“对标爆款分析”工具大多调用gemini api就是这个原理。 gemini官网和google ai studio都有免费的额度,快去试一试!
43
20
88
29,046
这个英语学习工具很不错,今天用了四十分钟,已经把它固定成我的英语学习工具了。 同时兼顾听写、默写。还顺带练习了打字、发音。 我雅思目前大概6-6.5的水平,还需努力😅每天坚持20个单词
又淘到一个学英语狠项目,我深度体验了一下,非常好用,百词斩、多邻国付费版做的事,这个免费项目全包了。 它把背单词拆成了四个阶段。从跟打到听写,到自测,再到默写,层层递进。 市面上大部分工具只做到第一阶段:让你认。TypeWords 推到第四阶段,这是它的特殊优势。 它用的 ts-fsrs 间隔重复算法,根据你每次敲对敲错的速度,动态算下一次什么时候该见这个词。跟那种按固定天数推复习的,是代差的区别。 → 考雅思托福的,跟打先带你过拼写,听写遮住原词让你打,自测看中文敲英文。三关下来这个词长进肌肉里了。 → 背 GRE 考研的,FSRS 算法根据每次敲对的反应速度算间隔。打错自动进错题本,隔几天推回来重打,对三次才标记掌握。 → 日常想维持英语的,文章模块支持逐句默写,导入自己材料自动翻译双语文档。边写边听边记。 想直接用的,打开 typewords.cc,选一个词库,从跟打模式开始。一天 15 分钟,一周拼写记得嘎嘎清楚。 做英语学习产品的,去翻它的源码。自己去部署,开发新的网站。 仓库:github.com/zyronon/TypeWords 上手:typewords.cc P.S. 下次有人说学英语靠坚持,把老王这条帖子甩过他脸上
48
39
180
38,800
其实想要学习Codex很简单: 点击我的主页,右上角找到“搜索” 输入Codex 然后你就能学习我所有关于Codex的推文 然后拓展出去 问Grok推特上所有分享Codex使用方法最多的中英文博主 同上 学完你就是Codex大师了
43
4
31
5,607
元宝还有妙用啊,微信群聊总结这事其实元宝能干。。。
我最近真的有点沉迷腾讯系列产品。。。数据太牛逼了。 我暑假要找个律所实习,大概率是法律 科技或者资本市场方向的。 这种实习招聘一般都会在公众号里面发布,所以我想了想元宝不就刚好和公众号打通了吗,直接打开网页版元宝,然后就把所有相关招聘链接全部找出来了。。。 数据才是AI时代的护城河啊,只要静等姚顺雨训练好的腾讯新模型发布,或者腾讯神秘AI发布,全网就要沸腾了。
4
2
13
5,249
原生多模态的Step 3.7 Flash这次是真的上大分了。电脑主机接口识别,400tokens/s的速度,在10s内就输出了完整的教学步骤(包括接口名称、概念解释和温馨提醒),Agent工作流全程无剪辑、无加速,效果太牛逼了。​ ​ 整个视频的制作原理其实很简单:​ 1.网上找了一张电脑主机接口图片,让GPT高清处理​ 2.把图片嵌入到一个网站里面,接入Step 3.7 Flash的API​ 3.输入提示词,Step 3.7 Flash开始识别,联网搜索完成视觉审查​ 4.搜索到的结果返回流式输出,最后再以卡片形式结构化呈现​ ​ 真正让我意外的不是速度,而是Step 3.7 Flash在高速输出的情况下同时保证了高质量内容输出。​ ​ 一般这种 Flash 模型跑得快,质量就容易变成“看起来很懂,细看全错”。 但这次视频中Agent在10s内就完成了从图像识别、到联网搜索、最后到结果输出的整个过程;而且最后的输出质量特别高:接口位置能框准,接口名称能说清,用途解释也能落实到新手能理解的层面,甚至还有补充提醒。​ ​ 在 Advisor Mode 下,它的编程能力甚至能达到 Claude Opus 4.6 的 97%,但每个任务成本大约只有后者的九分之一。所以Step 3.7 Flash不是光快就完了,而是真正落实到了“质量”,是真正能够进入我们工作流干实事的模型。​ ​ 所以,大家快去试试@StepFun_ai的Step 3.7 Flash,不仅效率高、处理任务也一点不含糊,该有的规划、推理、搜搜和工具调用全都拉满了,是时候把Claude Code里面的模型换一下了~​ ​ Step海外平台:platform.stepfun.ai/​ Step国内平台:platform.stepfun.com/
26
5
63
16,315