Joined September 2024
461 Photos and videos
AI 上云
We’ve reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-running work, even when laptops are closed, and help more organizations deploy agents securely in production. After closing, Ona will join OpenAI’s Codex team. openai.com/index/openai-to-a…
1
1,263
凡人小北 retweeted
Claude Fable 5 changed how we work on the Claude Code team day to day. We used to verify that Claude did the work right. Now we verify that it's doing the right work. Here’s the 3 biggest changes:
289
767
11,323
996,221
Anthropic 家的模型文字水平高,从他们家的模型起名就能看得出来。 haiku sonnet opus fable mythos 隔壁 OpenAI 家就土了很多,理科生无疑。
Replying to @claudeai
Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowledge work, scientific research, and vision. The longer and more complex the task, the larger Fable 5’s lead over our other models.
3
1
2,102
凡人小北 retweeted
Jun 9
Anthropic 今天同时发布了两个模型:Claude Fable 5 和 Claude Mythos 5。 两个模型用的是同一个底座,区别在于 Fable 5 加了一套安全分类器,面向所有用户开放;Mythos 5 去掉了部分安全限制,只给 Project Glasswing 的网络安全合作伙伴用。 简单说,Fable 5 就是"带护栏的 Mythos"。两个月前,Mythos Preview 还锁在大约 200 家防御机构手里,现在普通开发者也能用到同级别的能力了。 【Fable 5 的安全机制】 Fable 5 的安全机制不是传统的"拒绝回答",而是降级:当分类器检测到请求涉及网络安全攻击、生物化学武器相关内容或模型蒸馏行为时,会自动切换到 Opus 4.8 来回答,并告知用户发生了降级。Anthropic 给出的数据是,超过 95% 的对话不会触发降级。 Anthropic 也坦承分类器目前调得偏严,会误伤正常请求,后续会持续优化降低误报率。 【能力到底有多强】 Anthropic 列了一堆 benchmark,但几个实际案例更能说明问题。 Stripe 拿 Fable 5 在一个 5000 万行的 Ruby 代码库里做了一次全库迁移,一天完成,原本需要一整个团队花两个多月。在 Cognition 的 FrontierCode 测试中,Fable 5 在中等算力消耗下就拿到了最高分,Token 效率比之前的 Claude 模型明显更好。 视觉能力上,之前的 Claude 模型玩宝可梦火红版需要各种辅助工具才能推进,Fable 5 只靠最基础的视觉接口就通关了。还能从截图直接还原一个 Web 应用的源代码。 在生命科学方向,Mythos 5 让 Anthropic 内部的蛋白质设计专家把药物设计流程中的部分环节加速了约 10 倍。在一项基因组学研究中,Mythos 5 在几乎完全自主的情况下工作了一周多,训练出的模型表现超过了发表在 Science 上的模型,而体量只有后者的百分之一。 【价格和可用性】 Fable 5 和 Mythos 5 的 API 定价是每百万输入 Token 10 美元、输出 50 美元。对比 Mythos Preview 的 25/125 美元,降了 60%。但比 Opus 4.8 的 5/25 美元贵了一倍,和 OpenAI 的 GPT-5.5(5/30 美元)相比,输入贵一倍,输出贵了约 67%。 订阅用户要注意一个时间窗口:从今天到 6 月 22 日,Pro、Max、Team 和企业版用户可以免费使用 Fable 5。6 月 23 日开始,使用 Fable 5 需要额外购买 usage credits。Anthropic 说等产能充足后会把 Fable 5 恢复为订阅计划的标配,但没给具体时间。 API 和按量付费的企业用户不受影响,今天起就能正常调用。 【一个容易被忽略的政策变化】 Anthropic 同时宣布,从 Fable 5 开始,所有 Mythos 级别模型的流量将强制保留 30 天,覆盖第一方和第三方平台。Anthropic 承诺不会用这些数据训练模型,仅用于安全监控,比如检测新型越狱攻击和跨请求的复杂攻击模式。但对于注重数据隐私的企业用户来说,这是一个需要评估的变化,尤其是那些之前选择 Anthropic 正是因为其零留存政策的客户。
Introducing Claude Fable 5: a Mythos-class model that we’ve made safe for general use. Its capabilities exceed those of any model we’ve ever made generally available.
112
41
299
142,980
TRAE 的路子走宽了👍
13
21
11,694
Notion 这种级别的产品第一反应是直接切流。 某种程度上,这比榜单更能说明问题。 当 AI 开始成为生产环境的一部分,能连续都维持同样水准才是真正的护城河。 外加企业自己不要作妖。
Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures for users selecting these models in Notion AI. To mitigate impact, all Anthropic models have been disabled in the model picker and requests have been rerouted to alternative providers. Most users should now be able to continue using Notion AI with minimal disruption, though Anthropic-specific features remain unavailable. Please refer to notion-status.com/ for the details.
27
1
69
23,279
AI 时代的又一个受益者, Supabase 宣布完成 5 亿美元的 F 轮融资。 公司的估值已达 100 亿美元。而在一年前它只值 20 亿。
1
1
3
2,348
腾讯也回过神了。 内部宣布调整 AI token 额度。全员统一额度改为按工作任务动态调配。 通知明确表示,总投入只增不减,对能用 AI 带来显著提效和价值产出的同学,保障 token 额度,不搞 token 消耗量排名,不贩卖焦虑。
136
21
497
209,267
AI使用率是古德哈特定律的又一个经典例子。 评估任何一件事情都需要指标, 在没有一个更有衡量价值的指标的情况下,大家都选择了一个没那么坏的指标。
“My company did layoffs a few weeks ago. The main metric for productivity is AI usage (% of PRs with AI assistance) and PR count per week. People are burnt out after layoffs, but they don’t want to be next so they are doing what’s requested: use AI, inflate PR count….”
18
4
3,691
Codex Obsidian 是个非常好的 agent 组合, 现在唯一的缺陷是文档太多了,每次打开 Obsidian 都卡几秒, 大家有啥解决方案吗👀
Obsidian 加上 Codex,再配合合适的 API、MCP 和 Skills,基本上能替代目前 90% 以上的 AI Agent 产品。 这是我将笔记从 Notion 迁移到 Obsidian 一个月之后的感受。
40
1
5
4,575
懒猫家这个摄像头好看啊
懒猫摄像头开始预售啦! 继懒猫微服,懒猫 AI 算力舱后,第三款懒猫智能硬件发布啦! 星际太空人,科幻外观设计,从零开模打磨了一年半,头围和蔚来汽车的 Nomi 一样大,意味着买了摄像头后,所有 Nomi 的头饰都可以随意搭配 后期会让懒猫 AI 摄像头结合懒猫 AI 算力舱,让用户自定义 AI 大模型,实现 100% 隐私的家庭 AI 摄像头 最重要的一点是,懒猫 AI 摄像头是 NAS 界第一款智能摄像头,买回家扫码就可以用。以前那种购买第三方摄像头,破解 Token 各种折腾的时代结束彻底了! 正式售卖价格 399 元,预售期间购买 360 元,评论区打 1,先到先得 想要免费获得这款科幻摄像头的推友,只需关注我,写任意评论并转发这个推特,下周三抽奖免费送 10 台懒猫 AI 摄像头,千万不要错过抽奖机会,0 门槛参与!!!
2
3,026
凡人小北 retweeted
How do we automate business analytics with Claude? New blog post covering our best practices for skills, data foundations, and evaluations when building agents to perform data analysis: claude.com/blog/how-anthropi…
90
391
4,229
1,258,234
凡人小北 retweeted
Jun 4
We’ve been researching new ways for ChatGPT memory to carry context across conversations and keep it useful over time. Today, that work is rolling out as a more capable memory system in ChatGPT. openai.com/index/chatgpt-mem…
742
1,017
9,687
2,620,040
chatgpt 和 codex 是该合并了,我现在打开手机总搜索 codex。
18
7
8,254
Codex 新发布的这几个插件宣传大于实际,插件底层把能团结的友商全拉进来了。 如果你是相关 saas 或者工具的用户,那可以满足不少日常工作。 但更严谨一些,每个公司每个人都有自己的业务逻辑和规范,最终要起飞还得沉淀自己的 marketplace 和 plugin / skill。 回到这个逻辑,Pete 最近采访 YC,关于YC 如何进行 AI-Native 组织改造,值得一看。
OpenAI 的野心和獠牙展现得比想象中更快。 CodeX 在其规划中已不再是程序员专属,而是走向更通用的 Agent。 为了让大家认识到这一点,以及具体帮哪些人做哪些事,OpenAI 主动晒出了数据分析、创意生产、销售、产品设计、股票投资和投行等插件。 未来适合更多工种的插件也会陆续上线。 Agent 帮更多人提效的时代,加速了。
5
9
5,275
Codex 正在变成 Agent 的默认 Runtime。 codex 其实还同时有 typescript sdk。 如果你要搭建一个 agent,技术栈可以是: typescript codex cc-switch
We just released the Codex Python SDK 🔥 You can now embed Codex directly into your Python apps and workflows! > Start threads > Run turns > Stream progress > Resume sessions > Pass images > Control sandbox access All whilst reusing your existing Codex auth. pip install openai-codex Go build with it!!
6
4
37
12,577
明天 6 月 1 日, codex pro 100 美金订阅的 10 倍福利没有了, 该升级 200 美金了, 大家注意下。
Apr 9
We’re updating our ChatGPT Pro and Plus subscriptions to better support the growing use of Codex. We’re introducing a new $100/month Pro tier. This new tier offers 5x more Codex usage than Plus and is best for longer, high-effort Codex sessions. In ChatGPT, this new Pro tier still offers access to all Pro features, including the exclusive Pro model and unlimited access to Instant and Thinking models. To celebrate the launch, we’re increasing Codex usage for a limited time through May 31st so that Pro $100 subscribers get up to 10x usage of ChatGPT Plus on Codex to build your most ambitious ideas.
27
2
133
77,503