Cursor 这份开发者报告,撇开"我们自家模型最香"那句自夸之后,真正值得拆的是它怎么把几组中性数字「框定」成了利好。
一、行数不等于价值。
人均周新增代码 3.6K→8.6K 行,p75 单 PR 从 126 行涨到 345 行(2.5x),Mega PR(≥1000 行)占比 8%→13.8%。报告叫它"开发者加速"。反过来读:AI 在批量生产更难审查的大 diff,成本从"写代码"转移到了"读和审代码"。通篇没有缺陷率、回滚率、生产事故这类负向指标——行数从来不是产出,否则最臃肿的代码库最高产。
二、"60 分钟存活率"是个很弱的质量代理。
AI 代码被采纳后 60 分钟还在的比例从 76% 升到 81%,被当成质量变好的证据。但 60 分钟短到只能说明"作者当场没立刻删"。真正的质量问题——评审打回、几天后的 bug、架构债——全发生在这个窗口之外。
三、三分之一的改动绕过了人工审查。
agent 改动"不经单独人工 diff 确认直接进 commit"的比例,半年从 7% 涨到 36.3%。报告把它放进"自动化成熟"的正面叙事。换个视角:1/3 的 AI 改动没人逐行看过,叠加 Mega PR 翻倍,审查盲区在累积。最讽刺的是同一份报告说 Automations 的头号用例是 security review——一边自动绕过审查,一边再自动补一层审查。
四、真正硬、且和厂商利益无关的两个信号。
1)上下文经济学发生结构性转变:输入/输出 token 比从 4.5× 飙到 13×,输入侧占成本接近 70%,cache-read 占总 token ~90%。agentic 编码的成本中心已经从"生成"搬到"喂上下文",缓存命中率才是真正的成本杠杆。
2)红利极度集中:P99 开发者产出是中位数的 46 倍、合并 PR 是 15 倍,Gini 0.72-0.77。AI 放大的是已有的能力差,不是抹平它——"AI 让人人平权"是幻觉。
Introducing the Cursor Developer Habits Report.
We’re sharing some of our findings on how software development is changing.
It’s based on the most comprehensive dataset on AI coding in the world, across all model families.