Filter
Exclude
Time range
-
Near
You can also try using the Convex ESLint plugin, there is an autofix to automatically insert the right table name where needed!
1
21
Replying to @don100a
大丈夫そう? 全エラーをAutoFixしましたか?
1
69
Every workflow has inefficiencies. Dazhcorp’s agents find them — and fix them — automatically. #WorkflowOptimization #Dazhcorp #AgentAI #AutoFix
19
Shipped Autofix. It reviews your PRs while you sleep and fixes the easy ones before you wake up. Your competitors are still commenting. codepatrol-7-2.polsia.app

18
Jun 14
一篇来自 Stripe 关于 Agent 的经典文章,值得一读再读: # Stripe 的 Minions:一次性端到端编码 Agent 在整个行业中,AI Agent 编码已经从新鲜事物变成了基本要求。随着底层模型的持续进步,无人值守的编码 Agent 已经从可能性变成了现实。 Minions 是 Stripe 自研的编码 Agent。它们完全无人值守,专门为一次性(one-shot)完成任务而构建。**Stripe 每周有超过一千个被合并的 Pull Request 完全由 Minion 生成**,虽然经过人类审查,但不包含任何人类编写的代码。 我们的开发者仍然可以规划和与 Claude、Cursor 等 Agent 协作,但在一个开发者注意力是我们最稀缺资源之一的世界里,无人值守的 Agent 允许任务的并行化。 一个典型的 Minion 运行从 Slack 消息开始,以一个通过 CI 并等待人类审查的 Pull Request 结束,中间没有任何人工交互。我们经常看到工程师同时启动多个 Minion,并行完成多个不同的任务。这在值班轮岗期间尤其有用,可以有效解决许多可能同时出现的小问题。 在这篇博客文章系列的第一部分,我们将展示我们的工程师如何使用 Minions 以及它们能做什么。在第二部分,我们将深入探讨底层的实现以及我们是如何构建它们的。 ### 为什么自己造? 用 vibe coding 从零构建一个原型,和向 Stripe 的代码库贡献代码,是根本不同的事情。 Stripe 的代码库涵盖数亿行代码,分布在少数几个大型仓库中。我们的大部分后端使用 Ruby(不是 Rails)编写,配合 Sorbet 类型系统,这是一个相对少见的技术栈。在代码中,我们使用了大量 Stripe 独有的自研库,因此 LLM 天生不熟悉。 风险很高:这些代码每年在生产环境中处理超过 1 万亿美元的支付交易。同时,Stripe 与金融机构有着许多复杂的现实依赖关系,以及代码必须遵守的监管和合规义务。 LLM Agent 在从零构建软件时表现出色,此时系统的约束相对较少。然而,在任何像 Stripe 这样规模、复杂度和成熟度的代码库上进行迭代,本质上要困难得多。人类必须建立复杂的心理模型才能在我们的仓库中做出有效的改动,而让 Agent 在其上下文窗口的限制内发展出正确的直觉并使用正确的工具,是极具挑战性的。 多年来,Stripe 在开发者生产力基础上持续投入,支持我们在开发生命周期各个阶段的独特约束:源码控制、环境、代码生成、CI 等等。因此我们定制的 Minion 框架与这些工具紧密集成。Minions 使用的开发者工具,与让 Stripe 人类工程师能够在我们的规模上高效工作的工具完全相同:如果对人好,对 LLM 也好。 ### 使用 Minion 是什么体验? Minions 有多个不同的入口点,设计上尽可能贴合 Stripes 的工作习惯。虽然我们提供了 CLI 和 Web 界面来启动 Minions,但工程师最常从 Slack 启动。通过在 Slack 中 @我们的 Slack 应用,工程师可以直接从讨论某个改动的对话线程中启动一个 Minion,它能够访问整个线程以及其中包含的任何链接作为上下文。 如果你是一个做内部工具的工程师,你可能会用这样一条消息启动一个 Minion: > 一条调用 Minion 运行的 Slack 消息 Minions 也可以从 Stripe 的其他内部应用中调用。我们的内部文档平台、feature flag 平台和内部工单 UI 都与 Minions 集成。例如,当我们的 CI 系统检测到 flaky test 时,我们会自动创建工单,提示用户用 Minion 修复问题。 > 一张 flaky test 工单截图,附带一个启动 Minion 修复它的按钮 在 Minion 工作期间或完成之后,工程师可以在 Web UI 中查看 Minion 所做的决策和行动。 > Minion 运行管理 Web 界面的示例 一旦完成任务,Minion 会创建一个分支,推送到 CI,并按照 Stripe 的 PR 模板准备一个 Pull Request。如果代码看起来没问题,工程师就打开 PR 并请另一位 Stripe 工程师审查。如果不行,他们可以给 Minion 进一步的指示,Minion 完成后会将更新后的代码推送到分支上。 工程师也可以在 Minion 运行完成后手动进行迭代。虽然我们的北极星是完全不包含任何人类代码的 PR,但一个不完全正确的 Minion 运行成果,通常仍然是工程师聚焦工作的绝佳起点。 ### Minions 是如何工作的? 一个 Minion 运行包含多个阶段,在本系列的**第二部分**中,我们将有更多关于 Minions 如何工作的细节。许多细节是 Stripe 特有的,但我们认为有一些可推广的经验。为了吊一下胃口,这里先做一个简要的时间线概览。 一个 Minion 运行从**隔离的开发者环境**(或称 "devbox")开始,这和 Stripe 工程师写代码时使用的机器是同一类型。Devbox 是预热的,因此可以在 10 秒内启动,预载了 Stripe 的代码和服务。它们与生产资源和互联网隔离,因此我们可以在不需要人工权限审批的情况下在 devbox 上运行 Minions。这也提供了并行化能力,而没有 git worktree 之类的开销——这在 Stripe 的规模下无法扩展。 核心 Agent 循环运行在 Block 的编码 Agent [goose](github.com/block/goose) 的一个 fork 版本上。这是最早被广泛使用的编码 Agent 之一,我们很早就 fork 了它。我们以一种有主见的方式定制了编排流程,将 Agent 循环和确定性代码交替编排:Agent 负责创造性的推理,确定性代码处理 git 操作、linter、测试等等。这样 Minion 的运行既能融合 Agent 的创造力,又能确保它们始终完成 Stripe 要求的步骤,比如运行 linter。 总体而言,Minions 读取和 Cursor、Claude Code 等人类操作工具相同的编码 Agent 规则文件,兼容多种不同的 Agent 规则文件格式。然而,让 Stripe 拥有大量无条件规则是不现实的,因此 Stripe 几乎所有的 Agent 规则都基于子目录条件性应用。 Minions 连接到 **MCP**(Model Context Protocol),它为网络化的 LLM 函数调用提供了一种通用语言。这就是它们收集上下文的方式——内部文档、工单详情、构建状态、通过 Sourcegraph 搜索的代码智能等等。实际上,**我们会在 Minion 运行开始之前,就确定性地对可能相关的链接预先运行相关的 MCP 工具**,以更好地充实上下文。 由于 MCP 是 Stripe 所有 Agent(不仅仅是 Minions)的通用语言,我们构建了一个中心化内部 MCP 服务器 **Toolshed**,托管了超过 400 个 MCP 工具,涵盖内部系统和我们使用的 SaaS 平台。Minions 和其他 Agent 可以连接到这些工具的可配置但经过筛选的子集。 Minions 的设计目标是一次性完成任务,但如果没做到,给 Agent 反馈就至关重要。我们通过多个自动化的测试层来实现这一点,Minions 可以针对这些测试层进行迭代。第一道防线是一个**自动化的本地可执行文件**,它使用启发式方法在每个 git push 上选择并自动运行选定的 lint。这不到五秒。 在考虑开发者生产力时,我们追求**"反馈左移"**。这意味着,对于人类和 Agent 来说,任何会在 CI 中失败的 lint 步骤都应该在 IDE 或 git push 时就被强制执行,并立即呈现给工程师。 如果本地测试没有发现问题,CI 会在推送时从 Stripe 的测试库中有选择地运行测试——我们有超过三百万个测试。我们的许多测试都有针对失败的自动修复(autofix),我们会自动应用这些修复。如果一个测试失败没有自动修复,我们就把它返回给 Minion 去尝试修复。 由于 CI 运行消耗 token、算力和时间,我们**最多只进行两轮 CI**。如果测试在首次推送后失败,我们会提示 Minion 修复失败的测试并推送第二次,然后就到此为止。在速度和完整性之间需要平衡,让 LLM 运行多轮完整 CI 循环的边际收益递减。我们认为"通常一轮,最多两轮 CI 运行——并且只在我们修复了所有能在本地解决的问题之后"的指导原则,取得了很好的平衡。 简而言之,Minions 配备了与人类工程师相同的工具,以及遵循 Stripe 最佳实践编写代码所需的上下文。工程师在日常工作中就可以顺手调用它们——也确实在这么做。 ### 下一步? Minions 已经重新定义了在 Stripe 写代码的体验。行业仍在探索 Agent 编码的未来会是什么样子。但我们确信,**无人值守的编码 Agent 用例将始终是 Agent 最激动人心的应用之一。** 在[第二部分](stripe.dev/blog/minions-stri…)中,我们将更深入地探讨我们是如何实现 Minions 的。 --- 原文:stripe.dev/blog/minions-stri… #Stripe #AI编码 #Agent #软件工程
1
3
34
3,128
Build ボタン押しても Building Avatar の表示から先に進まない AutoFix ボタンの表示なし 無理ぽ
29
ふわぬぎAutoFixで除外したものまで脱げるのー…うーむなんじゃろ。まぁよいか…
3
167
すごいです 疑問を全部解決してくれました✨ ありがとうございました 今後の推奨アクション 費用削減方法 Incremental Review を有効化 Bugbot ダッシュボード → Settings 「Incremental Review」をオン 効果:前回レビュー以降の変更のみレビュー → コスト ~30% 削減 Effort Level を Default に維持 現在 Default に設定されている(推奨) High に変更しない Bugbot Autofix の活用を検討 自動修正で対応すれば、バグ解決率が向上 Cloud Agent クレジットを使用(別途課金) Usage Limit を設定 ダッシュボードに「Set Limit」オプンがあります $20 の上限設定で追加費用の制御が可能 Bugbot の課金モデル(確認済み) 使用量ベース課金 PR 1件ごと に料金が発生(バグ数ではなく) Auto Composer プールから消費 Effort Level により単価が変動 月額支出推移の確認 ダッシュボードの「Last month」タブで、過去の月間費用を確認できます。パターンがあれば、予算計画がしやすくなります。 質問:このレベルの月額Bugbot費用($196 )は、あなたのチームにとって妥当ですか?それとも削減を希望されますか?
36
推定料金も出してくれました Bugbot の料金ドキュメントを確認いたしました。あなたのデータから料金を分析します。 Bugbot 料金分析 現在の利用状況 レビュー済みPR数: 20個 検出バグ総数: 47個 課金対象: PR レビュー数 Team プランでの Bugbot 料金体系 Bugbot Teams は使用量ベースの課金です: 料金の仕組み 各 PR レビューごとに課金(バグ数ではなく) 「Auto Composer」プールと「API」プールで課金 デフォルトは「Default」エフォートレベル(効率的) より詳細なレビューは「High」エフォートレベル(より高額) あなたの推定コスト 20 PR × エフォートレベル単価 = 月額課金 具体的な単価は公開ドキュメントに記載されていません 費用削減方法 Incremental Review を有効化 全 diff ではなく、前回レビュー以降の変更のみをレビュー レビュー数が同じでも単価が低下 エフォートレベルの最適化 Default(現在のおすすめ) = より安価 High = より高額だが、バグ検出率向上 Bugbot Autofix の活用 自動修正で検出バグを自動解決 Cloud Agent クレジットを消費(別途課金) 正確な料金確認方法 Bugbot の具体的な単価については: Cursor 価格ページ で「Bugbot」セクションを確認 Bugbot ダッシュボード で月額予想コストを確認 質問: 現在のBugbot月額予想コストはダッシュボードに表示されていますか? おおよそいくらくらい? Bugbot のドキュメントを確認しました。正確な単価は公開されていませんが、以下の情報から推定できます。 料金推定分析 あなたの利用状況 20 PR のレビュー 47個のバグ検出 Default エフォートレベル(推奨、より安価) Bugbot Teams の料金体系 ドキュメントに記載されている内容: 使用量ベース課金 PR 1件ごと、またはレビュー1回ごとに課金 バグ数ではなく レビュー数で課金 エフォートレベルによる価格差 Default: より安価(現在のあなたの設定) High: より高額だが、バグ検出率が向上 Incremental Review で削減可能 全diff ではなく差分のみをレビュー 同じレビュー数でも単価が低下 おおよその月額推定 ドキュメントに具体的な単価が明記されていないため、正確には答えられませんが、一般的なAIコード審査サービスと比較すると: 20 PR × $10~30/PR = $200~600/月 (推定範囲) 正確な費用確認方法 以下の方法で確実に確認できます: Bugbot ダッシュボード → 「Usage」または「Billing」タブで月額予想コストを確認 Cursor 価格ページ → 「Bugbot」セクションで最新の単価を確認 Cursor サポート に直接お問い合わせ
1
328
james hawkins retweeted
Trying PostHog Code to autofix code base on the error tracking. Amazing! Thanks to @posthog team for the Beta access.
1
3
426
Jun 13
Every AI code reviewer finds bugs. Ours fixes them. Autofix is live. Autonomous PR review with actual code suggestions, not just comments. codepatrol-7-2.polsia.app

27
Jun 13
Replying to @linear
autofix on Triage is When issue trackers turn into agent runtimes. the interesting design question is which signals graduate from bug report to tool call...l;;
278
#Shoutout to @AikidoSecurity , a Gold Sponsor of @AppSec_Village 💀 Every scanner you need - SAST, SCA, secrets, cloud, container - in one platform, minus the alert overload. First results in minutes; autofix PRs to close them out. Check them out ⬇️ aikido.dev/?utm_source=appse…
1
166
Replying to @MLBTheShow
why don’t you worry about the actual dog shit product you put out like oh my fucking god this is the most brainless studio right now. Bots all over the marketplace no patch for it. PCI shrinkage also not patched. but since the pack glitch fucks with your pockets we get a autofix
37