Joined April 2026
13 Photos and videos
「Findy AI 」に、AI活用のトレンド・ボトルネックを分析する3つのグラフを追加しました🎉 トークン・PR・並列開発から見る、AI活用の"伸びしろ"が分かります。 ✅️ トークン推移:AI活用が軽い用途で止まっていないか ✅ Output:整えたSkillが使われてるか、Skillが成果(PR)に繋がっているか ✅ 並列開発:並列開発で生産性上げれているか が組織全体・チーム・ユーザー単位でひと目で確認可能です。 ぜひスレッドのURLからご利用してみてください。 無料でご利用可能です。
2
11
15
1,236
「Findy AI 」に、AI活用のトレンド・ボトルネックを分析する3つのグラフを追加しました🎉 トークン・PR・並列開発から見る、AI活用の"伸びしろ"が分かります。 ✅️ トークン推移:AI活用が軽い用途で止まっていないか ✅ Output:整えたSkillが使われてるか、Skillが成果(PR)に繋がっているか ✅ 並列開発:並列開発で生産性上げれているか が組織全体・チーム・ユーザー単位でひと目で確認可能です。 ぜひスレッドのURLからご利用してみてください。 無料でご利用可能です。
2
11
15
1,236
データの読み解き方も合わせてご覧いただくと、AI活用の課題がひと目でご理解いただけます。
2
2
190
Claude Managed Agentsに新機能が追加 スケジュール実行とCLI認証が使えるようになり、定期的なデータ同期・レポート生成・ログ監視を自動化できる。 認証情報はvaultに格納されるからエージェントには渡らない仕組み。 claude.com/blog/whats-new-in… 💡 ポイント ・cron形式でエージェントを定期実行(夜間同期・週次レポート・日次監視など) ・環境変数vaultでCLI認証——APIキーは実行時にネットワーク境界で差し込まれる ・Browserbase/KERNELでブラウザ操作が可能に(CLIベース) 1. スケジュール実行の仕組み ・scheduled deploymentにcronスケジュールを設定 ・スケジュール発火ごとに新規セッション開始→タスク完了 ・デプロイ後は一時停止・再開・アーカイブ・手動トリガーが可能 ・スケジューラーを自前でホストする必要がない 2. 環境変数vaultによるCLI認証 ・vaultに環境変数を登録(APIキー 許可ドメイン) ・エージェントのサンドボックスにはプレースホルダーのみ ・実際のキーはネットワーク境界で付与される(許可ドメインのみ) ・vault内のキーを更新すれば、実行中セッションも次回呼び出しから新しい値を使う ・Browserbase、KERNEL、Notion、Ramp、Sentry CLIなどが対応 3. ブラウザ操作の追加 ・Browserbase/KERNELのCLIでブラウザ機能を初めて利用可能に ・エージェントがWebページをナビゲート・操作できる ・他のツールと併用可能 4. 実例:Rakuten ・週次・月次でスプレッドシートを分析→レポート・デッキ生成 ・本番ログ・メトリクスを監視→ダッシュボード不要でアプリ健全性を確認 5. 実例:Actively AI ・営業チーム向けクロスアカウント検索システムをManaged Agentsで構築 ・scheduled deploymentsで定期的に回答を更新 ・自前のスケジューリング基盤を置き換え→スタック簡素化・開発サイクル改善 6. 実例:Ando ・採用・営業チームの進捗を自律監視 ・チャネルで提案された次ステップを監視→期限到来時にフォローアップ・ミーティングリマインダー送信 7. 実例:Notion ・環境変数vaultでNotion CLIを展開 ・MCPツールと併用してファイルアップロード機能を追加 ・APIトークンがモデルに渡らない(セキュリティチームの厳格なガイドラインをクリア) 8. 実例:Browserbase ・browse CLIを使ってブラウザスキルのpublicカタログを生成 ・vaultで認証 ・scheduled deploymentsでカタログを定期検証→精度維持 9. 実例:KERNEL ・環境変数vaultで利用状況・顧客会話を追跡するDBに接続 ・30日分の日次利用データを数秒で取得 ・利用急増をリアルタイムで検出→顧客に意図的なアクティビティか確認 10. 実例:Milana ・環境変数vaultで顧客のコードベースに接続 ・AIプロダクトエンジニアがバグを自動検出・修正 ・大規模データ分析が以前より高速化 11. スケジュール実行のユースケース ・夜間データ同期(nightly data sync) ・週次コンプライアンススキャン ・日次ダイジェスト生成 ・複数の営業・採用プロセスを1つの自律エージェントにまとめる(Andoの使い方) 12. 環境変数vaultのセキュリティモデル ・エージェントは実際のキーを見ない ・サンドボックスにはプレースホルダーのみ保存 ・実キーはネットワーク境界で付与(許可ドメインへのリクエストのみ) ・キー更新は即座に反映(実行中セッションも次回呼び出しから適用) 13. CLI統合の利点 ・既存のコマンドラインツールを直接駆動 ・軽量で高速な統合パス ・HTTP経由でキーを送信するCLIは大半が対応 14. Notion CLIの追加機能 ・MCPツールと補完関係 ・ファイルアップロード機能を追加 ・APIトークンがエージェントに渡らない安全性 15. Actively AIのスタック簡素化 ・自前で構築したスケジューリング基盤を削除 ・scheduled deploymentsに置き換え ・プロダクトサイクルが改善 16. Milanaの品質保証 ・顧客の実際のコードベースに基づいてエージェントをグラウンディング ・CLIで非公開APIを呼び出し(認証情報を露出させない) ・すべての出力の品質を保証可能
We've just added two new Claude Managed Agents features: 1. Scheduled deployments - run tasks on a schedule 2. Environment variables - expose vault credentials for CLIs as environment variables
1
1
4
900
Fableが自分のローンチ動画を自分で編集。 動画編集ツールを一切使わず、コード生成とツール呼び出しだけで完結した事例。 💡 ポイント ・文字起こしサービスとffmpegを自動操作 ・カラーグレーディングも自動実行 ・Figma MCPでUI作成、Remotionでレンダリング 実装内容 ・コード生成とツール呼び出しで動画編集を完結 ・従来の動画編集ソフトは不使用 ・文字起こし、映像処理、UI生成、レンダリング を統合
Jun 10
Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of code & tool calls to use transcription services, ffmpeg, do colorgrading, use the figma mcp, make remotion UI and render it. I didn't touch a video editor.
1
275
AIコストを食いつぶすのは、モデルではなく設計の問題だった トークン消費が急増している。けれど、ビジネス価値は同じペースで増えていない。Uberは2026年分のAIコーディングツール予算を4ヶ月で使い切った。 💡 ポイント ・Deloitteの調査では、回答者の半数以上がデジタル予算の21〜50%をAIに割いている(平均36%) ・Rampの報告では、AI支出が前年比4倍に増加 ・トークン消費は急増しているが、ビジネス価値は同じペースで増えていない 1. 問題の核心:トークン使用量ではなく、トークンあたりの成果で測れ ・重要なのは「どれだけトークンを消費したか」ではなく「消費したトークンあたりどれだけ有用な成果を生んだか」 ・これを「トークンイールド(token yield)」と呼ぶ ・トークン消費はモデル単体ではなく、システム全体の設計で決まる——コンテキスト取得、ツール公開、タスク分解、モデルルーティング、実行の再利用などすべてが影響する 2. 見えないトークンの実態 ・ユーザーが入力する短いプロンプト(例:「このアカウントのチャーンリスクを分析してフォローアップタスクを作成」)は氷山の一角 ・実際のトークン消費にはシステム命令、ツールスキーマ、取得文書、中間推論、実行トレース、メモリが含まれる ・エンタープライズシステムでは、トークンの大半はユーザーが入力したものではなく、タスク周辺の足場(scaffolding)が生成している ・システムが過剰なコンテキストを取得したり、既に完了した作業を繰り返したり、ルーチンワークを高価なフロンティアモデルに押し付けたりすると、品質向上なしにトークン消費だけが増える 3. アーキテクチャのレバー①:コンテキストの質 ・エンタープライズAIの失敗の大半はコンテキストから始まる ・モデルはどのコンテキストが重要かを知らない——与えられたものをすべて処理する ・コンテキストが増えるほど、そのコンテキストに注意を払うコストも増える ・取得が雑だと、モデルは正しい信号に基づいて行動する代わりに、無関係または矛盾する情報を推論するために予算を使う ・解決策はプロンプトにもっとデータを詰め込むことではなく、より良い取得をすること ・Gleanの一元化されたインデックスは、既製のMCPツールと比較して約2.5倍選ばれ、既製ツールは約30%多くトークンを消費した ・既製ツールが正確さで勝った場合でも、約83kトークンが必要だったのに対し、Gleanは約43kトークンで済んだ ・つまり、弱い取得は、より多くのツール呼び出し、より多くの推論ループ、より多くの過剰取得で補償することを強制する ・設計の悪いコンテキストアーキテクチャには「隠れた税金」がある ・よく設計されたコンテキスト層は、モデルに正しい情報をより早く、より使いやすい形で与える——問題を組み立てることではなく、問題を解決することにトークンを使えるようにする 4. アーキテクチャのレバー②:モデルルーティング ・エージェントワークフローのすべてのステップがフロンティア推論を必要とするわけではない ・エンタープライズAI作業の大部分は運用的なもの:検索、取得計画、ツール選択、検証、実行管理 ・これらのステップは重要だが、スタック内で最も高価なモデルを常に必要とするわけではない ・マルチモデルアーキテクチャが重要な理由——目標はより小さなモデルをどこでも使うことではなく、仕事に適したレベルの知性を使うこと ・使用がスケールするにつれてこの区別はより重要になる——すべてのステップがデフォルトでフロンティアモデルにルーティングされると、ルーチンワークにフロンティア価格を実質的に支払っていることになる ・モデル使用の適正化はトークンイールドを改善する最も直接的な方法の1つ:差別化された価値を生み出す場所にフロンティア推論を温存し、作業がより狭くより反復的な場所に特化モデルを使う 5. アーキテクチャのレバー③:継続学習 ・エンタープライズAIシステムは同じクラスの問題を毎回ゼロから解くべきではない ・すべての実行は、次回同様の作業をどのように行うべきかのシグナルを生む:どのツールが有用だったか、どの取得パスが機能したか、どのステップが不要だったか、どの出力が実際にユーザーのジョブ完成に役立ったか ・システムが過去の実行から学ばなければ、同じ探索コストを何度も払い続ける ・過去の実行から学ぶシステムは、冗長な推論を減らし、失敗したパスをスキップし、正しいワークフローに速く収束できる——結果は品質の向上だけでなく、繰り返し作業のコスト低減 ・最高のエンタープライズAIシステムはこの方法で複利を生む——各完了タスクが次の関連タスクの経済性を改善すべき 6. アーキテクチャのレバー④:ハーネス設計 ・エージェントが長期的・多段階の作業を引き受けるにつれて、ハーネスは品質とコストの両方の主要な決定要因になる ・ナイーブなハーネスはアクティブなコンテキストウィンドウを膨張させ続ける——すべてのステップで、より多くの命令、ツール、状態、中間出力を前に運ぶ。コストはワークフローとともに増大。信頼性も低下する ・より良いハーネスはコンテキストを蓄積するものではなく管理するものとして扱う ・ツールを現在のステップにスコープし、適切な場合に特化エージェントに作業を分散し、中間状態をアクティブメモリに保持せず外部化し、各モデルに必要な作業セットだけを与える——目標はより複雑なタスクをサポートすることだけでなく、コンテキストの膨張で崩壊することなくそれらをサポートすること 本当のAIのモートは実行効率にある。
1
3
945
Anthropicエンジニア1人あたりのコード量、2024年比で8倍に。AIが12時間分の作業をこなせるレベルに到達。 Anthropicが社内データを公開。 💡 ポイント ・2026年5月時点でAnthropicのコードの80%超はClaudeが執筆 ・エンジニア1人あたりのコード量は2024年比で8倍に増加 ・Claude Mythos Previewは社員調査で「自分だけで作業するより4倍の成果」と回答 1. 作業時間がここまで変わった ・2024年3月:Claudeは「人間が4分でこなせるタスク」を完了 ・2025年3月:「1時間半かかるタスク」をこなせるレベルに ・2026年現在:「12時間分の作業」まで対応(4ヶ月ごとに倍増のペース) 2. 研究でも人間を超えはじめた ・コード最適化テスト:1年で3倍→52倍の速度改善(熟練エンジニアは4〜8時間で4倍が限界) ・「次に何をすべきか」の判断で人間より良い選択をした割合:51%→64%(2025年11月→2026年4月) ・800件のバグ修正を自律的に完了。人間が対応すれば4年かかる量を単独でこなした 3. 今後の3つのシナリオ ・成長が頭打ちになり、現状の性能が社会に普及していく ・AIが加速的に効率化するが人間が方向性を決め続ける(現状に近い) ・AIが自分の後継モデルを自律的に開発できるようになる(再帰的自己改善)
Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention. anthropic.com/institute/recu…
1
2
219
Findy AI |生成AIの最新ニュースを発信 retweeted
"あわせてPR作成Skillの中からセルフレビューSkillを呼び出すようにして、PRを作るときには必ずセルフレビューSkillを使用する環境に変えました" / これぐらい強制力を持たせてしまってもいいのかなー / “配ったSkillの効果を「定着 × 成果」で測る — Findy AI の活用事例 …” htn.to/4qMEMA1uwZ
3
4
399
AIの世界平均利用量、6.5年前のOpenAI社内トップと同水準に。 当時のトップは月10万トークンで「おそらく世界1位」だった。現在の社内トップは月1,000億トークン。それでもAltmanは「社外にもっと使っている人がいる」と認めた。 💡 ポイント ・月10万→月1,000億トークンで100万倍(6.5年) ・社外に社内トップを上回る利用者が存在 ・2026年初頭まではコスト問題は「全く話題にならなかった」 1. OpenAI社内のトークン文化 ・社内にトークン消費量のランキングが存在し、社員がXで自慢することも ・OpenClaw開発者は1ヶ月で130万ドル(約2億円)分を消費 ・別の社員は30日で6,030億トークン、1週間で2,100億トークンの事例も 2. 他社はコスト管理に動き始めた ・Amazonは社内トークンランキングをすでに廃止 ・UberはCOOが「支出の正当化が難しい」と発言しトークン上限を設定 ・Altman自身も「より少ない費用で価値を届ける方法を模索中」と発言
JUST IN: Sam Altman says AI budgeting has suddenly become a “huge issue” for companies.
1
2
572
AIエージェント活用の「個人技化」「ブラックボックス」を解消する5つの新機能をFindy AI でリリースしました🎉🎉 【今すぐ使える5つの機能】 ・成果あたりのAIコスト・トークン量を可視化 ・セッションログで組織/チーム/個人のAI活用度を分析 ・整備したSkillsが実際に使われているかを定量把握 ・リポジトリ別のハーネス整備状況を一覧化・改善レコメンド ・ハーネス整備度と生産性指標の相関をデータで可視化 個人のばらつきをなくし、組織全体で成果最大化とコスト最適化を両立できる状態へ。 AI駆動開発を加速させたいチームはぜひ👇👇️
Findy AI で5つの新機能をリリースしました! 「うちのエンジニアはAIをどれくらい使っているんだろう?」 「Claude Code、上手く使えてるの?」 という疑問を解決できます! ・AIコスト・トークン量を可視化/改善 ・AIの活用度の分析/改善 ・AIを使いまくってるメンバーの特徴を知れる 他にも、
1
2
7
579
UberがAIコーディングツールの利用を月1,500ドル(22.5万円)に制限との報道。 年換算で年収の約5%に相当。 1. 何が起きたか ・UberがCursorやGitHub Copilotなどのバイブコーディングツール(=AIがコードを自動生成するツール)の利用を月$1,500に上限設定 ・社員の利用が想定以上に膨らみ、AI関連予算を超過したとされる ※Uberは公式発表していない 2. 背景:Uberエンジニアの給与水準 ・エントリー(SE I):約2,900万円($194K) ・中堅(Senior SE):約6,700万円($447K) ・全体中央値:約5,000万円($330K) ・高給の現場でも、AIツール代が経営課題になる規模感
NEW: Uber is reportedly capping employee use of AI vibe-coding tools at $1,500 per month after blowing through its AI budget.
1
1
5
1,322
Uber、人事部門の23%を削減。 「組織が複雑になりすぎた」が理由。 AIリストラではないと明言しつつ、社内AIツールの効率化を理由に採用ペース自体はすでに落としている。 リモート承認済みの従業員も週3出社へ。 💡 ポイント ・人事・採用・職場施設・文化を担う部門が対象 ・全従業員3万4000人のうち1%未満、上位職が多数 ・他社のような「AI投資のためのリストラ」とは明確に線引き 1. AI活用の実態 ・社内AIツールの効率化を理由に、先月から採用全体のペースを縮小 ・エンジニアのAIコーディングアシスタント月間利用率は95% ・削減とは別に、ロボタクシー商業化向けのポジションを含む800以上の求人は継続中 2. 組織的な背景 ・新社長が「責任重複・オーナーシップ不明確」と指摘し主導 ・リモート承認済みの人事スタッフにも週3出社を義務化 ・2023年にも採用部門・子会社で同様の削減を実施済み
Jun 3
Uber Cuts 23% Of Jobs In People’s Division As New President Takes Charge. The Reason Is… ndtv.com/us-markets/uber-fir…
300
AnthropicとPwCが提携を拡大。金融・医療・サイバーセキュリティの現場でClaudeが稼働中。 保険の審査期間が10週間→10日に。 anthropic.com/news/pwc-expan… 💡 ポイント ・保険の審査サイクル: 10週間→10日に短縮 ・セキュリティインシデント対応: 数時間→数分に ・システム改修の納期を最大70%削減 1. PwC社内での展開 ・社内AIアシスタント「ChatPwC」にClaudeを統合済み ・米国チームからClaude CodeとCoworkを展開、数十万人規模に拡大予定 ・3万人のプロフェッショナルを認定トレーニングプログラムで育成 2. 導入済みの現場 ・スポーツ運営: デジタルファン体験とチーム管理業務を刷新 ・COBOL(古いシステムのプログラミング言語)の大規模移行を予定通り進行中 ・停滞していたHR(人事)システムを1週間でプロトタイプ化、2ヶ月以内に本番稼働 3. 今後の注力領域 ・医療: 臨床業務・事務処理の自動化 ・製薬: 治験のサイクル短縮と規制申請の効率化 ・金融・PE(未上場企業投資): 買収審査から統合まで一気通貫で対応
1
1
1
164
コード不要でWebアプリを作る「バイブコーディング」、14分でチャットサイト作成の手順を実例付きで解説。 💡 ポイント ・Claude Codeがコード・ホスティング・バグ修正をすべて自動処理 ・プロンプトに「bypass permissions mode」を設定すると承認なしで完走 1. 実際の手順(7ステップ) ・Claude デスクトップアプリの「Code」タブを開く ・「Bypass permissions」モードを有効化 ・GitHubとVercelを接続(どちらも無料) ・素材ファイル(テキスト・画像)をアップロード ・目的と完成イメージをプロンプトで指示 ・あとはClaude Codeが自動で構築・デプロイ 2. 今回作ったもの ・7本のニュースレターを読み込んだチャットボット ・「Chat with Ruben, about Claude」として公開 ・完成まで約14分、URLも自動生成 3. Claude習得に読むべき7本のガイド(記事内で紹介) ・Claude For Dummies(入門、約5分) ・Claude Cowork(コード不要ユーザー向け、約20分) ・Claude Skills(繰り返し作業の効率化、約15分) ・「自分らしい文体」に調整する方法(約40分) ・AIっぽい文体を避けるためのプロンプト術(約7分)
254
Claude Codeが、タスクに合わせた作業手順を自分で組み立てられるようになった。 「ultracode」とプロンプトに書くだけで起動。コーディング以外にも、リサーチ・セキュリティ分析・コードレビューなど、複数のAIエージェントを並列で動かす処理に向いている。 💡 ポイント ・1つの会話の中で計画と実行を同時にやる限界を超えるための仕組み ・途中で止めても、再開すると続きから動く ・トークン消費が増えるので、単純なコーディングタスクには不要 1. なぜ必要か ・長い作業を1つの会話でやると「途中で諦める」「自分の答えを正しいと思い込む」「最初の指示を忘れる」の3つの問題が起きやすい ・ワークフローは別々のAIに分けて担当させることでこれを回避する ・Bunのコードベース移行(Zig→Rust)もこの仕組みで対応済み 2. 使えるパターン ・複数案を出して競わせ、最良を選ぶ「トーナメント方式」 ・タスクを細かく分割して並列処理し、最後にまとめる「扇型展開」 ・別のAIに答えを批判的に検証させる「対立検証」 ・完了条件を満たすまでループする「条件付き繰り返し」 3. 具体的な使いどころ ・過去50セッションを振り返り、繰り返してきた修正をCLAUDE.mdのルールに変換 ・Slackの#incidentsチャンネル6ヶ月分からチケット未対応の再発原因を抽出 ・80件の履歴書をバックエンドエンジニア採用向けにランク付けしてトップ10を再確認 ・ブログ記事の技術的な主張をコードベースと照合して誤りを検出
Jun 2
Workflows are the biggest upgrade to Claude Code’s capabilities since skills and subagents. I dove deep into it with @sidbid to figure out best practices, examples and more.  I’m particularly excited about the non-technical tasks it enables for Claude Code.
312