Filter
Exclude
Time range
-
Near
かなり衝撃的だし学びが多い ClaudeCodeの担当者Cursorも使ってるの? ほぼClaudeがコーディングしてるし我々が使っているのと同じもので開発してる 以下、ビデオの会話の要約ByGemini笑 1. Claude Codeの誕生と初期の開発 実際、プルリクエストのほぼ100%(メッセージの作成やコミットなど)はClaudeが書いています。コードレビューについても、現在では大部分をClaudeが行っており、おそらく作業の80%から90%はClaudeが担っています。私たちはClaude Code SDKと /codereview コマンドを使用しています。タスクが少し複雑な場合は、「プランモード(Plan mode)」から始めます。一緒に計画を練り上げ、それから実行を指示します。 インタビュアー: 自己紹介と、Claude Code誕生のきっかけを少し教えていただけますか? ボリス (Boris): Toliaさん、お招きいただきありがとうございます。私はボリスです。Claude Codeのクリエイターであり、Anthropicの技術スタッフメンバーです。Claude Codeの起源は、約1年前のハッカソンプロジェクトでした。最初はコーディング用の製品として意図されたものでも、製品化を考えていたわけでもありません。Anthropicの公開API(現在もClaude Codeが使用しているもの)の使い方を理解するために作りました。APIの感覚を掴み、自分たちでテスト(ドッグフーディング)するためのものだったんです。現在でもClaude CodeはAnthropicの公開APIのみを使用しており、皆さんが使っているのと同じ公開モデルを使っています。ドッグフーディングは成功したと言えるでしょうね。 インタビュアー: 最初からClaude Codeを作る目的で入社したわけではないのですね。入社時はどのチームにいて、どうやってClaude Codeを作り、大量のリソースを投入することになったのですか? ボリス: 私が参加したのは「Anthropic Labs」というチームでした。Anthropicの共同創設者の一人であるベン・マン(Ben Mann)と、初期メンバーであるラフ(Raph)が率いていました。以前Instagramにいた時にも似たようなLabsチームにいて、新しいプロジェクトを立ち上げて「次は何を作るべきか」を模索していました。 AIラボにおけるこの種のイノベーションチームは非常に特殊です。いつでも無限の数のものを作れる可能性があり、「モデルはまだどの製品もカバーしていないあらゆるタスクをこなせる能力がある」という圧倒的な感覚があります。このような状況で、彼らは何をすべきか考えていました。MCP(Model Context Protocol)やClaudeデスクトップアプリも、メンバーは違いますが同じチームから生まれました。 最初はターミナル上のただのチャットアプリでした。ある時、気まぐれでBashツールへのアクセス権を与えてみたんです。ターミナル上でClaudeに「私の音楽プレイヤーをコントロールして」と頼むと、ClaudeはすぐにBashツールを使ってAppleScriptを書き、それを実行して今聴いている曲を教えてくれました。さらに、AppleScriptで音楽の再生・停止までできたんです。これには衝撃を受けました。当時、私はLLMのAPIでツールを利用(Tool Use)したことがありませんでした。テキストを送信してテキストが返ってくるだけだと思っていたモデルが、ツールを使って現実世界と対話したがっていることに気付いたのです。 2. モデルの進化に合わせて製品を作る インタビュアー: モデルの進化が製品にどのように影響を与えているかについてお伺いします。「現在のモデルではなく、6ヶ月後のモデルに向けて製品を作れ」とアドバイスされているそうですが、現在の機能に過剰適合(オーバーフィット)させずに製品の足場(スキャフォールディング)を作るバランスについてどうお考えですか? ボリス: 全くその通りです。「今日のモデル」のために作ってはいけません。3〜4ヶ月後には全く違う能力を持った次のモデルが出るからです。Claude Codeではこれを意図せずとも実践していました。私たちが最初にClaude Codeを作り始めた時はClaude 3.5の時代で、コミットメッセージやコードは生成できましたが、コンパイルエラーやLintエラーも多く、完璧ではありませんでした。 しかし、3.6や3.7と進化するにつれて良くなり、Sonnet 3.5 (Claude 3.5 Sonnet) やOpusが出た時に、突如として全てが噛み合ったのです。モデルとスキャフォールディングが完璧に機能するようになりました。モデルが常に同じ間違いをする場合は、それを修正するための足場を組みますが、私たちは意図的に「生の(Raw)」状態を残すようにしています。例えばモデルが string replace でミスをした場合、あえてユーザーにそれを見せます。モデルに何ができて何ができないのか、その直感を掴んでもらうことが重要だからです。モデルが進化するたびに足場を変更し、不要になったプロンプトやツールは削除しています。「古いシステムプロンプトの半分を削除した」ということもありました。新しいモデルにはそれが必要なかったからです。 インタビュアー: エンジニアとコードの関係はどう変わっていますか? ボリス: 以前は、自分が書いたコードに執着し、「これが正しいやり方だ」と防御的になることもありました。しかし今は、システムプロンプトもClaude Code自体も頻繁に書き換えますし、週に何度もツールを追加したり削除したりします。実験コストが非常に安くなったので、モデルを自由にさせ、自律性(エージェンシー)を与えるべきです。 3. 日常の開発ワークフローと「ターミナル」の復活 インタビュアー: 個人的なセットアップや、ClaudeとCursorをどのように使い分けているか教えてください。 ボリス: ソフトウェア開発のライフサイクル(計画、コーディング、デバッグ、保守)で分けて考えています。 計画 (Planning): Claude Codeを使います。BigQueryサーバーにアクセスさせてデータをクエリし、「コードは書かずにアイデアだけ練ろう」と指示してアプローチを決めます。 コーディング (Coding): タスクに応じてClaude CodeとCursor(またはVS Code)を使い分けます。 デバッグ (Debugging): Claude Codeを使います。MCP経由でPuppeteerを使ってブラウザのエラーログを見せたり、ターミナルでログをtailして直接Claude Codeにパイプ(pipe)してコンテキストを与えます。 保守 (Maintenance): 不要なコードや実験コードの削除などをClaude Codeに任せます。 コーディングのタスクは主に3つに分類しています。 簡単なタスク: 1回のプロンプトで完了するもの。GitHubのIssueで @claude とメンションしてPRを作らせます。 中程度のタスク: ターミナル上で対話しながら進めます。モデルが間違った方向に進みそうなら途中で停止(エスケープ)させて軌道修正します。プランモード(Plan Mode)を使うと成功率が20〜30%から70〜80%に跳ね上がります。 難しいタスク: 事前にMarkdownファイルで計画を立て、それをClaudeに実装させます。最終的にはCursorなどのIDEを開いて自分で微調整します。現在では、私の作業の40〜50%はワンショット(1回の指示)で完了しています。 4. コミットの規律、プライバシー、セキュリティ インタビュアー: 巨大な自動コミットが行われる中、チーム内でどのようにコミットの規律を維持していますか? ボリス: 初期の頃は、私が巨大なPRを直接mainブランチにプッシュしていたので皆から文句を言われました(笑)。規模が大きくなるにつれ、ブランチやPRの使用を徹底し、強力な静的解析やLintを導入しました。Claudeは変更セットを論理的に分割して複数のコミットやPRにしてくれるので、今では非常に焦点の絞られたクリーンなPRが作成されています。 インタビュアー: APIキーやシークレットの管理、セキュリティについてはどうしていますか? ボリス: 基本レベルとしては、モデルのアライメント(安全性調整)に多大な労力を費やしており、悪意のあるBashコマンドを実行しないようにしています。また、プロンプトインジェクションを防ぐための分類器(Classifier)を挟み、Web検索の生の出力をClaudeに直接見せないような中間モデルも用意しています。 ユーザー側でできることとしては、settings.json のDeny(拒否)ルールを使うのが確実です。読み取り(read)を拒否するだけで十分です。また、「Post-hooks(ポストフック)」を使って、モデルにデータが渡る前にシークレット情報をスクラブ(除去)することも可能です。 5. 「サブエージェント(Sub-agents)」という新しい概念 インタビュアー: 話題の「サブエージェント」について教えてください。 ボリス: サブエージェントは、メインのClaudeが呼び出す「子Claude」のことです。メインプロセスを「Mama Claude(ママ・クロード)」と呼び、彼女が特定のサブタスク(コードレビュー、コードの単純化、計画立案など)を委任するために「Baby Claudes(ベビー・クロード)」を生成します。 これは、Redditで「MCPサーバーを使ってPM、デザイナー、フロントエンド、バックエンドのサブエージェントを作った」という投稿を見たチームメンバーがハッカソンで作ったのが始まりです。コンテキストウィンドウやツールがそのタスク専用に絞られるため、非常に効率的です。いずれモデル自体のコンテキスト管理能力が完璧になれば不要になる(非推奨になる)かもしれませんが、現在のモデルの足場としては非常に強力です。 6. 非エンジニア層への広がりと未来のエンジニア インタビュアー: エンジニア以外のメンバーによる、非技術的なユースケースについて教えてください。 ボリス: 驚くべきことに、これまでターミナルに触れたこともなかった人々がClaude Codeを使っています。 デザイナー: FigmaのデザインをClaude Codeに渡し、プロトタイプを作らせています。数回のイテレーションで、エンジニアが書くような本番レベルのコードを生成しています。 データサイエンティスト: BigQueryと接続し、ターミナルから自然言語で高度なデータ分析クエリを自動生成させています。 プロダクトマネージャー (PM): 市場調査のために「20個のリサーチ用エージェントを立ち上げて要約して」と指示し、30分後には完璧なPDFや表形式のレポートを受け取っています。 インタビュアー: 最後に、エンジニアの役割は今後どう変化し、Anthropicではどのような人材を求めているのでしょうか? ボリス: 現在私たちが求めているスキルは、過去のものとは全く異なります。最も重要なのは、知的探求心と誠実さ、第一原理(First principles)から物事を考えられる能力、そして自分が間違っていた時にそれを認められることです。単一の技術スタックにこだわるのではなく、様々なスタックを横断してハックできる能力です。 大企業で成功してきた従来の「エンジニア」というよりは、「科学者」や「ハッカー」に近い人材を求めています。ゼネラリストの復活ですね。一人のエンジニアが10人分の働きをできる今、唯一のボトルネックは「アイデア」だけになっています。
Claude Code creator: "100% of our pull requests at Anrtopic are run by Claude Code. 80–90% of code review too. The feature I’m using the most today is /loops. I’m not prompting Claude anymore - I’m building loops" in 1-hour interview, Boris reveals his setup, which helps him build the #1 coding tool of this year. Worth more than a $500 vibe-coding course.
2
5
9
1,517
Replying to @cjzafir
Is the tools powered by AppleScript?
Yes it’s basically mimicking a terminal session. Bonus points if you have Mac and want to do it via iterm you can use AppleScript to communicate directly with iterm
1
1
29
Browser use, but for terminals. I recorded a fun little goof. Check out the skill if you wanna do something wonkier… Finally, putting ghostty’s applescript support to good use.
1
69
Claude Code - now a billion-dollar product - started as a hackathon toy. It wasn't even meant to be a product. Boris Cherny just wanted to learn Anthropic's API. On a whim he gave the model a basic bash tool and asked it to control his music - it instantly wrote AppleScript, ran it, and started skipping tracks. That was the click: code is how the model wants to reach out and touch the world. "All the model wants to do is use tools and interact with the world." "Don't build for the model of today - build for where it'll be in six months." "Claude writes almost 100% of our pull requests - and does most of our code review." ~40 min, free. the accidental origin of the tool that's rewriting how software gets built ↓
6
2
31
705
以前のAppleScript (ここは詳しくないのでご容赦…) と同様なGUI経由でリモコンするUIオートメーションも、マイクロソフトの提供するGUIではサポートされてたりされてなかったりします。(電源設定が対応しているかは未確認…) learn.microsoft.com/ja-jp/wi…
1
1
14
どういうことかというと スクリプト右クリックでKM用にコピーすると、マクロxmlとしてコピーされ、Keyboard Maestroの編集画面でペーストすればexecute AppleScriptマクロとしてそのままペーストできる、つうちょっとした時短です。
1
284
我让自动化助手做了一个无敏感信息的小视频,演示 AppleScript 调用本机能力实现自动化:查询系统状态、生成内容、控制 Chrome、减少手动点击。#AppleScript #Automation
1
9
【話題】 Claude Codeの開発者が、Y Combinatorのポッドキャストで開発の裏側を語った😳 設計の起点と、Anthropicが賭けた構造が語られている👇 x.com/0xCodez/status/2063682… ・最初はAnthropicのAPIを試すためだけの小さなターミナルアプリが出発点だった ・Claude 3.5がAppleScriptを自分で書いてMacを操作した瞬間に、初めて「AGI感」を覚えたとのこと ・「今のモデルではなく、6ヶ月後のモデルが得意なことを先取りして作る」を原則にしている Claude Code・MCP・デスクトップアプリは「コーディング→ツール使用→コンピュータ操作」というAnthropicのAGIへの設計思想から生まれている この原則が通るなら、いまのClaude Codeは途中経過にすぎない
Codez

3
1
13
5,887
こないだは、AppleScriptもかいてくれたよ。
7
Replying to @jxnlco
IME codex often runs into technical issues with browser/chrome and gives up way too quickly, falling back from browser -> chrome -> computer use in an annoying way; it'll also fall back to using AppleScript or other stuff that steals focus too soon. what would make it better (imo): - figure out how to get credentials (e.g. icloud keychain) & passkeys into in-app browser so it can do all tasks authenticated inside codex - make the model WAY more persistent when it runs into technical issues with browser/chrome, instead of immediately giving up. - optionally add recovery skills for browser/chrome tooling (model has to discover this from first principles all the time, i see it doing random one-off scripts in node constantly when stuff is broken. it usually does not solve the problem). - give codex clear preference rules for fallback (first browser, then chrome, only then computer use if all other stuff fails) - strongly discourage codex from using stuff like AppleScript or other tools that steal focus without user instructions - make multiple browser windows available in the harness; currently it can't e.g. monitor 2 windows at same time or compare 2 windows. - make all this tooling available in EU too ;) it's really cool stuff and the team cooked. but it can be even better too!
131
He built Claude Code in three days in his wife’s dark office, surrounded by her basket research. Anthropic is now worth $160 billion. Boris taught himself to code at thirteen. Needed a website to sell Pokémon cards. Wrote it himself. His grandfather used punch cards. Last November, Boris wrote his last line of code by hand. He still codes every day. He asked Claude what song was playing in his music app. Claude wrote a small AppleScript, ran it, came back with the right answer. Boris didn’t program it to do that. It figured out the tool on its own. That was the day the chatbot became an agent. Claude Code launched to two Slack reactions. Flatlined for three months. Dario asked why Boris was forcing employees to use it. “We’re not forcing anyone,” Boris said. “Everyone just decided to.” May hit. Usage went exponential. Now Claude writes 100% of Claude Code. Over 90% of all code at Anthropic. Boris hasn’t touched a line since November. A journalist asked what he calls himself now. “Whether I write the code or an agent writes it, that’s not the question. What are you building and why.” His grandfather computed with punch cards. Boris wrote TypeScript textbooks. The tool he built in three days now writes itself.
8
103
Jun 12
ふぅ、やっとAppleScriptに対応できた。元AppleScript使いとしては、これでようやく一区切りかな。TextViewを完全に自作している関係でText Suiteの対応は困難だけど、まあそんなに使わないだろうしいいか。 Ganpiの動作を制御する機能としてはもう十分なレベルだけど、汎用メソッドはどうするかな…
1
61
Jun 12
AppleScriptについては、一般的なアプリケーション・ドキュメントの動作、ドキュメントの文字コードやフォントなどのパラメータの操作、テキストの読み書きや正規表現を利用可能な検索・置換、ユーザーマクロの実行などを実装しています。
1
48
Replying to @kentcdodds
Gonna try experiment with Apple Pro Apps SDK to see if harness I’m working on can do more than just XML/AppleScript wrangling for library/project generation - (obviously that’s only FCPX, Logic Pro etc) - you using Adobe?
22
The attack surface is already real: • MCP tool poisoning — hidden instructions inside a tool's description (CVE-2025-54136) • Git MCP abusing smudge/clean filters for RCE • Cursor hit by indirect prompt injection → AppleScript exec Your agent trusts it by default.
42
Replying to @KanoiKrishnav
True However, the difference here would be that they own the OS layer on which this tool works so it’s impossible for someone else to build a better version of it Like Apple could remove Applescript itself (which this tool uses to use the computer)
1
1
18
Replying to @mikeliu93980295
你是指 AppleScript?
1
1
195