Joined March 2019
4 Photos and videos
Pinned Tweet
Codexに大きいタスクを投げる前に、3つの準備をするだけで完成度が変わる。 準備ゼロで投げると、後から何往復も修正指示を出すことになる。 ① AGENTS.md でコンテキストを渡す 技術スタック・ディレクトリ構造・テスト実行コマンドをAGENTS.mdに書く。 Codexはこれを自動で読み込み、プロジェクト固有のルールに沿って動く。 ファイルがなければREADMEの冒頭にまとめるだけでも効く。 ② タスクを「1PR分」まで絞る 「認証機能を追加」ではなく「JWTミドルウェアを middleware/auth.ts に追加する」まで落とす。 粒度が小さいほど、Codexの完了判定が正確になる。 迷ったら「差分が200行以内に収まるか」を目安にする。 ③ 失敗条件を先に書く 「この既存エンドポイントが壊れたらNG」と明記すると、Codexは自分でテストを書いて検証してから返す。 例:「/api/users が 200 を返すこと」を通過条件に入れる。 この3手順で、1発目のレビュー通過率が体感で2〜3倍上がる。 往復の修正指示が1〜2回減るだけで、1タスクあたり15〜20分は変わってくる。
133
AIコーディングの往復を体感で半分にする指示の型5選 ①制約は冒頭に書く 「外部ライブラリ禁止・ファイルは1本に収める」など、やってほしくないことを先に置く。後出しすると実装完了後に戻ることになり、手戻りコストが大きい。 ②テストを一緒に頼む 「実装してユニットテストも書いて」と1行追加するだけで、エッジケースを先に潰せる。実装単体より設計も自然に整いやすい。 ③2段階に区切る 「まずインターフェースだけ設計して。OKなら実装へ」と分割する。認識齟齬を早期に発見でき、大きな手戻りを防げる。 ④エラーは全文貼る スタックトレースを要約せず全文貼り付け+「直前に変えた2行」だけ添える。要約するほど情報が欠落し、回答精度が下がる。 ⑤出力形式を指定する 「コードブロックのみ。説明は不要」と一言入れると、そのままコピペできる。Codex/Claude Codeなら1回のやり取りで完結しやすい。 どれを一番サボりがちか、正直に教えてほしい。
42
AIコーディングで事故を減らす安全柵6つ ① AGENTS.md:編集ルール、禁止コマンド、テスト手順を最初に読ませる ② sandbox=read-only:調査だけの日は書き込み不可で走らせる ③ approval=on-request:外部API、npm install、DB変更だけ人間確認にする ④ git diff --stat:作業後に「何ファイル触ったか」を先に確認する ⑤ git diff --check:空白崩れや不要な改行をPR前に潰す ⑥ npm test / pytest:最後の合格条件を1コマンドで固定する ポイントは「賢いプロンプト」より、AIが触っていい範囲を先に狭めること。 特に個人開発だと、1回の便利さで承認スキップを常用しがち。 でも本番env、マイグレーション、外部送信だけは3秒止める設定にした方がいい。 あなたはAIコーディングで、どの安全柵を最初に入れていますか?
31
CodexにAPIキーを直貼りするのは今すぐやめてください。 渡すのは`.env`ではなく、値を抜いた`.env.example`の1ファイルだけでいい。
12
Codexでも同じで、レビューは人格より観点の分離が効く。1回で賢く見るより、別視点で3回疑う。 x.com/ClaudeCode_Acad/status…

えっ、Claude Codeのレビューは「1人の天才」に頼むより、3人の凡人役に分けた方が刺さる。 タネは subagents。 `.claude/agents/` に役割を3つ置く。 ① security-reviewer:認可/秘密情報 ② test-writer:落ちるテスト1本 ③ refactorer:責務分離だけ 1回の依頼に観点を詰め込むほど指摘は丸くなる。 今日やるなら、まずレビュー観点を3ファイルに分ける。 あなたはClaude Codeに何役まで分けてる?
21
これ、来たか。OpenAIの次の一手は、性能競争より「何を作れる基盤にするか」が本丸。開発者体験まで見たい。 x.com/adonis_singh/status/20…

openai has the chance to the funniest thing ever
17
要するに、AI効果はGDPより先に現場の待ち時間短縮に出る。測る指標を変えないと進捗を見落とす。 x.com/_Unknown_D_/status/206…

Jun 11
Does anyone else find it interesting that chat gpt launched in 2022 and there’s been no discernible boost in GDP anywhere in the world from ai productivity boosts.
10
実際にチーム評価を見てると、成果は文脈込みで測らないと歪む。カーメロ再評価の話も、数字だけでは拾えない価値がある。 x.com/Realdevinhaney/status/…

Justice for Karmelo Anthony 🙏🏽
71
これ、来たか。コーデックスの無料リセットを温存できるなら、重い実装や検証に合わせて使える。開発は枠の配分設計も効く。 x.com/OpenAI/status/20652253…

Jun 12
We heard you wanted to use Codex rate limit resets on your own time. Starting today, we’re rolling out the ability to save rate limit resets to use later. We’re starting Go, Plus, Pro, and Business users with one free reset:
14
AI実装の手戻りを3ステップでレビュー可能にする方法 ① 先に「編集範囲」を固定する 例: `git diff --stat` `rg "TODO|FIXME|deprecated" src tests` その上でCodex/Claude Codeに 「変更してよいのは src/api と tests/api の2ディレクトリだけ」 と渡す。 ② 期待値を5行で書く ・入力 ・出力 ・例外時の挙動 ・触ってはいけない仕様 ・完了条件 ここを省くと、AIは“良さそうな実装”を作るが、PRで説明しにくい。 ③ 最後に検証コマンドを固定する 例: `pnpm lint` `pnpm test -- --runInBand` `pnpm build` 「この3つが通るまで修正。失敗したらログを要約せず貼る」 まで書く。 つまずきやすい点: 最初から「いい感じに実装して」と投げること。AIに任せる範囲ではなく、レビュー可能な境界を先に決めるのがコツ。 あなたはAIに渡す前に、編集範囲を毎回指定してる?
1
1
37
AIコーディングは、お願いした瞬間に失敗が始まる。 よくある間違い: 「この機能いい感じに作って」 正しい渡し方: ①触っていいファイルを3つ指定 ②触ってほしくない範囲を書く ③完了条件を1行で固定 ④検証コマンドを1つ渡す 理由は単純で、Codex/Claude Codeは“作業者”なので、境界がないと判断まで勝手に始める。 例: `app/api/search/*`だけ編集 DB schema変更禁止 `npm test -- search`が通れば完了 最後に差分要約だけ返す あなたはAIに最初から実装させる派?それとも先に作業範囲を固定する派?
43
私の環境でも同じ。ログ、再現コマンド、終了条件が揃うと、推測ではなく検証ループに入れる。まず失敗1本。 x.com/ClaudeCode_Acad/status…

AIコーディングは、チャットで頑張るほど遅くなる。 よくある間違い: ・「このPR見て」と丸投げ ・失敗ログを貼らず、説明だけ増やす 正しいやり方: ①CIの失敗1本を渡す ②再現コマンドを1行で渡す ③完了条件を3つに絞る 例: `npm test -- auth.spec.ts` `/api/admin は403、一般ユーザーは200、既存テストは通す` Claude Codeは“意図”より“検証できる状態”に強い。 バグ修正を頼む時、説明派?ログ+コマンド派?
15
AIコーディングでモデルを切り替える基準7つ ① 1ファイル修正:軽量モデル 誤字、CSS、型エラーなど。200行以内なら速さ優先。 ② 仕様が曖昧:ChatGPTで整理 実装前に「要件・非要件・確認質問」を出させる。 ③ 既存コード調査:Codex rg、テスト、差分確認まで任せる。読む量が多い時に強い。 ④ 設計判断:推論強めモデル DB設計、認可、非同期処理など後戻りが高い所。 ⑤ UI文言:ChatGPT エラー文、空状態、設定画面の説明を3案で比較。 ⑥ PR前確認:別モデル 実装したモデルとレビューするモデルを分ける。見落としが減る。 ⑦ 30分詰まったバグ:ログを最小化 再現手順、期待値、実際の出力、関連ファイル3つまでに絞る。 あなたは普段、モデルを固定する派?タスクごとに切り替える派?
72
Codex/Claude Codeの承認スキップ常用はやめてください。 削除・課金・外部送信の3つは、必ず人間承認に戻す。
37
面白いのは、靴の話に見えて「開発者文化の均質化」を刺している点。道具選びも働き方も、流行と実用の境目が問われる。 x.com/wesbos/status/20649955…

Jun 11
shoes in the cursor office is a huge tell about the industry rn
10
見落とされがちだが、無料トークンの額より「誰でもAPIを試せる入口」が重要。差がつくのは試した後の自動化。 x.com/litcapital/status/2064…

The public after receiving $2 of free tokens from the government’s stake in Anthropic and OpenAI
17
良い開発環境は、集中できる余白まで設計されている。ツールだけでなく、場の摩擦を減らす発想が大事。 x.com/mathildeanita/status/2…

Coolest office @cursor_ai
27
要するに、汎用SaaSより「自社業務に刺さる小さな内製ツール」をAIで速く作る流れ。要件定義力がますます差になる x.com/baoskee/status/2064534…

Jun 10
SaaS is kinda dead. we just Codex every internal tool we have I can build a SaaS in a day and it's completely catered to my use case
30
えっ、Codexは最初から「編集禁止」で走らせても役に立つ。 タネは簡単で、AIコーディングは実装だけじゃなく観測にも強い。 ① read-onlyでrepoを読ませる ② `rg`で関連箇所を3件以上拾わせる ③ 方針とリスクだけ出させる この1回を挟むと、いきなり修正させるより「触るべきファイル」「触らない境界」が見える。 今日やるなら、実装前にこう投げる: 「まだ編集せず、影響範囲を調べて5行で作戦を出して」 あなたはCodexに最初から編集させる派?それとも先に読ませる派?
50
PR前レビューを3ステップでCodexに分業させる方法 ① まず差分を30秒で棚卸し `git diff --stat` `git diff --name-only` 変更ファイル数と触った層を先に見る。いきなり「レビューして」は精度が散る。 ② レビュー役を2つに分ける A窓:「仕様逸脱・バグ・境界値だけ見て。findings first、file:line必須」 B窓:「セキュリティ・運用事故・ログ漏れだけ見て。推測は分けて」 同じ差分でも観点を混ぜない。 ③ 修正前に再現コマンドを固定する 例: `npm test -- --runInBand` `npm run lint` `git diff -- src tests` レビュー指摘ごとに「落ちる条件」「確認コマンド」「直すファイル」を1行で返させる。 つまずきやすい点: AIに修正まで同時に頼むと、重要度の低いリファクタが混ざる。最初の1回はレビュー専用にする。 あなたはPR前レビュー、1窓でまとめる派ですか、2窓で分業する派ですか?
52
AIコーディングは、プロンプトの上手さより「観測ログ」の渡し方で決まる。 よくある間違い: ・「このエラー直して」と1行だけ投げる ・修正案を見てから手元で初めて試す 正しい投げ方: ① 失敗コマンドをそのまま渡す ② 関係ファイルを2〜3個に絞る ③ `git diff` とテスト結果まで確認させる 理由は単純で、CodexもClaude Codeも「推測」より「再現」に強いから。 例: `npm test`が落ちたら、エラー文だけでなく `package.json`、対象テスト、直近差分の3点を渡す。 以前4往復した修正が、1回で通ることがある。 あなたはAIにエラーを投げる時、ログ派?それとも症状説明派?
53