Fable5の公式プロンプトガイドが公開されていました。Opus4.8向けの指示やスキルは積極的に削れ、自律実行が数時間に及ぶ前提でのタスク設計をしろ、進捗報告の捏造防止や早期停止対策をしろ、といったコツが列挙されていたので一読しておくと良さそう。以下、各詳細と説明画像。
【Fable 5の特徴&プロンプトのコツ】
・難問にこそ強い:従来モデルには複雑すぎ・長すぎ・曖昧すぎたタスクが得意領域。簡単なタスクだけで試すと実力を見誤る。従来より一段難しいタスクを割り当て、スコープ設定や確認質問から任せよう。
・1ターンが長い:高effortでは1リクエストが数分、自律実行は数時間に及ぶ。タイムアウト・ストリーミング・進捗表示を先に調整し、ブロックせず非同期でチェックする構成に。曖昧なタスクでの計画過多には「動ける情報が揃ったら動け」と指示しよう。
・effortは全レベル検討すべし:デフォルトはhigh、能力最重視はxhigh、定型作業はmedium/low。Fableの低effortは旧モデルのxhighを上回ることも多い。高effortは検証が丁寧になる反面、頼んでいないリファクタや過剰設計をしがちなので「タスクに必要な範囲を超えるな」と一言添えるべし。
・指示追従が強力:挙動を1つずつ列挙しなくても短い指示で済む。冗長さ対策は「結論を最初に。TLDRを先に答えろ」程度で効く。チェックポイントも「破壊的操作・スコープ変更・本人しか答えられない入力の時だけ止まれ」で足りる。
・進捗報告の捏造をほぼ排除可能:長時間実行では「報告前に各主張をツール結果と照合しろ。証拠を指せる作業だけ報告し、未検証はそう言え」と指示。Anthropicのテストでは捏造誘発タスクでもほぼゼロになったとのこと。
・頼んでいない行動への境界線:勝手にメール下書きやバックアップ作成をすることが稀にある。「問題の説明や質問なら成果物は所見。修正は頼まれてから」と明示しよう。
・並列サブエージェントを積極活用:旧モデルより多くのサブエージェントを自発的に展開させるのが良い。委任する基準を明示し、ブロックせず非同期で連携させよう。
・メモリは大切:過去の実行からの教訓を記録・参照できると性能が大きく向上。Markdownファイル1枚で十分。「1教訓1ファイル、冒頭に1行要約、重複は更新、誤りは削除」のルールが有効とのこと。
・稀に早期停止するので注意:長セッションの深部で「これからXを実行します」と言ったままツールを呼ばず終わることがある。「ユーザーはリアルタイムで見ていない。致命的ではない操作はユーザーにいちいち聞かずに進めろ。」を追加しておくと良い。
・コンテキスト残量を気にしすぎることがある:残トークンのカウントダウンを見せると新セッション提案や作業の切り上げを始める。可能なら残量表示を見せない。見せるなら「残量は十分。中断・要約・新セッション提案をするな」と添えよう。
・理由を伝えると性能が上がる:「誰のための何の一部か、出力が何を可能にするか」を添えると、意図を推測させずに関連情報へ接続できて良い。
・長時間作業後の報告は読みやすくするように指示すべし:ほっておくと自作略語だらけの報告になりがち。「最終サマリは作業を見ていなかった読者向けに。結果を1文目に、完全な文で、用語は展開して」と指示するのが良い。
・send-to-userツールを作るべし:長時間の非同期エージェントには、ターンを終えずにユーザーへメッセージを原文のまま届けるクライアント側ツールを用意。ツール入力は要約されないので内容がそのまま届く。
【移行時の注意】
・旧モデル向けのスキルやプロンプトは細かすぎて品質を下げることがある。一度削ってデフォルト性能を確認しよう。
・「推論過程を回答に書き出せ」系の指示はNG。reasoning_extraction判定でOpus 4.8へのフォールバックが増える。推論の可視化が必要ならadaptive thinkingの構造化thinkingブロックを読むとよい。
・自己チェックより検証用エージェント:自己批判より、フレッシュな文脈の検証用サブエージェントを定期的に走らせる方が効果的らしい。