驚き屋になると、40時間ほど前にリリースされたモデルを3日間使える。
Claude Fable 5を3日間使った感想。これは別物だなと。
・4月発表のMythosと同じ基盤モデル でサイバー能力が高すぎて重要インフラ企業のみに限定提供されていた知能を、安全装置つきで一般開放
・Haiku/Sonnet/Opusの上に新設された第4のクラス ・コーディング、ナレッジワーク、ビジョンの主要ベンチマークをほぼ総なめ
・自分で計画し、進捗を確認し、軌道修正しながら『数日単位』のタスクを完走
・タスクが長く複雑なほど他モデルとの差が開く
・論文の図表やPDF内の表から正確に数値を抽出
・自分でテストを作り、成果物を自己検証してから返してくる
『プロンプトに答えてもらう』から『仕事を預けて検証済み成果物を受け取る』になってきたのでいよいよ動きが人間的になってきたシンギュラリティを感じる。