軽率なツイートが伸びてしまったのでしっかり調べた情報を追加します。
まずKimiがFableを蒸留するのは無理でした。
蒸留にはlogitやsoftmaxのパラメータを取得する必要がありますがFableのlogitはAPIで公開されていなかったのでこの線は無さそうです。
できるとしたらFableの出力データで学習する合成データ系のアプローチですが、その筋の学習は時間がかかるため辻褄は合わないです。
また、Claudeは競合企業に対して性能を下げるアプローチを取っていたようです。
wired.jp/article/anthro…
私が蒸留したと疑ってしまった理由は、今年の2月にKimiやDeepSeekが複数アカウントを作成して不正にClaudeを蒸留した疑惑があったからです。
anthropic.com/news/detecting…
不正と言っても利用規約違反という意味で、法律違反かどうかは判断が難しくグレーゾーンだと言えます。
またKimiはしっかり技術をもったスタートアップ(ユニコーン)でMoE学習やAgent Swarm、RLなどの技術的積み上げをしっかりしています。これは彼が指摘している通りです。
x.com/sugimoto_ec/st…
「Fableを一瞬で蒸留して急成長」は間違いでMoonshotの方々に失礼な言い方だったと思います。
「過去のClaude等への蒸留疑惑+研究投資」が妥当な見立てです。