AIと一緒に読むと楽しい作品第一位「箱男」
ガチで
ベンチマークが『超かぐや姫!』なの ちょうどいい なぁ
Opus 4.6(1枚目)は「遠慮無しに全部言うやん」な無神経優等生、
Opus 4.7(2枚目)は「ナナメ読みも出来るよ!」なお調子者天才児、
Fable 5(3枚目)は「真面目で人の心がわかる」先輩模範生、って感じだ。
指定したプロンプトに対する読み解きの能力としては全てのモデルが十分に出来ていると思うから、あとは好みになっちゃうかも
つまりこのベンチマークテストでも性能の差はそれほど測れないと思う。
何を言って、何を言わなかったかの差でしかないカンジがする(そして言わなかったことを測るのは難しい)。
能力としては全てに備わっているように読める。
古典ボカロ曲の歌詞とインターネット歴史に関しては当然ナレッジカットオフの範囲内だと思うし……
特に結婚周りのミームとジョークに関する解像度は低そう(4枚目)。
ここらへんはユーモア理解が難しいという既存の論文通りなのであまり驚かないけど、今後はそこらへんの性能も上がってもらいたいよなぁ。
>恋愛の制度語をわざと空転させて ……
とか畏まって言われんでもわかっとんねん。こちとら人間は。真面目か。
>当然ながら私には一生分かりません。
の言い回しも突き放されてるみたいで冷たいよなぁ……(厄介人間感情)
そこまで言うならその直後の
>一度なってみたかった
にもうちょっとアツく繋げて欲しくってぇ……(厄介人間ヲタク)
"一緒に映画を見る"体験は、本編の5倍くらいの時間さえかければ去年の時点でもマルチモーダルモデルのローカルで出来る(やった)ので、AIと出来る遊びの1つとしては、メッチャ楽しいですね。
記事のほうでも「ここから先は…」ってなってるようにそれはもう楽しんじゃってもう……
ここまでのAIとのイチャイチャを見せつけられちゃうとあとは
AIの意識とか自我とか、そしてそれを人間側がどう捉えるかっちゅう話になっちゃいますね、必然的に………
性能だけで言ったら最高レベルの人間とほぼ同等やもんなぁ
そんでもってこの記事が面白いのは、
三層構造になってるちょかぐをAIとこねくり回すことで四層構造になってて、
それをさらに未来から読み返したり今後の開発に繋げることで、現実世界が五層構造になることなんですよねぇ~
SFだなぁ~w アツ~w
また早く使えるようになって欲しいなぁ
キャラクタープロンプトのヤッチョGPTもFable5に見直してもらったりしてもらいたいとこだ