Gemma 4 QAT MPTでの実行、unslothがモデルを提供していて、hfのモデルのページにあるllama-serverのコマンドでそのまま実行できてる(ひとまずllama-cliで動かしてみている)
EVO-X2(Ryzen AI Max 395)での実行も、llama.cppのリリースページにあるビルド済みバイナリで実行できている
試せそう
Gemma 4 QAT MPTでの実行、unslothがモデルを提供していて、hfのモデルのページにあるllama-serverのコマンドでそのまま実行できてる(ひとまずllama-cliで動かしてみている)
EVO-X2(Ryzen AI Max 395)での実行も、llama.cppのリリースページにあるビルド済みバイナリで実行できている
試せそう