We've officially released Qwen3-Swallow and GPT-OSS-Swallow! 🚀 It’s quite an emotional moment for me, as we’ve been working hard on these models since the summer of 2025.
For this release, I was responsible for the continual pre-training (CPT), SFT, and training data refinement across all models. We successfully enhanced the Japanese language capabilities while fully preserving the strong math and coding performance of the base models.
I'll also be giving a talk about this at NVIDIA GTC 2026 in San Jose, CA! See you there!
#SwallowLLM #GTC2026
Qwen3-Swallow、GPT-OSS-Swallowをリリースしました。2025年夏頃からずっと開発してきたモデルなので感慨深いです。
今回も継続事前学習、SFT、学習データの改善を担当させていただきました。
元モデルの高い数学、コード能力はそのままに日本語能力を強化したモデルとなっています。
ぜひ、ご利用ください!!