Nemotron 3 Ultraが出ましたね。
Nemotron 3 Nano, Super, Ultraとすべてかなり参考になる点が多い上に、LatentMoE, Multi Token Prediction, NVFP4 pre-training, Multi-teacher On-Policy Distillationと盛りだくさんなので、しっかりと理解しきるのには時間を要しそうです。
執筆中のブログでNemotron 3 Super, Ultraで採用されている技術についても触れていく予定なので、そちらもぜひ
NVIDIA Nemotron 3 Ultra is now live!
Frontier accuracy, 5X greater speed, 30% lower cost.
Deploy however you need - on-premise, on the cloud, or at the edge.
Model is live on HuggingFace under the OpenMDW 1.1 license.
youtube.com/watch?v=D8LIIvQV…