NVIDIA 发布 Nemotron 3 Super,120B 总参数 / 12B 激活参数。吞吐量比 GPT-OSS-120B 高 2.2 倍,比 Qwen3.5-122B 高 7.5 倍。配备 NVFP4 预训练、LatentMoE 和 MTP 层。
NVIDIA releases Nemotron 3 Super with 120B total / 12B active params. Delivers 2.2x throughput vs GPT-OSS-120B and 7.5x vs Qwen3.5-122B. Features NVFP4 pretraining, LatentMoE, and MTP layers.