Nemotron 3 – 英伟达推出的最新开源AI模型系列，提升推理的准确性和适应性。

406 00

英伟达发布了 Nemotron 3 系列开放模型，共三种规模，分别为 Nano、Super 和 Ultra，支持开发者大规模构建和部署可靠的多智能体系统。Nemotron 3 Nano 拥有 300 亿参数，通过优化推理成本，实现高达 4 倍于前代的吞吐量，适合软件调试、内容总结等任务。Nemotron 3提供海量训练数据和开源工具，助力开发者快速构建和部署专业化的 AI 系统，推动多智能体 AI 的发展。

高效推理：Nemotron 3 Nano 拥有 300 亿参数，通过混合专家混合（MoE）架构，实现高达 4 倍于前代的吞吐量，显著降低推理成本。
多智能体协作：Nemotron 3 Super 和 Ultra 分别具备 1000 亿和 5000 亿参数，支持复杂的多智能体应用，能处理需要深度推理和战略规划的任务。
长文本处理能力：Nemotron 3 Nano 支持 100 万字的上下文窗口，能更好地处理长文本任务，保持信息连贯性。
高精度推理：通过先进的强化学习技术和多环境并发训练，Nemotron 3 在准确性方面表现出色。

混合专家混合（MoE）架构：Nemotron 3 Nano 采用独特的混合 MoE 架构，通过动态激活部分参数（如 Nano 模型每次激活最多 30 亿参数），在保持高效计算的同时，实现更高的吞吐量和更低的推理成本。
强化学习与多环境训练：模型通过先进的强化学习技术，在多个环境中进行并发训练，提升推理的准确性和适应性。
高效训练格式：Nemotron 3 Super 和 Ultra 使用 NVIDIA 的 4 位 NVFP4 训练格式，显著降低内存需求，加速训练过程，同时保持与高精度格式相当的准确性。
大规模预训练数据集：提供包含 3 万亿 token 的预训练、后训练和强化学习数据集，为模型提供丰富的推理、编码和多步骤工作流示例，支持领域专业化。