楼主: Lyon0898
122 0

Nemotron-Post-Training-Dataset-v2 后训练数据集 [推广有奖]

  • 0关注
  • 7粉丝

已卖:4905份资源

院士

42%

还不是VIP/贵宾

-

威望
0
论坛币
145942 个
通用积分
15193.1197
学术水平
55 点
热心指数
57 点
信用等级
55 点
经验
46233 点
帖子
1858
精华
0
在线时间
438 小时
注册时间
2022-3-14
最后登录
2026-1-4

楼主
Lyon0898 在职认证  发表于 2025-11-26 17:22:06 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Nemotron-Post-Training-Dataset-v2 是英伟达于 2025 年基于既有后训练语料扩展推出的版本。该数据集将 SFT 与 RL 数据扩展到五种目标语言(西/法/德/意/日),覆盖数学、代码、 STEM(科学、技术、工程和数学)、对话等场景,用于提升模型的推理与指令跟随能力;并提供基于元数据的筛选功能与典型子集示例。该数据集服务于 Nemotron-Nano-9B-v2 系列的发布与对齐研究,属于其公开的后训练语料之一,便于用户复现实验与进一步改进。相关论文成果为「NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model」。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Training dataset Train DataS 训练数据集

Nemotron-Post-Training-Dataset-v2.rar
下载链接: https://bbs.pinggu.org/a-8634555.html

368.95 KB

需要: 201 个论坛币  [购买]

磁力链接,36.78G

本附件包括:

  • Nemotron-Post-Training-Dataset-v2.torrent

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 07:35