198 0

[经管数据集] 北京大学 DeepSeek-R1 \Kimi 1.5 及类强推理模型开发解读 [推广有奖]

  • 0关注
  • 15粉丝

已卖:2165份资源

学科带头人

75%

还不是VIP/贵宾

-

威望
0
论坛币
266 个
通用积分
73.8514
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
16031 点
帖子
479
精华
0
在线时间
3594 小时
注册时间
2020-11-11
最后登录
2025-12-20

楼主
微信1079718670 在职认证  发表于 2025-2-27 15:46:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
北京大学 DeepSeek-R1 \Kimi 1.5 及类强推理模型开发解读
《DeepSeek-R1\Kimi 1.5 及类强推理模型开发解读》报告详细解析了 DeepSeek-R1 及其相关强推理模型的开发过程、技术创新及未来发展方向。报告围绕强化学习(RL)在大语言模型推理中的应用,探讨了 DeepSeek-R1 Zero 和 DeepSeek-R1 在无需监督微调(SFT)情况下,通过 纯强化学习 提升推理能力的创新性方法。

DeepSeek-R1及类强推理模型开发解读.pdf (9.01 MB, 需要: RMB 10 元)


微信截图_20250227154525.png 微信截图_20250227154540.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:kimi 模型开发 deep 北京大学 seek

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 19:10