[经管数据集] 北京大学 DeepSeek-R1 \Kimi 1.5 及类强推理模型开发解读 [推广有奖]

0关注
15粉丝

已卖：2237份资源

学科带头人

83%

还不是VIP/贵宾

威望: 0 级
论坛币: 266 个
通用积分: 73.7746
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 16150 点
帖子: 493
精华: 0
在线时间: 3733 小时
注册时间: 2020-11-11
最后登录: 2026-4-19

楼主

微信1079718670

发表于 2025-2-27 15:46:52 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

北京大学 DeepSeek-R1 \Kimi 1.5 及类强推理模型开发解读
《DeepSeek-R1\Kimi 1.5 及类强推理模型开发解读》报告详细解析了 DeepSeek-R1 及其相关强推理模型的开发过程、技术创新及未来发展方向。报告围绕强化学习（RL）在大语言模型推理中的应用，探讨了 DeepSeek-R1 Zero 和 DeepSeek-R1 在无需监督微调（SFT）情况下，通过纯强化学习提升推理能力的创新性方法。

DeepSeek-R1及类强推理模型开发解读.pdf (9.01 MB, 需要: RMB 10 元)

2025-2-27 15:46:39 上传

需要: RMB 10 元 [购买]

微信截图_20250227154525.png