楼主: Kaka-2030
67 0

[其他] Towards Theoretically Understanding Why Sgd Generalizes Better Than Adam in ... [推广有奖]

  • 0关注
  • 2粉丝

已卖:128份资源

院士

4%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
52.0007
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
42508 点
帖子
2093
精华
0
在线时间
1106 小时
注册时间
2024-7-18
最后登录
2026-1-22

楼主
Kaka-2030 发表于 2025-8-8 08:23:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Towards Theoretically Understanding Why S GD
  Generalizes Better Than A DAM in Deep Learning

   Pan Zhou , Jiashi Feng , Chao Ma , Caiming Xiong , Steven HOI , Weinan E
   
     Salesforce Research,  National University of Singapore,  Princeton University
  {pzhou,shoi,cxiong}@salesforce.com elefjia@nus.edu.sg {chaom@, weinan@math.}princeton.edu

                       Abstract
     It is not clear yet why A DAM-alike adaptive gradient algorithms suffer from worse
     generalization ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Theoretical Generalize Understand Theoretic Towards

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 02:15