人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 学道会 › 【学习笔记】史上最大AI语言模型——GPT-3又迭代了，现在 ...

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: ccwwccww

395 0

[学习笔记] 【学习笔记】史上最大AI语言模型——GPT-3又迭代了，现在有1750亿个参数。45T ... [推广有奖]

13关注
76粉丝

大师

56%

还不是VIP/贵宾

威望: 0 级
论坛币: 357397 个
通用积分: 193114.8414
学术水平: 202 点
热心指数: 220 点
信用等级: 170 点
经验: 13352 点
帖子: 11052
精华: 0
在线时间: 5823 小时
注册时间: 2008-3-25
最后登录: 2024-9-21

楼主

ccwwccww 发表于 2020-6-1 17:33:43 来自手机 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

史上最大AI语言模型——GPT-3又迭代了，现在有1750亿个参数。45TB数据，会编故事，还会三位数加减法
OpenAI表示，通过GPT-3，他们证明了无需梯度更新，无需微调，规模更大的语言模型就可以大大改善无关任务和小样本（few-shot）学习的性能，达到最先进微调方法的水准。
在部分任务中，甚至超越了最先进微调方法。
达到这样的效果，不需要梯度更新，不需要微调。只需要指定任务、展示少量演示，来与模型文本交互，就能使其完成任务。
这样一来，一方面，对于新任务，就不需要重新收集大量带标签的数据。另一方面，可以避免微调阶段出现过拟合，导致模型泛化能力下降的问题。而实现的关键，总结起来就是：大力出奇迹。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：学习笔记习笔记 Shot Open Few

[学习笔记] 【学习笔记】史上最大AI语言模型——GPT-3又迭代了，现在有1750亿个参数。45T ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

[学习笔记] 【学习笔记】史上最大AI语言模型——GPT-3又迭代了，现在有1750亿个参数。45T ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群