人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 学道会 › 【学习笔记】开源“穷人版”摘要生成NLP模型：训练成本低 ...

发帖

楼主: ccwwccww

1023 0

[学习笔记] 【学习笔记】开源“穷人版”摘要生成NLP模型：训练成本低，只要1000个样本就能 ... [推广有奖]

13关注
76粉丝

已卖：2468份资源

大师

57%

还不是VIP/贵宾

威望: 0 级
论坛币: 349632 个
通用积分: 193045.9695
学术水平: 202 点
热心指数: 220 点
信用等级: 170 点
经验: 13395 点
帖子: 11028
精华: 0
在线时间: 6041 小时
注册时间: 2008-3-25
最后登录: 2025-7-31

楼主

ccwwccww 发表于 2020-6-14 16:51:50 来自手机 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

开源“穷人版”摘要生成NLP模型：训练成本低，只要1000个样本就能打败人类
BERT、GPT-2、XLNet等通用语言模型可以应付各类任务，比如文本生成、问答。当这些模型对各种语言任务进行微调时，可以达到SOTA性能。
以上这些NLP模型都是“通才”，在面向特定任务时需要微调，训练数据集也十分庞大，非一般人所能承受。

谷.歌发布的“天马”（PEGASUS）模型，专门为机器生成摘要而生，刷新了该领域的SOTA成绩，并被ICML 2020收录。“天马”模型仅使用1000个样本进行训练，就能接近人类摘要的水平，大大减少了对监督数据的需求，创造了低成本使用的可能性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：学习笔记摘要生成 NLP 习笔记训练数据集

[学习笔记] 【学习笔记】开源“穷人版”摘要生成NLP模型：训练成本低，只要1000个样本就能 ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[学习笔记] 【学习笔记】开源“穷人版”摘要生成NLP模型：训练成本低，只要1000个样本就能 ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群