楼主: 2019hansi
502 0

[其他论文] 基于强化学习的生成式对话系统研究 [推广有奖]

  • 3关注
  • 4粉丝

等待验证会员

院士

46%

还不是VIP/贵宾

-

威望
0
论坛币
14 个
通用积分
86.6097
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
40511 点
帖子
1777
精华
0
在线时间
816 小时
注册时间
2019-6-4
最后登录
2025-12-31

楼主
2019hansi 发表于 2023-5-15 09:58:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1 论文标题:基于强化学习的生成式对话系统研究

2 作者信息:颜 永, 白宗文*:延安大学物理与电子信息学院,陕西 延安

3 出处和链接:颜永, 白宗文. 基于强化学习的生成式对话系统研究[J]. 数据挖掘, 2023, 13(2): 185-193. https://doi.org/10.12677/HJDM.2023.132018

4 摘要:构建一个回复多样性的开放型对话系统模型,以尝试解决对话系统在回复过程中回答单调的问题。提出一种融合双向长短期记忆神经网络和强化学习模型的生成式对话方法。首先,采用多种类型过滤器对语料库进行预处理,使对话语料库能够被多样化探索到;其次,为了增加对话系统回复的多样性,采用多样性集束搜索作为解码器;最终,在微调模型阶段采用自评序列训练方法削减REINFORCE算法策略梯度的高方差现象。所提方法比Srinivasan等人的方法在BLUE、ROUGE-L、Perplexity分别增长了10.5%,9%和5%,模型的训练时间比原来缩短了43%。部分类型语料数量较少,所以对话系统在这方面的话题相对缺乏。传统的网络架构融合强化学习方法,能够有效地使对话系统产生极具价值意义的回复。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习的 电子信息学院 Rouge Force Info

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 01:32