楼主: 论文库
413 0

语言建模中最小化样本风险算法的研究和改进 [推广有奖]

  • 0关注
  • 13粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
0
论坛币
5 个
通用积分
0.0363
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
38440 点
帖子
3839
精华
0
在线时间
836 小时
注册时间
2017-9-5
最后登录
2018-4-9

楼主
论文库 在职认证  发表于 2017-9-26 09:40:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要:目前,一些主流的判别学习算法只能优化光滑可导的损失函数,但在自然语言处理(natural language processing,简称NLP)中,很多应用的直接评价标准(如字符转换错误数(character error rate,简称CER))都是不可导的阶梯形函数.为解决此问题,研究了一种新提出的判别学习算法——最小化样本风险(minimum samplerisk,简称MSR)算法.与其他判别训练算法不同,MSR算法直接使用阶梯形函数作为其损失函数.首先,对MSR算法的时空复杂性作了分析和提高;同时,提出了改进的算法MSR—Ⅱ。使得特征之间相关性的计算更加稳定.此外,还通过大量领域适应性建模实验来考察MSR-Ⅱ的鲁棒性.日文汉字输入实验的评测结果表明:(1)MSR/MSR—Ⅱ显著优于传统三元模型,使错误率下降了20.9%;(2)MSR/MSR—Ⅱ与另两类主流判别学习算法Boosting和Pereeptron现相当;(3)MSR-Ⅱ不仅在时空复杂度上优于MSR,特征选择的稳定性也更高;(4)领域适应性建模的结果证明了MSR—Ⅱ的良好鲁棒性.总之,MSR/MSR—Ⅱ是一种非常有效的算法.由于其使用的是阶梯形的损失函数,因此可以广泛应用于自然语言处理的各个领域,如拼写校正和机器翻译.

原文链接:http://www.cqvip.com/Main/Detail.aspx?id=23828939

送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Processing Character Boosting Language processI 语言建模 判别训练算法 输入法编辑器 最小化样本风险 领域适应性建模

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 05:24