楼主: 人工智能-AI
975 0

基于深度学习的中文自然语言处理 [推广有奖]

  • 0关注
  • 10粉丝

会员

学术权威

71%

还不是VIP/贵宾

-

威望
0
论坛币
25 个
通用积分
0.0584
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
37770 点
帖子
3776
精华
0
在线时间
853 小时
注册时间
2017-9-5
最后登录
2018-4-11

楼主
人工智能-AI 在职认证  发表于 2017-9-29 07:00:05 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要:深度学习是当前机器学习领域研究的前沿与热点之一,深度学习的研究与应用已经在英文自然语言处理领域成功地产生了诸多突破性的成果。在中文自然语言处理领域,基于深度学习的研究近年来方兴未艾。但是,由于中文与英文本质上的不同特点,在英文自然语言处理领域获得良好结果的深度学习模型和方法无法被直接应用于中文,研究人员需要根据中文的特点重新建立合适的深度学习模型,寻找合适的训练方法。  本文在深度学习的英语自然语言处理模型的基础上,提出了适用于中文自然语言处理的深度神经网络模型,以及针对该模型的完整的训练方法,包括无监督预训练方法以及有监督调优训练方法。该模型无需任何语言学知识或手工特征设计,可被用于中文分词、词性标注以及命名实体识别等多种中文自然语言处理任务。具体来说:1)本文针对中文的特点,提出了中文自然语言处理深度神经网络模型;2)本文提出了一个新的优化目标来构造中文神经语言模型,并从理论上说明了使用本文提出的优化目标训练中文神经语言模型等价于训练一个特殊的降噪自动编码器——文本窗口降噪自动编码器(Text Window Denoising Autoencoder);3)本文描述了通过堆叠文本窗口自动编码器来预训练中文自然语言处理深度神经网络的过程;4)本文说明了针对具体任务有监督地调优训练中文自然语言处理深度神经网络的过程。  本文根据提出的模型以及训练方法,建立了一个完整的基于深度神经网络的中文自然语言处理系统。该系统的主要特点为:1)完全基于统计,无需任何语言学知识或手工特征设计;2)支持并行的模型训练,有效地提升了在多CPU核心环境下的模型训练效率;3)支持多任务学习,可以准确、高效的处理原始中文自然语言文本,并同时完成分词、词性标注以及命名实体识别等任务。  本文使用公开数据集在上述系统中进行了实验。实验结果表明,使用本文提出的模型以及训练方法可以有效地解决中文自然语言处理中的分词、词性标注以及命名实体识别问题,并可获得良好的性能。

原文链接:http://d.wanfangdata.com.cn/Thesis/Y2707309

送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深度学习 自然语言 语言处理 学习的 wanfangdata 中文自然语言处理 深度学习 神经网络模型 训练方法

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 00:36