楼主: 3866_1565697229
395 2

[充实挑战] 【学习笔记】2019.09.02 1、机器翻译的发展之路:1)基于规则,依靠人来写规则 ... [推广有奖]

  • 2关注
  • 6粉丝

博士生

55%

还不是VIP/贵宾

-

威望
0
论坛币
2156 个
通用积分
222.0842
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1362 点
帖子
255
精华
0
在线时间
1 小时
注册时间
2019-8-13
最后登录
2022-3-3

楼主
3866_1565697229 发表于 2019-9-2 10:07:50 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
2019.09.02
1、机器翻译的发展之路:1)基于规则,依靠人来写规则并教机器如何去翻译 2)基于统计的机器翻译之法,给到机器一堆语料让机器自己去学习翻译规则,被赋予了概率 3)将整个推理过程映射到一个高维空间中,并在高维空间中进行运算。
2、在基于规则和基于统计的机器翻译方法下,词语形态分析是机器翻译首先需要解决的问题。对于中文而言,汉字的翻译效果很差,分词是必须解决的问题。中文以外的很多语言都存在形态问题,英语的形态问题比较简单,因为英语词的变化较少;法语有四五十种变化,俄语更多;以土耳其和波斯语为例的黏着语,一个词可能有上千种变化。
3、目前最好的是神经网络机器翻译框架,神经网络可以很好地捕捉句子的结构,无需进行句法分析,系统可以自动获得处理复杂结构句子翻译的能力。在神经网络机器翻译框架下,端到端训练成为标准模式,所有模块构成一个有机的整体,针对同一个目标函数同时训练,有效避免了错误传播,提高了系统性能
4、基于规则的机器翻译方法中,可以通过修改规则来纠正;基于统计的机器翻译方法,虽然改的方式绕一点,但是统计的数据都是可以解释的,可以在其中加上一个短语表来纠正,但在神经网络机器学习方法中,几乎是不能进行修改的
5、深度学习的边界:数据边界、语义边界、符号边界和因果边界
数据边界是指当前的数据不够;语义边界是指现在的自然语言处理系统大部分都无法对客观世界进行精准建模;符号边界,神经网络实际上是潜意识的行为,可以输入语言和输出语言表达,但是无法对整个推理和计算过程进行描述;因果边界,即神经网络很难理解事物之间的因果关系
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 机器翻译 习笔记 神经网络 翻译方法

已有 1 人评分论坛币 收起 理由
sophia615 + 30 精彩帖子

总评分: 论坛币 + 30   查看全部评分

沙发
sophia615 发表于 2019-9-2 14:26:57
学习笔记奖!

藤椅
jessie68us 发表于 2020-1-27 14:08:25 来自手机

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-4 09:19