楼主: lzguo568
2686 0

[学科前沿] 深度学习新算法,完成字里行间的情绪识别 [推广有奖]

已卖:1051份资源

学术权威

54%

还不是VIP/贵宾

-

TA的文库  其他...

统计入门

威望
3
论坛币
10213 个
通用积分
10704.0688
学术水平
2275 点
热心指数
2224 点
信用等级
1485 点
经验
-224 点
帖子
5788
精华
14
在线时间
3549 小时
注册时间
2010-8-31
最后登录
2025-9-14

初级学术勋章 初级热心勋章 中级热心勋章 中级学术勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 特级热心勋章 特级学术勋章 高级信用勋章

楼主
lzguo568 在职认证  发表于 2016-6-10 10:06:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

深度学习新算法,完成字里行间的情绪识别



摘要: 深度学习领域是计算机科学一个新兴领域,通俗说来就是构建像人脑一样处理数据的计算机程序。深度学习首先发起于学术界,目前各大互联网巨头也纷纷投入研究,如Google的猫脸识别以及Facebook的深度学习团队。每天,数 ...



深度学习领域是计算机科学一个新兴领域,通俗说来就是构建像人脑一样处理数据的计算机程序。深度学习首先发起于学术界,目前各大互联网巨头也纷纷投入研究,如Google的猫脸识别以及Facebook的深度学习团队。

每天,数百万人在使用Twitter、Facebook和其它社交网络来就各类热点话题互相交流。大量的个人信息被汇集到这里,对于Google、Facebook、Amazon和Twitter等大型互联网公司来说,如果拥有较为实用的深度学习技术,这些数据就可以转化为财富。但是说起来容易做起来难,对这些数据的处理能力很大程度上取决于他们的计算机算法是否成熟。


近日,斯担福大学的研究生Richard Socher和Andrew Ng(Google深度学习项目工程师之一),以及一位语言学及人工智能领域的专家Chris Manning,共同研究开发了一个深度学习的新算法,这个算法被称为Neural Analysis of Sentiment,缩写为NaSent。NaSent算法从人脑中得到灵感,旨在改善当前书面语言的分析方法。

Socher介绍说NaSent的目的是开发一种可在无人监督的情况下运行的算法。“过去感知分析主要聚焦于模型,忽略了词序,而且依赖人工干预,并且只适用于简单的例子,永远不会达到人类的理解能力。因为词义会随语境变化,就算是语言专家也不能准确定义语言中感情的微妙之处。我们的深度学习模型就是为了解决这些问题”。


目前,应用最广的情绪分析是“词袋(bag of wodrds)”模型,并没有将词序列入考虑范围。词袋中的词汇被标记为正面或负面的,通过计数来评估整个句子或段落的含义是正面还是负面。

AlchemyAPI(一家将深度学习用于情绪分析的公司)CEO说将词汇单独分析的方法并不准确,必须将其放入到越来越大的结构中。

Socher和他的团队从影评网站Rotten Tomatoes抽取了12000个句子,并将其粗略分割为214000个词组,每个词组被标记为负面、中立或正面(数字表示),计算机科学家称这些数字化的表述为“特征表示”,类似于人脑理解概念和定义的方式。

如何分析和组织这些被标记的数据才是NaSent算法的核心。以下通过对两个句子的分析来理解这个算法:

Unlike the surreal Leon, this movie is weird but likeable.
Unlike the surreal but likeable Leon, this movie is weird.

这两个句子中使用的词汇完全相同,“词袋”模型分析显然不会得到正确的结果。NaSent算法首先会为每个句子构造文法树,如下图所示:


在分析句子时,红色的节点代表这个词汇或短语带有负面情绪,例如“weird”虽然是一个负面词汇,但短语“is weird but likeable”被正确理解为正面情绪。


如上图所示“surreal but likeable Leon”是一个正面词组,但“this movie is weird”是负面的,整个句子得到的分析结果也是负面的。

相比之前模型80%的准确率,NaSent的准确率达到了85%。这个系统还没有授权给外部组织,但是据Socher说已经有几个初创公司联系他们表示对NaSent算法很感兴趣。

但遇到没有被统计的词汇或短语,这个系统就会失效。Socher和他的团队已经开始通过Twitter和网上的电影数据库,扩充系统的词汇库,他们还允许外部人员对这个词汇库进行扩充。短短几周内,就收到了14000份词汇库的提交。

[/tr]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深度学习 Sentiment FACEBOOK Analysis twitter Facebook 计算机程序 计算机科学 人工智能 Twitter

<img src="static/image/smiley/comcom/5.gif" class="vm&qu

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-21 08:49