在购买价格超过一包口香糖的东西之前,您会做什么?无论您是想购买新的运动鞋,笔记本电脑,还是出国旅游,在不检查相似产品或报价并阅读评论的情况下处理订单都不再有意义。多亏了电子商务网站,社交网络,评论平台或专用论坛上的评论部分,您可以了解有关产品或服务的大量信息,并评估其是否物有所值。其他客户,包括您的潜在客户,将完成上述所有操作。
人们与企业打交道的愿望和整体品牌认知在很大程度上取决于公众舆论。根据Podium的一项调查,有93%的消费者表示在线评论会影响他们的购买决定。一旦阅读了一些不好的评论,用户可能就不会给您机会。他们不会研究反馈是否为假。他们将选择另一个选项。在这种情况下,不断监控其声誉的组织可以根据反馈及时解决问题并改善运营。情感分析可以有效地衡量信息时代人们对组织的态度。
什么是情绪分析
情感分析是一种文本研究,也称为挖掘。它结合了统计,自然语言处理(NLP)和机器学习的功能, 以从文本文件中识别和提取主观信息,例如,审阅者对特定主题,事件或公司的感觉,想法,判断或评估。及其如上所述的活动。这种分析类型也称为观点挖掘(侧重于提取)或情感评分。一些专家还使用术语 情感分类和提取。无论名称如何,情感分析的目标都是相同的:通过分析来自各种来源的大量文本来了解用户或听众对目标对象的看法。
您可以分析不同详细程度的文本,详细程度取决于您的目标。例如,您可以定义一组评论的平均情绪基调,以了解有多少百分比的顾客喜欢您的新服装系列。如果您需要知道访客对特定服装的喜欢或不喜欢什么,为什么,或者他们是否将其与其他品牌的类似商品进行比较,则需要分析每个评论句子,重点放在特定方面和用法或特定关键字上。
根据规模,可以使用两种分析类型:粗粒度和细粒度。粗粒度分析允许在文档或句子级别上定义情感。通过细粒度的分析,您可以提取每个句子部分中的情感。
粗粒度的情感分析:分析整个帖子/评论或句子
这种分析类型是在文档和句子级别上完成的。实际上,大多数专家使用它来分析句子而不是整个文档。粗粒度的SA需要完成两个连贯的任务:主观性分类以及情感检测和分类。
1.主观性分类。首先,有必要确定一个句子是主观的还是主观的。客观的句子包含有关一个对象或主题的一些事实: 三个陌生人在出生相同的三胞胎,出生时分开并被三个不同的家庭收养后,以惊人的巧合重新团聚。
顾名思义,主观句子表达了某人对主题的态度:这套公寓很棒。我喜欢在这里度过的每一分钟。
2.情绪检测和分类。 该操作的目的是定义一个句子是否具有情感,如果存在,则确定情感是正面的,负面的还是中立的。
情感分数
300w“ size =”(最大宽度:683px)100vw,683px“ />极性感应。资料来源: KDNuggets
有时人们无情绪地分享自己的观点。例如,我认为每个人都应该获得第二次机会的句子的发表者表达了他们的主观意见。但是,很难理解作者对每个人的感觉如何。因此,该句子不表达情感并且是中立的。中性句子-缺乏情感的句子-属于独立类别, 不应被视为介于两者之间。
让我们看看这个评论:年度最令人惊讶和最令人满意的电影之一。按照这句话,评论者喜欢这部电影,所以这句话包含了积极的情绪。
下面的评论是主观句子带有负面情绪的一个明显例子:它本身也很笨拙,并且表现平庸,这似乎根本就没有意义。
但是,客观的句子也可以表达一种情感:我买了这款防水相机盒,因为它比标准的相机盒更可靠。从上下文中可以明显看出,该案并非当事人所期望的。该句子带有负面情绪,但它是隐式表达的。
情感不取决于主观性或客观性,这会使分析变得复杂。但是,我们仍然需要将表达情感,评价或态度的句子与不包含这些句子的句子区分开,以从反馈数据中获得有价值的见解。
细粒度的情感分析:逐句分析
正如他们所说,魔鬼在细节中。如果需要更精确的结果,则可以使用细粒度分析。
您在子句级别应用细粒度的分析,这是为了确定情感的目标(主题)。句子被分解为短语或从句,并且将每个部分与其他部分联系起来进行分析。简而言之,您可以确定谁在谈论某个产品,以及一个人在他们的反馈中究竟在谈论什么。另外,它有助于理解作者为什么以某种方式对其进行评估。
细粒度分析可用于处理比较表达式(例如,三星比iPhone更好)或简短的社交媒体帖子。
它不仅使您了解人们如何评价您的产品或服务,还可以确定他们讨论的功能或方面:使用笔记本电脑的触摸板在使用4个月后停止工作。这样,您确切地知道必须改进或重新考虑的内容。
定义情感强度的能力是细粒度分析的另一个优点。除了三个情绪得分(负面,中性和正面),您还可以使用正面和负面类别。
如何进行情绪分析:方法和工具
情感分析使您可以从客户的角度看待您的操作。但是,如何从用户生成的数据中提取这些知识呢?
数据收集和准备。 首先,您需要在一个文档中收集所有相关的品牌提及。考虑选择标准–如果这些提及是有时间限制的,仅使用一种语言,或来自特定位置等,则必须准备数据进行分析:必须阅读数据,删除所有非文本内容,纠正语法错误或错别字,排除所有不相关的内容,例如有关审阅者的信息等。一旦我们准备好数据,我们就可以对其进行分析并从中提取情绪。
由于可能需要分析成千上万的提及,因此最佳实践是使用软件自动完成这项繁琐的工作。
1


雷达卡



京公网安备 11010802022788号







