楼主: 我的素质低
2092 1

[clementine] 使用 SPSS 文本挖掘工具构建社交媒体数据集市 [推广有奖]

学术权威

83%

还不是VIP/贵宾

-

TA的文库  其他...

〖素质文库〗

结构方程模型

考研资料库

威望
8
论坛币
23388 个
通用积分
28302.3504
学术水平
2705 点
热心指数
2881 点
信用等级
2398 点
经验
223623 点
帖子
2977
精华
52
在线时间
2175 小时
注册时间
2012-11-24
最后登录
2024-1-13

一级伯乐勋章 初级学术勋章 初级热心勋章 初级信用勋章 中级热心勋章 中级学术勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级学术勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
来自IBM DEVELOPERWORKS

简介





我们今天熟知的这些社交网络的先驱是在二十世纪六十年代晚期出现的,当时公告牌是首批交互消息共享平台之一。更晚些时候(二十世纪九十年代,当 craigslist 和 AOL 进入人们的视线时),社交革命才有了飞速发展的基础。社交网络的腾飞是在二十一世纪,先是 Friendster、LinkedIn、MySpace、Flickr、Vimeo、YouTube,之后是 2004 年推出的 Facebook 和 2006 年诞生的 Twitter,以及最近的 Google+ 和 Pinterest。

社交媒体的广泛采用伴随着数字趋势,对品牌产生了直接影响,它们为有移动特征的环境开发了流动数字战略。社交流有效地延长了品牌和顾客间的关系。在电子商务和社交媒体出现之前,顾客一般是对产品进行研究,然后进行明确的购买,买卖方之间的关系即告结束,直至以后有购买的需要。口碑仅限于顾客的实体社交网络。现在,顾客的意见通过社交网络得到了放大,甚至有可能触及整个消费者群体。

有品牌商家们知道如今的消费者都在积极收集购买前的信息,从中查阅好评和差评,并更好地进行快速价格对比,这一切通过移动设备上的几次点击即可完成。他们还知道消费者现在对社交网络内其他人的响应更为敏感,而这催生了一种新型的影响者忠诚计划的开发,该计划旨在物质激励和奖励具有强大品牌影响力的个人。消费者正在成为品牌的保卫者,以至于调整品牌个性和品牌身份对于品牌的生存从未如此重要。

那么,有品牌的商家是如何管理数字交互信息的汇集?技术在加紧追赶社交消费者的脚步。社交网络们已经提供了特定于站点的流量和数据统计工具(比如 Facebook Insights、YouTube Insights 和社交媒体管理套件,比如 HootSuite),还提供了影响者测量门户,比如 Klout,该门户提供了用于品牌参与跟踪指标的第三方选项。而多种商业的社交侦听工具,比如 Radian6、SM2、Viralheat 和 Sysomos,提供了报告、文本分析、管理、情感分析、访客信息和参与工作流程。这些工具在范围以及可用性上都有所提高,但是这些工具的许多方面仍然处于发展的早期阶段。比如,情感分析缺乏准确性,而通过像 Twitter firehose 这样的服务以及像 Gnip 和 DataSift 这样的合作公司提供的社交数据价格依然有些昂贵,且在数据可用性方面存在限制。因此,一些人强烈要求扩充这些具有内核文本挖掘功能的商业工具,并建立一个专有社交媒体数据集市。社交媒体数据集市可存储从社交媒体交互中获得的消费者级别的信息以及所有有关的数字信息,比如位置、设备、移动行为、移动支付、平台和与评论数据相关的速度。



文本挖掘的商业用例






品牌为文本挖掘提供了不同的目标:


  • 像 Sears 这样的公司,如 示例 1 所示,可能有兴趣在新产品线启动后通过社交媒体评论和 Facebook 页面粉丝的交互来直接跟踪消费者的观点。这样一来,更容易理解围绕图片、产品和启动产品而引起的对话集群的基本反响。通过这种实时的反馈可以实现快速的消息更新和非流行内容的删除,并且 Facebook 的粉丝们成为了实时焦点群,提供了产品特性的即时反馈。
  • JACT Media 公司的任务是构建品牌和视频游戏玩家之间的关系。该公司提供了一个游戏内的临时设施,在玩家玩常玩游戏的同时向玩家展示各种具有针对性的、已安排好的内容。玩家赢得 JACT 虚拟货币,而这些 JACT BUX 可兑换奖品,包括虚拟的和可下载的商品。玩家在 Facebook 页面或 Twitter 上与 JACT 交互,并频繁在游戏论坛经常提及 JACT BUX。这种原始的评论数据可从各种来源获取,并且可以存储个人级别的评论和偏好。比如,如果玩家对某个视频游戏特别感兴趣,或是在 tweet 上提到了自己的奖品,那么基于特定游戏的游戏内目标锁定和奖品类型可能比随机的奖励更能促进忠诚度的增加。
  • 超市也能够使用社交媒体数据来识别更为有价值的购物者、对客服的印象、商店的环境、产品的偏好、包装的偏好和定价。将这类信息与 Twitter 或移动设备提供的位置数据汇总在一起,超市就能从某个角度进行定位,量身定制购物体验。而这对于库存、定价、广告、个人数字和邮寄优惠券等都有影响。


示例 1:SPSS Modeler Premium 中的社交媒体数据和文本挖掘

第一个示例是一个 SPSS Modeler Premium 用例。在此场景中,启动了一个新的产品线,该公司有兴趣跟踪社会媒体数据中的消费者反应。SPSS Modeler Premium Facebook 节点被用来跟踪 Sears Facebook 页面上的新 Kardashian 产品线,如 图 1 所示。

图 1. 零售商在 Facebook 上启动了一个新的产品线

在跟踪和分析评论数据的第一个步骤中,涉及到要求用户指定用户名以及在 SPSS Modeler Premium Facebook 节点中用于评论的页面和线程的数量,如 图 2 所示。

图 2. 用于通过提取 Facebook wall 评论来识别启动后的评论反馈分析的 SPSS Modeler

然后,会从 Sears Facebook 页面提取评论数据,并在 SPSS Modeler 中使用它,如 图 3 所示。

图 3. 可直接通过 SPSS Modeler Facebook 节点查看的原始评论数据

(请查看 图 3 的大图。)

下一个步骤涉及到添加过滤器和执行概念提取,从而形象地描述围绕该品牌的内容类别。这个用户友好的图形 UI 可在整个过程中引导用户,并且不需要使用 API 从 Twitter 或 Facebook 中提取社交数据。其结果是获得一个容易理解的概念地图,并了解连接线的厚度所代表的概念集群的敏感性,如 图 4 所示。

图 4. 概念地图为品牌提供了概念强度类别的可视化

(请查看图 4 的大图。)


示例 2:在 SPSS Statistics Base 中使用了提取内容和禁止词的超市产品偏好示例


下列的社交媒体数据集市组装过程描述了一个简单的手动文本挖掘过程。在这个示例中,我们希望使用借助了 SPSS Statistics Base 的文本挖掘来获取和存储来自社交媒体数据的各种产品偏好。本例包括一个从 Twitter 和 Facebook 提取超市品牌数据的分步指南。过程架构如 图 5 所示。

图 5. BrandMeter 社交媒体数据集市架构

第一步是确定感兴趣的品牌。设置一个例程来通过一个 API 过程收集与品牌相关的提及。这是通过 图 6 中所示的搜索请求来完成的,结果是以 JSON 格式返回的。一个 JSON 库会解析数据,并将每个记录分成多个字段,这些字段包含了像用户 ID、数据和未处理的文本消息评论这样的信息。然后,此数据会存储在一个数据库中,并且可供文本挖掘使用。


图 6. 用来访问原始 Twitter 和 Facebook 评论数据的示例 API

这个简化的文本挖掘练习的目标是确定特定消费者产品偏好和消费模式。然后,此信息会存储在社交媒体数据集市在。对于这个特定示例,假设您想要确定蔬菜玉米的所有消费者。图 7 显示了 Character Index 函数的使用情况,该函数可识别原始评论数据中使用了单词 corn 的所有实例。

图 7. 用 SPSS Base Character Index 函数提取文本

这些结果还需要进一步的过滤,并且需要通过各种迭代来应用禁止词,从而提高分类的准确性。通过应用像 popcorn、candy corn、corndogcorn syrup 这样的禁止词,并限制实例为四个字符的组合,可以让玉米产品的识别更准确一些。然后可以使用 'corn_consumer_flag'=1 在数据库中标记这些用户名,并在未来市场营销活动中,为特定于玉米的产品和食品而选中它们

图 8. 使用了禁止词的原始评论分类过程

在获得详尽的列表之后,您就可以执行用户 ID 聚合,并填充表来捕获产品购买、包装方面的评论和其他存储了个人级别消费者行为的变量。在本例中,原始社交媒体数据存储在一个 NoSQL 数据库内,而所得到的产品偏好标志则存储在一个 MySQL 数据集市内,其中用户 ID 是一个主匹配键

图 9. 用 SPSS Base Aggregate 函数将评论数据聚合到用户 ID 级别








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:SPSS 文本挖掘 数据集市 社交媒体 PSS Facebook 电子商务 LinkedIn YouTube Twitter SPSS 文本挖掘 工具 构建 社交媒体 数据集市

已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
niuniuyiwan + 60 + 60 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 60  论坛币 + 60  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

本帖被以下文库推荐

心晴的时候,雨也是晴;心雨的时候,晴也是雨!
扣扣:407117636,欢迎一块儿吐槽!!
沙发
niuniuyiwan 在职认证  发表于 2015-11-11 09:27:56 |只看作者 |坛友微信交流群
发帖不易,良苦用心 ,感谢楼主,感谢分享


使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 16:35