不喜勿买。谢谢。真正需要的会觉得物有所值。
数据背景介绍
Twitter是一个社交网络(Social Network Service)及微博客服务的网站,是全球互联网上访问量最大的十个网站之一。它利用无线网络,有线网络,通信技术,进行即时通讯,是微博客的典型应用。它允许用户将自己的最新动态和想法以短信形式发送给手机和个性化网站群,而不仅仅是发送给个人。
Twitter是一个广受欢迎的社交网络及微博客服务的网站,允许用户将自己的最新动态和想法以移动电话中的短信息形式(推文)发布(发推),可绑定IM即时通讯软件。所有的Twitter消息都被限制在140个字符之内。
数据应用方向
1) 社交网络数据分析
2) 机器自然语言学习
3) 英文文本提取
4) 英文文本情感分析
5) 基于英文微博的网络舆情监测
数据应用机构
该数据可应用从事有网络舆情监控、评论分析的研究的企业或进行有关英文文本情感分析的研究机构和高校
里边分别是点集与边集两个.csv格式的文件。点数很多,边数更多。
边是给出了边的两个端点,每行一条边。下载后解压缩说明:
文件较大,所以分为三部分压缩的,下载后先分别解压缩三个Twitter-dataset.zip-001,002,003压缩文件。
然后将三个部分(Twitter-dataset.zip.001,Twitter-dataset.zip.002,Twitter-dataset.zip.003)放在同一个文件夹中,点其中Twitter-dataset.zip001进行解压缩,即可得到完整数据。
Twitter-dataset.zip.003.zip
(60.62 MB)
Twitter-dataset.zip.002.zip
(98.68 MB)
Twitter-dataset.zip.001.zip
(99 MB, 需要: 50 个论坛币)


雷达卡




京公网安备 11010802022788号







