1.新浪微博简介
中国著名的信息分享和交流平台,其数据量大,维度丰富,包含发文内容及其评论状况、指定内容以及用户信息等多个样本,是研究社交网络的数据基础。
2.新浪微博数据字段
发文内容及其评论状况:序号、关联文章编号、评论编号、评论人编号、评论人昵称、评论内容、评论时间、评论点赞数、采集时间;
指定内容,如对“股票注册制”这一事件的关注:序号、搜索关键字、发文博主、博主认证、博文编号、发文内容、博文全文、转发次数、评论次数、点赞次数、发文时间、文章来源、采集时间、博主个人主页、博主编号;
用户信息:序号、博主编号、博主昵称、博主性别、微博认证、微博会员等级、关注数、粉丝数、微博数、微博认证标志、微博等级、微博简介、博主简介、所在地、毕业于、公司、婚姻状态、性取向、星座或生日、行业类别、邮箱地址、个性域名、博客地址、标签、友情链接、采集时间;
3.新浪微博数据样本截图(截图仅为部分内容)
1.雪球简介
中国权威投资分析内容的输出地,独特的“金融+社交”模式,能够进行UGC模式下的投资理财需求与研究分析能力的快速匹配,该网站积累了大量的社交投资数据,为研究者研究投资者情绪、投资中的社交网络等提供了良好的数据基础。
2.雪球数据字段
贴文指标:序号、股票代码、股票名称、发帖人编号、发帖人昵称、帖子编号、帖子类型、帖子全文、发帖时间、帖子来源、帖子转发次数、帖子赞助数额、帖子评论数、转发发帖人编号、转发发帖人、转发帖子标题、转发帖子全文、转发帖子时间、转发帖子相关讨论、采集时间;
贴文评论指标:序号、博主编号、博主昵称、被评论文章编号、评论人昵称、评论人个人主页、被回复人昵称、被回复人个人主页、评论内容、评论时间、采集时间;
发帖人粉丝指标:投资人编号、投资人昵称、粉丝编号、粉丝昵称、粉丝地域、粉丝股票、粉丝讨论、粉丝的粉丝、粉丝的关注、粉丝简介、采集时间;
发帖人关注指标:投资人编号、投资人昵称、被关注人编号、被关注人昵称、被关注人地域、被关注人股票、被关注人讨论、被关注人粉丝、被关注人关注、被关注人简介、采集时间;
发帖人所有贴文指标:序号、投资者编号、投资者昵称、投资者性格、投资者性别、投资者地域、关注股票数、参与讨论数、粉丝人数、投资者简介、投资者能力圈、主贴编号、主贴全文、主贴发文时间、主贴来源、主贴转发次数、主贴赞助金额、主贴评论数、转发发帖人昵称、转发发帖人编号、转发贴标题、转发贴全文、转发贴时间、转发贴讨论数、采集时间 ;
3.雪球数据数据样本截图(截图仅为部分内容)