楼主: 759828809
1691 0

[经管数据集] 样本量几十万,两份twitter社交网络数据集! [推广有奖]

  • 0关注
  • 16粉丝

已卖:3805份资源

讲师

80%

还不是VIP/贵宾

-

威望
0
论坛币
56469 个
通用积分
48.0902
学术水平
6 点
热心指数
6 点
信用等级
6 点
经验
5754 点
帖子
199
精华
1
在线时间
489 小时
注册时间
2019-11-4
最后登录
2026-1-9

楼主
759828809 在职认证  发表于 2021-6-1 21:08:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1、数据来源:http://snap.stanford.edu/data/egonets-Twitter.html(Social circles: Twitter);http://snap.stanford.edu/data/higgs-twitter.html(Higgs Twitter Dataset)

2、时间跨度:twitter

3、区域范围:全国

4、指标说明:

(1)Social circles: Twitter

该数据集由Twitter的“圆圈”(或“列表”)组成。Twitter数据来自公共资源。数据集包括节点要素(轮廓),圆和自我网络。

Dataset statistics

Nodes

81306

Edges

1768149

Nodes in largest WCC

81306 (1.000)

Edges in largest WCC

1768149 (1.000)

Nodes in largest SCC

68413 (0.841)

Edges in largest SCC

1685163 (0.953)

Average clustering coefficient

0.5653

Number of triangles

13082506

Fraction of closed triangles

0.06415

Diameter (longest shortest path)

[size=10.0000pt]7

90-percentile effective diameter

4.5

Citation:

J. McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS, 2012.

(2) Higgs Twitter Dataset

希格斯(Higgs)数据集的建立是在2012年7月4日宣布发现具有希格斯玻色子玻色子特征的新粒子之前,之中和之后监视Twitter上的传播过程而建立的。和2012年7月7日。

此处提供的四个定向网络已从Twitter中的用户活动中提取为:

1. 转推(转推网络)

2. 回复(回复网络)现有推文

3. 提及(提及网络)其他用户

4. 参与上述活动的用户之间的朋友/追随者社交关系

5. 关于希格斯玻色子发现期间Twitter活动的信息

值得一提的是,用户ID已被匿名化,并且所有网络都使用相同的用户ID。这种选择允许将Higgs数据集用于有关大规模相互依存/互连的多路复用/多层网络的研究,其中一层负责社会结构,三层负责编码不同类型的用户动态。

此数据集最终更新2015年3月31日更新。

Social Network statistics

Nodes

456626

Edges

14855842

Nodes in largest WCC

456290 (0.999)

Edges in largest WCC

14855466 (1.000)

Nodes in largest SCC

360210 (0.789)

Edges in largest SCC

14102605 (0.949)

Average clustering coefficient

0.1887

Number of triangles

83023401

Fraction of closed triangles

0.002901

Diameter (longest shortest path)

9

90-percentile effective diameter

3.7

Retweet Network statistics

Nodes

256491

Edges

328132

Nodes in largest WCC

223833 (0.873)

Edges in largest WCC

308596 (0.940)

Nodes in largest SCC

984 (0.004)

Edges in largest SCC

3850 (0.012)

Average clustering coefficient

0.0156

Number of triangles

21172

Fraction of closed triangles

0.0001085

Diameter (longest shortest path)

19

90-percentile effective diameter

6.8

Reply Network statistics

Nodes

38918

Edges

32523

Nodes in largest WCC

12839 (0.330)

Edges in largest WCC

14944 (0.459)

Nodes in largest SCC

322 (0.008)

Edges in largest SCC

708 (0.022)

Average clustering coefficient

0.0058

Number of triangles

244

Fraction of closed triangles

0.0001561

Diameter (longest shortest path)

29

90-percentile effective diameter

10

Mention Network statistics

Nodes

116408

Edges

150818

Nodes in largest WCC

91606 (0.787)

Edges in largest WCC

132068 (0.876)

Nodes in largest SCC

1801 (0.015)

Edges in largest SCC

7069 (0.047)

Average clustering coefficient

0.0825

Number of triangles

23068

Fraction of closed triangles

0.0002417

Diameter (longest shortest path)

18

90-percentile effective diameter

6.5

Citation

M. De Domenico, A. Lima, P. Mougel and M. Musolesi. The Anatomy of a Scientific Rumor. (Nature Open Access) Scientific Reports 3, 2980 (2013).

相关研究:

[1]Boyd,  Ellison N B . Social Network Sites: Definition, History, and Scholarship[J]. Journal of Computer-Mediated Communication, 2007, 13(1, article 11).

[1] Pachucki M A ,  Jacques P F ,  Christakis N A . Social Network Concordance in Food Choice Among Spouses, Friends, and Siblings[J]. American Journal of Public Health, 2011, 101(11):2170-2177.

[3] Gordon I R ,  Mccann P . Industrial Clusters: Complexes, Agglomeration And/Or Social Networks[J]. Urban Studies, 2013, 37(3):513-532.

[4]GR ∗,  Pattison P ,  Kalish Y , et al. An introduction to exponential random graph models for social networks[J]. Social Networks, 2007, 29(2):173-191.

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:twitter 社交网络 数据集 TWI ITT

样本量几十万,两份twitter社交网络数据集!(1)
下载链接: https://bbs.pinggu.org/a-3469739.html

76 Bytes

需要: RMB 3 元  [购买]

仅供学术科研用途,勿用于商业,如有不妥请联系删除

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-7 21:25