楼主: mingdashike22
903 24

[量化金融] 经验投资者分层结构的比较分析 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-24 06:45:48
(2010); Jiang等人(2016),可通过最小化以下残差来估计阈值KH,R=Pnsi公司Ksi,f it-Ksi,empKsi,f it+Ksi,emp+Pnlj公司Klj,f it-Klj,empKlj,f it+Klj,emp√ns+nl(7),其中K和Kemper表示拟合分布和经验分布,上标s和l表示小于或大于阈值kH的样本,n表示样本量。两种截断分布的参数都是通过极大似然估计(MLE)确定的。表1:SVEIN和SVCN的统计描述。k表示网络中用户的程度。平均性病/平均性病/平均性病的加权度数A组:SVEINk>100 487 2.23%142.9 38.5 26.95%18487.1 10984.6 59.42%50<k≤ 100 1394 6.39% 68.8 13.9 20. 22%5504.3 2935.4 53.33%k≤ 50 19925 91.37%10.0 11.8 117.95%477.0 1134.0 237.73%B组:SVCNk>100 60748 1.46%142.2 45.8 32.23%1544.7 775.0 5 0.17%50<k≤ 100 177076 4.25% 69.4 13.7 19. 79%780.3 410.9 52.66%k≤ 50 3930604 94.29%8.1 10.0 124.08%92.1 161.7 17 5.68%表2:SVEIN和SVN的幂律、正态、指数和对数正态分布的(加权)度拟合结果,以及是否从四个分布中提取(加权)度的统计测试。

12
nandehutu2022 在职认证  发表于 2022-6-24 06:45:51
符号*,**, 和***分别表示5%、1%和0.1%的显著水平。SVEIN SVCNDegree加权度度加权度>0 k>100 k>0 k>100 k>0 k>100 k>0 k>100 k>0 k>100面板A:符合幂律分布。α1.50 3.50 1.50 1.84 1.50 3.50 1.50 1.50KS 0.19 0.11 0.33 0.26 0.16 0.09 0.42 0.42p值0.00***0.13 0.00***0***0***0***0***0***AIC 161511.77 4693.74 325265.95 10568.02 28130126.25 580173.13 49774220.93 1084909.45面板B:符合正态分布uN-1031.56-93.68 1200.60 18487.09 12.61-2292.22 142.47 1422.38σN131.70 107.86 3570.82 10973.34 23.12 327.80 298.20 881.68KS 0.26 0.03 0.37 0.15 0.31 0.03 0.32 0.09p值0.00***0.77 0.00***0***0***0.40 0.00***0***AIC 166010.36 4632.85 418656.91 10447.39 38012462.68 576466.02 59330827.17 975316.25面板C:适合指数分布α16.71 42.91 1200.60 18487.09 12.62 42.23 142.47 1446.69KS 0.24 0.05 0.41 0.28 0.24 0.02 0.30 0.28p值0.00***0.46 0.00***0***0***0.63 0.00***0***AIC 166432.62 4637.31 352848.35 10540.11 29472982.01 576270.11 49680143.77 1005464.72面板D:对数正态分布uL1.83 4.65 5.08 9.67 1.61 4.20 3.34 7.24σL1.43 0.39 2.04 0.54 1.30 0.54 2.04 0.45KS 0.13 0.04 0.06 0.08 0.11 0.02 0.07 0.01p值0.00***0.71 0.00***0**0***0.61 0.00***0.17AIC 157319.09 4634.67 314478.41 10208.38 27447309.97 575902.17 45639797.91 955503.08图。2(a)和(b)说明了拟合残差作为SVEIN和SVN度的可能阈值s的函数。因此,我们可以发现SVEIN和SVCN的最佳阈值分别为152和48。图中绘制了相应的右截断和左截断度分布。2(c–f)表示SVEIN和SVCN。

13
kedemingshi 在职认证  发表于 2022-6-24 06:45:54
每个面板中的实线表示截断对数正态分布的最佳拟合。对于两个网络的加权度,我们进行了相同的分析,并在图3中说明了结果。SVEIN和SVCN的加权程度的最佳阈值分别为374和653。我们可以看到,经验分布与图2和图3中的拟合分布很好地吻合,这支持了网络的(加权)度符合混合对数正态分布。0 50 100 150 200 250-3-2-10 200 400 600-3-2-10 50 100 150-4-3-2-1Emp PDFR Trun。LN Fit0 10 20 30 40 50-3-2-1Emp PDFR Trun。LN Fit150 200 250 300 350-4-3-2-1Emp PDFL Trun。LN Fit0 200 400 600 800 1000-8-6-4-2Emp PDFL Trun。LN拟合(a)(b)(c)(d)(e)(f)图2:SVEIN(a,c,e)和SVCN(b,d,f)的最佳截断度分布结果。(a,b)拟合残差图(公式(7))作为阈值kH的函数。(c,d)右截断度分布图。左截断度分布的(e,f)图。众所周知,对数正态分布在描述自然现象中起着重要作用,在这种自然现象中,生长过程是由许多小百分比变化(增长率)的累积驱动的,而这些变化在对数尺度上是相加的。如果每个百分比变化足够小,则根据中心极限定理,对数尺度上的总和趋于正态分布,这意味着百分比变化在线性尺度上遵循对数正态分布。对数正态分布的一个有趣的特征是,生长率与其大小无关。

14
mingdashike22 在职认证  发表于 2022-6-24 06:45:57
根据对数正态度分布,可以推断出一个人的“朋友”的增长率应该与SVEIN和SVCN中当前的“朋友”数量无关。0 1000 2000 3000 4000-10 1000 2000 3000 4000 5000-2-10 100 200 300 400-4-3-2Emp PDFR Trun。LN Fit0 200 400 600 800-4-3-2-1Emp PDFR Trun。LN Fit0 2 4 6-8-6-4-2Emp PDFL Trun。LN Fit0 2500 5000 7500 10000-8-6-4-2Emp PDFL Trun。LN拟合(a)(b)(c)(d)(e)(f)图3:SVEIN(a,c,e)和SVCN(b,d,f)加权度的最佳截断分布结果。(a,b)拟合残差图(公式(7))作为阈值kH的函数。(c,d)右截断度分布图。左截断度分布的(e,f)图。3.2. 群体自我网络中的层次结构通常是基于链接上的情感亲密度来确定的。在这里,我们无法直接测量运动贴近度。作为一种替代方法,我们使用EIN中的订单数量和CN中的呼叫数量作为链接情感亲密度的代表。对于具有n个链接的给定节点,我们首先通过以下等式规范化每个链接上的订单放置数量(对应调用数量)Wi(i=1,2,3,····,n),即^Wi=Wi- WminWmax- Wmin,(8),其中Wmin=min({Wi}),Wmax=max({Wi})。等式(8)确保0≤^Wi≤ 1、自然断裂的存在(与网络层相关)应反映在^Wi分布中尖峰的存在中。因此,我们在图4中绘制了两个网络的归一化d权重的分布。如图4(a)所示,SVEIN无法观察到破裂。一个可能的情况是SVEIN的数据样本太小。相比之下,SVCN在0.1左右有一个明显的峰值,如图4(b)所示,这对应于自然断裂wi≈ 0.1=15/150,即。

15
mingdashike22 在职认证  发表于 2022-6-24 06:46:00
第二层位于邓巴离散等级的15层。接下来,我们使用聚类算法(k-means和H/T-br-eak)根据归一化权重^Wi揭示k>100的节点的离散层次结构。0 0.2 0.4 0.6 0.8 10.51.50 0.2 0.4 0.6 0.8 10.51.52.5(a)(b)图4:归一化权重的概率分布^Wi。(a) 斯文。(b) SVCN。图5显示了根据k-means和H/T break的聚类算法m具有相同层数a的用户的百分比。如图5(A)和(b)所示,根据ek均值和H/T Break算法,属于SVEIN中k>100度投资者的变更主要分为2-4类和4-6类。此外,我们还发现,56.9%的投资者的期权可分为5层。为了衡量聚类结果的相似性和鲁棒性,我们进一步估计了两种算法对同一用户的聚类结果之间的Jaccard系数。所有用户的平均Jaccard系数为0.11。如图5(c)和(d)所示,我们发现在SVCN中,基于k-Means算法和H/T Break算法,k>100度用户的滤波器主要分为3-6类和4-5类。聚类结果的平均Jaccard系数为0.23。因此,我们的结果表明,两种算法的聚类重叠程度较低。(a) (b)(c)(d)图5:基于k均值(a,c)和H/T(b,d)中断算法的SVEIN(a,b)和SVCN(c,d)中具有相同层数的用户百分比图。表3显示了基于kmeans和H/T break算法的两种网络中k度>100的用户的聚类结果比较。表3的面板A中报告了SVEI N的两种聚类算法的结果。

16
mingdashike22 在职认证  发表于 2022-6-24 06:46:03
我们发现,在SVEINare中,43%的k级>100的用户分为3个层,层中的平均交替数分别为10.9、4.5.8和141.7,其中,最后两层对应于经验离散层次结构的中间两层,而第一层似乎与前两层经验结构的联盟相关(Zhou et al.,2005;Hill and Dunbar,2003)。H/T Break算法显示,约90%的变更投资商表现出5层和6层的配置。我们可以观察到,外Fourlayers中的变化次数非常接近理论上的Dunb a r圆5、15、50和150。内层或两层的涂改数量仅为1-3。表3的面板B列出了SVCN每层中的累计好友数。对于k-means算法,我们发现16918个(41.1%的分数)用户具有四层结构。从内部到外部的平均累积变化数为3.0、12.8、42.8和132.0,这与之前报告的离散层次结构3-5、10-15、30-50和100-200不一致(Zh-ou等人,2005;Hill和Dunbar,2003)。相应的比例为3.22,接近邓巴数字3。我们还发现,目前有15209名用户具有五层结构,平均累计数量为2.1、7.3、20.4、54。2和141.4。除内层n=2.1外,外层四层中的变化数量非常接近参考文献Z hou等人(2005)中报告的层次结构;希尔和邓巴(200 3)。对于H/T Break算法,29125个用户(约50.2%)表现出四层结构,平均累积变化数分别为2.1、8.7、33.4和133.9。

17
大多数88 在职认证  发表于 2022-6-24 06:46:06
re为25539(约44.1%),用户可将变更分为5层,连续层中的平均累计变更数分别为1.2、3.8、11.7、39.5和147.6。这两种聚类算法揭示了手机网络中类似的离散层次结构。我们发现,对于在自我网络中有四层的用户,有一个额外的最内层(1.2-2.1),大约有1-2个变化。我们进一步将k-means算法的聚类数确定为4,并估计每层中的累积聚类数,得到2.5、10.3、36.8和142.2。此外,我们还利用k均值算法对每个自我网络的链接活动进行了聚类分析,其中d度50<k<100的自我投资者。我们发现,有621名投资者(约44.9%)具有两层结构,相应的层结构为19.8和67.2,接近之前报告的层次结构的中间两层(Zhou et al.,2005;Hill and Dunbar,2003)。SVEIN和SVCN中个人自我网络的经验层次结构与从内到外的3-5、10-15、30-50、100-200的结构相兼容,接近理论上的邓巴圆。平均经验标度比接近先前发现的值3,这也可以从理论上解释(Lera和Sornette,2019)。无花果。6和7显示了在纹理和SVCN中,阶数k>100的EGO在各层中的变化数分布。我们只展示了其个人自我网络在SVEIN(SVCN)中具有三层和四层(分别为五层和六层)结构的节点。

18
可人4 在职认证  发表于 2022-6-24 06:46:09
对于这两个网络,bo-th算法的聚类结果不见表3:基于SVEIN和SVCN的k-mean和H/T break算法,对度k>100的用户的聚类结果进行比较。N和fre表示用户总数和百分比。NK表示第k层中的累计用户数。hri是平均s标度比。N f nnnn hripanel A:SVEINk平均值的聚类结果C=2 114 27.9%27.8 121.7 3.84c=3 176 43.0%10.9 45.8 141.7 3.04c=4 119 29.1%5.4 20.8 57.5 151.4 2 2.64H/T断裂C=4 54 11.3%2.9 11.0 37.1 133.1 3.45c=5 273 56.9%1.6 5.3 15.0 42.8 133.0 3.00c=6 153 31.9%1.2 3.2 7.5 18是的。5 51.3 156.0 2. 88面板B:SVCNk平均值的聚类结果c=4 16918 41.1%3.0 12.8 42.8 132.0 3.22c=5 15209 36.9%2.1 7.3 20.4 54.2 141.4 2.66c=6 9049 22.0%1.6 5 12.5 28.9 66.5 154.0 2.33H/T断裂c=3 3308 5.7%5.0 27.1 126.7 4.71c=4 29125 50.2%2 8.7 33.4 133.9 3.97c=5 25539 44.1%1.2 3.8 11.7 39.5 147.6 3.61Zhou 5 15 50 3.00-3-2-1-3-2-1-2-1-3-2-1(a)(B)(c)(d)图6:概率SVEIN不同层中变化数量的分布。实线代表经验分布的最佳对数正态分布。(a) 从k-means算法中获得三层的Egos。(b) 从k-means算法中获得四层的Egos。(c) 从H/T break算法中获得五层的EGO。(d) 从H/T break算法中获得六层的EGO。他们的Jaccard系数值很低,这反映了他们之间的一致性。一个有趣的现象是,每一层中变化数量的经验分布可以很好地由对数正态分布拟合,由实心曲线证明。

19
可人4 在职认证  发表于 2022-6-24 06:46:12
当使用不同的聚类算法时,这种对数正态分布是稳健的,这与Facebook和Twitter的在线社交网络的结果一致(Dunbar等人,2015)-4-3-2-1-5-3-1-5-3-1-5-3-1(a)(b)(c)(d)图7:SVCN不同层中变化数量的概率分布。实线代表经验分布的最佳对数正态分布。(a) 从k-means算法中获得四层的Egos。(b) 从k-means算法中获得五层的EGO。(c) 从H/T断裂算法中获得四层的EGO。(d) 从H/T break算法中获得五层的EGO。3.3. 符合理论模型我们进一步将聚类结果符合个人社交网络层次结构的理论模型(Tamarit et al.,2018)。根据该模型,将个体的变化分为lll = (l, l, ..., lr) ,计算如下(lll|五十、 u,N)=BL,LN- 1,N- 1.eu- 1eur- 1.陆上通信线lll!euPr-1k=0klk+1(9),其中lll = (l, l, ..., lr) 表示每层中的更改数。L表示每一层变化期望的SUM,等于变化总数L。N是网络中个体的总数。B(L,p,N)=NL!pL(1- p) NL表示一个二进制分布。模型中有一个唯一的参数u,它是自我网络离散层次结构的指示器。如果个人投资(时间和能量)随层数线性减少,则参数u近似等于连续层中累积个体数之间比例对数(r)的对数m(Tamarit et al.,2018)。(a) (b)(c)(d)图8:基于SVEIN的不同聚类算法,不同层面的自我中心比例的经验分布。(a) 三层和K表示算法。

20
nandehutu2022 在职认证  发表于 2022-6-24 06:46:16
(b) 四层和k-means算法。(c) 五层和H/T中断算法。(d) 六层和H/T中断算法。一旦获得自我的经验层次结构,我们将根据Tama rit提出的模型计算相邻累积层之间的平均比例hri(Tamarit et al.,2018)。表3最后一列列出了两种算法的估计理论比例。对于SVEIN,k-means算法表明,用户被优先划分为具有三层结构的群组,而H/T break算法揭示了自我网络呈现出五层的比例。它们的标度比非常接近Zhou等人(2005)发现的标度比3。然而,我们发现SVCN的两种聚类算法之间的平均比例存在显著差异。平均而言,H/T-break算法的平均比例大于3.5,而k-means算法得到的比例小于3.5。两种聚类算法都表明,大多数用户在其自我网络中表现出四层结构,其比例分别为3.2和4.0,与之前报告的比例大致兼容(Zhou等人,2005)。(a) (b)(c)(d)图9:基于SVCN不同聚类算法的不同层级的自我中心比例的实证分布。(a) 四层和K表示算法。(b) 五层和k-means算法。(c) 四层和H/T中断算法。(d) 五层和H/T中断算法。无花果。8和9显示了具有两个网络sam e层结构的EGO的估计平均比例分布。我们发现,Tamarit模型给出的标度比分布符合两种聚类算法的对数正态分布。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 18:17