楼主: 能者818
1358 28

[量化金融] 多样性及其分解为多样性、平衡性和差异性 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-6-14 05:12:55
换句话说,句子和字母有条件地依赖于知道单词,它们的联合概率由pik=Xjpi | jpk | jpj给出,这意味着MI(X,Z | Y)=0。然后,当仅考虑单词重叠时,单词和字母重叠的句子多样性等于多样性(见附录C):DZβ(S)=eMI(XY,Z)=eMI(Z,Y)。(4) 因此,当Z根据Y描述的特征描述的类型的组成独立于特征Y本身如何与其他特征X组成时,特征X与考虑Z的多样性无关。例如,考虑图3中的行业多样性,其中职业被视为行业的特征。因此,我们可以将行业分布视为聚集过度职业的一种特殊方式。类似地,职业可以被视为特定技能和任务的集合,因此行业间接也是这些技能和任务的集合。等式(4)表明,只要职业在技能和任务方面的构成独立于他们所从事的行业,那么行业的多样性就完全由职业来体现,没有必要考虑技能和任务。5讨论本文提出了一个衡量多样性的框架,同时考虑了类型的多样性、平衡性和差异性。该框架建立在希尔数[6,8]和相应的多样性分解为独立的α和β分量[9]的基础上。拟议的框架提供了一种将差异纳入多样性测量的方法,而无需像目前的方法一样依赖于类型之间成对相似性的特殊选择[1,10]。

22
能者818 在职认证  发表于 2022-6-14 05:12:58
该框架还提供了多样性的自然衍生,解决了多样性的每个维度在一个综合指数中的权重问题【20】。此外,提议的多样性度量值有一个明确的解释,即“组成单元的数量”[22],描述了假设情境中可能存在的类型数量,其中类型没有重叠,并且它们具有相同的份额。我还提出了多样性的“ABC”分解,它提供了一种在单独度量中捕获多样性、平衡和差异的方法。这一衡量标准揭示了不同系统中不同维度多样性可能具有的不同动力学和功能特性。例如,在经济学的背景下,经济发展往往与经济活动多样性的增加有关[5,19]。然而,这是一个公开的问题,即多样性的各个组成部分在经济发展过程中的作用是什么——正如本论文的初步结果所表明的那样,如果以行业和他们所从事的职业来衡量差距,经济发展实际上可能与缩小差距同时进行。该框架还揭示了测量多样性与信息论不确定性度量之间的密切联系。信息论测度的simpleaditive性质对应于多样性测度的乘法性质,并且在考虑多个特征时可以推导simpleproperties。这些属性可以为分析高维数据集提供有用的工具。此外,这里给出的多样性度量可以解释为二部网络上的向心度量,或多变量情况下的超图。从这个意义上讲,beta多样性捕获了网络的结构特性。

23
能者818 在职认证  发表于 2022-6-14 05:13:01
这些度量的应用可以扩展到有向网络(例如经济学中的投入产出表[11]),因为任何有向网络都可以被解释为二部网络。在实践中,找到特定研究问题的兴趣特征可能很有挑战性。这些问题取决于具体的应用领域和可用的数据,需要理论驱动的调整。第二个挑战是从数据中准确估计拟议的多样性度量。众所周知,像互信息这样的信息论度量的估计是困难的。未来可能的方法是使用自举技术[2]或贝叶斯推理[7]从数据中估计多样性度量。感谢Andres Gomez Lievano和Koen Frenken的宝贵反馈和评论。这项工作由荷兰科学研究组织(NWO)根据Vici计划(编号453-14-014)资助,并从Swantje Mondt旅游基金获得支持。参考文献【1】A.Daly、J.Baetens和B.De Baets。生态多样性:测量不可测量的。数学,6(7):1192018年7月。内政部:10.3390/math6070119。[2] S.DeDeo、R.Hawkins、S.Klingenstein和T.Hitchcock。Bootstrap方法,用于对社会系统中的决策和信息流进行实证研究。熵,15(6):2246–22762013。内政部:10.3390/e15062246。[3] R.A.Foley和M.Mirazon Lahr。文化多样性的演变。皇家学会哲学学报B:生物科学,366(1567):1080–10892011年4月。内政部:10.1098/rstb。2010.0370.[4] K.Frenken、F.Van Oort和T.Verburg。相关品种、未更新品种与区域经济增长。区域研究,41(5):685–6972007年7月。内政部:10.1080/00343400601120296。[5] C.A.Hidalgo和R.Hausmann。经济复杂性的组成部分。

24
可人4 在职认证  发表于 2022-6-14 05:13:04
美国国家科学院学报,106(26):10570–105752009年6月,0909.3890。内政部:10.1073/pnas。0900943106【6】M.O.Hill。多样性和均匀性:统一的符号及其后果。生态学,54(2):427–4321973年3月。内政部:10.2307/1934352。[7] M.Hutter。相互信息的分发。arXiv,(12月):399–406102001年12月。统一资源定位地址http://arxiv.org/abs/cs/0112019.[8] 约斯特。熵和多样性。Oikos,113(2):363–375,2006年5月。内政部:10.1111/j.2006.0030-1299.14714。x、 [9]L.Jost。将多样性划分为独立的alpha-en-beta组件。生态学,88(10):2427–24392007年10月,1106.4388。内政部:10.1890/061736.1。[10] T.Leinster和C.A.Cobbold。衡量多样性:物种相似性的重要性。《生态学》,93(3):477–4892012年3月。内政部:10.1890/102402.1。[11] W.Leontief。投入产出经济学。牛津大学出版社,纽约,1966年。[12] R.麦克阿瑟。动物种群的波动和群落稳定性的衡量。生态学,36(3):533,1955年7月。内政部:10.2307/1929601。[13] S.E.页。多样性和复杂性。普林斯顿大学出版社,2011年。统一资源定位地址http://www.jstor.org/stable/j.ctt7pfdp.[14] A.珀维斯和A.赫克托。获取生物多样性的度量。《自然》,405(6783):212–2192000年5月,arXiv:1011.1669v3。内政部:10.1038/35012221。[15] I.Rafols和M.Meyer。多样性和网络一致性作为跨学科的指标:生物纳米科学案例研究。科学计量学,82(2):263–28720010,0901.1380。内政部:10.1007/s11192-009-0041-y[16]C.Rao。多样性和差异系数:一种统一的方法。《理论种群生物学》,21(1):24–431982年2月。内政部:10.1016/00405809(82)90004-1。[17] A.Renyi和A.R’enyi。关于熵和信息的度量。

25
能者818 在职认证  发表于 2022-6-14 05:13:07
《第四届伯克利数理统计与概率研讨会论文集》,第1卷:对统计理论的贡献,《第四届伯克利数理统计与概率研讨会论文集》,第547-561页,加州伯克利,1961年。加利福尼亚大学出版社。统一资源定位地址https://projecteuclid.org/euclid.bsmsp/1200512181.[18] S.Ruggles、S.Flood、R.Goeken、J.Grover、E.Meyer、J.Pacas和M。索贝克。IPUMS美国:8.0版[数据集]。明尼苏达州明尼阿波利斯:IPUMS,2018年。内政部:10.18128/D010。V8.0。[19] P.P.萨维奥蒂。技术演变、多样性和经济。爱德华·埃尔加出版社,1996年。统一资源定位地址https://econpapers.repec.org/RePEc:elg:eebook:727.[20] A.斯特林。分析科学、技术和社会多样性的一般框架。《皇家学会界面杂志》,4(15):707–7192007年8月。内政部:10.1098/rsif。2007.0213.[21]D.Tilman、F.Isbell和J.M.Cowles。生物多样性和生态系统功能。《生态学、进化和系统学年鉴》,45(1):471–493,2014年11月,arXiv:1011.1669v3。内政部:10.1146/Annurevicolsys-120213-091917。【22】H.Tuomisto。量化物种多样性的统一术语?是的,它确实存在。Oecologia,164(4):853–8602010年12月。内政部:10.1007/s00442-010-1812-0。【23】J.C.van den Bergh。最佳多样性:相对于重组创新,增加回报。《经济行为与组织杂志》,68(3-4):565–5802008年12月。内政部:10.1016/j.jebo。2008.09.003.【24】N.J.van Eck和L.Waltman。如何规范共现数据?对一些著名的相似性度量的分析。《美国信息科学和技术学会杂志》,60(8):1635-16512009年8月,0803.1716。内政部:10.1002/asi。21075【25】M.L.Weitzman。重组生长。《经济学季刊》,113(2):331–360,1998年5月。内政部:10.1162/00335539855595。【26】R.H.惠塔克。

26
nandehutu2022 在职认证  发表于 2022-6-14 05:13:11
物种多样性的进化和测量。分类单元,21(2/3):213,1972年5月。内政部:10.2307/1218190。【27】M.A.Yildirim和M.Coscia。使用随机游动在对象之间生成关联。PLoS ONE,9(8):E1048132014年8月。doi:10.1371/journal。波内。0104813.[28]L.Zhang、R.Rousseau和W.Gl–anzel。参考文献多样性是期刊跨学科性的一个指标:考虑学科间的相似性。《信息科学与技术协会杂志》,67(5):1257–12652016年5月,0803.1716。内政部:10.1002/asi。A希尔数和熵在多样性的定义中,我们依赖于希尔数的概念,遵循[6]和[8]。q阶希尔数由相对频率的广义平均值的倒数给出。类型相对频率的广义加权平均值由q'p=q给出-1sXipipq-1i,(5)其中权重由相对频率pi给出。参数Q决定了所考虑的平均值。例如,\'p表示调和平均值,\'p表示几何平均值,\'p表示算术平均值[6]。Hillnumber of order q将类型多样性度量为Meanqd(S)=q'p=Xipqi!的倒数!1.-q、 参数q决定了常见Orrre物种的平均权重。q>1的值对相对频率高的类型更为重要,q<1的值对相对频率低的类型更为重要。q=0的最小值考虑到每个类型对平均值的贡献相等,而不管其相对频率如何。对于q=0,分集由byD(S)=Xi1=nand给出,仅给出S中类型数的计数。

27
mingdashike22 在职认证  发表于 2022-6-14 05:13:14
因此,0级的山数是多样性的度量,也就是生态学中的物种丰富度。对于q=2,得到的一个SD(S)=Xipi,它与辛普森集中指数和基尼指数直接相关[8]。通常,Hill数与Rnyi熵[17]相关,由qd(S)=eqH(X),其中qh(X)=1- qlogXipqi!。当取q的极限时,香农熵作为特例出现→ 1、这对应于唯一的希尔数,它既不支持稀有型也不支持普通型,并由比亚迪(S)=limq给出→1qD(S)=e-Pipilog(pi)=eH(X)。上述希尔数和熵之间的关系告诉我们如何将以比特或NAT为单位的熵给出的不确定性度量转换为以“有效类型数”为单位给出的多样性度量。S中随机取样元素的类型越不确定(即,Qh(X)越高),则认为集合Sin的多样性越大。B多重特征本节阐述了在考虑随机变量X和Y描述的两个特征时,正文中给出的关于多样性的结果。然后用联合分布pij=P(X=i,Y=j)来描述自然对。利用信息论量的简单加性,我们给出了关于多样性的一些简单结果。通过考虑图6中的维恩图,可以轻松验证计算结果。在这里,我们重写了对应于随机变量Z的类型多样性,给出了由随机变量x和Y给出的一对特征的重叠,asDXYβ(S)=eMI(XY,Z)(6)=eH(XY)-H(XY | Z)=eH(X)+H(Y)-M I(XY)-H(X | Z)-H(Y | Z)+M I(XY | Z)=eMI(X,Z)+MI(Y,Z)-MI(XY)+MI(XY | Z),其中我们使用H(XY)=H(X)+H(Y)- M I(XY)和H(XY | Z)=H(X | Z)+H(Y | Z)- MI(XY | Z)。由此可知,随着特征X和Y具有更大的依赖性,即。

28
nandehutu2022 在职认证  发表于 2022-6-14 05:13:17
更具相关性,如M I(XY)的大值所示。在特征X和Y不共享信息的特殊情况下,即MI(X,Y)=0,我们有dxyβ(S)=eMI(XY,Z)(7)=eMI(X,Z)+MI(Y,Z)=DXβ(S)DYβ(S)。因此,对于独立特征,多样性是乘性的。C聚合另一种情况是,我们认为由随机变量Z描述的类型由随机变量Y描述的特征组成,而特征Y本身具有由随机变量X描述的特征。因此,类型和特征之间的联系由联合概率分布pjk给出,以及通过联合分布pij在特征和“子特征”之间建立的链接。当联合概率pijare独立于联合概率pjk时,我们得到了pijk=pijpk | j=pi | jpk | jpj。换句话说,随机变量Z和X在给定Y时是条件独立的,这意味着MI(X,Z | Y)=0。然后,多样性给定的特征对XY可以重写为dxyβ(S)=MI(XY,Z)(8)=eH(Z)-H(Z | XY)=eH(Z)-(H(ZX | Y)-H(X | Y))=eH(Z)-H(Z | Y)=eMI(Z,Y),其中我们使用MI(X,Z | Y)=0表示H(XZ | Y)- H(X | Y)=H(Z | Y)。换言之,当考虑特征XY中Z的多样性时,考虑X是非常复杂的。AX YZBX YZCX YZFigure 6:熵和互信息可以用Venndiagrams表示,其中每个圆对应于相关随机变量X的熵H(X)。例如,与X和Y相关的两个圆的交点表示互信息M I(X,Y),它们的并集表示联合熵H(XY)。条件熵H(X | Y)是通过从总不确定度H(X)中减去交集得到的。A表示等式(6)中的互信息mi(XY,Z)。给定重叠曲率XY的变量Z的多样性由阴影区域的指数给出。

29
mingdashike22 在职认证  发表于 2022-6-14 05:13:20
B表示(7)的特殊情况,其中特征X和Y是独立的,即M i(X,Y)=0。从图中可以清楚地看出,MI(XY,Z)=M I(X,Z)+M I(Y,Z),因此在这种情况下,相关的多样性是乘性的(方程(7))。C表示(8)的情况,其中Z和X在条件上独立于Y,即M i(Z,X | Y)=0。在这种情况下,在计算给定特征对XY的Z多样性时,考虑特征X变得无关紧要。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 12:44