|
换句话说,句子和字母有条件地依赖于知道单词,它们的联合概率由pik=Xjpi | jpk | jpj给出,这意味着MI(X,Z | Y)=0。然后,当仅考虑单词重叠时,单词和字母重叠的句子多样性等于多样性(见附录C):DZβ(S)=eMI(XY,Z)=eMI(Z,Y)。(4) 因此,当Z根据Y描述的特征描述的类型的组成独立于特征Y本身如何与其他特征X组成时,特征X与考虑Z的多样性无关。例如,考虑图3中的行业多样性,其中职业被视为行业的特征。因此,我们可以将行业分布视为聚集过度职业的一种特殊方式。类似地,职业可以被视为特定技能和任务的集合,因此行业间接也是这些技能和任务的集合。等式(4)表明,只要职业在技能和任务方面的构成独立于他们所从事的行业,那么行业的多样性就完全由职业来体现,没有必要考虑技能和任务。5讨论本文提出了一个衡量多样性的框架,同时考虑了类型的多样性、平衡性和差异性。该框架建立在希尔数[6,8]和相应的多样性分解为独立的α和β分量[9]的基础上。拟议的框架提供了一种将差异纳入多样性测量的方法,而无需像目前的方法一样依赖于类型之间成对相似性的特殊选择[1,10]。
|