楼主: 大多数88
1915 73

[量化金融] 估算城市经济复杂性的驱动因素及其联系 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-11 06:05:47
该领域是城市环境的抽象,代表了城市提供现象发生要素之一的特定位置概率,我们可以假设人们在城市生活和工作时与之互动。它应该捕捉到人们通过社会、经济和建筑环境接触到的所有类型的城市互动中的元素。从这个角度来看,城市的功能就好像它被一个“文化场”渗透到了整个空间,而rc(x,y)量化了特定地点可用的社会、经济和文化资源的规模。该地块价值较高的位置具有高度集中的各种城市因素。此处可能需要注意术语。所有这三个度量值都会随着所考虑的distinctcabilities数量的增加而增加。因此,它们可以被视为多样性的衡量标准(或多样性,如【57】所定义;另见【58】)。一个行业、个人或城市所需的能力越多,重组能力的可能性就越大(例如,rcitself有可能不断推动电子补充材料C中所述的更大RCA)。该模型的这一方面也支持将这些量解释为复杂性的度量(与[59]描述生物多样性和复杂性如何携手并进的思路相同),尽管多样性和复杂性通常被视为衡量系统的不同方面(有关这些概念的全面审查,请参见[60])。图2:。嵌套从模型中出现。对于100个城市和100个行业,就业概率为,s=0.1假设为常数,r均匀分布在0.7和0.95之间,M均匀分布在5和25.3之间。

12
kedemingshi 在职认证  发表于 2022-6-11 06:05:51
模型的理论和方法学意义(a)城市比例法根据公式(2.1)我们可以重现就业与人口规模的幂律关系(见[38])。为此,我们援引文化进化模型,预测人口规模与集体知识规模之间的特定关联,rc=a+b ln(Nc)(见[61-63])。这种关系与城市环境中的观察结果一致,在城市环境中,c市的因素和能力的多样性大约是人口规模的对数函数[38]。结合RCA和Ncinto公式(2.1)之间的关系,yieldspi,c,f=e-Mf(1-si)(1-a) ebMf(1-si)ln(Nc)=e-Mf(1-si)(1-a) NbMf(1-si)c.幂律函数出现的原因变得很清楚,因为我们是对数的幂函数(关于测试此解释预测的详细信息,请参见[7])。这一结果表明,更复杂的现象更具超线性,解释了为什么更复杂的技术创新和生产过程往往发生在更大、更多样化的城市中心[7,8,46,64]。与此相关的是,它还解释了可能由类似的社会互动网络驱动的同类不同现象(例如,两种性传播疾病、两种大学学位或两种犯罪)为什么以及如何以非常不同的城市规模模式为特征(见[43,44,65,66])。尽管这些都是建立rcandNc之间关系的坚实理论基础,但下面我们将从数据中直接估计参数RCA,并展示其与Ncalso对数的关联如何作为经验结果出现。(b) 跨地区活动的嵌套性城市间产业的嵌套(三角形)模式(参见,例如,[37])自然产生于等式(2.1)中的函数。

13
kedemingshi 在职认证  发表于 2022-6-11 06:05:54
为了说明这一点,为了简单起见,假设所有位置的所有个体的Si近似为常数。接下来,设两个产业L和H,使ML<MH,以及两个城市L和H,使rl<rh。根据公式(2.1),由于p(MH,s,rh)>p(MH,s,rl)和p(ML,s,rh)>p(ML,s,rl),两个行业的集体技术水平较高的城市的就业概率较高。此外,由于p(MH,s,rh)/p(ML,s,rh)>p(MH,s,rl)/p(ML,s,rl),不同城市中高复杂度行业相对于低复杂度行业的就业份额将大于低复杂度城市的相同比例。后一种属性被称为“对数超模块”,反映了为什么多样性城市在复杂的经济活动中比不那么多样的城市更具竞争力【8,19,46,67,68】。这一结果如图2所示,其中城市和行业的r(均匀分布在0.7和0.95之间)和M(均匀分布在5和25之间)的值不同,p(M,s,r)(常数s=0.1)的计算值也不同。正如经验所观察到的那样,出现的三角模式表明就业的可能性是嵌套的[37]。根据该模型,很明显,如果我们假设具有高个人知识(高s)的个人倾向于将自己定位在高r的城市,那么这种嵌套模式可能会变得更加激烈。这种个人分类是根据经验观察到的,我们将在下一节讨论它如何从该模型中出现。(c) 对高知识个人的分类在这里,我们展示了一些论点,这些论点表明该模型可能再现了一个观察结果,即有技能的个人倾向于将自己定位在大型多样化的城市【69】。这可以通过注意等式中的概率来表示。

14
mingdashike22 在职认证  发表于 2022-6-11 06:05:57
(2.1)意味着个人和城市之间的一种分类匹配形式,假设所有城市的总就业人数在估算成本的基础上最大化(详见电子补充材料B)。为了证明这一点,让两个个体L和H之间的sL<S,两个城市L和H之间的rl<rh。问题是,假设在同一个城市存在成本,那么这两个人将如何将自己归类到这两个城市中。鉴于此,对于固定(但较大)Mf=M,我们有p(M,sL,rl)+p(M,sH,rh)>p(M,sL,rh)+p(M,sH,rl)(见电子补充材料B)。换句话说,最有可能的情况是,拥有高(低)水平专有技术的个人将排序到拥有高(低)水平集体专有技术的地方。在一个更完整的价格模型和更具体的拥挤成本模型中,分类匹配现象最终应该反映在工资上,正如所观察到的那样【69,70】。我们将通过研究我们的经济复杂性变量(一旦估计)如何与各行业城市的工资相关联来实证探讨这一问题。(d) 城市经济复杂性的三个驱动因素之间的关系我们将等式(2.1)中的(负)指数称为“净复杂性”(见[71])。该指数可分解为城市复杂性的最初三个驱动因素。它们是先验的独立量。目前,在我们的建模框架内,我们缺乏关于变量Mf、SIA和RCA的动力学规律的详细理论,以及它们之间的关系。

15
大多数88 在职认证  发表于 2022-6-11 06:06:00
还有理由预计,集体知识的增加(通过移民带来新的能力和知识,直接外国投资为特定行业注入特定的能力,或通过创新)可能会产生一种强化效应,激发和推动良性循环:一个拥有足够大集体知识的地方将吸引更多的人,并促进出现更复杂的经济活动,这将反过来增加该地区的集体知识。因此,这一过程将推动集体学习的失控循环,集中大城市的经济活动和财富(参见,例如,[29])。活动越复杂,集中的地方就越少。有趣的是,这三个术语的变化对就业概率有指数效应(更多详情请参见电子补充材料C)。净复杂性项是可分解的,这一事实导致了一种通过取两次对数来估计其组成部分的策略,将乘积的指数转换为简单值。只有当我们的模型能够准确描述如何创建员工时,这种方法才有效。为了检验后一种假设,在下文中,我们将估计这些数量,并证明等式(2.1)从建模和预测能力的角度对交替概念化提供了重要的统计改进。至关重要的是,对城市特定驱动因素(城市集体专有技术)的评估结果与经济绩效的衡量相关。

16
kedemingshi 在职认证  发表于 2022-6-11 06:06:03
简言之,我们表明,城市经济复杂性的“驱动因素”是可以衡量的,并具有可衡量的后果。然而,从统计上看,我们预计它们会相互关联,因为具有复杂生产流程(高Mf)的公司很可能会选择位于不同的城市(高rc),而这些城市是高技能个人(高si)自我分类的地方(详见电子补充材料B)。例如[72]中的模型表明,当移民的技能与当地人的技能互补时,当地人和移民的工资都会增加。4、材料和方法(a)数据我们使用的数据是按城市工业年分列的就业人数、机构数量和平均工资的估计数。使用劳工统计局提供的编程代码下载数据。有关数据的其他详细信息,请参阅电子补充材料D。(b) 根据数据估计城市复杂性的驱动因素我们对复杂性的估计(针对行业、城市和个人)代表我们数学模型中的参数。在本节中,我们将展示如何使用回归中的估计固定效应来估计这三个复杂性驱动因素。现在,假设我们知道等式(2.1)中概率的值,pi,c,f。将这样的概率等同于建议的函数形式,取两次负对数,得到- 自然对数- 自然对数pi、c、f= - ln(Mf)- ln(1- si)- ln(1- rc),(4.1)方程(4.1)显示了网络复杂性是如何线性分解为其主要组成部分的。为了估计我们模型中经济复杂性变量的值,等式(4.1)意味着我们可以回归- 自然对数- 自然对数pi、c、f针对与活动、个人和城市相对应的三种加性固定水平效应。然而,我们提出的回归方法在实践中有一些局限性。

17
能者818 在职认证  发表于 2022-6-11 06:06:06
通常情况下,个人层面的微观数据往往很难获得,这使得pi、c、fdif难以估计。当可用的唯一信息是每个行业和城市的就业总数时,我们无法在每个后二元水平上估计等式(4.1)左侧的概率,因此我们无法在右侧包含个人固定效应。幸运的是,该模型足够简单,我们可以用c市的平均个人专有技术取代siin公式(2.1)来解决这一限制≈圆周率∈csi/Nc。这个替换意味着Pr{Xc,f=1}=exp-Mf(1- \'sc)(1- 钢筋混凝土)(见电子补充材料E)。该表达式表示c市任何随机个体(与特定个体相反)受雇于活动f的概率。我们通过就业份额bpc、f=yc、f=yc、f/Nc来估计pc、f=Pr{Xc、f=1},其中yc、fis是c市f行业的就业人数和Ncis总人口规模。回归方程将允许我们估计行业的复杂性和城市的集体知识(但不是工人的个人知识)变成- 自然对数- 自然对数yc,f= δf+γc+εc,f,(4.2),其中εc,fis是误差项,δf代表- ln(Mf)和γcfor- ln((1- \'sc)(1- rc))。我们注意到,城市固定效应是一个城市特有的变量,包括城市环境的适宜性和公民的平均能力之间的相互作用。虽然我们无法从我们的数据中了解到很多关于个人层面的专业知识,但加入代理可以让我们了解其他两个驱动因素对城市绩效衡量的影响(第(d)节)。(c) 对竞争模型的评估我们使用保留数据评估模型(4.2)对四种备选模型的预测能力。

18
大多数88 在职认证  发表于 2022-6-11 06:06:09
其中两个模型仅在功能方面与我们的模型不同。pc的估计值Fc原则上应包含使用伪计数的贝叶斯先验,bpc,f=(Yc,f+αc,f)/(Nc+Pfαc,f),以便处理Yc,f=0的情况。参见【73】。如果对数据中所有可能的c和f组合(即,地点和活动矩阵中没有缺失值)的bpc、f进行估计,则估计方法更简单。将奇异值分解(SVD)或主成分分析(PCA)应用于日志(bpc,f)=-Mf(1- \'sc)(1- rc),将产生一对向量,一个主分量向量和另一个主荷载向量,对应于(1)的向量- \'sc)(1- rc)和Mf。由于数据中的缺失值更像是规则而非例外,因此本文提出的固定效应方法可能比SVD的应用具有更大的适用性。因变量的变换;也就是说- ln公司(- ln(yc,f,t)),左侧分别由yc,f,t(即模型1.1)和ln(yc,f,t)(模型1.2)给出。如电子补充材料F所示,例如,模型1.2源自一个能力不是互补的(正如我们所假设的)而是可替代的世界。因此,模型(4.2)和这两个其他模型之间预测性能的差异将向我们展示理论及其基本假设预测的特定功能形式的重要性。其他两个备选模型与(4.2)的不同之处在于模型右侧的公式。一个模型(即模型2.1)将是标准的城市比例模型,其中假设所有现象的比例指数都相同,如基于网络的解释所建议的那样【74】。

19
可人4 在职认证  发表于 2022-6-11 06:06:12
最后一个备选模型(模型2.2)是标准比例模型的无约束版本,其中假设每个行业f的基线流行率和比例指数原则上都不同(见电子补充材料f)。模型(4.2)和后两个模型之间的绩效差异将告诉我们,增加自由度来解释城市和行业就业模式的有效性。为了根据“样本外”预测性能对这些模型进行比较,我们每年都将数据分为训练集和测试集(或验证集)。使用训练数据确定模型参数后,通过预测测试集上的依赖变量的准确程度来比较模型参数。使用均方根误差(RMSE)和平均绝对误差(MAE)评估预测。对数据重复100次训练和测试随机分割(引导交叉验证)。详见电子补充材料F。(d) 将驱动因素与城市经济绩效联系起来,是个人和企业之间的紧张关系,他们试图从城市的多样性中获益,而个人和企业则试图避免彼此,以减少在同一城市生活和运营的拥堵成本。然而,正如我们在第(c)节中所述,我们希望有技能的个人和复杂的行业能够在大城市中找到自己的位置,支付更高的工资来补偿拥堵的成本。

20
大多数88 在职认证  发表于 2022-6-11 06:06:15
因此,在本节提出的实证分析中,我们有兴趣分析我们的利益变量(行业复杂性和集体知识)是否与企业和工人的经济绩效指标呈正相关。我们将在城市-行业组合的水平上,用平均工资和机构的平均规模来衡量绩效。考虑到更大(人口更多)城市的企业和工人生产率更高[75–85],我们还将城市人口规模的对数作为控制变量纳入回归分析。此外,我们还将包括两个衡量城市和行业复杂性的指标,这两个指标在之前关于经济复杂性的文献中已经提出过。这些指标被称为经济复杂性指数(ECI)和产品复杂性指数(PCI)[2],这里适用于城市和工业(而不是国家和出口产品)。这些指数不是对专有技术或复杂性的统计估计。相反,它们是一种数学结构,考虑到它们与经济增长指标的理论高度相关[24],假设它们根据其潜在能力数量对城市和行业进行排名(有关讨论,请参见[21],有关该方法的分析合理性,请参见[31])。我们将通过以下形式的线性回归分析这些关联:ln(zc,f,t)=β+βln(\'sproxyc,t)- βdδf,t+βdγc,t+x控制β控制+εc,f,t.(4.3),其中zc,f,t代表工资或机构规模,其中我们明确了表示年份的时间维度t。我们将进行不同规格的回归。在这里,我们面临一个关于数据测量内容的挑战。美国劳工统计局(Bureau of Labor Statistics)提供了城市行业组合层面的就业数据,而非企业数据。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 16:53