楼主: 能者818
989 43

[量化金融] 城市经济的共同轨迹 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-6-25 04:07:02
Vollrath,《世界经济评论》127,265(1991)。【63】J.Gao,B.Jun,A.Pentland,T.Zhou,C.A.Hidalgo,et al.,arXiv预印本arXiv:1703.01369(2017)。支持信息:城市经济I概述的共同轨迹。数据集SAB1998 2000 2002 2004 2006 2008 2010 2012年9698100102104106108110NO。员工人数:百万5.55.65.75.85.966.16.26.36.46.5无。单位:百万图。S1.(A)4-digitsNAICS分类、大都市统计区(MSA)和年份的就业数据可视化。第一年(1998年)工业分类由加权总和订购,以将其改造为嵌套矩阵。MSA按其人口排序。(B) 员工总数(蓝色)和机构总数(红色)的时间序列。我们利用县商业模式(CBP)提供的1998年至2013年的16年就业和机构数据研究了城市产业的动态和结构。北美行业分类系统(NAICS)的行业分类等级从19个到978个。我们使用350个大都市统计区(MSA)作为城市及其年度人口的定义;该数据由美国人口普查局提供。我们用Y(c,i,t)表示时间t时c市工业i的规模,用N(c,t)表示城市人口。图S1A中提供了完整数据集的聚合时空视图。大城市的工业比小城市多。图1b显示了美国所有城市员工和机构总数的时间序列。员工和机构的时间变化显示出类似的趋势,其中包括2010年附近的低谷。

22
nandehutu2022 在职认证  发表于 2022-6-25 04:07:05
某些行业的员工人数被表示为SizeClass,因为数据需要避免披露(机密性),或者不符合发布标准。员工人数等级如下:A为0-19,B为20-99,C为100-249,E为250-499,F为500-999,GF1000-2499,H为2500-4999,I为5000-9999,J为10000-24999,K为25000-49999,L为50000-99999,M为100000或以上。如果数据不完整,我们使用范围的中间值。在2013年的例子中,约68.5%的数据是由于特定行业的员工规模较小而导致的。虽然许多数据点都是模糊的,但它们几乎不会影响趋势,因为大多数模糊数据都表示非常小的行业,因此,在分析中,当将其聚合到2或3位数的NAICS分类时,它们的贡献很小。在上述数据中,约98.8%的数据在1000名员工以下(A至F)的范围内,具体而言,A为61.8%,B为25.5%,C为6.9%,E为3.0%,F为1.5%。在本研究期间,NAICS行业分类系统不是静态的。相反,分类法会定期更新,以适应新的行业。我们使用美国人口普查局的NAICS修订数据,以及美国国家公路与运输协会(AASHTO)、美国人口普查局和维基百科的MSA修订数据,将这些变化总结为整个研究期间的单一分类法。A、 NAICS修订北美行业分类系统(NAICS)由联邦统计机构用于对商业机构进行分类,以收集、分析和发布与美国商业经济相关的统计数据。除了商业部门的暂时演变外,这种分类法本身也会定期修订,以适应新的行业。

23
mingdashike22 在职认证  发表于 2022-6-25 04:07:08
这些更新提供了重塑U的功能的信息。S、 经济,包括技术变革。然而,有可能某些行业在命名法中仍以相同的名称命名,并具有全新的内容,我们无法在这些情况下捕捉创新。相反,我们将其作为涵盖整个行业的技术进步的背景。这种模糊性给我们的发现增加了噪音。在我们的分析中,我们使用了1998年至2013年的年度就业数据。我们根据6位数的NAICS新NAICS mergingingInheritanceInheritanceCreationInheritedDivision非继承DivisionInheritageDivisionInheritageDivisionInheritaceDivisionInheritaceDivisionInheritaceDivisionInheritaceDivisionInheritaceDivisionInheritanceDivisionInheritanceDivisionInheritanceDivisionInheritanceDi。S2、NAICS分类转换图。红色和蓝色节点分别描述新旧NAICS代码。箭头表示新旧代码之间的连接。箭头的颜色为黑色、深灰色和浅灰色,分别描述了旧代码的员工数量是否完全、部分和全部转移到新代码。NAICS代码以及1997、2002、2007和2012年分类的时间变化在2012年统一为分类。美国人口普查局给出的sameNAICS分类间隔为1998-2002、2003-2007、20082011和2012-2013。该方案允许我们在整个研究期间采用单一行业分类法。两次连续修订之间存在一些不精确匹配的情况。例如,“企业对企业电子市场”是一个新创建的部门,它将68个批发商部门的一些功能部分结合在一起。

24
mingdashike22 在职认证  发表于 2022-6-25 04:07:11
在整个时期内,只有4起创建案例,即2003年的“新住房销售建筑商”、“住宅拆迁商”、“企业对企业电子市场”和“批发贸易代理和经纪人”。这些行业分类的时间变化定义了一个将旧NAICS代码连接到新代码的二分网络。为方便起见,我们将旧代码称为家长,将新代码称为孩子。所有代码分为7组:继承(I)、创建(C)、合并(MG)、分割(D)、继承分割(ID)、非继承分割(ND)和合并(MD)。该方案专门且完全地对数据集中的每个代码更改进行分类。连接结构中旧代码的out degrees kout(i)和新代码的in degreeskin(j)定义了分类。图S2显示了分类更改的连接方案。继承是NAICS代码简单一对一转换所需的基本连接。当新代码具有kin(j)=1,而与旧代码相连的其他新代码具有kin(j)时,也定义了代码对≥ 简而言之,只有一个新代码以独占方式继承其父代码,因为旧代码是子代码的唯一父代码。对于带有kout(i)的旧代码,定义了继承除法和非继承除法≥ 2(除法),并取决于旧代码是否有继承的子代码。为新代码定义的创建、合并和分割。当其父代中的每一个都有另一个继承子代时,新代码被确定为创建。合并是针对其父母没有其他继承子女的非创造情况定义的。当一个新节点的kin(j)=1并且是非继承除法节点的子节点时,它被视为已除法节点。

25
能者818 在职认证  发表于 2022-6-25 04:07:14
最后,为kout(i)=1的旧代码定义了Mergedis,它是合并代码的特性。我们将所有行业分类转换为最新分类(2012年),以制定统一的员工人数时间序列。在继承的情况下(图S2中的黑色箭头),旧类别中的所有员工都会转移到新类别中的继承节点。浅灰色员工的划分不会转移到后面的节点,这意味着这些连接将被忽略。作为特例,非继承分割将其就业平均分配给分割节点(深灰色)。B、 都市统计区修订与NAICS修订类似,都市统计区(MSA)大约每5年修订一次。准确的时间间隔为1993-1999年、2000-2002年、20032006年、2007-2011年和2012-2013年。通过使用从美国国家公路与运输协会(AASHTO)获得的转换表,我们将所有MSA统一为一个参考。1998年和1999年,MSA分为两类:合并都市统计区(CMSA)和主要都市统计区(PMSA),其中一个CMSA包含多个PMSA。从2000年起,MSA被重新修订为综合统计区(CBSA)。例如,纽约市被归类为“纽约州新泽西州长岛北部纽约州CT-PA”CBSA和“纽约州新泽西州长岛北部纽约州”CMSA,共有15个PMSA,包括“新泽西州卑尔根帕塞克”、“新泽西州布里奇波特”、“新泽西州丹伯里”、“纽约州达奇斯县”、“新泽西州泽西市”、“新泽西州米德尔塞克斯萨默塞特亨特顿”、“新泽西州蒙茅斯海洋”、“拿骚乌尔克、,纽约州、纽黑文梅里登、康涅狄格州、纽约州、新泽西州纽瓦克、宾夕法尼亚州纽堡、康涅狄格州斯坦福德诺沃克、新泽西州特伦顿和康涅狄格州沃特伯里。1998年和1999年,我们使用CMSA作为城市的划分,因为CMSA的规模与CBAS相似。

26
何人来此 在职认证  发表于 2022-6-25 04:07:18
当一个MSA划分为多个MSA或与另一个MSA合并时,我们将这些MSA聚合为最大的MSA。使用U提供的MSA定义修改了一些例外情况。S、 人口普查局和一些大城市,如纽约、洛杉矶和芝加哥,都在与维基百科的定义进行交叉核对。二、显示的比较优势150 100 150 200 250 300 350城市rank555461565142534871238172226244312111行业代码02468101214B50 100 200 250 300 350城市rank5554615651425348712381226244312111行业代码00.10.20.30.40.5C50 100 150 200 300 350城市rank5554615651425348712381226244312111行业代码0510152503540D50 150 250 300 350城市RANK55546156525142534871238172226244312111行业代码00.511.522.533.5图。S3、行业i(yaxis)和城市c(x轴)的时间平均就业规模,通过自上而下的各种措施进行量化:(A)员工规模对数(Y(c,i)+1),(B)每个城市的份额,(c)RCA和(D)对数RCA(log(RCA+1))。行业代码根据其缩放指数(底部高)进行调整,城市根据其人口规模进行调整(大城市低)。原始规模是最具代表性的就业或机构指标。然而,它在捕捉城市产业特征方面有两个局限性。首先,城市的基准行业规模使小型行业难以区分。例如,零售业的份额是农业平均份额的100倍,大多数城市的基线产业构成类似,如图S3B所示。一个小的行业很容易被一个规模如此巨大的行业所掩盖。此外,城市规模的巨大差异可能会掩盖小城市的特征。

27
可人4 在职认证  发表于 2022-6-25 04:07:21
图S4B中城市人口的幂律分布表明城市规模的高度异质性。图S3A显示,当我们看到非标准化规模时,大城市几乎占据了所有行业的主导地位。因此,需要对城市规模进行标准化,以比较小城市和大城市的模式。显示比较优势(RCA)来源于国际贸易分析[45],为城市规模和行业规模的正常化提供了一个理想的选择。A健康护理零售业专业服务。FinanceManufacturingAdmin。,废物Mngt。会计科目。,食品服务。批发贸易其他服务建筑信息教育运输管理房地产、娱乐设施采矿农业2位数行业订购规模024681021416员工规模10500.511.5RCAB104105106107108人口10-310-210-1100累积概率0 10 20 30 40 5010-410-310-210-1100RCAln(RCA+1)0.5 1 1.5 2 2.5 3 3 3.5 410-410-210-1100图。S4.(A)纽约市2数字NAICS分类的行业规模(红色)和RCA(蓝色)。这些值是时间平均值,误差是时间的标准偏差。这些行业按规模按降序排列。(B) 所有城市时间平均人口的互补累积概率分布。幂律指数测量为-0.90,对应于概率分布p(N)的γ=1.90~ N-γ. (C) RCA(黑色)和对数RCA(蓝色)的概率分布。插图中描述了对数RCA分布的详细信息。RCA定义为一个行业的城市份额与所有城市的行业份额之比。RCA可以通过规范城市和行业的城市产业规模,缩小城市之间的产业结构差异。图S4A显示了纽约的行业规模及其RCA。

28
kedemingshi 在职认证  发表于 2022-6-25 04:07:24
RCA将所有行业标准化为可比规模。在许多研究中[38,39],如果工业或生产能力的RCA大于1,则认为其存在“已揭示”。由于其存在和不存在在[0,1]和[1]中具有不对称范围,∞), 分别制定了标准化RCA措施,以减少范围的异质性。对数RCA(lrca)[62,63]是归一化RCA度量之一。rca(c,i,t)=Y(c,i,t)PiY(c,i,t)/PcY(c,i,t)Pc,iY(c,i,t)(S1)lrca(c,i,t)=log(rca(c,i,t)+1)(S2)(S3)与对数rca相比,原始rca具有高度不均匀的分布,如图S4C所示。具有极高或极低RCA价值的城市产业使得其他一般产业非常微不足道。三、 城市比例关系1998 2000 2002 2006 2008 2010 2012 2014年0.60.811.21.41.6比例指数1121222331424448515253545566162717281图。S5、2位数NAICS分类行业标度指数的时间序列。线条旁边的数字记录行业代码。之前的研究表明,城市就业与行业的比例关系[31]。因此,我们通过将以下等式与经验就业数据拟合,计算就业规模Y(c,i,t)和城市规模N(c,t)的标度指数β(i,t)和行业前因子Y(i,t):Y(c,i,t)≈ Y(i,t)·N(c,t)β(i,t)(S4)行业规模在低分类水平上具有高波动性。因此,我们使用2位NAICS分辨率。我们通过对固定行业i和时间t的Y(c,i,t)和N(c,i,t)的对数进行线性回归来计算标度指数。表中列出了1998年至2013年标度指数的时间平均值和相应的时间偏差。S1、在本研究期间,标度指数没有显示出太大的时间变化(见图。

29
能者818 在职认证  发表于 2022-6-25 04:07:27
S5)。行业NAICS代码β农业、林业、渔业和狩猎11 0.65±0.03 0.31±0.04采矿、采石、,石油和天然气开采21 0.78±0.04 0.31±0.04制造业31 0.94±0.02 0.73±0.02零售业44 0.96±0.01 0.98±0.00医疗和社会援助62 0.96±0.01 0.94±0.00公用事业22 0.99±0.02 0.66±0.02住宿和餐饮服务72 1.00±0.01 0.95±0.00其他服务(公共行政除外)81 1.02±0.01 0.95±0.00建筑23 1.05±0.01 0.92±0.01艺术、娱乐、,娱乐71 1.09±0.01 0.86±0.01运输和仓储48 1.11±0.04 0.85±0.01房地产和租赁53 1.12±0.02 0.93±0.00批发贸易42 1.12±0.01 0.91±0.01信息51 1.16±0.02 0.89±0.01金融和保险52 1.17±0.01 0.88±0.01行政和支持以及废物管理和修复服务56 1.17±0.02 0.93±0.01教育服务61 1.21±0.03 0.77±0.01专业、科学和技术服务54 1.22±0.01 0.92±0.01公司和企业管理55 1.46±0.03 0.76±0.02表S1。2位数NAICS分类中的行业比例指数。标度指数是1998-2013年标度指数的时间平均值,Ris也是时间平均值。四、 引导-跟随矩阵。铅跟踪矩阵的定义我们使用RCAin公式S2规范化城市就业规模。通过使用RCA值,我们将一个城市的产业描述为第t年城市c的产业向量I(c,t)。产业I的空间向量可以用类似的方式定义~I(c,t)=(…,lrca(c,I,t),…)我∈I(S5)~ L(I,t)=(…,lrca(c,I,t),…)c∈C(S6),其中lrca=对数(rca+1),I和C分别表示对数rca、行业集和城市集。行业向量的长度与行业数量相等(例如,对于2位数的NAICSindustries,为19)。

30
可人4 在职认证  发表于 2022-6-25 04:07:30
现在,通过两个向量I(c,t)和I(c,t+τ)之间的Pearsoncorrelation来衡量具有时滞τ的两个城市之间的行业相似性。φ(c,t;c,t+τ)=ρ(~ I(c,t),~ I(c,t+τ))(S7),其中ρ测量两个向量之间的皮尔逊相关性。对于位置向量L(i,t),也可以获得行业间位置相似性ψ(i,t;i,t+τ)。随着每个城市的动态变化,我们按人口对城市进行分组,并以平均人口作为参考~G(G,t)=(…,hlog(rca(c,i,t)+1)ic∈g、 …)我∈I(S8),其中h·ic∈G组中城市c的平均值。我们通常把这些城市分成20组等分。集团之间的行业相似性也可以通过公式S7中的相关性来确定。φ(g,g,t,τ)=ρ(~g(g,t),~g(g,t+τ))(S9)然后,我们将一组g作为参考组,让另一组在时间上波动(τ),并测量其行业相似性φ(g,g,t,τ)。通过跟踪产业相似性φ随时滞τ的变化,我们可以观察到群体gis与群体gin时间是否相似。为了关注时滞τ的影响,我们对参考时间t的变化进行了平均。φ(g,g,t,τ)=φ(g,g,t,τ)- φ(g,g,t,0)(S10)φ(g,g,τ)=hφ(g,g,t,τ)it(S11),其中φ(g,g,τ)是参考组g和观察组g的时间差异τ之间相似性的平均变化。图S6A和图S6B显示了φ(g,g,τ)与固定参考组g和各种观察组g的滞后τ之间的关系,用彩色线表示。在图S6A中,最大参考城市的相似性通常增加,这意味着小城市在时间上与最大城市相似。另一方面,大城市与最小的城市群不同。S6B。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 21:42