楼主: 可人4
1108 27

[量化金融] 规模报酬率的人为递增与抽样问题 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-6-10 07:51:31
把所有的东西放在一起,这个序列告诉我们()带有尺寸的秤是近似值经验值2英寸().(6) 我们可以为y固定状态足够大且足够大(以便()2英寸()) 但是现在仍然是, 我们有=d项次()/dd项次()/d,d+ 2英寸()/dd项次()/d,(7) 由此产生(, )2英寸().(8) 考虑到我们的零模型,等式(8)为我们提供了在si ze特定样本附近的纯统计效应的局部标度指数的期望值. 价值观(, )1重新呈现以下组合:和对于这一点,人们会期望规模收益不变。具体来说,这是一个相对于大数定律(LLN)适用,且不应为任何IR服务。从许多ci的横截面缩放指数缩放指数本质上是局部的,因为它们量化了总输出随大小的相对变化率。因此,对于不同的尺寸,该比率可能不同,例如,如等式(8)所示。然而,在城市规模分析中,我们通常使用普通最小二乘法(OLS)估计值,根据经验估算全球规模指数,该指数代表了许多城市的平均弹性(但请参见Gomez-Lievano et al.2012;Leit~ao et al.2016)。因为比例系数可能与尺寸有关, 城市尺度分析中使用的OLS回归的线性假设可能不成立,这反过来可能会在估计中产生偏差。

12
可人4 在职认证  发表于 2022-6-10 07:51:34
假设数据中存在上一节所述的比例指数,如果我们从许多城市总产出与人口规模的对数回归线来估计,比例指数会是多少?在简单线性回归模型中[|]= ()哪里()= + , thecoefficient公司关系的可表示为比率[,][]=[][][][].因此,为了计算传统的全局缩放指数,我们将populationsize表示为一个随机变量. 在我们的例子中,标度指数would为(, , )=[ln()ln公司(())][ln()][ln(())][ln()].到目前为止,我们已经分析了() 对于两个政权。一个当 v相对于  其中,我们得到方程(4)(即,对于大尺寸和小偏差,LLN保证的常数返回到比例),另一个是 issmall相对于 我们得到方程(8)(小规模和大差异的最大值产生的规模收益递增)。因此,如果我们在空模型中生成一个城市集合  从分布中获取多个值,输出  在最大的城市,它的规模将与规模成线性关系,而在小城市,它的规模将超线性关系。为了解释方程(4)和(8)产生的所有可能的弹性,我们通过限制() 仅适用于这两种天平。因此,为了计算(, , ),我们定义以下分段函数[ln(())|ln公司()]=ln公司(),                           如果ln()+ 2英寸(),   如果ln()<,(9) 结合了两种制度。根据对公司和城市规模的观察(见Saichev等人,2009),我们假设  isPareto分布,具有概率密度函数(;,)=,    对于.(10) 何时= 这种分布通常被称为“齐普夫定律”。

13
可人4 在职认证  发表于 2022-6-10 07:51:36
参数确定尺寸遵循Paretodistribution的最小值。利用方程(9)和方程(10)计算期望值,我们可以求出平均标度指数的值(, , ). 在补充信息C中,我们详细说明了此推导的重要步骤,这将产生(, , )= 1,用于,(11) 以及(, , )=(1 2.)erf公司erf公司++ (1 ),        对于< /,(12) 在哪里 ln公司()和.  方程式(12)代表了我们的主要分析贡献。在i.i.d.对数正态生产率和帕累托规模的假设下,等式(12)提供了城市生产率与规模的标度指数的零期望。请注意(, , )仅是分布参数的函数。研究通常是在各个城市的随机工人子样本上进行的。我们通过引入一个新参数来模拟这种情况, 在0和1之间,预乘所有种群。方便地改变变量=   不改变事件的概率()d= ()d  (带=  ) 基于方程式(10)中的粒子密度。此更改仅影响参数, 所以我们有( , , ). 例如,如果使用随机的1%censussample,则只需将参数相乘即可式(12)中:= 0.01.图1显示了三个图表,绘制( , , )作为其中一个参数的函数,保持其他参数不变。面板A显示恒定的标度回报(即。,= 1) 对于小型, 但回报不断增加(> 1) 对于大型. B小组确认了LLN的影响:城市人口的比例越大,艺术效果越差。

14
能者818 在职认证  发表于 2022-6-10 07:51:40
最后,面板C显示在crea-ses中, 这表明,规模扩张将比城市规模更大。在所有三个参数中,对…的影响最小. 考虑到实际数据的估计值与1、与之相反,第和强烈影响.在以下部分中,我们将分析通过模拟,以及使用真实世界的数据。图1:。城市总产出相对于城市规模的人工标度指数,作为三个分布参数的函数。A类:依赖于σ,即原木生产率的标准偏差。B组:对f的依赖性,f是从城市人口规模中抽取的分数。C组:取决于城市规模分布的帕累托系数α。模拟我们模拟= 900个使用我们模型的综合城市。每个城市都有人口激增根据参数进行调整= 10000和= 1、各城市我们生成从方程式(1)中抽取i.i.d.的生产率。我们将利用所有个人= 1、我们将为模型参数的不同值生成模拟, 我们会比较()()/反对,  适用于所有城市= 1,…,900,其中我们将使用上标使e xpli cit成为模拟城市输出的fact。图2显示了此类模拟的结果,使用对数轴绘制了人均生产率与人口规模的关系图。黑色虚线是平均生产率的理论预期值,我们将其设置为= 1、图2中的模拟数据由关系式很好地描述()= .

15
kedemingshi 在职认证  发表于 2022-6-10 07:51:43
曲线实线是典型城市比例关系ln的OLS拟合()()= ln公司()+ ln公司()+ 其中, 当我们改变在我们的模拟中,应将( , , )=( , , )因此,在我们的模型下,城市的总产出很好地近似于幂律函数()= ,(13) 在哪里= 1 + .图2:。零模型下σ对人均产出的影响。Dots代表m=900个城市,人口由参数的帕累托分布产生,最小值=10000,α=1。单个对数范数a l produ ct i vi t i e s是基因,因此[X]=1是固定的(黑色虚线)。ln(Y(n)/n对ln(n)的普通最小二乘回归线显示n为紫色实线。可以观察到,参数控制人工缩放指数正如我们从分析预测中所预期的那样。我们还注意到减少为增加。当原木生产率的方差非常大时,所有这些影响都会出现,这也反映在以下事实上,即方程(13)的拟合优度降低,如低数值如下图3C所示。图3更系统地绘制了andln公司()根据他们的理论值,= 1和N()= ln公司()= 0,以及它们对.很明显,随着σ的增加,城市尺度律出现。通过模拟模型的100次不同运行(即由有序对定义的城市, ()()) 每个值介于1.5和6.5之间。我们观察到开始偏离1.0时3.0,定性地遵循方程式(12)和图1的预测。

16
何人来此 在职认证  发表于 2022-6-10 07:51:46
在图3的面板AO中,虚线表示预测的分析曲线(, , )对于= 10000和= 1.0.  需要注意的是,foreach值, 灰色区域,表示95%的估计值如图3所示。当对数正态生产率变得更重尾时,由大数定律(LLN)的一部分驱动的人工标度指数。每个点都表示一个单一城市横截面的线性回归估计值,如图2中的一个面板,我们显示了OLS估计值:标度指数 (面板A),接口()(面板B),以及(面板C)。对于每个值 我们生成了100个模拟。灰色区域显示95%的点估计值下降的区域。面板A中的虚线是由等式(12)预测的连续指数。模拟s相对较窄,这意味着平均标度指数显著且系统地偏离1。这些偏离理论值的情况与OLS回归的较大未解释方差有关,我们观察到该方差呈单调递减.在下一节中,我们将分析减少, 在保持固定的预测是,城市规模溢价将随着样本规模越来越小而人为地变大(见图1的面板B)。为此,我们将分析Col om bia n w age s上的所有数据。应用程序方程式(8)强调了两个重要影响。一方面,人工标定指数如果原木生产力的标准差,, 增加。另一方面,我告诉我们当样品尺寸增大时,也会增加(或者,) 是全部。

17
大多数88 在职认证  发表于 2022-6-10 07:51:50
最后一节通过仿真对前一种预测进行了分析。本节研究了后解释预测。数据、描述和分布此处使用的数据是2014年哥伦比亚社会保障体系的行政记录(西班牙语首字母缩写为PILA,用于社会保障缴款综合报告),用于分析所有哥伦比亚市正规工人的月平均工资。我们建议读者参考补充信息B了解数据源,以及有关数据集清理和准备的详细信息。在对数据进行预处理后,最终的样本包括在正规部门就业的6713975名工人,他们分布在几乎覆盖整个哥伦比亚领土的117个城市。我们使用正式就业人数对一个城市的“人口规模”进行量化,在我们的数据中,该城市被定义为2014年最后一个工作岗位。我们首先要评估是否对数正态分布和帕累托分布分别表征了工资和规模的分布。在补充信息D中,我们对工资模型(表1)和市政规模模型(表2)的几种概率分布函数的拟合优度统计进行了详细分析。这两个量都是左截断的,所以我们用极大似然法拟合了一些截断的概率分布函数。

18
可人4 在职认证  发表于 2022-6-10 07:51:53
根据三个标准:最大可能性、最小AkaikeInformation标准(AIC)和最小Bayesian信息标准(BIC),工资通过截断对数正态分布进行最佳拟合,市政规模通过帕累托分布进行最佳拟合。拟合分布得出以下估计参数:2.00,0.67和287(关于这些参数的图形比较和估计置信区间,请参见补充信息D,图7和图9),我们可以使用这些信息预测是否需要人工IRS。我们的结果表明,当我们取总人口中较小的随机分数f时,如果条件< e/大约保持不变。对于哥伦比亚人的估计,这意味着我们将为< 0.026.这意味着从最小的自治市随机抽取7名工人,从最大的自治市随机抽取58495名工人。我们将使用方程式(12)来计算( 287,2,0.67)>1当我们使用数据的分数缩小尺寸时小于0.026。我们将在下面更详细地研究小样本工人的影响。图4绘制了每个城市的月平均工资与城市规模之间的横截面图。显然存在一个积极且显著的缩放指数0.06.确定wag es的扩展指数是否因人工抽样效应而与尺寸相关的策略是对工人进行地理随机化。

19
kedemingshi 在职认证  发表于 2022-6-10 07:51:56
这背后的原因相当清楚:虽然随机化的个体应该消除由排序或集聚效应引起的个体内在依赖性所提供的城市生产率溢价的经验证据,但人工IRS效应应该在统计上对数据中因果效应的去除保持不变。随机化如图4所示。2014年哥伦比亚正规工人的数据显示,较大城市的工人平均每月工资较高。销毁有关工人在城市中进行自我分类的方式,以及工人与谁互动或正在与谁互动的信息。换言之,通过随机化工人的空间位置,消除了因果效应,但分布效应却没有。在我们对工人工作的城市进行随机抽样之后,回归中剩余的任何缩放指数都必须来自分布的统计抽样效应。请注意,随机化不会改变工人的工资。从这个意义上说,我们并没有破坏所有的信息,因为工资分配本身就是一系列与人们流动、聚集和相互学习有关的社会经济原因。因此,我们并不是说人们的地理随机化假设,如果工人在新的地点工作,他们会获得同样的工资。我们也不是说,年龄分布应该对是否存在分选或聚集效应保持不变。

20
kedemingshi 在职认证  发表于 2022-6-10 07:51:59
我们只是说,在这种分布的条件下,在回归过程中,甚至在破坏了与人们所在地相关的本地信息之后,也可以自然和系统地产生比一个更大的标度指数。对于数据的真实和随机版本,我们将估计以下基本回归:ln(,)= + ln公司()+ ,(14) 在哪里是市政指数,  和{, }, 其中“真实”表示我们计算在市政部门工作的实际个人的平均工资,  而“随机化”表明,我们在随机排列各市镇的个人位置后,取的是平均数。上标是指平均工资(实际或随机)超过了一小部分在所有工人中。我们将探讨取不同的值对缩放指数的影响.  然而,在方程式(14)给出的回归中,正规就业的规模对于每个自治市,保留为正式就业的总数,并且不与或.方法是(i)取一个子样本从全部工人人口中,(ii)计算他们的平均工资,以刺激(“real”)规模,如图5所示。通过使用适用于各个城市的数字来增加样本量,从而影响缩放比例。面板A绘制了由参数f(x轴)的每个值确定的给定工人样本在随机分组(黑点)之前和随机分组(红点)之后计算的弹性(y轴)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 07:22