楼主: 可人4
746 27

[量化金融] 规模报酬率的人为递增与抽样问题 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
46.5432
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24566 点
帖子
4099
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-10 07:50:59 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Artificial Increasing Returns to Scale and the Problem of Sampling from
  Lognormals》
---
作者:
Andres Gomez-Lievano, Vladislav Vysotsky, Jose Lobo
---
最新提交年份:
2020
---
英文摘要:
  We show how increasing returns to scale in urban scaling can artificially emerge, systematically and predictably, without any sorting or positive externalities. We employ a model where individual productivities are independent and identically distributed lognormal random variables across all cities. We use extreme value theory to demonstrate analytically the paradoxical emergence of increasing returns to scale when the variance of log-productivity is larger than twice the log-size of the population size of the smallest city in a cross-sectional regression. Our contributions are to derive an analytical prediction for the artificial scaling exponent arising from this mechanism and to develop a simple statistical test to try to tell whether a given estimate is real or an artifact. Our analytical results are validated analyzing simulations and real microdata of wages across municipalities in Colombia. We show how an artificial scaling exponent emerges in the Colombian data when the sizes of random samples of workers per municipality are $1\\%$ or less of their total size.
---
中文摘要:
我们展示了在没有任何排序或正外部性的情况下,城市规模增长的规模收益如何可以人为地、系统地和可预测地出现。我们采用了一个模型,其中个人生产力在所有城市都是独立且分布相同的对数正态随机变量。在横截面回归中,当原木生产力的方差大于最小城市人口规模的两倍时,我们使用极值理论分析证明了规模收益递增的矛盾性。我们的贡献是推导出由该机制产生的人工标度指数的分析预测,并开发一个简单的统计测试,试图判断给定的估计是真实的还是伪影。通过对哥伦比亚各市工资的模拟和真实微观数据的分析,我们的分析结果得到了验证。我们展示了当每个城市的工人随机样本的规模为其总规模的1\\%$或更少时,哥伦比亚数据中如何出现一个人工标度指数。
---
分类信息:

一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
--> Artificial_Increasing_Returns_to_Scale_and_the_Problem_of_Sampling_from_Lognormals.pdf (1 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:规模报酬 报酬率 Quantitative Contribution Productivity

沙发
可人4 在职认证  发表于 2022-6-10 07:51:04 |只看作者 |坛友微信交流群
人为增加规模回报率和从Lognor m a lsAndrés Gómez Liévano、Vladislav Vysotsky和JoséLoboabstracts采样的问题我们展示了城市规模增长中的规模回报率(IRS)是如何在没有任何排序或正外部性的情况下,系统和可预测地人工合并的。我们采用了一个模型,其中个人生产力在所有城市中是独立且相同分布(i.i.d.)的对数正态随机变量。我们使用极值理论(EVT)分析论证了在横截面回归中,当对数乘积的方差大于较小城市人口的对数大小的两倍时,IRS的矛盾出现。我们的贡献是推导出这种机制产生的人工标度指数的分析预测,并开发一个简单的统计测试,试图判断给定的估计是真实的还是真实的。我们的分析结果通过分析哥伦比亚各市的模拟和真实微观数据得到验证。我们讨论了当工人永久单胎性随机样本的大小为其总大小的1%或更少时,哥伦比亚数据中如何出现人工标度指数。关键词Surban scaling,城市工资溢价,规模报酬递增,对数正态分布,重尾分布,国际发展极值理论中心,哈佛大学,剑桥,美国数学系,苏塞克斯大学,布莱顿,英国可持续发展学院,亚利桑那州立大学,坦佩,美国通讯作者:安德烈斯·戈梅兹·利瓦诺,美国马萨诸塞州坎布里奇肯尼迪街79号哈佛大学肯尼迪政府学院国际发展中心增长实验室。电子邮件:AndresGomez@hks.harvard.eduIntroductionThe企业规模和城市规模工资溢价的起源仍然是一个活跃的研究课题。

使用道具

藤椅
mingdashike22 在职认证  发表于 2022-6-10 07:51:08 |只看作者 |坛友微信交流群
这两项研究的结果表明,人们普遍认为,大公司(Oi和Idson 1999)和大城市(Rosenthal和Strange 2004)的个人工资平均较高。为什么人口规模与这些经济优势相关的问题在《城市经济学》(The urban Economics)中仍有激烈的争论(例如,Duranton and Puga 2004;Hollister 2004;Lehmer and M"oller 2010;Combes and Gobillon 2015;Eeckhout and Kircher 2018),并已成为思考城市现象统一理论的基础(Pumain et al.2006;Bettencourt and West 2010;Bettencourt 2013;Batty 2013;Martinez 2016;Gomez-Lievano et al.2016)。我们对这篇文献的贡献是研究工资近似对数正态分布这一简单现象所带来的预期分析结果和经验挑战(参见Kleiber和Kotz2003的综述;关于更老的讨论,参见Roy 1950;Shockley 1957;Aitchisonand Bro wn 1957;Mincer 1970)。与nor m al di strib uti相比,忽略m al s可以生成非常大的值。对数正态分布的这种特征如何能够准确估计出支持城市可持续发展的统计效应。我们不寻求重新评估对城市和企业规模生产率溢价的公认解释,也不反驳城市规模理论。我们的结果是关于方差极大的变量的标度指数估计的潜在偏差来源,这会减慢样本均值到总体均值的收敛速度。我们在这里关注的不是抽样过程中的偏差,例如统计局、研究人员或测量设备如何从城市抽样信息。在研究工资等变量时,我们关注的是标度指数的估计,即使每个城市的工资是“统一抽样”的。

使用道具

板凳
kedemingshi 在职认证  发表于 2022-6-10 07:51:11 |只看作者 |坛友微信交流群
我们工作的主要结果是方法论上的,我们的结果与调查规模对工资的影响的研究相关,因为后者已被纳入平均值或总账单。因此,我们的研究与Rice等人(2006)的研究相关;Andersson等人(2016);Strumsky等人(2019年);Keus ch nigg等人(2019年);Keuschnigg(2019年)。推动我们在本文中给出结果的工资的一般问题是,工资是重尾分布的,因此包含异常值。研究人员已经设计出处理异常值的经验法则,但缺少严格的分析。我们对异常值如何影响规模收益递增(IRS)的估计进行了分析。我们的贡献如下:o我们确定了一种机制,该机制可以通过样本量导致平均工资虚假上升,这可能被误认为是城市规模扩大的证据我们确定工资数据中可能出现这种机制的条件我们推导出了格雷泽和马雷(2001)的(虚假)标度指数的解析表达式,并在par ticul ar Combes et al.(2008)中,首次使用个人水平数据研究了我们的数据。之所以使用个人数据,是因为他们可以解决与将集聚外部性与技术工人分类到大城市相关的内生性问题(见Combesand Gobillon 2015)。

使用道具

报纸
kedemingshi 在职认证  发表于 2022-6-10 07:51:13 |只看作者 |坛友微信交流群
然而,从聚合到独立级别数据的方法转换导致了其他潜在的统计问题,如工资等变量的聚合。产生的规模工资。o我们开发了一个简单的统计测试,试图将这种机制排除在工资规模溢价的解释之外。我们目前的工作可以推广到通常构建城市平均值的其他个人产出指标,如平均收入或平均专利数量。然而,我们的工作必须与侧重于谋杀、传染病或就业等国家的比例分析以及可能出现的相应统计漏报问题相区别。和统计漏报问题相比,本文讨论的是样本均值的统计收敛问题。本文的组织结构如下。首先,我们为我们的研究奠定了基础,并简要概述了城市规模及其背后的机制。其次,我们得到了主要的分析结果。第三,我们给出了数值模拟,然后是一个现实世界的应用程序,在该应用程序中,我们分析了城市规模对工资的超线性缩放。最后,我们对我们的结果进行了讨论和总结。在城市中,IRS通常通过幂律函数的指数值来量化这与总产量有关至人口规模, 通过= (), 何处()= . IRS发生时> 0(例如,Sveikauskas 1975;Rosenthal and Strange 2004;Bettencourt 2013)。例如,Bettencourt et al.(2007)表明美国大都市统计区的总工资为0.12。标度指数= 1 + 和量化总产出和人均产出与人口规模百分比变化的“弹性”程度. 因此在数学上定义为=//.

使用道具

地板
可人4 在职认证  发表于 2022-6-10 07:51:16 |只看作者 |坛友微信交流群
在该限制中,它可以写为=()/()/, 其中日期/日期是关于我们假设= ()是的函数只有我们有时会将标度指数称为“弹性”。规模越大,生产率越高,这一观察结果通常可以用两种一般机制中的一种或两种组合来解释:富有生产力的个体将自己分类到大城市中(“企业规模溢价文献中的分类匹配”),或者大城市通过相互作用产生的正外部性产生更具生产力的个体。我们将这两种机制分别简单地称为排序效应和聚集效应。这些影响来自特定的经济过程,这些经济过程要么需要经济主体的决策,要么需要经济主体之间的相互作用,而经济主体的缺席将导致IRS的缺席。这些工作就是为了实现这一目标。虽然分类和聚集效应已被证明会导致IRS(Glaeserand Maré2001;Rosenthal and Strange 2004;Melo et al.2009;Bettencourt 2013;Behrens et al.2014;Combes and Gobillon 2015),但IRS的存在并不意味着分类或聚集效应。因此,我们将表明,城市规模扩张渠道的出现是生产力贡献极值的结果。也可能存在选择效应,对总产出影响最大的是淘汰生产力最低的企业。据我们所知,我们是第一个在对数正态生产率的情况下分析证明这些矛盾结果的人。我们还提出了一种区分数据中实数和人工缩放指数的方法。该方法基于一个简单的例子:跨城市对数据中的个人进行随机管理应该消除经济影响,而不是人为影响。

使用道具

7
可人4 在职认证  发表于 2022-6-10 07:51:19 |只看作者 |坛友微信交流群
为了不同地说明这一点,人工效应(如果存在)是由于随机性造成的,将在数据随机化后观察到。在我们的分析中,我们将抽象出任何市场、均衡条件或个人之间的协调机制,因为我们的主要主张是,IRS的存在并不一定意味着存在或协调、相互作用或正外部性。在我们的模型中,生产率将被独立地和独立地抽样,但我们将表明,总产出将在很大范围内显示递增的回报。分析结果摘要个体,无论其居住在哪个城市,其生产力都是独立且同分布的(i.i.d.),从对数正态分布中抽样(, ), 其概率密度函数为(; , )=  (),(1) 在哪里和是正参数()= [ln()]和=[ln()]. 一个简单的计算可以得出预期生产率的值[]= /. 我们将使用大写和小写字母分别表示随机变量及其可能的值。我们定义了一个人口城市的总产出作为其居民生产力的总和,()=.  从今以后,我们将假定城市,索引为= 1, … , , 每个都有总人口, … , .对数正态分布的选择有两个目的。首先,有证据表明,对数正态分布很好地描述了工人生产率的经验分布,如工资收入率(Roy 1950;Aitchison and Brown 1957;Mincer 1970;Kleiber and Kotz 2003;Combes et al.2012;Eeckhoutet al.2014)。

使用道具

8
大多数88 在职认证  发表于 2022-6-10 07:51:22 |只看作者 |坛友微信交流群
其次,尽管所有的矩都是有限的,但对数正态分布或正态分布有一个特性,使得IRS能够作为一种人工效应出现:即对数正态分布是重尾的,由于方差非常大,往往会产生非常大的正值。如果人口规模增加> 1: E类[()]= E,(2)= E类[],=  E类[],= E类[()].将两个sid划分为我们得到了每一个ca p ITATE rm s,E()= E().从期望值的角度来看,我们的模型没有显示IRS,而且各城市的人均预期产出是恒定的。具体而言,我们模式中的总预期产量[()]= , 使用缩放指数=和= . 虽然方程式(2)的推导看起来微不足道,但事实是[()]永远都看不见也不那么明显。我们实际观察到的是(), 一个至关重要的区别是具有某些属性。我们必须超越对期望值的依赖,研究确定是否()显示具有超线性指数的IRS。我们了解随机变量()具有相同尺寸的秤利用所谓“稳定定律”的概率理论。该理论为寻找序列提供了见解和这样概率分布函数(CDF)Pr((()))收敛到稳定分布。当我们找到这样的序列时,我们可以说()使用缩放像做因此,缩放指数可以使用, 像() =d项次()/dd项次()/d,(3) 在我们明确指出可能的函数依赖性之前, 预计标度指数可能会受到样本大小的影响。

使用道具

9
何人来此 在职认证  发表于 2022-6-10 07:51:25 |只看作者 |坛友微信交流群
为了了解这种方法为什么有用,让我们讨论一下中心极限定理(CLT)成立的情况。根据CLT,当i.i.d.是否具有有限的均值和方差,以及非常大,那么稳定定律((()))收敛到as是标准高斯分布,如果= []和=([])/. 因此,表示[]= , 像, 总输出相对于大小的缩放指数为=d项次()/dd项次()/d=d项次( )/dd项次()/d= 1.(4)然而,只有当足够大了。然而,“足够大”的含义是由随机变量的方差决定的. 形式上的区别是分布是“轻尾”还是“重尾”,其中的区别取决于变量的共同分布的尾部(生存函数)是否与指数尾相比,减少速度更快(轻尾)或更慢(重尾)。什么时候是对数正态分布的它们是重尾的。因此= 由于差异较大,可能不成立,但大小有限,因此在实践中不会发生变化。我们能找到序列吗对于“小尺寸”区域内的对数正态分布(与“超大尺寸限制”相对)?由于具有较大方差的对数正态分布往往会生成非常大的值,因此我们的方法将是近似()bymax公司{, … , }. 当然,对于(非常)大的尺寸,这样的模拟是错误的, 其中()由CLT定义。然而,我们将为我们的启发式方法提供分析证明,并且我们将找到一个序列我们可以用来描述和()对于“s mall”.对数正态随机变量的最大值对于m= , 哪里, , …i.i.d.随机变量是否从标准正态分布中取样(0,1).

使用道具

10
kedemingshi 在职认证  发表于 2022-6-10 07:51:28 |只看作者 |坛友微信交流群
我们分析中的重要参数是, Ln的标准偏差(). 我们将调整其他参数,, 这样的话()= /2,为了保证分布的平均值是常数[]=()/= 1,为方便起见,选择为1。我们的想法是()以最大生产力()最大值{, … , }在城市里。此数量可以写为()= ()/,哪里()最大值{, … , }表示i.i.d.标准正态随机变量的最大值。总和可以分解为()= ()1 + (),其中ter m()是一个序列,其中主导项(对应于下列项中的第二大值除以()) 是正常的/(). 对于(), 的价值()变得微不足道。换句话说,因为决定对数正态随机变量方差的参数与样本大小相比非常大,所以最大值支配着总和。在补充信息A中,我们详细说明了假设的分析验证()可近似为(), 以及其他条件对总和的贡献。的行为()对于大型众所周知(Leadbetter等人,1983年;Embr ec ht s等人,2013年):lim2英寸()()2英寸()+ln(ln())+ ln(4)8英寸()= ,      ,(5) 其中,极限是标准的Gumbel分布函数。因此()增长为2ln()随机波动主订单的2英寸().

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 03:53