楼主: 大多数88
1161 22

[量化金融] 收入与通勤距离关系的建模 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-10 18:03:33
首先,我们假设员工在整个空间中按顺序评估工作,而在最初的McCall模型中,评估是通过时间进行的。第二,工作的选择基于一些“质量”方面,这些方面可以考虑许多因素,而不仅仅是工资(例如,参见[26,27])。最后,我们改变了用于研究人类行为的框架,麦考尔模型的保留质量(这是一个优化策略的结果)被代表满足工人期望的最低工作质量的保留质量所取代。我们仍然考虑从住所开始寻找工作的工人的问题(我们假设其所在地为r=0)。工作人员均匀分布在密度为ρ的空间中。与工人相关的工作密度ρ取决于收入水平Y和收入水平,假设它只是ρ=ρYα(10),因此高收入工作的密度低于低收入工作。指数α取决于所考虑的国家,反映了在一定收入水平下与就业相关的许多外生因素[26,27]。我们注意到,工作密度ρ是区分不同类型工人的唯一参数。我们还注意到,这里为INCOMEAL引入的框架允许对其他数量进行许多概括,例如技能水平。麦考尔模型假设工作的主要特征是他们提供的工资。我们偏离了这一点,而是假设每个作业都有一个随机的“质量”X,它编码许多因素。工作质量按f分布(相应的累积分布f),工作质量是独立的。我们进一步假设一个给定的工人有一个保留质量值τ(与保留工资的精神相同),她将继续扩大她的搜索半径,直到达到这个阈值。

12
可人4 在职认证  发表于 2022-5-10 18:03:36
我们用R表示通信距离及其累积读数sp(R≤ r |τ)=P(X[0,r]≥ τ) = 1 - F(τ)ρπr.(11)我们现在考虑到工人有不同的搜索成本和对未来工作的不同期望,这导致他们有不同的保留质量。我们认为预订质量是随机的,按照密度g(τ)分布,并得到通勤距离sp(R)的累积分布≤ r) =Zg(τ)P(r)≤ r |τ)dτ,(12)具有相应的密度(r=r)=dP(r≤ r) dr=-2ρπrZg(τ)F(τ)ρπrlog F(τ)dτ。(13) 该积分中的第一项是一个工人具有保留质量τ的概率,第二项是在半径r盘中所有效应都低于τ的概率,最后一项(对数)对应于在圆带[r,r+dr]中至少有一个效应高于τ的概率(该过程的简单说明见图2)。保留质量τ分布的一个简单而自然的假设是,它与工作质量F:g(τ)的分布相同≡ f(τ)。然后,等式(13)以一种显著的方式简化为p(R=R)=-2ρπrZf(τ)F(τ)ρπrlog(F(τ))dτ=-2ρπrZxρπrlog x dx=2ρπr(1+ρπr)。

13
nandehutu2022 在职认证  发表于 2022-5-10 18:03:39
(14) 在这些假设下,通勤距离的分布不取决于工作质量的分布,这一影响已在[7]中讨论的具体案例中观察到,因此,本文提出的模型可以被视为此类过程的微观基础。这也意味着我们可以概括模型的解释:我们可以允许工作质量的分布针对每个工人,因为这与通勤距离的分布无关。与前一节中显示快速高斯衰减尾巴的McCall求职模型相比,我们在这里观察到,随着P(R=R)的增加,分布正在缓慢衰减~ R-3.对于较大的r.平均值Fig。2:导致式(13)的论证说明。通勤距离很容易在最近机会模型中计算,我们发现=rπρ。(15) 用ρ/Yα代替ρ,我们发现,通勤距离的分布取决于收入isP(R=R|Y)=2ρπrYα(Yα+ρπR)(16),平均通勤距离isr(I)=RπρYα/2,(17),这是指数β=α/2的幂律。公式(16)的理论结果也暗示了一个可以通过经验检验的简单尺度。事实上,如果我们用Yα/2来衡量通勤距离,u=r/√Yα,所有不同收入的曲线都应该在唯一曲线上崩溃,该曲线只依赖于一个参数,由p(u)=2πρu(1+ρπu)给出。(18) 在下一节中,我们将根据我们的数据评估这些理论预测。与实证结果的比较最近的机会模型预测平均通勤距离随着收入的增加而变化~ Yα/2,其中α取决于所考虑的国家。我们将根据这种关系来解释我们的实证结果。对于美国,我们观察到了一个指数≈ 0表明美国的工作密度与技能水平无关。

14
kedemingshi 在职认证  发表于 2022-5-10 18:03:43
对于英国和丹麦,我们观察到βUK的非零指数≈ 英国为1/2,丹麦为1/2≈ 0.8. 这些结果表明,工作密度随着技能水平的提高而降低,丹麦的下降幅度大于英国。观察到的美国和两个欧洲国家在不同收入水平的工作空间密度上的差异表明,欧洲和美国之间存在更普遍的差异(关于工人和技能水平空间分布的均衡理论讨论,参见示例[28])。有趣的是,指数β的值与国家的大小之间似乎存在相关性。然而,为了证实这一观察结果,还需要进一步的研究。让我们能够区分不同模型的关键预测是通勤距离的分布以及它如何依赖于收入。事实上,对于本文介绍的McCall模型的简单空间扩展,r的分布下降得非常快(等式(9)),并且不是一个广泛的分布(使用运输成本扩展McCall模型可能会导致广泛的分布,例如幂律,但这需要对参数进行微调,请参见材料和方法部分)。与此形成鲜明对比的是,在最接近的机会模型中,我们有公式(16)和inFig给出的形式的海外分布。1我们用此表格显示给定收入类别的一个参数fit。与Database达成的协议对英国和美国来说都很好,但在丹麦的案例中存在一些差异。对于这个丹麦案例,我们的模型似乎没有考虑到其他异质性。尤其是,丹麦是一个小国,人口中有很大一部分生活在岛屿上,这对人口迁移模式造成了重要限制。这是对EQ有效性的额外且非常有力的测试。

15
可人4 在职认证  发表于 2022-5-10 18:03:46
(16) 曲线上的数据折叠由公式(18)提供。在图3(右栏)中,我们绘制了不同收入类别的通勤距离比例分布图,我们观察到了一个非常好的崩溃,除了英国的低收入类别,平方根行为不适用。我们注意到,对于USβ=0,这意味着概率分布等式(16)不依赖于收入类别,因此曲线会自动折叠。我们还注意到,我们的模型预测的数据崩溃和数据中观察到的数据崩溃(如图3所示),有力地加强了数据与Denmark最近机会模型之间的一致性。讨论和展望随着越来越精确和全面的数据的可用性,我们可以测试城市结构及其过程模型的许多预测。本文预测了通勤距离的分布,并讨论了其与收入的关系。我们发现,经验数据不支持求职过程的标准麦考尔模型(基于最优控制)。取而代之的是,我们提出了一个基于最接近机会的模型,该模型满足了每个人能够正确预测胎儿的期望。3:左列:不同收入阶层的通勤距离分布。不同收入阶层的概率分布如下所示。(顶部)英国数据(所有可用年份的平均值)。(底部)丹麦数据(所有年份的结果相同,我们选择此处显示2008年)。右栏:不同收入阶层的重新标度概率分布P(u)。

16
能者818 在职认证  发表于 2022-5-10 18:03:51
我们观察到,英国数据(顶部)和丹麦数据(底部)在所有可用年份的平均值β=0.5和β=0.77都出现了非常好的崩溃。平均通勤距离与工作人员密度的关系。更重要的是,该模型能够正确预测通信距离分布的形式、其宽尾,以及由其形式预测的数据崩溃。简而言之,以前的模型依赖于工人等待工资足够高的工作的想法,而在新的最近机会模型中,工人寻找足够好的工作的空间。尽管还需要对更多国家进行进一步研究,但该随机模型为一大类流动性模型提供了微观基础,并为流动性建模开辟了许多有趣的研究方向,同时也带来了可测试的预测。更一般地说,我们在这里提出了一个研究人类或动物行为的替代框架,在这个框架中,行动不是基于最优策略,而是基于第一个足够好的机会。该框架可能会在我们对觅食的理解中找到一些应用,例如,在生态学或金融领域的其他应用中,最优控制可能是一个太强的假设。材料和方法数据描述我们在下文中描述,对于美国和英国的数据集,已经开发了一种加权方法,以考虑无回应、欠平均、一户多部电话(对于美国数据集)和旅行记录中的下降(对于英国数据集)。开发这种方法是为了使数据可信和可用,但毫无疑问,数据中存在噪音(可能还有自我报告错误)。我们确实可以注意到,低收入值(英国和美国的数据)存在偏差,这很可能是由于四舍五入造成的。

17
大多数88 在职认证  发表于 2022-5-10 18:03:54
然而,这种偏差不会改变通勤距离的数量级,因此不会对结果产生实质性影响。英国数据我们使用了2002年英国国家旅游调查(NTS)的数据-2012 [13]. 每年的样本有15048个地址,旨在提供英国家庭的代表性样本。制定了一种称重方法,以调整旅行记录中的无反应和下降。数据收集是通过面对面访谈和个人日常旅行活动的七天旅行记录获得的。我们专门利用这个数据集的个人和旅行记录。个人档案用于确定每个个人的收入类别(数据提供23个收入等级)。旅行文件允许我们将个人与我们知道距离的每周通勤旅行联系起来。为了计算作为收入阶层函数的平均通勤距离,我们首先平均每个人的通勤距离,包括所有交通方式,以及一周内的通勤次数。然后,我们对每个收入类别的所有个人的这些数量进行平均。当我们考虑这些数据的平均值时,我们不会区分不同的交通方式或旅行起点和目的地的地理位置。美国数据我们使用了1995年、2001年和2009年全国家庭旅行调查(NHTS)[14]的数据,这是一项针对美国公民、非制度化人口的调查。

18
可人4 在职认证  发表于 2022-5-10 18:03:57
NHTS数据集分别包含42、033、26、032和150、147个家庭的数据(最新版本约有40000个附加采访)。使用加权系数是为了考虑无响应、欠平均和家庭中的多部电话。这些数据集允许我们将一个收入类别与每个工人(该数据集表示18个不同的收入箱)以及到工作场所的单向距离相关联。对于2009年NHTS,不提供个人收入,在这种情况下,我们用家庭收入除以家庭规模来代表个人收入。丹麦数据丹麦数据来自丹麦统计局2001年的年度行政登记数据- 2010年。我们观察了全部工人人口,每年我们都有关于工人年收入和通勤距离的信息。我们使用税后收入。通勤距离的计算使用了准确的居住和工作地址信息,并使用了两者之间的最短路线。请注意,对于这些数据,不需要使用加权方法,因为我们观察了该国的全部工人人口。包括McCall模型中的运输成本我们在这里讨论McCall模型的一般情况,其中运输成本与距离有关。从工人家到工作单位的距离是一个密度为2πρR的随机变量R,它与工作相关的工资W无关。为了将接受工作的概率与空间联系起来,我们假设工人接受工作时支付的线性运输成本δR。最终,她放弃了净工资W- δR.工人的最佳策略包括保留工资τ,工人接受第一个提供净工资W的工人-δR>τ。这些假设已经表明,公认工作满意度的通勤距离R<W-τδ.

19
能者818 在职认证  发表于 2022-5-10 18:04:00
因此,如果W具有有界分布,并且因此允许W具有无界分布,则通勤距离的尾部行为不能遵循幂律。通勤距离的密度isP(R=R | W- δR>τ=P(R=R)P(W)- δr>τ)P(W- δR>τ=2πρR(1)- F(τ+δr))r∞2πρs(1)- F(τ+δs))ds。(19) 由此我们可以观察到 ln P LnR=1-f(τ+δr)1- F(τ+δr)δr.(20),这表明一般情况下P不会以幂律衰减,除非F(τ+δr)1-F(τ+δr)=ζrf对于某些ζ>1。在特定情况下,W遵循F(W)=1的幂律-W-ζ、 W>1,我们得到 ln P LnR=1-ζrτ+δr,(21),趋向于1-ζδas r→ ∞. 因此,如果工资福利的分布遵循幂律,则该模型得出通勤距离分布的幂律。如果我们考虑所有工资,帕累托定律告诉我们,工资可以广泛分配,但这不是这里需要的数量。事实上,我们在这里考虑的是一组给定技能的效果分布,一个给定的个人很不可能在整个收入分配范围内取样。然后我们可以在这个模型中计算平均通勤距离和收入之间的关系。福鲁- δr>τ,我们有p(r=r | W=W,W- δR>τ)==P(R=R,W=W,W- δr>τ)P(W=W,δr<W- τ) =2rW-τδ, (22)这导致了条件期望(R | W=W,W- δR>τ=Zw-τδ2rW-τδdr=w- τδ.

20
能者818 在职认证  发表于 2022-5-10 18:04:03
(23)因此,该模型预测,对于线性运输成本,预期通勤距离在收入中始终是线性的,这不符合经验发现。在任何情况下,似乎为了预测与经验观察结果一致的结果(广泛的分布规律,如指数接近3的幂律,以及平均距离的幂律行为),该模型需要对参数进行微调,与最近的机会模型形成鲜明对比。将运输成本包括在最近的机会中。模型工作者的决策基于运输成本,运输成本不仅取决于距离,还取决于货币成本和旅行时间。我们将通过本文提出的最接近机会模型来了解运输成本是如何调节的。这很有用,因为我们可以准确预测模型的可观测值如何被运输成本修正。当运输成本发生变化时,该模型也可用于预测。我们让变量r在这里表示运输成本,最接近的机会模型预测SD log P(r=r)/d log(r)=-3(24)一般来说,我们可能会认为运输成本是距离的递增和凹函数,因为旅行者会选择更快的方式进行更长的旅行。用`表示物理距离,我们假设r~ `ν、 式中0<ν<1。就距离而言,我们发现d log P(R=R)d log`=d log P(R=R)d log rd log rd log`=-3ν. (25)对于收入弹性,该模型预测了运输成本和收入之间的关系,即β=d logr(I)/d logi=1/2。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 12:54