楼主: 何人来此
2354 60

[经济学] 技能生产中的动态互补性:来自遗传学的证据 [推广有奖]

11
何人来此 在职认证  发表于 2022-4-26 12:52:08
在最近的一项研究中,Schmitz&Conley(2017b)将教育成就的多基因评分与越南战争征兵联合作为一项自然实验,研究它们对教育成就的交互作用。我们不仅考虑了环境中的外源变异,而且还利用了多基因评分中的家族内变异,从而进一步推动了这一文献的发展。我们谈到的第二类文献是关于出生顺序效应的文献。这篇文献一致发现,在发达国家,晚生子女的教育程度较低。出生顺序效应也被发现存在于其他结果中,尽管有时结果好坏参半,例如智力(Black,Devereux和Salvanez,2011年)、健康(Black,Devereux和Salvanes,2016年;Pruckner等人,2019年)、个性和领导技能(Black等人,2018年)和犯罪(Breining等人,2020年)。我们通过研究出生顺序的异质性对遗传禀赋方面的教育成就的影响,为这篇文献做出了贡献。出生顺序和遗传禀赋之间的潜在相互作用不仅是治疗效果异质性的一个重要来源,而且如果存在的话,它会延续到下一代,可能加剧代际不平等(Havari&Savegnago,2020)。最后,我们讨论了有关技能生产和动态互补性的文献(Cunha&Heckman,2007;Cunha等人,2010;Todd&Wolpin,2003)。

12
mingdashike22 在职认证  发表于 2022-4-26 12:52:14
估计技能形成中的动态完整性需要初始禀赋和后续投资的独立变化,或者,顺序投资中的外生变化与利用外生环境的其他结果(例如巴塞洛斯、卡瓦略和特里(2018)、施密茨和康利(2016)以及佩雷拉、范·基佩尔斯卢伊斯和里特维尔德(2020))进行过度研究。《时代》(Almond&Mazumder,2013;Johnson&Jackson,2019)。因此,对动态互补性的实证测试极具挑战性(Almond、Currie和Duque,2018)。事实上,之前的文献几乎只关注早期生命结果,比如出生体重作为一种禀赋的衡量标准(例如,Datar、Kilburn和Loughran,2010;Figlio、Guryan、Karbownik和Roth,2014)。然而,这种早期生活结果受到产前投资的影响(Aizer&Cunha,2012),这意味着它们部分地反映了父母的选择,因此是内生的。此外,父母对孩子的捐赠做出反应(例如,阿德瓦尤和尼沙德姆,2016年;艾泽和库尼亚,2012年;阿蒙德和马祖姆德,2013年;g.s.贝克尔和多姆斯,1986年;巴拉德瓦伊、埃伯哈德和尼尔森,2018年;达塔等,2010年;弗里杰斯、约翰斯顿、沙阿和希尔兹,2013年;詹诺拉,2020年;辛和费尔夫,2014年),最近的研究表明,父母的投资也会对儿童的遗传禀赋产生影响(Breinholt&Conley,2019年;Fletcher,Wu,Zhao和Lu,2020年;Houmark,Ronda和Rosholm,2020年;Sanz de galdeano和Terskaya,2019年)。因此,衡量儿童天赋的指标很少没有父母的投资,父母的投资也很少独立于天赋,这对准确识别技能信息中的动态互补性构成了一个经验挑战。我们利用遗传禀赋和父母投资中的外源性变异为这篇文献做出贡献。

13
kedemingshi 在职认证  发表于 2022-4-26 12:52:20
事实上,我们对天赋的衡量是随机分配的,以婴儿为单位,固定在受孕时。因此,它没有母公司的投资。此外,我们使用个人的出生顺序代表父母的投资,这与父母的投资密切相关,但与遗传禀赋无关。本质上,将出生顺序作为父母投资的代理,利用了晚生孩子出生后可用时间和金钱的自然减少,因此独立于孩子的出生。利用遗传禀赋和(出生顺序诱导的)父母时间投资中的随机家族内变异,提供了一个创新的环境,以实证检验技能形成中的动态互补性。我们表明,利用外源性G和E在家族G×E中的使用,提供了一种测试动态互补性的新方法,这种方法通常不局限于出生顺序效应,而是扩展到其他(外源性)。最近的一组论文研究了罕见的情况,其中外源性变异既存在于初始捐赠中,也存在于后期投资中,证据不一。一些研究发现证据与动态互补性一致(Adhvaryu等人,2019年;Duque等人,2018年;Gunsteinsson等人,2014年;Johnson&Jackson,2019年),而另一些研究发现捐赠和投资之间的证据较弱,甚至是可替代性(Lubotsky&Kaestner,2016年;Malamud等人,2016年;Rossin Slater&Wüst,2020年)。有关详细概述,请参见附录C。家长投资和政策变化(例如,降低师生比例)。

14
能者818 在职认证  发表于 2022-4-26 12:52:26
通过告知技能生产函数的形状和性质,我们的分析是一个结构模型的重要前奏,在这个模型中,父母面对孩子的技能生产函数以及预算和时间约束,以决定自己对孩子的消费和投资。我们对动态互补性的支持性证据强调了早期投资和后期投资的重要性,以获得人力资本成果方面的全部收益(例如,库尼亚和赫克曼,2007年)。本文的其余部分组织如下。在第2节中,我们概述了我们的经验策略。第3节讨论数据源。在第4节中,我们介绍了我们的主要结果和一些稳健性检查。第5节讨论了我们的结果和结论。2.实证策略我们分析一个人的遗传倾向、教育程度和出生顺序之间的基因-环境(G×E)交互作用,作为教育的一个重要环境决定因素。经验规范植根于技能生产函数(1),我们假设成人教育程度是儿童期结束时获得的技能的一个增长函数()正如库尼亚和赫克曼(2008年,方程式2)和库尼亚等人(2010年,方程式2.2)所述。继Todd&Wolpin(2003)和Cunha&Heckman(2008)之后,我们指定了一个线性生产函数,其中规定了完成教育的年数 是初始捐赠的函数, 母公司投资的历史, 以及未被观察到的父母特征. 根据经验,我们通过教育成就的多基因评分来衡量初始捐赠(), 父母投资的历史由长子的指标代表(), 父母的特征被纳入家庭固定效应.

15
mingdashike22 在职认证  发表于 2022-4-26 12:52:32
我们超越了Todd&Wolpin(2003)和Cunha&Heckman(2008),考虑了 和, 允许动态互补。这导致了以下规范= + + + × + + +  (2) 对于家庭j中的每一个人,就是多年的教育,对于长子来说等于一,否则等于零是教育的标准化多基因分数(有关其结构的更多信息,请参见第3节和附录A)。× 是互动术语。是一组个体水平的控制,包括性别、出生月份和出生年份的假人(Black等人,2005年;Handy&Shester,2020年)。它还包括遗传相关矩阵前40个主成分(PC)的向量。最后家庭固定效应和是错误术语。我们采用异方差稳健标准差,在家族水平上进行聚类。参数捕获标准多基因教育分数与受教育年限之间的关联,同时估计了长子与晚辈相比在受教育年限上的平均优势。显示了多基因分数和第一胎在多大程度上对教育产生了互补性影响,因此提供了关于假设性效应和动态互补性存在的信息。继Black等人(2005年、2011年)、Heiland(2009年)、Lehmann、Nuevo Chiquero和VidalFernandez(2018年)之后,我们比较了系列内部和系列之间的规格。

16
mingdashike22 在职认证  发表于 2022-4-26 12:52:38
家庭固定效应的包含确保了多基因评分和出生顺序的变化是随机的,使得多基因评分和出生顺序相互正交。因此,通过比较同一家族中的兄弟姐妹,我们避免了因忽略变量而引起的内生性问题。由于构建多基因评分所依据的GWA是基于有限样本的,因此我们估计的多基因评分是真实(潜在)多基因评分的嘈杂代理(例如Benjamin、Daniel Cesarini、Laibson和Turley,2020;van Kippersluis等人,2020)。此外,构建多基因评分所依据的GWA不能控制父母代数类型,再次导致多基因评分的测量误差(Trejo&Domingue,2019)。这两种测量误差源都会导致多基因评分系数的衰减偏差。虽然我们无法解决遗传主成分(PC)引起的衰减偏差,但在abetween家族(群体水平)分析(Price et al.,2006;Rietveld et al.,2014)中,它可以用来控制群体分层的微妙形式(即,样本中各亚群体的等位基因频率和环境因素之间的相关性)。虽然由于包含家族固定效应,不必严格纳入家族内分析,但我们将PCs保留在所有规范中,以便于在家族间和家族内结果之间进行干净的比较。在第4.5节中,我们使用比本文介绍的线性交互更灵活的方法来研究交互效应。在第4.5节中,我们进一步测试了为最后出生的孩子添加一个假人的稳健性,以评估基于遗传禀赋的内源性生育决定是否会影响我们的结果。有限样本偏差导致的经典测量误差导致衰减偏差的原因是众所周知的。

17
大多数88 在职认证  发表于 2022-4-26 12:52:44
更微妙的是,为什么在发现的GWAS中排除亲本基因型会导致衰减偏差。原因是,任何多基因评分都将反映个体基因型产生的直接遗传效应,以及遗漏亲本基因型产生的间接遗传效应。后一种影响是GWAS中父母基因型的缺失,我们遵循DiPrete、Burik和Koellinger(2018)和van Kippersluis等人(2020)的方法,应用工具变量(IV)来解决分类测量误差问题。更具体地说,我们将我们的发现GWAS样本分成两半,并基于这两个发现样本构建两个多基因分数。尽管这两个多基因分数各自具有较低的预测能力,但这两个分数的测量结果似乎是正交的,因此它们可以用作彼此的工具变量。利用这两个多基因评分,我们应用了明显相关的工具变量(ORIV;Gillen等人,2019)。详见附录C。3.数据我们使用来自英国生物银行(2006-2010)的数据,这是一个以人口为基础的队列,约有50万人在接受采访时年龄在40-69岁之间,居住在距离英格兰、威尔士和苏格兰22个评估中心之一40公里的半径范围内(Fry等人,2017年)。它包含调查数据、生物标志物和DNA样本、物理测量,以及与患者登记册和死亡记录的联系(Sudlow等人,2015年)。由于参与英国生物银行是自愿的,因此它不是英国人口的代表性样本(详细分析见Fry等人(2017))。我们采用以下样本选择标准。

18
大多数88 在职认证  发表于 2022-4-26 12:52:50
我们从502498个同意的个人开始。我们遵循文献,删除非欧洲血统(92892次观察)、双胞胎和多胞胎(9310次观察)以及兄弟姐妹数量和/或家庭规模信息缺失或冲突的个人(3801次观察)。在此过程中,我们得到了396494人的样本。我们进一步将该样本限制为英国生物库中至少有一个兄弟姐妹的个体,且分析中包含的任何变量(即受教育年限、出生顺序、家庭规模、出生年份和月份、主成分、性别和多基因教育分数)均无缺失值。由于UKBiobank没有专门针对家庭,因此最终样本量为N=15019个兄弟姐妹。被称为“遗传培养”(例如,Kong等人,2018年)。当在家庭中应用时,由于亲本基因型在兄弟姐妹之间是相同的,因此亲本基因型引起的多基因核心差异是虚假的。因此,兄弟姐妹之间在多基因评分方面的部分差异是虚假的,可以被认为是测量误差,削弱了由此产生的家庭内估计(Trejo&Domingue,2019)。根据遗传数据确定兄弟姐妹;英国生物银行没有自我报告的兄弟姐妹。有关识别兄弟姐妹的完整程序,请参见附录B。我们遵循文献(如Lee等人,2018年;Okbay等人,2016年;Rietveld等人,2013年),并使用国际标准教育分类(ISCED)将个人学历转换为同等教育年限。兄弟姐妹样本的平均受教育年限为13.9年(见表1)。我们根据个体对他们有多少兄弟姐妹这个问题的反应来构建个体的出生顺序。

19
能者818 在职认证  发表于 2022-4-26 12:52:56
如果受访者报告没有兄妹,则出生顺序设置为一。对于缺少兄妹数量信息的个人,如果所有人都在英国生物库中,我们将根据家庭规模和个人及其兄妹的出生年份确定出生顺序。这在我们的分析样本中添加了1752个兄弟姐妹的出生顺序信息。表1显示,我们有5911名第一胎(39.4%),平均出生顺序为1.91(其中,我们对245名出生顺序超过5的受访者的出生顺序进行了审查)。我们样本中约37%是最新出生的,平均家庭规模为3人(即平均兄弟姐妹人数为2人)。我们衡量教育遗传禀赋的标准是多基因教育分数。载脂蛋白评分是称为单核苷酸多态性(SNPs,详见附录a)的遗传变异的加权总和。SNP权重由独立(发现)样本中SNP与受教育年限之间的关联(Dudbridge,2013)确定:受教育年限从7年到20年不等,其中大学或大学学位相当于20年,国家职业资格(NVQ)、国家高级文凭(HND)或国家高级证书(HNC)相当于19年,其他专业资格达到15年,具有A或AS等级或类似于13年、O级(普通)中等教育证书((G)CSE)至10年,如果没有上述任何一项,则达到7年的最低水平。表1:描述性统计分析样本(N=15019)变量均值。D.最低最高受教育年限13。8995.0207.00020.000长子(1/0)39.4%受教育年限的PGS 0。0001.000-3.9384.166出生顺序1。9130.9971.0005.000Secondborn41。51%的人出生在11岁。23%四分之四。31%是第五或第三名。60%的家庭规模2。9871.5272.00014.000最后一个孩子(1/0)36.9%男性(1/0)42.5%注:S.D.=标准偏差;最小值=最小值;最大值。

20
mingdashike22 在职认证  发表于 2022-4-26 12:53:02
=最大值。=,(3) 在哪里是个体i的多基因评分值,是SNP j的回归系数( = 1, … , ) 来自GWA,以及是SNP j个体i的基因型(编码为0、1或2,表示“效应”等位基因的数量)。在同胞样本中,多基因评分标准化,平均值为0,标准偏差为1。多基因评分在发现GWASsample的环境背景和人口统计学特征中衡量了受教育程度的遗传倾向(Domingue、Trejo、Armstrong Carter和Tucker Drob,2020)。因此,最好从相同的环境背景中选择发现和分析样本,尤其是在分析基因-环境相互作用时。同时,发现样本应独立于分析样本,以避免过度拟合(Dudbridge,2013)。因此,作为最佳平衡,我们使用我们自己定制的GWAS中的权重来构建多基因评分,该GWAS使用的是英国生物银行样本,没有兄弟姐妹及其亲属。兄弟姐妹的亲属是根据他们的遗传数据确定的。GWAS发现样本包括来自英国生物银行的392771人;我们使用这些分析的汇总统计数据,在15019个兄弟姐妹的样本中创建多基因评分。这种定制的多基因评分缓解了发现样本和分析样本在人口统计学、环境背景以及测量方面的差异(即,感兴趣的变量以相同的方式进行测量(Elam、Clifford、Shaw、Wilson和Lemery Chalfant,2019;Tropf et al.,2017)。此外,运行我们自己的GWAS可以构建两个独立的多基因分数,这两个分数是通过将发现GWAS样本分成两等份获得的,可用于ORIV。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 23:43