楼主: 何人来此
2343 60

[经济学] 技能生产中的动态互补性:来自遗传学的证据 [推广有奖]

21
可人4 在职认证  发表于 2022-4-26 12:53:08
这种方法已被证明优于基于多个队列元分析的单多基因评分(van Kippersluis等人,2020年)。作为稳健性检查,我们基于Okbayet al.(2016)的荟萃分析GWAS结果构建了一个多基因评分,包括23andMe汇总统计数据和我们自己的英国生物库发现样本GWAS。根据预期,与仅基于英国生物库构建的多基因分数相比,该多基因分数更能预测教育成就。然而,该多基因评分基于来自不同环境背景的几个发现队列,不允许我们使用ORIV,因为我们无法获得暗示样本,从而创建多个多基因评分。结果在质量上是相同的,但鉴于这一多基因评分反映了不同的环境背景(见Domingue等人,2020年),预计相互作用的影响较小,在常规水平上没有达到统计显著性(可根据作者的要求获得结果)。结果4。1.多基因分数对教育成就的预测能力图1显示,我们的多基因分数对教育年限的预测是正态分布的。将多基因评分分为200个区间;这些点代表每个人的平均受教育年限。通过点的线是从我们的多基因分数的受教育年限的局部多项式回归中获得的。根据文献(Lee等人,2018年;Okbay等人,2016年;Rietveld等人,2013年),多基因评分与受教育年限呈正相关(r=0.24,p<0.001)。

22
能者818 在职认证  发表于 2022-4-26 12:53:14
这两个标准差低于多基因得分的平均值,而这两个标准差高于平均值的平均值之间的平均差异是近4年的完整教育,突出了多基因核心的实质性预测能力。此外,图1表明,这种关系近似为线性关系,几乎不表明受教育年限与多基因分数之间存在任何强非线性。图1。分析样本中标准化多基因评分与受教育年限之间的关系。表2显示,在家庭间分析中,多基因得分的增量Rof(即,在控制性别、出生月份和年份以及前40个主成分后,由多基因得分解释的附加方差)为6.0%(即0.095-0.035=0.060;第1列和第2列)。在具有家族固定效应的规范(第3列和第4列)中,多基因得分的增量(内)R降低至1.0%。当从家庭之间的估计转移到家庭内的估计时,这种预测能力的降低在0。1.2.3.4密度1 012 14 1618年教育年限-4-2024年教育文学年限(参见例如,柯林格和哈登,2018年;孔等人,2018年;李等人,2018年;里特维尔德等人,2013年;塞尔扎姆等人,2019年)。这一减少反映了一个事实,即家庭固定效应解释了共享的家庭环境和父母基因型,而这在家庭间规范中没有被解释。在效应大小方面,我们观察到,多基因评分的一个标准差增加与1.23年的教育程度增加有关。使用固定族效果时,效果大小将减小到0.633。表2。

23
可人4 在职认证  发表于 2022-4-26 12:53:20
受教育年限对多基因评分(PGS)的回归结果。家庭间分析家庭分析(1)(2)(3)(4)受教育年限的PGS 1。234***0.633***(0.038)(0.071)常数15。664***15.099***15.383***15.227***(1.696)(1.766)(2.336)(2.433)R20。0350.0950.0280.038N1501915019150191915019注:括号中的稳健标准错误,按家族内部分析中的家族进行聚类;*p<0.10,**p<0.05,***p<0.01;控制变量的系数(出生年份和月份、性别和前40个主成分)不显示,但可根据作者的要求提供。4.2.  出生顺序和教育程度之间的关系图2显示了按出生顺序划分的教育年限的原始差异(没有家庭固定效应和其他控制变量)(A组)。虽然前三个孩子的平均教育水平相似,但出生顺序较高的孩子的平均教育水平明显较低(尽管差异较大)。当把所有Laterborn集合在一起时(B组),Firstborn和Laterborn之间的差异相对较小,但清晰可见。图2。分析样本中出生顺序和受教育年限之间的关系。表3。

24
kedemingshi 在职认证  发表于 2022-4-26 12:53:26
不同出生顺序的教育年限回归结果。家庭分析内部家庭分析(1)(2)(3)(4)第一个出生。334***0.362***(0.089)(0.111)ndborn-0.302***-0.348***(0.093)(0.124)rdborn-0.317**-0.391(0.148)(0.243)thborn-0.846***-0.544(0.226)(0.366)thborn-0.878***-0.090(0.271)(0.483)Constant16。021***16.219***14.476***14.898***(1.752)(1.743)(2.333)(2.333)R0。044 0.0440.030 0.030N15019150191915019注释:括号中的稳健标准错误,在家族内分析中按家族分类;*p<0.10,**p<0.05,***p<0.01;控制变量的系数(出生年份和月份、性别和前40个主成分)不显示,但可根据作者的要求提供。12.5 1313.514平均受教育年限12345出生顺序表A13。7.13.8 13.91414.1 14.2第一出生后出生规范B表3确认了规范中的出生顺序效应,包括和不包括家庭固定效应,并表明在控制变量的条件下,差异变得更加显著。我们观察到,第一个和第二个孩子之间持续存在0.3-0.4年的教育差距。对于使用二元指标或出生顺序的分类变量,影响的方向和大小是稳健的。由于观察的数量相对较少(见表1),出生顺序高于三个的家庭内效应大小未达到统计显著性。出生顺序与多年教育中的多基因评分之间的关系为了衡量因果基因-环境相互作用,重要的是要证明出生顺序与多基因评分是正交的。图3给出了两个测量之间原始关系的第一印象,没有控制家庭固定效应或其他控制变量。

25
kedemingshi 在职认证  发表于 2022-4-26 12:53:33
专家组A表明,晚出生儿童的教育成就多基因分数往往略低。在B组中,当减少第一胎与第二胎的比较时,同样的模式成立。然而,这些差异在统计学上并不显著。此外,多基因评分按出生顺序的分布是相同的(C组和D组)。图3。分析样本中出生顺序与受教育年限的多基因评分之间的关系。3-.2-.10.1PGS(教育年限)12345出生率RankPanel A-.02-.010.01.02.03第一次出生后出生。1.2.3.4人口密度-4-2024PG,适用于受教育年限1st2nd3rd4th5面板C0。1.2.3.4-4-2024PGS对于受教育年限的长子和晚生子女,根据图表证据,表4显示了在家庭间分析中,长子和晚生子女之间的多基因评分存在0.04标准差的轻微差异。然而,当研究家庭内部的这种关系时,这种差异在经济上和统计上都不显著。这些结果证实了这样一个结论:第一胎的平均遗传禀赋与后胎的兄弟姐妹没有差异(c.f.孟德尔定律)。研究结果也证实了多基因评分和出生顺序之间不存在基因-环境相关性(rGE)的观点。表4。

26
kedemingshi 在职认证  发表于 2022-4-26 12:53:39
教育程度的多基因评分对出生顺序的回归结果。家庭分析内部家庭分析(1)(2)(3)(4)第一胎-0.041**-0.016(0.018)(0.018)第二胎0。040**0.018(0.019)(0.020)第三出生。073**0.022(0.031)(0.038)第四出生-0.0270.018(0.045)(0.057)第五出生-0.0370.036(0.055)(0.077)康斯坦顿。5440.4880.2880.279(0.343)(0.341)(0.382)(0.383)R20。0180.0180.0120.012N15019150191915019注释:括号中的稳健标准误差,在族内分析中按族聚类;*p<0.10,**p<0.05,***p<0.01;控制变量的系数(出生年份和月份、性别和前40个主要组成部分)不显示,但可根据作者的要求提供。在家庭内部分析中,不同出生顺序的多基因评分没有显著差异,这一事实表明,图3所示的原始关系主要由家庭规模决定。我们确实证实了这一点,控制变量家庭规模的系数为负值,在家庭间分析中具有统计学意义。4.4.  基因-环境相互作用和技能形成的动态互补性表5给出了家族间和家族内分析中的基因-环境相互作用结果。将表5中的第1列和第4列与上述估算值(表2和表3)进行比较,结果表明,增加教育程度多基因分数不会直接影响出生顺序对受教育年限的影响。这一比较再次证实了多基因评分和出生顺序是独立的。据估计,多基因得分的一个标准偏差增加将使受教育年限提高1.23年(家庭分析之间)和0.64年(家庭内分析)。

27
nandehutu2022 在职认证  发表于 2022-4-26 12:53:45
此外,第一个孩子比第二个孩子平均多受0.37-0.40年的教育。表5。基因-环境相互作用教育年限回归的结果。家庭分析内部家庭分析(1)(2)(3)(4)(5)(6)olsolsorivolsolivfirstborn0。384***0.384***0.404***0.372***0.368***0.371***(0.080)(0.080)(0.080)(0.110)(0.110)(0.110)教育年限的PGS。227***1.186***1.528***0.635***0.574***0.823***(0.041)(0.049)(0.062)(0.071)(0.078)(0.101)受教育年限的长子×PGS 0。1080.184**0.162**0.224**(0.073)(0.093)(0.081)(0.100)常数15。353**15.353**14.683**14.293***14.282***14.144***(1.807)(1.818)(1.838)(2.431)(2.449)(4.479)R20。1020.1030.0400.040Cragg-Donald F-stat.4887.5424068.062N1501915019150191501915019注释:括号中的稳健标准误差,在族内分析中按族聚类;*p<0.10,**p<0.05,***p<0.01;控制变量的系数(出生年份和月份、性别和前40个主成分)不显示,但可根据作者的要求提供。家庭之间的设计表明,多基因评分与0.108的第一胎之间存在着经济意义上的积极互动(第2栏)。然而,在常规阈值下,它在统计上并不重要。当我们使用明显相关的工具变量(ORIV)回归(第3列)时,交互项在统计学上变得显著,表明多基因评分中的测量误差减弱了多基因核心和交互项的主要影响。在家庭固定效应规范中,我们发现OLS和ORIV规范中的交互效应都是显著的。测量误差修正使得相互作用项更强,无论是在统计学上还是在效应大小方面(0.162 vs。

28
nandehutu2022 在职认证  发表于 2022-4-26 12:53:51
0.224).作为检验主要结果统计显著性的补充方法,我们还通过使用10000个多基因评分和出生顺序的排列进行随机推断,每次重新估计家族内的规格(Fisher,1935;Rosenbaum,2002)。这种方法不依赖于对假设人群的重复抽样,并且能够衡量我们的交互效应的大小和重要性对于多基因评分和出生顺序的其他排列是多么罕见。图4给出了所有10000个排列的t统计量分布,实际估计的t统计量显示为实线。估计的相互作用项的t统计量的精确p值(即,t统计量的比例比我们的估计更极端)为0.04。积极且具有统计学意义的交互作用项为教育中的基因-环境交互作用提供了强有力的证据,并与技能形成中的动态互补性的存在相一致:长子的影响(与更多的父母投资相关)与多年教育中多基因得分的较高值是互补的。换句话说:多基因评分较高的人从与长子相关的父母投资增加中受益更多。系数的大小表明,对于那些多基因得分低于平均水平的人来说,长子没有优势。相反,对于多基因得分较高的人来说,长子会增加受教育年限。例如,多基因得分高于平均值两个标准差的第一胎与晚生兄弟相比,平均多受0.8年教育。图4。基于随机推断的G×E相互作用项的t统计量分布。4.5.

29
mingdashike22 在职认证  发表于 2022-4-26 12:53:57
稳健性检查在本节中,我们检查我们的结果对多基因评分函数形式中潜在的非线性以及出生顺序的稳健性,以及对进一步控制变量的添加。虽然第4.4节中采用的线性形式似乎由图1中的视觉关系证明是合理的,但我们通过考虑可能的非线性来探索结果的稳健性。表6比较了连续形式的家族内规范(复制到第1列进行比较),以及以二元形式(高于和低于平均值,第2列)、四分位数(第3列)和平方形式(第4列)指定多基因评分的规范。我们在所有规范中都遵守积极的互动条款。与我们的主要发现一致,对于多基因评分较低的人来说,长子的影响是不显著的,而且这种影响集中在多基因评分分布的上半部分。我们还发现,第1列中的主要结果对于在PolyGenicCore中指定一个二次型具有鲁棒性。0.1.2.3.4密度-4-2024t统计交互作用术语表6。

30
nandehutu2022 在职认证  发表于 2022-4-26 12:54:05
基因-环境相互作用教育年限回归结果;多基因评分对非线性的稳健性。家庭内分析(1)(2)(3)(4)初生子女。368***0.1710.1980.377***(0.110)(0.145)(0.195)(0.127)PGS,教育年限0。574***0.573***(0.078)(0.078)长子×受教育年限0。162**0.164**(0.081)(0.082)教育年限PGS(>平均值)0.424***(0.137)长子×教育年限PGS(>平均值)0.376**(0.175)教育年限PGS(第二个四分位数)0.437**(0.185)教育年限PGS(第三个四分位数)0.486**(0.192)教育年限PGS(第四个四分位数)1.133***(0.208)教育年限PGS(第二个四分位数)×第一个四分位数-0.040(0.271)教育年限PGS(第三个四分位数)×第一个四分位数0。457*(0.258)教育年限PGS(第四个四分位数)×第一个出生年龄。261(0.240)PGS教育年限(平方)0.032(0.047)PGS教育年限(平方)×长子-0.008(0.062)Constant14。282***14.100***13.766***14.227***(2.449)(2.375)(2.421)(2.448)R20。040 0.033 0.046 0.040N15019150191915019注释:括号中的稳健标准错误,按族聚集;*p<0.10,**p<0.05,***p<0.01;控制变量的系数(出生年份和月份、性别和前40个主要组成部分)不显示,但可根据作者的要求提供。表7报告了结果对出生顺序替代规范的敏感性。第1列复制了表5中的结果进行比较。在第2栏中,我们将每个出生级别的假人包括在内,第一胎作为参考类别。因此,与第1列相比,我们预计效果会逆转。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-6 12:04