楼主: 何人来此
2346 60

[经济学] 技能生产中的动态互补性:来自遗传学的证据 [推广有奖]

51
kedemingshi 在职认证  发表于 2022-4-26 12:56:18
越南时代的征兵制度和教育成就的遗传潜力对教育结果的影响。《教育经济学评论》,第61期(10月),第85-97页。https://doi.org/10.1016/j.econedurev.2017.10.001Selzam,S.,Ritchie,S.J.,Pingault,J.B.,Reynolds,C.A.,O\'Reilly,P.F.,和Plomin,R.(2019年)。比较家庭内和家庭间多基因评分预测。《美国人类遗传学杂志》,105(2),351-363。https://doi.org/10.1016/j.ajhg.2019.06.006Sudlow,C.,Gallacher,J.,Allen,N.,Beral,V.,Burton,P.,Danesh,J.,Collins,R.(2015)。UKBiobank:一个开放获取的资源,用于识别各种复杂的中老年疾病的病因。《公共科学图书馆·医学》,12(3),e1001779。https://doi.org/10.1371/journal.pmed.1001779Todd,P.E.,和Wolpin,K.I.(2003)。关于认知成就的生产函数的描述和估计。《经济日报》,113(485),F3-F33。Trejo,S.,和Domingue,B.(2019年)。遗传天性还是遗传培养?使用多基因评分量化分析中的偏差。BioRxiv,524850。https://doi.org/10.1101/524850Tropf,F.C.,Lee,S.H.,Verweij,R.M.,Stulp,G.,Van Der Most,P.J.,De Vlaming,R.,Mills,M.C.(2017)。由于七个群体的异质性而产生的隐性遗传力。《自然与人类行为》,1(10),757-765。https://doi.org/10.1038/s41562-017-0195-1vanH.Kippersluis,P.Biroli,P.Galama,T.von Hinke,Stephanie Meddens,S.F.W.Muslimova,D.Pereira,R.和Rietveld,C.A.(2020年)。停止元分析,开始仪器化:减少多基因评分中的测量误差。工作文件。Vilhjálmsson,B.J.,Yang,J.,Finucane,H.K.,Gusev,A.,Lindstr"om,S.,Ripke,S.,Price,A.L.(2015)。建立连锁不平衡模型可以提高多基因风险评分的准确性。《美国人类遗传学杂志》,97(4),576-592。https://doi.org/10.1016/j.ajhg.2015.09.001Visscher下午4点,北卡罗来纳州威伊。

52
nandehutu2022 在职认证  发表于 2022-4-26 12:56:24
R.,Zhang,Q.,Sklar,P.,McCarthy,M.I.,Brown,M.A.,和Yang,J.(2017)。10年的GWAS发现:生物学,功能和翻译。《美国人类遗传学杂志》,101(1),5-22。https://doi.org/10.1016/j.ajhg.2017.06.005Willer李彦彦,C.J.,和阿贝卡西斯,G.R.(2010)。金属:快速有效的基因组关联扫描荟萃分析。生物信息学,26(17),2190-2191。https://doi.org/10.1093/bioinformatics/btq340Winkler,T.W.,Day,F.R.,Croteau Chonka,D.C.,Wood,A.R.,Locke,A.E.,M"agi,R.,Loos,R.J.F.(2014)。全基因组关联荟萃分析的质量控制和实施。自然协议,9(5),1192-1212。https://doi.org/10.1038/nprot.2014.0717.附录A。遗传数据、GWA和多基因评分遗传数据。一个完整的人类基因组由23对染色体组成,第23对染色体决定了一个人的生物性别。每对染色体中都有一条来自父亲,另一条来自母亲。染色体由两条相互缠绕的脱氧核糖核酸(DNA)链组成,每条链由四种可能的核苷酸分子组成:腺嘌呤、胞嘧啶、胸腺嘧啶和鸟嘌呤。一条链上的腺嘌呤(A)总是与另一条链上的胸腺嘧啶(T)配对,而胞嘧啶(C)总是与鸟嘌呤(G)配对。这些对被称为碱基对。每一个人类基因组都包含大约30亿个碱基对,编码蛋白质的碱基对的延伸被称为基因。人类基因组中约有20000个基因,其碱基对长度各不相同(Ezkurdia等人,2014年)。两个无关的人类共享大约99.6%的DNA,人类之间的大多数基因差异可归因于单核苷酸多态性(SNP)(Autonet al.,2015)。SNP是DNA中的一个位点,在这个位点上可以观察到两种不同的核苷酸。

53
何人来此 在职认证  发表于 2022-4-26 12:56:30
这两个可能的核苷酸中的每一个都被称为该SNP的等位基因。个体的基因型编码为0、1或2,具体取决于“效应”等位基因的数量。在人类基因组中,至少有8500万个SNP的“次要”等位基因患病率至少为1%(Auton等人,2015年)。全基因组关联研究(GWASs)旨在通过无假设方法将每个变异与某一特定性状关联,从而识别与该性状相关的遗传变异。严格的显著性阈值用于识别与该性状密切相关的变异,其他独立样本用于复制。利用GWASapproach,已经有数千个基因发现(Visscher等人,2017年)。个体SNP通常解释不到0.02%的行为结果差异(Chabris,Lee,Cesarini,Benjamin和Laibson,2015;Visscher等人,2017)。因此,将多个SNP组合成一个多基因评分是很常见的(Dudbridge,2013),它被构造为SNP的加权和。通过GWAS样本量的增加,教育多基因评分的预测能力已从2-3%(Rietveld等人,2013年)增加到6-8%(Okbay等人,2016年),目前为11-13%(Lee等人,2018年)。就生物学途径而言,有证据表明,许多已识别的基因与健康、认知和中枢神经系统特征有关(Rietveld等人,2013年)。同样,Okbay et al.(2016)和Lee et al.(2018)中的大多数重要SNP与产前期间负责儿童大脑基因表达的基因组区域有关。方法。关联性。作为第一步,我们使用英国生物银行提供的亲属关系矩阵识别兄弟姐妹及其亲属。

54
mingdashike22 在职认证  发表于 2022-4-26 12:56:36
亲属关系矩阵基于基因识别的相关性,包含使用KING软件识别的三级和更近亲属(Manichaikul等人,2010)。英国生物银行没有关于自我报告相关性的信息(Bycroft等人,2017年)。基于亲属关系系数和遗传相似性(根据身份状态(IBS)系数)的组合,个体对之间的关联程度。IBS测量相关个体不共享等位基因的标记比例。关于如何确定家庭关系的阈值,我们遵循《国王手册》(见表A.1)。每个关系类型确定的配对数量与Bycroft等人(2017年)的略有不同,因为一些英国生物银行参与者从那时起就同意分析他们的数据。表A.1:英国生物库中用于确定个体间相关性的阈值。重复/单合子双生子一级/亲子二级-三级亲缘关系/亲缘关系系数>0.35400.1770–0.35400.1770–0.35400.0442–0.1770IBS0<0.0012>0.0012N(对)62712265978038107147为了我们的分析,我们进一步分离了那些与兄弟姐妹相关的人,直到三级(亲缘关系系数)≥  0.025),即兄弟姐妹、兄弟姐妹的父母、兄弟姐妹的堂兄弟姐妹(见表A.2)。

55
kedemingshi 在职认证  发表于 2022-4-26 12:56:42
这样,我们用于多基因评分构建和预测的坚持样本(即兄弟姐妹子样本)与用于校准用于构建多基因评分的SNP权重的GWAS发现样本无关。表A.2:与英国生物银行兄弟姐妹子样本中个体的相关性。与siblings的关系与siblings完全同胞无关2-3 siblings父母或SIBLINGSTOTALN子女(个人)的亲属910554149810207470147500注:根据表A.1中报告的亲属关系分类计算与同胞的亲属关系。瓜斯。我们定制的GWA是使用Jiang等人(2019)开发的用于全基因组复合物分析(GCTA)的fastGWA工具进行的。fastGWA将混合线性建模(MLM)应用于英国生物库的遗传数据。fastGWA需要以下步骤。首先,我们根据KING软件的输出,使用来自英国生物库的家族关系文件生成稀疏遗传关系矩阵(GRM)。接下来,我们使用SNP数据、稀疏GRM、表型文件和0.001的次要等位基因频率(MAF)过滤器执行基于MLM的GWA。表型文件提供了关于出生年份、性别、出生年份和性别的相互作用、批次以及前40个主成分(PC)的教育剩余年数的数据。我们还进行质量控制。最终的GWAS发现样本包括392771个人:181459名男性和211312名女性。我们使用EasyQC工具(Winkler等人,2014年)进一步对生成的GWAS汇总统计数据进行质量控制,并使用Okbay等人(2016年)的汇总统计数据对我们定制的GWAS权重进行元分析。我们使用这些数据来构建用于稳健性分析的替代多基因评分(见脚注13)。

56
可人4 在职认证  发表于 2022-4-26 12:56:50
Meta分析使用软件包METAL(Willer、Li和Abecasis,2010)进行。多基因评分。多基因评分是在使用LDpred(Vilhjálmsson等人,2015)1.06版和Python 3.6.6版解释SNP之间的链接不平衡时构建的。连锁不平衡是指单个染色体不同位点的NSNP之间的非随机相关性。LDpred是一个基于Python的软件包,它使用贝叶斯方法调整LD的GWAS权重。我们遵循Mills、Barban和Tropf(2020)中列出的步骤,包括协调基础文件和目标文件,计算LD调整后的权重,然后将其应用于多基因评分。更具体地说,我们排除了撤回同意、性别缺失或自报性别与基因识别不匹配、非欧洲血统的个人,基因分型质量差,假定性染色体非整倍体,其第二染色体核型不同于XX或XY,杂合度异常,或缺少关于任何前一标准的信息。使用PLINK进行施工(Purcell等人,2007年)。我们根据LDP和假定的因果SNP比例重新加权SNP效应,我们将其设置为1,这是行为特征的标准实践(Cesarini&Visscher,2017)。我们构建多基因核心的保留样本由49866个兄弟姐妹及其亲属组成,其中所有变量的最终分析样本为15019个兄弟姐妹。多基因评分包括所有SNPs,即在协调步骤筛选HapMap3 SNPs后的1065078个SNPs。

57
kedemingshi 在职认证  发表于 2022-4-26 12:56:56
对于拆分样本GWA,我们将clean discovery样本(N=392771)随机拆分为两个样本,每个样本约196380人,并使用与完整UKB GWA相同的FastGWA程序获得SNP权重。我们继续使用LDpred根据两组汇总统计数据构建两个多基因分数。同样,我们也包括所有SNPs(在协调步骤过滤HapMap SNPs后为1065146)。B.动态互补性测试动态互补性的概念具有挑战性,因为它需要初始捐赠和后期投资的独立变化,或者随着时间的推移,多重投资的外源性变化(Almond&Mazumder,2013;Johnson&Jackson,2019)、Cunha&Heckman(2007)和Cunha et al.(2010)采用结构性方法,将两项技能以及母公司投资建模为低维潜在变量,并发现证据与动态互补性一致。许多研究检验了特定干预或投资的效果是否因初始技能而异。Aizer&Cunha(2012)对某些产前投资的早期生命健康措施进行了纠正,并发现学前教育入学率对于这种残存的捐赠措施水平较高的儿童来说更有成效。Lubotsky&Kaestner(2016)使用幼儿园入学年龄作为初始认知技能的外生变量,并找到了一些关于动态完成的证据,尽管这种影响在一年级后消失。最近的一组论文研究了罕见的情况,即初始捐赠和后期投资都存在外源性变化。例如,Malamud等人(2016年)研究了罗马尼亚获得更好学校机会的外源性差异与堕胎导致的婴儿期背景差异之间的相互作用。

58
能者818 在职认证  发表于 2022-4-26 12:57:01
他们的发现并不表明最初的捐赠和后来的投资之间存在着有意义的互动。Rossin Slater&Wüst(2020)将护士家访计划作为捐赠的外源性冲击,并将在丹麦交错获得高质量学前儿童保育作为投资的外源性冲击,发现这些干预措施是替代而非补充。Gunnsteinsson等人(2014年)利用了一个独特的组合,龙卷风袭击了孟加拉的一个地区,该地区碰巧参与了维生素a补充的随机实验。他们的发现与动态互补性是一致的,因为服用维生素A补充剂的儿童可以更好地避免地震的后果。Adhvaryu等人(2019年)将出生年份的当地降雨量作为捐赠的外生变量,并将Progresa的随机现金激励作为投资的外生风险。他们的主要发现是,收到现金转账的家庭的孩子受到更好的保护,免受不利的捐赠,这与动态补足一致。同样,Duque等人(2018年)也使用了哥伦比亚不利天气冲击和有条件现金转移的组合,以表明在正常天气条件下出生的儿童从现金转移中受益更多。

59
kedemingshi 在职认证  发表于 2022-4-26 12:57:08
最后,Johnson&Jackson(2019)利用先发制人的推出和法院命令的学校财务模式(SFR)的实施,将增加公立K-12学校的支出作为人力资本投资的两个外部冲击,再次发现有利于动态互补的证据。因此,上述论文表明,越来越多的论文探讨了初始捐赠和后期投资的变化,以研究动态互补性。然而,这些文献中的证据是混合的,一些研究支持动态互补性的存在,另一些研究发现捐赠和投资之间的证据较弱,甚至是可替代性。C.明显相关工具变量(ORIV)回归在本节中,我们解释了明显相关工具变量(ORIV;Gillen et al.,2019)回归的技术。假设我们想使用多基因评分预测结果变量Y,即估计以下模型: =  + +  ,                                                      (C.1)在何处 是一个常数, 是真的多基因评分的结果吗和 是错误术语。我们对真正的多基因评分有两种估计:= + 和= +. 两者之间的协方差为零,(, ) = 0,它们具有相同的测量误差相对偏差, . 也就是说:==,                                                           (C.2)在哪里和是测量误差的方差, 分别和是各多基因得分的方差。如果我们使用作为, 以下内容适用:=(,)/()(,)/()=(,)(,)= = .    (C.3)吉伦等人开发的ORIV回归。

60
可人4 在职认证  发表于 2022-4-26 12:57:14
(2019)估计了一个“叠加”模型:=+ + ,                                             (C.4)其中一个工具是估计的多基因分数的堆栈具有2+1+,其中N是样本量,0是一个带有零的Nx1向量。我们包括一个族堆栈fixedeffect,用于在一个数据堆栈中进行族内比较。Correia(2017年、2019年)之后,标准误差在家庭和个人层面上进行了聚类。D.早期父母投资在英国生物银行观察到的早期父母投资仅包括孩子是否母乳喂养以及母亲是否在出生时吸烟。我们还观察了后来的兄弟姐妹之间的年龄差距。表D.1报告了回归分析的结果,解释了早年父母投资与长子、多基因教育分数及其相互作用的关系。这表明,母亲是否会根据自己的第一个或第二个孩子以及孩子的多基因评分来改变自己的行为。结果表明,第一胎和第二胎之间母乳喂养的可能性(第1栏)和孕期母亲吸烟的可能性(第2栏)相似。此外,(孩子)教育的多基因评分与零没有显著差异,我们也没有发现证据表明怀孕前后母亲的投资与第一胎的多基因评分有任何差异。最后,第3列给出了根据第一个兄弟姐妹的多基因得分对前两个兄弟姐妹之间的年龄差距进行回归的估计,这表明如果第一个孩子的多基因教育分数较高,则年龄差距略低(0.08岁)。然而,请注意,后一列比较了具有不同阶段差距的家庭,因此是一种家庭间分析,而不是家庭内分析。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-6 12:06