楼主: kedemingshi
2134 50

[经济学] 对中介效应和其他假设进行的几乎相似的测试 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-4-26 15:22:57
根据Hillier等人(2021年)展示的位置-尺度类型不变性,第二次缩减为(T,T)。根据定理1,置换和反射对称性进一步将相关样本空间减少到一个八分之一。最大不变量是有序的绝对t统计量(|t |(1),|t |(2))=(min(|t |,| t |),max(|t |,| t |),密度在表2中给出。对于一般u,g法的拒绝概率(RP)由以下公式给出:πg(u,u)=1-Z∞Zg(t)f | t |(1),|t |(2)(t,t,u,u)dtdtt。(9) 通过用标准正态分布Φ(·):Zbf | T |(1),|T |(2)(T,T,u,u)dt=rπexp的CDF表示内部积分,可以将二维积分简化为一维积分(-t/2)·{exp(-u/2)cosh(tu)(Φ(b)-u)+Φ(b+u)-1) +exp(-u/2)cosh(tu)(Φ(b)-u)+Φ(b+u)-1)}.(10) 因此,RP通过积分公式(10)将b=g(t)除以t简化为一维积分∈ [0, ∞), 这大大提高了效率和准确性。本文中的所有NRP都是通过t上的数值积分确定的∈ [0,u+9]在u=0的空值下。数值积分是在Julia中进行的,见Bezansonet等人(2017),使用基于自适应高斯-克朗罗德求积的函数quadgk。对于最终的g函数,计算的NRP绝对误差的估计上限约为10-8.g-边界通常由算法确定,附录D显示了使用J+2节点的线性样条曲线,第一个和最后一个节点固定的变化g-方法的基本实现。尽管它很简单,但即使对于J。

22
能者818 在职认证  发表于 2022-4-26 15:23:03
图4展示了固定数量网格点J=6的g函数构造,以及样本空间(|T |(1),|T |(2)),R.3123从东到东北的八分之一的结果→ T(2) |T(1)↑t(1)t(2)t(3)t(4)zα/2t(6)t(7)g(1)g(2)g(3)g(4)g(5)g(6)g(7)=zα/2g(t)g(t)g(t)ARCRFigure 4:构造J=6的基本g函数,共8个节点,并在(|t |(2),|t |(1))空间中生成cr边界。图5显示了与LR和Wald(Sobel)测试相比的测试NRP。在最低NRP中有显著的增长,因此当地电力从0.25%增加到4%。999%. 对于J=2,已经有了很大的改善,在J=8之后,收益很小,而在J=16之后,几乎没有任何改善。3.2权力对相似性的坚持通常会对权力产生负面影响,但没有任何负面影响。具有或不具有(近似)相似性限制的功率包络非常接近。我们的最佳测试的权力面也很接近。即使是J=16的基本测试也有非常好的GJ=2gJ=4LRW(Sobel)0 1 2 3 4 5μ→0.000.010.020.030.040.05P[Rej]→图5:NRPs g试验,J=2,4,与LR和Wald(Sobel)试验对比。功率与Sobel和LR测试相比,对于非中心参数u的所有值来说都是一致的。在u=0的原点附近,它基本上高出5%。公式(9)中定义的RPπg(u,u)是NRP,如果u和/或u等于0(零假设)。当两者都非零时,他的假和πg(u,u)是CRg定义的测试的幂。图6显示了45中的功率o, u=u,方向。其他方向的功率也优于Wald(Sobel)和LR测试。gJ=2gJ=8LRW(Sobel)0 1 2 3 4 50.20.40.60.81.0P[拒收]→μ →图6:沿u=u(=u)方向的功率比较基本g-测试、LR-和W(Sobel)测试。对于额外的功率有一个简单的解释。

23
能者818 在职认证  发表于 2022-4-26 15:23:10
Wald和LR测试均在原点附近拒绝远低于5%。因此,在不破坏尺寸条件的情况下,可以扩展临界区域并增加功率。在原产地,LR和Wald(Sobel)测试的NRP接近0%。通过扩展临界区域,我们可以在不违反尺寸条件的情况下获得近5%的功率。LR测试有一些吸引人的特点,包括对特定(t,t)的拒绝意味着对更大的tand/或talso值的拒绝。这是直观的,因为反对空值的证据正在增加。然而,缺点是,当tor小于1.96时,人们从不拒绝,这会导致极端保守,可以通过向临界区域添加面积来解决。还应注意,顺序统计量的相关分布(|T|(1),|T|(2))与(T,T)或其绝对值的两个标准正态乘积的分布非常不同。3.3功率包络线与Sobel和LR测试的比较是有限的,因为它们对于μ的小值都表现得很差。对于满足适当的不变性、大小和几乎相似性限制的一类测试,只有通过将测试的幂曲面与幂包络或其上界进行比较,才能评估新g测试的绝对质量,甚至接近最优。

24
kedemingshi 在职认证  发表于 2022-4-26 15:23:17
由于精确相似不变检验存在时是不可取的,我们引入了一类Γα,使用偏差小于 从α级和操作(超)类ΓMα, Γα,如下。定义3类Γα,近似相似边界函数 > 0和给定的α定义为:Γα,=G∈ DR+,R+supu≥0P[CRg |(0,u)]≤ α和infu≥0P[CRg |(0,u)]≥ α - ΓMα类,集合M=n0, u(ι)oΥι=1包含H下的Υ点,定义为:ΓMα,=(g)∈ DR+,R+sup(0,u)∈MP[CRg |(0,u)]≤ α和inf(0,u)∈MP[CRg |(0,u)]≥ α - ).对于 = 0Γ中的边界函数类似。在所有的数值例子中,我们考虑α=0.05,但对于一般的1/α/∈ N根据Orem 2,布景将是空的。对于 = α、 另一方面,Γα,α包含所有满足尺寸条件的基于g的测试。我们的兴趣在于 接近0,当α,包含几乎相似的边界。最小值 为此Γα,当1/α时,调解问题的“不为空”为0∈ N、 但通常取决于所考虑的测试问题,如果不存在类似的测试,则大于0。ΓMα类,可以被认为是Γα的离散化,在这个意义上,考虑了空值下的点网格。它施加的限制较少,只在有限的分数上执行近似相似的条件。因此,它可能包含不满足不在M中的点的大小条件的边界。显然是Γα, ΓMα,由于大小和NRP条件也适用于类Γα中以M为单位的点,没有唯一的解决方案。因此,我们必须从Γα中选择海洋边界函数,, 或者在实践中从ΓMα开始,, 进行操作测试。对于功率包络的构造,我们可以选择ΓMα中的测试,这将最大限度地提高针对备选方案中特定点(u,u)的功率。

25
nandehutu2022 在职认证  发表于 2022-4-26 15:23:24
该测试是一个点近似(POINS)测试。该测试的临界区域随(u,u)而变化,且Γα类中不存在统一最强的测试,. 然而,它可以用来构造功率包络线的上限。定义4近似不变测试的功率包络 > 0定义为:π(u,u)=maxg∈Γα,P[CRg |(u,u)]。对于给定的一组点M=n(0,u(ι))oΥι=1,幂包络的上界为:?(π(u,u)=maxg∈ΓMα,P[CRg |(u,u)]。为了符号的简单性,我们抑制了对 而M.自从Γα, ΓMα,和ΓMα元素,不一定满足所有参数值的大小条件,它遵循‘π(u,u)≥ π(u,u),因为施加的条件较少。为更接近π(u,u)的Mwill力选择一个网格,至少在Mwill力的其他点上,此时需要保持尺寸条件。还要注意的是,使点(u,u)的功率最大化的“点”最优GT可能具有不希望的特征,例如包括临界区域中的部分轴,即使此类观测完全符合零假设。我们通过直接最大化功率来确定α=0.05的¨π(u,u),方法是选择样本空间中的临界区域点,当真实密度有参数(u,u)时,在满足以下条件的侧面条件下,使反射概率最大化:∈ [0.05 - , 0.05]适用于所有参数(0,u)∈ M.将样本空间分解为285150个平方,并使用现代优化程序确定哪些平方应包含在临界或可接受区域中,以便在满足近似相似条件的同时最大化功率。对于网格为(u,u)的点重复此操作。因此,对于网格上的每个点,都会确定点的临界区域,并记录功率。

26
大多数88 在职认证  发表于 2022-4-26 15:23:31
附录D给出了算法的详细信息,以及可以处理大量变量和附带条件的优化例程。通过取消近似相似性限制(0.05-  ≤ 在相同的算法中,我们可以为非相似测试构造一个功率包络。当功率约为40%时,与(较高)非相似功率面的最大差异为2%,表明相似性要求导致的功率损失较小。计算出的¨π(u,u)表面使我们能够构建一个在下一节中导出的大小正确的最佳测试。4新的中介测试确定了幂包络的上界后,我们可以确定一个幂曲面尽可能接近这个上界的g-边界函数。该优化测试使用附录D中给出的算法进行。附录E中给出了该函数,附录E中还提供了R代码。为了便于实施,我们在表1中给出了g(t)的值。图7显示了调解问题的最佳g边界测试。0.0.5 1.0 1.5 2.0 2.5 3.00.00.51.01.52.0t→g(t)→图7:最佳g边界函数。虚线是LR边界。02448μ20.0499990.05P[Rej]→=图8:NRP作为非中心参数u的函数。实线是最佳测试,严格在0.049999(=0.05)之间- , 虚线)和0.05(虚线)。最佳CRGIN包括一个接近45的狭窄区域o两个t-统计量具有相同量级的线。这是权宜之计,有两个原因。首先,因为中介要求θ和θ都是非零的。检测到这一点的最佳可能性是沿着45o图9中的幂曲面显示了对角线上的最高幂。最佳的CRgdoes排除了两个小于0.1的t统计量,这与精确测试中不具吸引力的区域不同。

27
何人来此 在职认证  发表于 2022-4-26 15:23:37
其次,近似相似条件要求在八分之一点的左角有额外的临界区域,因为对于小参数值,NRP特别低。功率的增加自然与I型误差的增加有关,但定义测试的正确大小仅要求其不大于5%。尽管如此,规模(NRP)/电力交易以及其他可使用关键区域分析评估的折衷方案仍然存在。例如,拒绝并不是单调的,这一点似乎不那么直观,因为两者的增加提供了更多反对无效的证据。从这个意义上说,TheLR和Wald测试是单调的,但对于小参数值,会导致功率降低到接近零。t的任何观测值t都不会位于水平轴或垂直轴上。因此,任何观察到的t都更有可能被赋予一个替代参数值,而不是空值下的值。因此,在LR临界区域增加面积是可取的,即使这会导致非凸临界区域或验收区域。人们可以思考靠近对角线的非常狭窄的区域,以及是否应该沿着45度线继续接受o线大于0.1,直到如图2b所示的1.217,但新的边界是一个明确问题的最佳解决方案。最优CRgis的狭窄区域是CRLR的严格延伸,CRLR本身比Sobel(Wald)CRW大得多。由于新的检验是为了满足尺寸条件而构造的,所以我们有以下几点:定理3,Sobel/Wald检验和LR检验是不允许的。证据CRW CRLR CRghence P[CRW]<P[CRLR]<P[CRg]≤ 0.05. OptimiTag测试具有一致的更高功率,并且结构尺寸正确。NRP作为非中心参数u的函数如图8所示。

28
可人4 在职认证  发表于 2022-4-26 15:23:43
与5%的差异小于10%-5.如此之小,以至于该量表必须大幅放大,以至于无法与同一图表中的LR和Sobel测试进行比较。新g测试的功率非常接近功率包络线(上限)。最大差异为0.00614。这具有重要意义。首先,上界如前所述是正确的。第二,g测试的功率包络线和功率表面的上限在绘制图形时看起来几乎相同。因此,图9仅显示了最佳g-测试的功率表面。最后,新的g测试对于更大类别的测试中的所有意图和目的都是最佳的。通过在近似相似测试ΓMα的类别内进行构造,它是最优的,, 但考虑到其功率面与(非)相似功率包络线的接近性,不可能存在任何附加功率超过0.00614的近似相似测试,即使构造基于不同的方法。更一般地说,非相似测试的功率可以增加2%,但可能会导致奇数拒绝区域和测试构造中未使用的其他参数值的低功率。最优g检验对所有参数值都具有良好的性质。图9中的幂曲面仅显示了(u,u)参数空间的第一个象限。其他三个象限之后是参数的简单排列和反射。图9:Power surface optimal g-test5应用:教育成就和性别为了说明新测试的使用,我们考虑了Alan等人(2018)关于小学教师性别信仰(传统或进步)对学生数学和语言成绩影响的中介分析。他们利用土耳其数据独特的制度特征,为随机分配教师到学校提供了一个自然实验。

29
kedemingshi 在职认证  发表于 2022-4-26 15:23:49
信息由大约4000名三年级和四年级学生及其145名教师组成。这些数据可以在他们的在线附录中找到。根据与参与教师接触的时间长短,儿童被分为三组:“1年接触”(最多一年)、“2-3年接触”(超过一年,最多三年)和“4年接触”(最多四年)。Alan等人(2018年)考虑了三个潜在的调停者,但我们关注学生自己的性别角色信念。在等式(1)-(3)的表示法中,无论老师被归类为传统还是进步,X都是一个哑巴。中介变量M是学生自己对性别角色的信念。我们把语言测试分数作为因变量Y来关注。表2显示了在控制学校固定效应、学生特征、家庭特征、教师特征、教师风格和教师效应后,基于完整样本和三个暴露组对女孩间接效应的估计。完整样本的结果与ofAlan等人(2018年)表5和表6所示的值相似,尽管它们使用了Imai等人(2013年)的方法。我们考虑三种不同的暴露持续时间组。^θ的t比率在1年以上暴露的5%水平上不显著。然而,对于1年的风险敞口而言,这是非常重要的,但t比率=-θ的1.941不是。因此,LR测试不会产生显著影响,Alan等人(2018)使用的基于模拟的方法也不会产生显著影响。然而,使用新的测试,我们得到了|t |(1)=1.941和|t |(2)=2.052,因此g(2.05)=1.9175,因此|t |(1)>g(|t |(2)),并且建议的测试发现调解效应在5%的水平上显著。如果需要更高的精度,例如:。

30
mingdashike22 在职认证  发表于 2022-4-26 15:23:55
g(2.052)=1.9195。暴露:完整1年2-3年4年^θ:0.199 0.256 0.109 0.064t比率:3.140 2.052 1.065 0.513^θ:-0.119-0.097-0.125-0.113t比率:-5.343-1.941-4.163-1.931^θ·^θ:-0.024-0.025-0.014-0.007表2:学生自身性别角色对进步或传统教师言语测试分数的影响。全样本结果与Alan等人(2018年)的表5(性别角色信念:女孩)和表6(小组B.语言测试分数:性别信念)的值相似,他们使用Imai等人(2010年)的方法,两者略有不同,但最后一行中的间接效应值在数字上是相同的,基于回归(1)和(2)用相同的控制进行扩展。6更高维度在下面的进一步实证说明中,中介可能通过涉及两个中介变量的渠道进行。这需要对新测试进行多变量扩展。第2节给出了必要的变量和分布理论,但另一个方面是不同维度的解之间的一致性。考虑K维中的零假设H:θ·θ·θK=0。如果已知θK6=0,则零假设减少到h:θ·θ·θK-1= 0. 这意味着K的临界区域- 1相应的统计数据应简化为K的解-1当|uK |较大时的尺寸。对于|TK |的大值(非常小的p值),基本上已知uKandθKare非零。拒绝的概率实际上只取决于K-1其他t值。在二维空间中,这意味着→ ∞ 边界函数g(t)→ 1.96,这是测试H的一维解:当α=5%时,θ=0。在三维中,这意味着解决方案必须简化为第4节推导的g-检验。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-5-4 15:09