楼主: kedemingshi
1937 51

[经济学] 未观察到混淆的核心方法:阴性对照、代理、, [推广有奖]

11
mingdashike22 在职认证  发表于 2022-4-26 14:29:37
重叠确保不存在混杂共变量层,因此治疗和阴性对照治疗的支持有限;对于任何地层,都可能出现任何治疗值或阴性对照治疗。阴性对照治疗条件规定,阴性对照治疗Z仅通过实际治疗D影响结果Y。这与仪器变量的排除限制相同[Angrist et al.,1996]。阴性对照结果条件规定,阴性对照结果W不受治疗D和阴性对照治疗Z的影响。这是一个更强的排除限制。总之,这些假设形式化了一种直觉,即消极控制可以检测到未观察到的混淆的存在。它们还暗示了YZ | D,U,X和WD,Z | U,X,这是图形分析的便利条件[Miao et a l.,2018]。图1:阴性对照DAG图1显示了一个代表性的DAG。尽管可以使用协变量X,但未观察到的混淆U与治疗D和结果Y之间的路径不一致。在DAG中,我们也看到了这个学习问题的近似解释。协变量X、负性控制治疗Z和负性控制结果W都是一组控制变量的不完全替代物,这些控制变量会阻碍未观察到的混淆。协变量X是诱导治疗和结果的指标;阴性对照治疗Z是一种仅诱导治疗的ProxyZ;而阴性对照结果是一种仅诱导结果的代用品。接下来,我将引用一个高级技术条件,稍后我将对RKHS设置进行验证。定义回归γ(d,x,z):=E[Y | d=d,x=x,z=z]。假设3.2(混淆桥)。假设1。存在性:算子方程γ(d,x,z)=E[h(d,x,W)| d=d,x=x,z=z]2存在一个解。

12
kedemingshi 在职认证  发表于 2022-4-26 14:29:43
完整性:对于任何函数f,E[f(U)| D=D,X=X,Z=Z]=0(d,x,z)<==> f(U)=0我称之为混杂桥,如下[Miao and Tchetgen,2018]。在这里,我们看到了与非参数工具变量回归问题(NPIV)的形式相似性[Newey and Powell,2003]。在NPIV语言中,LHSγ(d,x,z)是约化形式,而RHS是第一阶段线性紧算子的组合:h(·,·,·,·)7→ E[h(D,X,W)|D=·,X=·,Z=·]和第二阶段结构函数h。简而言之,γ=Eh。在泛函分析语言中,算子方程是第一类的Fredh-olm积分方程。求解HinVolves的算子方程,求出具有有限维域的线性紧致算子的逆;这是一个不恰当的问题。事实上,存在需要对条件期望算子的谱进行限制。完整性是NPIV文献中的技术条件。它本质上表明,模型中的观察变量相对于未观察到的混杂因素具有充分的可变性。这意味着解h的唯一性。我在附录A中的RKHSS设置中验证了存在性和完整性。为了处理θDS,我推广了迁移学习中的一个标准假设。假设3.3(分配转移)。假设1。人口分布P和P的差异仅在治疗、阴性对照治疗和协变量的边际分布上:~P(Y,W,D,X,Z)=P(Y,W | D,X,Z)~P(D,X,Z)2。~P(D,X,Z)相对于P(D,X,Z)是绝对连续的。命题3.1(混杂桥的不变性)。在假设3.2和3.3下,不同人群P和P之间的混淆桥是相同的。有关证据,请参见Ap pendix B。

13
nandehutu2022 在职认证  发表于 2022-4-26 14:29:50
似乎假设3.3和命题3.1是负控制和NPIV环境下分布转移的初始形式化。在总结中,我提出了三个假设:负控制的可用性(假设3.1);混淆桥的存在唯一性(假设3.2);以及用于转换学习的混杂桥的不变性(假设3.3)。形式上,使用假设来表达数据治疗效果的定理被称为识别结果。我在下面给出了主要识别结果,将[Miao等人,2018,Miao和Tchetgen,2018,Deaner,2018,Tchetge n等人,2020]的强大见解扩展到了e(d)θ以外的其他治疗效果。定理3.1(治疗效果的识别)。如果假设3.1和3。2.等一下。E(d)处的θ=Rh(d,x,w)P(x,w)2。如果另外假设3.3成立,那么θDS(d,P)=Rh(d,x,w)~P(x,w)3。T(d,d′)处的θ=Rh(d′,x,w)P(x,w|d)4。θcate(d,v)=Rh(d,v,x,w)P(x,w | v)参见附录B中的证明。在定理3.1中,我们看到阴性对照(Z,w)如何允许我们调整未观察到的混淆U,以恢复感兴趣的治疗效果。特别是,每个治疗效果都是对假设3.2中定义的关于某些分布Q的混杂桥hde的重新加权,ea c h治疗效应是同一个一般非参数学习问题的一个例子:Rh(d,x,w)Q.Q可能是一个无条件分布,如asP(x,w)和P(x,w)或一个条件分布,如P(x,w | d)和P(x,w | v)。3.3 RKHS背景直到现在,我只在假设3.1、3.2和3.3中正式提出了因果假设。

14
可人4 在职认证  发表于 2022-4-26 14:29:56
为了计算和分析的可处理性,我现在在学习p问题上添加了额外的结构:我假设关键量是再生核希尔伯特空间(RKHS)的元素。RKHS是机器学习中的一个规范设置,它推广了Sob-olev空间。对于广泛的统计受众,我整理了RKHS学习理论中的观点,这些观点支撑了下面的第4节和第5节。基本内核和特征映射符号用于推导第4节中的算法。考虑由f:A形式的函数组成的theRKHS H→ R.设A为波兰空间,即一个可分的、完全可度量的拓扑空间。我用k:A×A表示它的核→ R、 这是一个正定的、对称的、连续的函数。它的特征图是φ:A→ H、 a 7→ k(a,·)。我表示相应的核矩阵KAA∈ Rn×nwith(i,j)-ntry k(ai,aj)。我表示估值向量KAa∈ 第i个条目为k(ai,a)。第5节的统计保证要求RKHS H的谱视图。让我们注意从A映射到R的平方可积函数相对于测量值EP的空间。对于固定核k,定义卷积算子L:L→ 五十、 F7→Rk(a,·)f(a)P(a)。通过谱定理,我们可以用它的可数特征值{λj}和igenfunctions{~nj}:Lf=P来表示算子L∞j=1λjhf,аji·аj。在不丢失基因序列的情况下,{λj}是一个弱递增序列,{j}形成了L的正交基。通过这个谱符号,我们可以形式化RKHS H是L的光滑子集的sen。因为{j}形成了L的正交基,任何f,g∈ lca可以表示为f=P∞j=1aj~njand g=P∞j=1bj~nj.根据[Cucker and Smale,2002,定理4],正式登陆RKH,我应该写出(d,x,w)dQ(d,x,w)。为了避免差异d和治疗值d之间的混淆,我在[Singh等人,2020]之后省略了前者。

15
nandehutu2022 在职认证  发表于 2022-4-26 14:30:02
我还省略了Q的参数。H可以显式地表示为L=f=∞Xj=1aj~nj:∞Xj=1aj<∞, 基尔=∞Xj=1ajbjH=f=∞Xj=1aj~nj:∞Xj=1ajλj<∞, hf,giH=∞Xj=1ajbjλj RKHS H是lf的子集,对于序列{~nj}中的高阶项,其贡献较小。在RKHS中,高阶系数会受到惩罚,而特征值的大小对应于特征值的大小。最后,我阐明了本文的主要近似假设。正式地说,我假设无统计目标FSATIESF∈ Hc:=f=∞Xj=1aj~nj:∞Xj=1ajλcj<∞, C∈ (1,2)(1)对于c=1,我们看到H=H;我们只是假设fis正确地指定了RKHS的一个元素。对于c>1,我们假设fis位于RKHS的内部。这种假设被称为统计理论和计量经济学中的源条件[Smale和Zhou,2007,Caponetto和De Vito,2007,Carrasco等人,2007]。正如我们将看到的,c值越大,对应的目标越平滑,均匀速率越快。我允许c与c=2一样大,这是核岭估计可以适应的最高平滑度。在Sobolev spac e s的上下文中,抽象近似条件很容易定义。用H表示形式为f:A的函数的Sobolev空间→ 带着 参数s表示f的许多导数是平方可积的。Sobolev空间是一个RKHS当且在ly-ifs>p上[Berlinet and Thomas Agnan,2011,定理132]。它的内核被称为Matérn内核。假设我们用H=hs和s>pas-th-RKHS进行估计。如果真正的目标是f∈ Hsthenc=ss[Fischer and Steinwart,2017]。在(1)的符号中,Hs=[Hs]c。显然,c>1意味着目标FI位于Hs的内部。

16
kedemingshi 在职认证  发表于 2022-4-26 14:30:09
只要s>s>p.4算法,以c表示的速率与fand的平滑度相适应,且与维数无关。1 RKHS结构我提供了一种新的RKHS结构,用于阴性对照治疗效果评估,概括并统一了[Singh et al.,2019,Singh et al.,2020]中的结构。在我的构建中,我定义了治疗D、阴性对照(Z,W)和协变量(V,X)的标量值RKHSs。例如,对于治疗D,表示可测量的阳性限定核kD:D×D→ R对应于标量值RKHS hdh和特征映射φD:D→ 高清,D7→ kD(d,·)。为了简化符号,我将在提供参数时抑制下标,例如φ(d)=φd(d)。RKHS构造涉及标量RKHSs的张量积。回想一下张量积符号:[a] b] c=ahb,ci。为了解释清楚,我首先把重点放在没有V的情况下,即排除θcate.I假设约化形式γ是RKHS的一个元素,其张量特性图φ(d,x,z):=φ(d) φ(x) φ(z),即γ∈ HRF:=HD HX 赫兹。我假设这是RKHS的一个元素,其张量积特征映射φ(d,x,w):=φ(d)φ(x) φ(w),即h∈ H:=HD HX 嗯。张量积RKHSs对应于积核。与HD、HX、HZ和HW相对应的正定义内核产品定义了与Hrfand H相对应的新正定义内核。产品结构将在统一分析中发挥关键作用。根据复制性质,h(d,x,w)=hh,φ(d) φ(x) φ(w)iH=hh,φ(d,x,w)iH。同样地,对于θCAT EI,假设h∈ H:=HD 高压 HX 嗯。我在RKHS结构上设置了弱调节条件,以便以更易于处理的形式表示定义3.1中定义并在OREM 3.1中确定的因果量。对于θcate,我将所述假设从X扩展到(V,X)。假设4.1(RKHS正则条件)。假设1。

17
kedemingshi 在职认证  发表于 2022-4-26 14:30:16
kD、kX、kW和kZare连续且有界:supd∈Dkφ(d)kHD≤ κd,supx∈Xkφ(x)kHX≤ κx,supw∈Wkφ(w)kHW≤ κw,supz∈Zkφ(z)kHZ≤ κz2。φ(d)、φ(x)、φ(w)和φ(z)是可测量的。Kx和kWare特征连续性、有界性和可测性是常用核满足的弱条件。我在下面解释特征属性的作用。定理4.1(通过核均值嵌入表示)。假设定理3.1的条件成立。假设假设假设4.1成立,γ∈ HRF和h∈ H.那么γ(d,x,z)=hh,φ(d)φ(x) 其中uw(d,x,z):=zφ(w)P(w | d,x,z)大于1。E(d)处的θ=hh,φ(d) uih其中u:=R[φ(x)φ(w)]P(x,w)2。θDS(d,~P)=hh,φ(d)式中,ν:=R[φ(x)φ(w)~P(x,w)3。T(d,d′)处的θ=hh,φ(d′)u(d)ih其中u(d):=R[φ(x)φ(w)]P(x,w | d)4。θcate(d,v)=hh,φ(d) φ(v) u(v)ih其中u(v):=R[φ(x)φ(w)]P(x,w | v)我在附录C中给出了证明。虽然定理3.1中的表达式是对混杂brid ge h的重新加权,但定理4.1中的表达式是h的内积。数量uw(d,x,z)编码了第一阶段的条件期望。数量u、ν、u(d)、u(v)嵌入了各种重新称重分布。一般来说,量子化r[φ(x) φ(w)]Q将分布Q编码为HX中的函数嗯。特征属性[Sriperumbudur e t al.,2010]确保映射Q 7→R[φ(x)φ(w)]Q是内射的,因此重加权分布Q的RKHS表示是唯一的。这些表示立即意味着估计量。混淆桥可以通过φ(D)上结果Y的核岭回归来估计φ(X) ^uw(D,X,Z)。治疗效果如下。例如,对于E(d)处的θ,估计量是E(d)处的^θ=h^h,φ(d) ^uiH,其中^h是共信息桥函数的正则核估计量,而^u是平均值。

18
kedemingshi 在职认证  发表于 2022-4-26 14:30:22
一般来说,如果Q是一个无条件分布,那么我用一个平均值来估计它的平均嵌入。如果Q是一个条件分布,那么我用核岭回归估计它的平均emb edding。4.2闭式formI通过核工具变量回归给出了混杂桥估计量的闭式解。具体而言,我将[Singh等人,2019年,算法1]推广到我的扩展RKHSC构造。设n为(di,xi,wi,zi)的观测数,用于通过带正则化参数λ的核回归估计第1阶段条件平均嵌入uw(d,x,z)。设n也是(yi,di,xi,zi)的观测数,用于用正则化参数ξ估计第2阶段混合桥hby核岭回归。允许⊙ 我是元素乘法。为了简单起见,我陈述了重用样本的算法的封闭形式解决方案。我证明了这个简单算法及其在不同阶段使用不同样本的推广的一致性保证。详见附录D。算法4.1(混杂桥的估计)。SetA=KDD⊙ KXX⊙ 千瓦瓦∈ Rn×nB=KDD⊙ KXX⊙ KZZ∈ Rn×nM=KDD⊙ KXX⊙ [KW W(B+nλI)-1B]∈ Rn×n^α=(毫米)+ nξA)-1车型年款∈ Rn^h(d,x,w)=α[KDd⊙ KXx⊙ 千瓦[瓦]∈ Rwhere(λ,ξ)是岭惩罚超参数。有关推导,请参见附录C。接下来,我给出了关于温度效应的闭式解。鉴于[Singh等人,2020年,算法3.1]在观察值选择不足的假设下估计治疗效果,本文提出的算法在阴性对照假设下估计治疗效果。对于θDS,设n为从总体P.算法4.2(治疗效果估计)得出的(~xi,~wi)观察数。

19
nandehutu2022 在职认证  发表于 2022-4-26 14:30:28
治疗效果估计器具有封闭式解1。E(d)处的θ=nPni=1α[KDd⊙ KXxi⊙ KW wi]2。θDS(d,~P)=~nP ~ni=1^α[KDd⊙ KX~xi⊙ 千瓦/千瓦]3。T(d,d′)处的θ=α[KDd\'\'⊙ {[KXX⊙ 千瓦(KDD+nλI)-1KD}]4。θcate(d,v)=α[KDd⊙ 千伏⊙ {[KXX⊙ 千瓦(千伏+nλI)-其中(λ,λ)是岭回归惩罚超参数。在θcate(d,v)中,α是包含v的混杂桥的系数。有关推导,请参见附录C。我给出了下面第5节中平衡偏差和方差的正则化参数的理论值。特别是,我在定理5.1中指定了(λ,ξ),在定理5.2中指定了(λ,λ)。我在附录F中提出了一个实用的调整程序,基于遗漏交叉验证,以经验平衡偏差和方差。5一致性为了确定第3节中的学习问题,我提出了三个假设:阴性对照的可用性(假设3.1);混杂桥的存在性和唯一性(假设3.2);迁移学习的混杂桥的变化(假设3.3)。为了构造第4节中的算法,我假设了RKHS正则性(假设4.1)。为了保证本节中的一致性,我提出了三个最终假设:原始空间规则性(假设5.1);条件期望算子的光滑性(假设5.2);以及混淆桥的平滑度(假设5.3)。首先证明混杂桥的一致性,然后证明治疗效果的一致性。如前所述,对于θ类EI,将所述假设从X扩展到(V,X)。5.1混淆桥接I需要在结果Y、处理D、协变量(V,X)和负对照(W,Z)的原始空间上具有弱正则性条件。假设5.1(原始空间规则性条件)。假设1。Y是有界的,即存在C<∞ 这样| Y |≤ 几乎可以肯定。

20
能者818 在职认证  发表于 2022-4-26 14:30:35
D、 X、W和Z是波兰空格原始草稿错误地引用了M=[KDD⊙ KXX⊙ 千瓦瓦(B+nλI)-1B。为了简化符号和分析,我要求结果为Y∈ R是有界标量。更一般地说,Y可以是一个可分的Hilbert空间。我对治疗、协变量和阴性对照具有普遍性。波兰空间是一个可分离且完全可度量的拓扑空间。波兰spa ce中支持的随机变量可能是离散的或连续的,也可能是低维、高维或有限维的。因此,我允许治疗、协变量和阴性对照,甚至可以是文本、图形或图像。接下来,我为第一阶段的条件平均嵌入uw(d,x,z)设置(1)意义上的平滑条件。为了便于以后的分析,我抽象地阐述了这个假设。考虑嵌入ua(b)的横向条件平均值:=Rφ(a)P(a | b),当a∈ AJ和b∈ 北京。结果表明,条件表达式运算符Ej:HAj→ HBj,f(·)7→ E[f(Aj)|Bj=·]编码与ua(b)相同的信息。具体来说,ua(b)=Zφ(a)P(a | b)=EAj | Bj=b[φ(Aj)]=E*j[φ(b)],a∈ Aj,b∈ Bje在哪里*jis是Ej的伴随词。我表示Hilbert-Sch-midt算子在Hajandhby L(HAj,HBj)之间的空间,它本身就是一个nRkhs。要使假设具体化,只需指定aj和Bj。例如,对于uw(d,x,z),A=w,d B=d×x×z。我明确地专门化了附录d和E中的假设。假设5.2(条件期望的平滑度)。假设Ej∈[L(朝圣,HBj)]接下来,我假设这座桥是平稳的。为此,可以方便地通过操作员H:H对混淆b脊进行参数化→ 定义为h(d,x,w)=hh,φ(d,x,w)iH=hφ(d,x,w)。操作员将其模拟为线性函数中的系数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 11:58