楼主: kedemingshi
1937 51

[经济学] 未观察到混淆的核心方法:阴性对照、代理、, [推广有奖]

41
何人来此 在职认证  发表于 2022-4-26 14:32:48
这是技术要求最高的附录。D.1概率引理位置D.1(引理[Smale and Zhou,2007])。设ξ是实可分希尔伯特空间K中取值的随机变量~M s.t.kξkK≤~M<∞ a、 s.σ(ξ):=EkξkkN∈ Nη ∈ (0,1),PnnXi=1ξi- EξK≤~M ln(2/η)n+r2σ(ξ)ln(2/η)n≥ 1.- ηD.2平滑度假设去掉符号o 平均成分。我用它来强调操作符的组成。假设D.1(条件表达式的平滑度)。假设1。条件期望算子被很好地定义为RKHSs之间的Hilbert-Schmidt算子,即∈ L(HW,HRF),其中E:HW→ HRF,h(·,·,·)7→ E[h(W)|D=·X=·Z=·2。条件期望算子是L(HW,HRF)的一个特别光滑的形式。形式上,定义协方差算子T:=e[φ(d,X,Z) φ(D,X,Z)]forL(HW,HRF)。我猜G∈ L(HW,HRF)s.t.E=(t)c-1.o G、 c∈ (1、2)和kGkL(HW、HRF)≤ ζ假设D.2(基础桥梁的平滑度)。假设1。令人困惑的桥梁运营商,他是一名专业的桥梁运营商,即H∈ HOhm2.c onfounding bridge操作符是H的一个特别平滑的元素Ohm. 形式上,定义协变量运算符T:=E[Ohm(·,u(D,X,Z)) Ohm对于H,(·,u(D,X,Z))]Ohm. 我猜G∈ HOhms、 t.H=Tc-1.o G、 c∈ (1,2)和kGkHOhm≤ ζ命题D.2。以下假设是等效的。假设5.2(A=W,B=D×X×Z)等同于假设D.12。假设5.3相当于假设D.2。直接引自[Caponnetto and De Vito,2007年,备注2]。扩展表达式更便于分析。D.3操作员注释定义D.1(点评估器)。确定运营商Ohmu(d,x,z):Y→ HOhm, y 7→ Ohm(·,u(d,x,z))进一步定义u(d,x,z):=Ohmu(d,x,z)o Ohm*u(d,x,z)Ohmu(d,x,z)在RKHS文献中被称为点评估器。在MY设置中,y R和Ohm*u(d,x,z)H=Hu(d,x,z)。提案D.3。

42
能者818 在职认证  发表于 2022-4-26 14:32:54
假设假设假设3.2和4.1成立。然后γ(d,x,z)=Hu(d,x,z)证明。根据算符方程,γ(d,x,z)=Zh(d,x,w)P(d,x,w | d,x,z)=Zhφ(d,x,w | d,x,z)=HZφ(d,x,w)P(d,x,w | d,x,z)=Hu(d,x,w)。提案D.4。假设假设假设3.2、4.1和5.1成立。ThenE[Ohmu(D,X,Z)Y]=T高屋顶。不管怎样∈ HOhm,嗨,嗨Ohm=H、 ZTu(d,x,z)P(d,x,z)HHOhm=H、 ZOhmu(d,x,z)Ohm*u(d,x,z)P(d,x,z)HHOhm=ZDH,Ohmu(d,x,z)Ohm*u(d,x,z)嘿OhmP(d,x,z)=ZDOhm*u(d,x,z)H,Ohm*u(d,x,z)HEYP(d,x,z)=ZhHu(d,x,z),Hu(d,x,z)iY=E[Hu(d,x,z)Hu(d,x,z)]此外,对于任何H∈ HOhmE[Hu(D,X,Z)Y]=ZHu(D,X,Z)yP(D,X,Z,Y)=ZHOhm*u(d,x,z)H,yiYP(d,x,z,y)=ZhH,Ohmu(d,x,z)yiYP(d,x,z,y)=H、 ZOhmu(d,x,z)yP(d,x,z,y)Y=H、 E[Ohmu(D,X,Z)Y]尹总结,对于任何H∈ HOhm,嗨,嗨Ohm= E[Hu(D,X,Z)Hu(D,X,Z)]=E[Hu(D,X,Z)γ(D,X,Z)]=E[Hu(D,X,Z)Y]=H、 E[Ohmu(D,X,Z)Y]对D.3提案大喊大叫并撒谎。D.4为了便于分析,确定以下数量。设n为(di,xi,wi,zi)的观测数,用于估计阶段e1条件平均嵌入u(d,x,z)=φ(d)φ(x)通过调节参数λ的核岭回归得到uw(d,x,z)。设m为(˙yi,˙di,˙xi,˙zi)的o观测数,用于估计具有正则化参数ξ的第2阶段混杂桥算子Hby kernelridge回归。定义D.2(混淆桥梁风险)。定义1。目标布里奇∈ 阿明∈HOhmE(H),E(H)=E(Y,Z)kY- Hu(D,X,Z)kY2。正则化桥ξ=argminH∈HOhmEξ(H),Eξ(H)=E(H)+ξkHkHOhm3.经验正则化bridgeHmξ=argminH∈HOhmEmξ(H),Emξ(H)=mmXi=1k˙yi- Hu(˙di,˙xi,˙zi)kY+ξkHkHOhm4.估计桥梁^Hmξ=argminH∈HOhm^Emξ(H),^Emξ(H)=mmXi=1k˙yi- Hunλ(˙di,˙xi,˙zi)kY+ξkHkHOhm其中unλ(d,x,z)是条件平均嵌入u(d,x,z)命题d.5的估计量。假设假设假设3.2和4.1成立。塞内克(H)- H) u(D,X,Z)kY=E(H)- E(H)证明。

43
何人来此 在职认证  发表于 2022-4-26 14:33:02
与[Sin gh等人,2019年,提案25]相同,对提案D.3提出上诉。提案D.6。假设命题D.5的条件成立。然后hξ=argminH∈HOhmEk(H)- H) u(D,X,Z)kHOhm+ ξkHkHOhm证据命题D.5的推论。提案D.7(封闭形式)。ξ>0时,解Hmξ到Emξ和解^Hmξ到^Emξ是唯一的,且Hmξ=(T+ξ)-1g,T=mmXi=1Tu(˙di,˙xi,˙zi),g=mmXi=1Ohmu(˙di,˙xi,˙zi)˙yi^Hmξ=(^T+ξ)-1^g,^T=mmXi=1Tunλ(˙di,˙xi,˙zi),^g=mmXi=1Ohmunλ(˙di,˙xi,˙zi)˙yiProof。直接从[Singh等人,2019年,第3期]开始。命题D.8(抽样误差)。假设假设假设3.2、4.1、5.1和5.3成立。然后η ∈(0,1),以下是w.p.1-η:kHmξ- HξkHOhm≤4κ(C+κkHkH)Ohm) ln(2/δ)√mξ,其中κ:=κdκxκwProof。我推广了[Smale和Zhou,2007,定理1]。我循序渐进。1.分解。Hmξ- Hξ=T+ξI-1.G-THξ- ξHξ=T+ξI-1.mmXi=1˙ξi- E˙ξ式中˙ξi=Ohmu(˙di,˙xi,˙zi)˙yi- Tu(˙di,˙xi,˙zi)Hξ=Ohmu(˙di,˙xi,˙zi)[˙yi]- Ohm*u(˙di,˙xi,˙zi)Hξ]观察到T+ξI-1.∈ L(H)Ohm),nnXi=1˙ξi- E˙ξ∈ HOhm其中L(H)Ohm) 是H的边界算子的空间Ohm到HOhm. 因此khmξ- HξkHOhm≤ξ˙,˙ =mmXi=1˙ξi- E˙ξHOhm2.时刻。k˙ξikHOhm≤ κC+κkHξkHOhmσ(˙ξi)=Ek˙ξikHOhm≤ κEkY- Ohm*u(D,X,Z)HξkY=κEkY- Hξu(D,X,Z)kY=κE(Hξ),通过H=0Ek(Hξ)的比例D.6- H) u(D,X,Z)kHOhm+ ξkHξkHOhm≤ EkHu(D,X,Z)kY≤ kHkHOhmEku(D,X,Z)kH≤ κkHkHOhm亨切克(Hξ)- H) u(D,X,Z)kHOhm≤ κkHkHOhmkHξkHOhm≤κkHkHOhm√ξ此外,定义为具有最小值E,E(H)≤ E(0)=Ek Y kY≤ 命题D.5E(Hξ)=E(H)+Ek(Hξ)的Cso- H) u(D,X,Z)kHOhm≤ C+κkHkHOhm总之,k˙ξikHOhm≤ κC+κkHkHOhm√ξ=κ(C+κkHkH)Ohm/pξ)σ(˙ξi)≤ κ(C+κkHkH)Ohm)3.专注。然后应用引理D.1。

44
能者818 在职认证  发表于 2022-4-26 14:33:08
概率为1- δ, ≤ κ(C+κkHkH)Ohm/pξ)2ln(2/δ)m+rκ(C+κkHkH)Ohm)2 ln(2/δ)mt这里有两种情况,我分析如下[Singh et al.,2 019,定理6]。(a) κ√mξ≤4ln(2/δ)。因为a+b≤ (a+b)对于a,b≥ 0, <2κC ln(2/δ)m+2κkHkHOhmln(2/δ)m√ξ+κ(C+κkHkH)Ohm)r2ln(2/δ)m=2κC ln(2/δ)m+2κkHkHOhmln(2/δ)√mκ√mξ+κ(C+κkHkH)Ohm) ln(2/δ)√msln(2/δ)≤2κC ln(2/δ)√m+2κkHkHOhmln(2/δ)√m+2κ(C+κkHkH)Ohm) ln(2/δ)√m=4κ(C+κkHkH)Ohm) ln(2/δ)√mThen recallkHmξ- HξkHOhm≤ξ(b) κ√mξ>4ln(2/δ)。通过定义HmξEmξ(Hmξ),观察到≤ Emξ(0)=mmXi=1k˙yikY≤ CHencekHmξkHOhm≤C√ξ和khmξ- HξkHOhm≤C√ξ+κkHkHOhm√ξ=C+κkHkHOhm√ξ最后观察到4ln(2/δ)<κ√mξ<==>C+κkHkHOhm√ξ<4κ(C+κkHkH)Ohm) ln(2/δ)√mξ命题D.9(近似误差)。假设假设假设3.2、4.1、5.1和5.3成立。ThenkHξ- HkHOhm≤ ξc-1pζ证明。我推广了[Smale和Zhou,2005,定理4]。根据假设D.2,存在一个G∈HOhms、 t.G=T1-cH=Xkλ1-凯凯克,你好Ohm根据D.4,写出ξ- H=[(T+ξI)-1T- 一] H=Xkλkλk+ξ- 1.艾克,你好Ohm因此,khξ- HkHOhm=Xkλkλk+ξ- 1.嗨,嗨Ohm=Xkξλk+ξ嗨,嗨Ohm=Xkξλk+ξ嗨,嗨Ohmξξ·λkλk·λk+ξλk+ξC-1=ξc-1Xkλ1-切克,嗨Ohmξλk+ξ3.-Cλkλk+ξC-1.≤ ξc-1Xkλ1-切克,嗨Ohm= ξc-1千克小时Ohm≤ ξc-1ζD.5边界建议D.10。假设假设4.1成立。假设kunλ(d,x,z)- u(d,x,z)kH≤ru(n,δ,c)1。然后kT-^TkL(H)Ohm)≤ 2κ·ru(n,δ,c)2。如果另外假设5.1成立,则k^g-gkHOhm≤ Cru(n,δ,c)证明。直接从[Singh等人,2019年,提案37]和提案5.1开始。D.11提案。假设假设4.1成立。如果kunλ(d,x,z)- u(d,x,z)kH≤ ru(n,δ,c)thenk(^T+ξ)-1.- (T+ξ)-1千克(小时)Ohm)≤2κ·ru(n,δ,c)ξ证明。自从-1.- B-1=B-1(B)-A) A-1,(^T+ξ)-1.- (T+ξ)-1=(T+ξ)-1(T)-^T)(^T+ξ)-1此处(^T+ξ)-1.- (T+ξ)-1千克(小时)Ohm)≤ξkT-^TkL(H)Ohm)≤2κ·ru(n,δ,c)ξ,其中e中的最终质量符合命题D.10命题D.12。假设假设假设4.1和5.1成立。

45
mingdashike22 在职认证  发表于 2022-4-26 14:33:14
森克赫Ohm≤ κCProof。克格赫Ohm=mmXi=1Ohmu(˙di,˙xi,˙zi)˙yiHOhm≤mmXi=1Ohmu(˙di,˙xi,˙zi)˙yiHOhm≤mmXi=1Ohmu(˙di,˙xi,˙zi)L(Y,H)Ohm)k˙yikY≤ κCby三角不等式与算子范数的定义。注意L(Y,HOhm) 是从Y到H的边界算子的空间Ohm.D.6主要结果OREM D.1(收集结果)。支持假设3.2、4.1、5.1和5.3。Suμnλ(d,x,z)- u(d,x,z)kH≤ ru(n,δ,c)w.p.1- δ. 然后δ ∈ (0,1)和η ∈ (0,1),以下为w.p.1- η - δ:k^Hmξ- HkHOhm≤ rH(n,δ,c;m,η,c):=ξCru(n,δ,c)+2κCru(n,δ,c)ξ+4κ(c+κkHkH)Ohm) ln(2/δ)√mξ+ξc-1pζ证明。我从命题D.7的分解开始。^Hmξ-H=H(^T+ξ)-1^g- (^T+ξ)-1gi+h(^T+ξ)-1克- (T+ξ)-1gi+(T+ξ)-1克-H以第一学期为例。k(^T+ξ)-1(^g)- g) kHOhm≤ξk^g-gkHOhm≤ξCru(n,δ,c)由命题D.10得出。以第二学期为例。h(^T+ξ)-1.- (T+ξ)-1igHOhm≤ k(^T+ξ)-1.-(T+ξ)-1千克(小时)Ohm)克格赫Ohm≤2κCru(n,δ,c)ξw.p.1- δ由命题D.11和D.12得出。以第三个术语为例。Hmξ- HHOhm≤Hmξ- HξHOhm+ kHξ- HkHOhm≤4κ(C+κkHkH)Ohm) ln(2/δ)√mξ+ξc-1pζw.p.1- η、 求助于三角不等式和命题D.8和D.9。推论D.1(桥接器到桥接器)。假设假设假设3.2、4.1、5.1和5.3成立。S上kunλ(d,x,z)- u(d,x,z)kH≤ ru(n,δ,c)w.p.1- δ. 然后δ ∈ (0,1)和η ∈ (0,1),以下为w.p.1- η - δ:k^h-hkH≤ rH(n,δ,c;m,η,c)证明。回想h(d,x,w)=hφ(d,x,w)。H和HOhm是等轴对称的。定理D.2(条件嵌入)。假设4.1、5.1和D.1成立。设置λ=n-c+1。然后是w.p.1-δ, D∈ D、 x∈ 十、 z∈ Zk^u(d,x,z)-u(d,x,z)kH≤ ru(n,δ,c),其中ru(n,δ,c):=κdκx·κRF·√ζ(c+1)c+14κRF(κw+κRFkEkL)ln(2/δ)√nζ(c)- 1)C-1c+1和κRF:=κdκxκzProof。

46
何人来此 在职认证  发表于 2022-4-26 14:33:20
写^u(d,x,z)-u(d,x,z)=[φ(d)φ(x) ^uw(d,x,z)]- [φ(d) φ(x) uw(d,x,z)]=[φ(d)φ(x)[w(d,x,z)- uw(d,x,z)],因此k^u(d,x,z)- u(d,x,z)kH≤ κdκx·k^uw(d,x,z)-uw(d,x,z)khw最终因子上的界限来自[Singh等人,2019年,推论1],观察到e:HW→ HRF,kφ(w)kH≤ κw,kφ(d,x,z)kHRF≤ κrf定理5.1的证明。求和定理D.1中的界asrH=Orμξ+rμξ+√mξ+ξc-1.= Orμξ+√mξ+ξc-1.总结定理D.2 asru=O中的界限N-C-1c+1= O(m)-a) n=ma(c+1)(c-1) 综合结果,rH=O马ξ+√mξ+ξc-1., s、 t.ξ≥ ru,mξ≥ (n,m)比值的选择与[Singh等人,2019年,定理4]的参数相同。我可以选择ξ作为m的函数来实现m的单级速率-C-1c+1。我选择ξ来匹配偏差ξc-1.使用变量maξ+√mξ。我将偏差设置为方差中的每个项。1.ξc-1=maξ。重新排列,ξ=m-ac+3。偏置项变成ξc-1=M-ac+3C-1剩余期限为√mξ=mac+3√m=m2a-(c+3)2(c+3)注意,当且仅当-ac+3c-1.≥2a-(c+3)2(c+3)<==> A.≤c+3c+12。ξc-1=√mξ。重新排列,ξ=m-c+1。偏置项变成ξc-1=M-c+1C-剩下的项变成mξ=m-A.M-c+1-2=m4-a(c+1)2(c+1)注意到前者支配后者当且仅当-c+1c-1.≥4.-a(c+1)2(c+1)<==> A.≥c+3c+1E治疗效果一致性证明在本附录中,I(I)明确规定平滑度假设,(ii)提供无条件平均嵌入率,(iv)提供条件平均嵌入率,以及(iv)证明阴性对照治疗效果的一致性。E.1平滑度假设消耗E.1(T处θ的平滑度)。假设1。条件期望算子被很好地定义为RKHSs之间的Hilbert-Schmidt算子,即∈ L(HX) HW,HD),其中E:HX HW→ HD,f(·,·)7→ E[f(X,W)|D=·2。

47
何人来此 在职认证  发表于 2022-4-26 14:33:26
条件期望算子是L(HX)的一个特别光滑的元素HW,HD)。形式上,定义协方差算子T:=E[φ(D) φ(D)]forL(HX HW,HD)。我猜G∈ L(HX) HW,HD)s.t.E=(t)c-1.o G、 c类∈ (1,2)和kGkL(HXHW,HD)≤ ζ假设E.2(θ类E的平滑度)。假设1。条件期望算子被很好地定义为RKHSs之间的Hilbert-Schmidt算子,即∈ L(HX) HW,HV),其中e:HX HW→ 高压,f(·,·)7→ E[f(X,W)|V=·2。条件期望算子是L(HX)的一个特别光滑的元素HW,HV)。形式上,定义协方差算子T:=E[φ(V) φ(V)]forL(HX HW,HV)。我猜G∈ L(HX) HW,HV)s.t.E=(t)c-1.o G、 c∈ (1,2)和kGkL(HX高、高)≤ ζ命题E.1。以下假设为等式1。假设5.2,A=X×W A和B=D相当于假设E.12。假设5.2 A=X×W A和B=V相当于假设E.2。直接引自[Caponnetto and De Vito,2007年,备注2]。扩展表达式更便于分析。E.2无条件平均嵌入定理E.1(无条件平均嵌入)。假设假设假设4.1和5.1成立。然后是w.p.1-δ、 k^u-ukHXHW≤ ru(n,δ):=4κxκwln(2/δ)√nLikewise,w.p.1- δk^ν-νkHXHW≤ rν(~n,δ):=4κxκwln(2/δ)√~nProof。通过命题D.1,其中ξi=φ(xi) φ(wi),自nnXi=1[φ(xi)φ(wi)]- E[φ(X) φ(W)]HXHW≤2κxκwln(2/δ)n+r2κxκwln(2/δ)n≤4κxκwln(2/δ)√使用ξi=φ(~xi),ν的参数是相同的φ(~wi)E.3条件平均嵌入定理E.2(条件平均嵌入率)。假设假设假设4.1和5.1成立。S et(λ,λ)=(n-c+1,n-c+1)。如果附加假设E.1成立,则w.p.1成立- δ, D∈ Dk^u(d)-u(d)kHXHW≤ 大鼠Tu(n,δ,c),其中大鼠Tu(n,δ,c):=κd·√ζ(c+1)c+14κd(κxκw+κdkEkL)ln(2/δ)√nζ(c)- 1)C-1c+12。如果另外假设E.2成立,则w.p。

48
何人来此 在职认证  发表于 2022-4-26 14:33:34
1.- δ, 五、∈ Vk^u(v)- u(v)kHXHW≤ rCAT Eu(n,δ,c),其中rCAT Eu(n,δ,c):=κv·√ζ(c+1)c+14κv(κxκw+κvkEkL)ln(2/δ)√nζ(c)- 1)C-1c+1屋顶。直接从[Singh等人,2019年,推论1]开始,观察到E:HX HW→ HD,kφ(x)φ(w)kHXHW≤ κxκw,kφ(d)kHD≤ κ-dandE:HX HW→ HV,kφ(x)φ(w)kHXHW≤ κxκw,kφ(v)kHV≤ κvE。4主要结果建议E.2。总之,n=mk^h- hkH=OpN-C-1c+1c-1c+3k^u-ukHXHW=OpN-k^ν-νkHXHW=Op~n-k^u(d)-u(d)kHXHW=OpN-C-1c+1k^u(v)- u(v)kHXHW=OpN-C-1c+1定理5.2的证明。我在[Singh等人,2020年,定理3.3]中概括了这个论点。我写下最后的样本绑定s.1。θ在E^θ在E(d)-E(d)处的θ=h^h,φ(d) ^uiH- hh,φ(d)uiH=h^h,φ(d) [^u -u]iH+h[^h-h] ,φ(d)uiH=h[^h-h] ,φ(d)[^u -u]iH+hh,φ(d) [^u -u]iH+h[^h-h] ,φ(d)uIHW.p.1-2δ -E(d)处的η|^θ-E(d)处的θ|≤ k^h-hkHkφ(d)kHDk^u-ukHXHW+khkφ(d)kHDk^u-ukHXHW+k^h-hkHkφ(d)kHDkukHXHW≤ κd·rH(n,δ,c;m,η,c)·ru(n,δ)+κd·khkH·ru(n,δ)+κdκxκw·rH(n,δ,c;m,η,c)=ON-C-1c+1c-1c+32.θDS。用和θ在E,w.p.1相同的参数-2δ -η|θDS(d,~P)-θDS(d,~P)|≤ κd·rH(n,δ,c;m,η,c)·rν(~n,δ)+κd·khkH·rν(~n,δ)+κdκxκw·rH(n,δ,c;m,η,c)=ON-C-1c+1c-1c+3+~n-3.T^θT(d,d′)-T(d,d′)处的θ=h^h,φ(d′) ^u(d)iH- hh,φ(d′) u(d)iH=h^h,φ(d′)[^u(d)- u(d)]iH+h[^h-h] ,φ(d′) u(d)iH=h[^h-h] ,φ(d′)[^u(d)- u(d)]iH+hh,φ(d′) [^u(d)- u(d)]iH+h[^h-h] ,φ(d′)u(d)IHW.p.1-2δ -η|^θ在T(d,d′)- T(d,d′)处的θ|≤ k^h- hkHkφ(d′)kHDk^u(d)-u(d)kHXHW+khkφ(d′)kHDk^u(d)-u(d)kHXHW+k^h-hkHkφ(d′)kHDku(d)kHXHW≤ κd·rH(n,δ,c;m,η,c)·大鼠Tu(n,δ,c)+κd·khkH·大鼠Tu(n,δ,c)+κdκxκw·rH(n,δ,c;m,η,c)=ON-C-1c+1c-1c+3+n-C-1c+14.

49
nandehutu2022 在职认证  发表于 2022-4-26 14:33:40
θCAT E^θCAT E(d,v)- θCAT E(d,v)=h^h,φ(d) φ(v) ^u(v)iH- hh,φ(d)φ(v) u(v)iH=h^h,φ(d) φ(v) [^u(v)- u(v)]iH+h[^h-h] ,φ(d)φ(v) u(v)iH=h[^h-h] ,φ(d) φ(v) [^u(v)- u(v)]iH+hh,φ(d)φ(v) [^u(v)- u(v)]iH+h[^h-h] ,φ(d) φ(v) u(v)IHW.p.1-2δ -η|^θE类(d,v)- θE类(d,v)|≤ k^h-hkHkφ(d)kHDkφ(v)kHVk^u(v)- u(v)kHXHW+khkHkφ(d)kHDkφ(v)kHVk^u(v)- u(v)kHXHW+k^h- hkHkφ(d)kHDkφ(v)kHVku(v)kHXHW≤ κdκv·rH(n,δ,c;m,η,c)·rCAT Eu(n,δ,c)+κdκv·khkH·rCAT Eu(n,δ,c)+κdκvκxκw·rH(n,δ,c;m,η,c)=ON-C-1c+1c-1c+3+n-C-1c+1调音。1简化设置我提出的剂量反应和异质治疗效应估计器由核岭回归组成。因此,新估计量的超参数与核岭回归估计量相同。现在,我为(I)岭回归惩罚和(ii)内核本身的超参数提供了实用的调整程序。本附录是对[Singh等人,2020年,附录F]的详细阐述。F.2 Ridge penaltyIt通过漏掉一个交叉验证(LOOCV)来调整λ是很方便的,因为验证损失已经形成了一个解决方案。我引用了内核岭回归的一个调优过程。为了简单起见,我将重点放在Y对W的回归上。算法F.1(Singh等人,2020年的算法F.1)。构造矩阵shλ:=I- KW W(KW W+nλI)-1.∈ Rn×n,~Hλ:=diag(Hλ)∈ Rn×nwhereHλ与Hλ具有相同的对角线项,非对角线项为0。然后设置λ*= argminλ∈∧nkH-1λHλyk,λ R同样的原则也适用于条件均值的调整,这可以被视为向量值回归。此外,在一个由两个核岭回归组成的变量回归中,核函数的调整也遵循同样的原则。

50
何人来此 在职认证  发表于 2022-4-26 14:33:47
将这些调整过程扩展到核心工具变量回归是一项创新,它不同于[Singh等人,2019年,附录A.5.2]中的调整过程。为了简化讨论,我重点讨论了φ(Y)在W上的条件平均嵌入。回想一下,使用所有观测值的条件均值嵌入估计量的闭式解是^u(w)=K·Y(KW w+nλI)-1KW wAlgorithm F.2(调谐条件平均嵌入)。构造矩阵r:=KW W(KW W+nλI)-1.∈ Rn×nS∈ Rn×ns。t、 Sij=1{i=j}1.-瑞伊T:=S(KY-Y)- 2岁+ RKY YR) ∈ Rn×nR是R的第i个对角元素,然后设置λ*= argminλ∈∧ntr(T),∧ 竞争。我证明ntr(T)是LOOCV损失。根据定义,LOOCV损耗isE(λ):=nnXi=1kφ(yi)- ^u-i(wi)kHYwhere^u-iis使用除第i个观测值以外的所有观测值的条件平均嵌入估计值。非正式地,设Φ为r{wi}特征的矩阵,第i行φ(wi), 让Q:=ΦΦ+nλ。设ψ为{yi}的特征矩阵,第i行φ(yi). 通过回归一阶条件^u(w)= φ(w)Q-1ΦΨ^u-i(w)= φ(w){Q-φ(wi)φ(wi)}-1{ΦΨ -φ(wi)φ(yi)}Sherma n-Morrison秩一更新公式给出{Q- φ(wi)φ(wi)}-1=Q-1+Q-1φ(wi)φ(wi)Q-11-φ(wi)Q-1φ(wi)设βi:=φ(wi)Q-1φ(wi)。那么^-i(w)= φ(wi)Q-1+Q-1φ(wi)φ(wi)Q-11-βi{ΦΨ -φ(wi)φ(yi)}= φ(wi)I+Q-1φ(wi)φ(wi)1.-βi{^u- Q-1φ(wi)φ(yi)}=1+βi1- βiφ(wi){^u- Q-1φ(wi)φ(yi)}=1+βi1- βi{^u(wi)- βiφ(yi)}=1.-βi{^u(wi)- βiφ(yi)}i、 e.^u-ican可以用^u表示。注意φ(yi)- ^u-i(wi)=φ(yi)-1.-βi{^u(wi)-βiφ(yi)}=φ(yi)+1-βi{βiφ(yi)- ^u(wi)}=1-βi{φ(yi)- ^u(wi)}替换回LOOCV lossnnXi=1kφ(y)i- ^u-i(wi)kHY=nnXi=1{φ(yi)- ^u(wi)}1.-βiHY=nnXi=11.-βik{φ(yi)- ^u(wi)}[Singh等人,2020年,附录F]中的开比论点,βi=[KW W(KW W+nλi)-1] iii.e。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 13:42