|
7599-7609.Rossi,Peter E,Robert E McCulloch,Greg M Allenby,“目标营销中采购历史数据的价值”,marketing Science,1996,15(4),321-340.Snoek,Jasper,Hugo Larochelle,Ryan P Adams,“实用贝叶斯优化”2012,25.Srinivas,Niranjan,Andreas Krause,Sham M Kakade,Matthias Seeger“bandit环境中的高斯过程优化:无遗憾和实验设计”arXiv预印本arXiv:0912.3995,2009.Vazquez-Bare,Gonzalo,Edexports,“arXiv预印本arXiv:1711.02745,2017。Viviano,DavidearXIV:2003.08421,2020。威廉姆斯,克里斯托弗·K和卡尔·爱德华·拉斯穆森机器学习,卷2,麻省理工学院出版社剑桥,马萨诸塞州,2006.定理1的证明当我们有离散协变量时,我们可以将最优治疗分配规则写为约束最大化问题的解maxδxx∈XF(x,δ)δ(x)μ(1,x,δ)+(1-δ(x))μ(0,x,δ)→S.T。0≤δ≤1(5)我们可以把这个问题的拉格朗日公式写成:L(δ),λ,λ)=xx∈xf(x,δ)δ(x)μ(1,x,δ)+(1-δ(x))μ(0,x,δ)-λ(δ-1)+λ(δ)fx,δμW,x,δδδ对应于约束优化问题为,对于每个x∈x:F(x,δ)[τ(x,δ)]+xz∈x f(z,δ)δ(x)(R)(z,δ)+f(z,δ)δ(z)(R)(1,z,δ)δ(x)+(1-δ(z))(R)(0,z,δ)δ(x)-λx+λx=0,和(δ(x)-1)λx=0,δ(x)λx=0,0≤δ(x)≤1,λx,λx≥0。由于我们有了约束条件是线性的,那么KKT条件是任何最优δ*必须成立的必要条件,这就导致了定理陈述。a.2推论1对于每个x∈x的证明,我们有了δc(x)=1或δC(x)=0。首先选择ANX,使得δC(x)=1,因此对δC(x)的约束成立。在这种情况下,我们有τ(x,δc)>0,通过对δc的认识。此外,必须是λx=0,这样两个约束条件都成立。剩下的检验条件是λx≥0和方程3。我们列举了几种情况:1.Sx,δc≥λxsx,δcfx,δτx,δ≥,最优性的必要条件不被违反。2.如果S(x,δc)≤0,且-S(x,δc)<τ(x,δc)f(x,δ),则λx=S(x,δc)+f(x,δ)τ(x,δ)≥,方程3。3.如果s(x,δc)≤0,且-s(x,δc)>τ(x,δc)f(x,δ),则不存在满足方程3和δc不能满足最优性必要条件的λx≥0,而δcxτ(x,δc)<0。我们必须有λx=0,这样两个约束条件都变旧了。其余要检查的条件是λx≥0,方程3.1.sx,δc≤λx-sx,δc-fx,δτx,δ≥,不违反最优性的必要条件。2.如果s(x,δc)≥0,且-s(x,δc)>τ(x,δc)f(x,δ),则λx=-s(x,δc)-f(x,δ)τ(x,δ)≥0满足方程3。3.如果s(x,δc)≥0,且-s(x,δc)<τ(x,δc)f(x,δ),则没有λx≥0满足方程3和δc不能满足最优性的必要条件。xδcx∈xδcsu。如果π(δ)也是凹的。A.3推论2的证明在二元情况下,我们可以写出ef(δ)=f(H,δ)和f(L,δ)=1-f(δ)。在δC,我们有δC(H)=1和δC(L)=0。利用方程4中的公式,我们可以写出(H,δC)=δ(H)hf(δC)μ(1,H,δC)+(1-f(δC))μ(0,L,δC)i。(6)s(L,δC)=δ(L)hf(δC)μ(1,H,δC)+(1-f(δC))μ(0,L,δC)I。(7)θyi·y·,θixiδxδ,θirirθip rxiδch,θp rxiδchθpθ此外,从假设3我们得到p r(Xi(δc)=Hθ)=(δc(H)-δc(L)≥r(θ)),其中对于那些总是报告H的人,我们可以写r(θ)=-∞。
|