楼主: 可人4
3314 142

[经济学] 策略转换和学习最优策略 [推广有奖]

71
kedemingshi 在职认证  发表于 2022-4-26 15:02:23
(5.17)现在注意,如果δ**= T] (1)-1/a)+ε对于任何ε>0,则T(δ)≤ (1 -1/a)·每个δ的δ≥ δ**. 此外,通过构造δ的值**将接近最小的可能值,这是正确的。现在,用σ=E确定γ*(γ) ≥ δ**. 那么很明显:T(σ)≤1.-A.E*(γ) ,(5.18)将这个结果与(5.16)和(5.17)相结合,我们得到了满足E*(γ) ≥ δ**我们有:E*(γ) ≤ aEn(γ),(5.19)En(γ)≤ 是*(γ). (5.20)引理5.1证明的其余部分致力于证明以下不等式成立,从技术上讲,(5.15)对Ph`b(·θ,γ,λ)和Ph`b(·θ,γ,λ)的依赖性是通过非对称不等式(c.f.Van Der Vaart and Wellner(1996)引理2.3.1)和Hoe-ffing型浓度不等式消除的,这正好导致上界T(δ),它以很高的概率成立。任何γ∈ Γ关于事件En:E*(γ) ≤ a(En(γ)∨ δ**) , (5.21)En(γ)≤ b(E)*(γ) ∨ δ**) , (5.22)在建立了这些不等式之后,可以直接认为Gn(δ/a) G*(δ)  当δ≥ aδ**. 直观地,定理5.2的证明证明了H`b(δ),T(·)(及其[- 和]-变换)和δ**引理5.1中定义的可替换为其可行版本Hn、`b(δ)、Tn(·和[- 和]-变换)和δ*定义见定理5.2。定理5.2建议采用以下程序来近似δ-水平仪。决策者首先计算En(γ)作为γ的函数(例如,通过在Γ上建立网格)。政策制定者有时重视∈ (1, ∞) 并构造了一个序列{δj}∞j=0随(1)减小到零- 1/a)δ>2H。一般来说,如果序列{δj}∞j=0具有较小的初始增量。然后policymaker计算δ*> T] n(1)-1/a)。这是通过以下程序完成的:(i)决策者接受NI.i.d。

72
可人4 在职认证  发表于 2022-4-26 15:02:30
Rademacher随机变量ξ的绘制。(ii)在jthstep(从第0步开始),决策者使用En(γ)计算Rademacher复杂度| | | Rn | |(Hn,`b(bδj))和公式(5.2)。(iii)决策者使用En(γ)来计算Hn的统一上界Hn(δj),`b(δj)(或者她可以简化2H)。(iv)决策者确定是否存在任何价值δ∈ (δj+1,δj]使得Tn(δj)/δ≥ 1.-1/a.o如果是,决策者停止并设置δ*= δ+η,其中η>0和δ∈ (δj+1,δj]等于满足Tn(δj)/δ的任何值≤ 1.-1/a.o如果不是,决策者重复迭代j+1的步骤(i)和(ii)。图4中提供了该步骤的说明。根据定理5.2,决策者就知道了≥ δ*, δ-最小集G(δ)将包含在样本模拟δ中-最小集Gn(bδ),并将包含样本模拟δ-概率至少为κ的极小集Gn(δ/a)。请注意,此过程中的计算瓶颈来自重复计算Rademacher复杂度。除了本身有趣之外,定理5.2还揭示了前一小节的结果。特别地,定理5.2和引理B.9的证明导致以下结果,这是定理5.2的推论。请注意,第一个不平等是微不足道的,因为当E*(γ) ≥ δ**, 如果E*(γ) ≤ δ**, 然后是E*(γ) ≤ aδ**,因为a>1。第二个不等式是非平凡的,依赖于附录中引理B.9给出的辅助结果。推论5.1。假设定理5.2的假设成立,让δ*如定理5.2所示。对于任何ε>0的情况,让^γ∈ Γ是eME决策规则选择的政策。

73
kedemingshi 在职认证  发表于 2022-4-26 15:02:36
如果δ≥ δ*≥ ε>0,则:infPY,Z∈PY,ZP纽约,Z(E)*(^γ) ≤ δ) ≥ κ.那是^γ∈ G*(δ) 当δ≥ δ*≥ ε > 0.这个结果表明,如果ε≤ δ*那么我们上一小节的eME规则将包含在δ中-水平集G*(δ) 当δ≥ δ*可能性很大。这应该作为使用eME规则的一些额外理由,因为它表明,当*和ε都很小,这是理论5建议的程序。2不会导致决策规则大大优于eME规则。6结论本论文的目的是为界定反事实数量和决策制定一个通用且新颖的框架。我们的框架适用于部分识别和/或不完整的模型。此外,我们不需要潜变量的参数分布假设,我们允许依赖于潜变量的矩条件。我们引入了策略变换,并认为许多反事实量可以写成某些函数的策略变换。然后,我们引入了一个考虑弱优势的偏好关系,并使用一个类似于计算学习理论中的PAC可学习性模型的框架讨论了政策选择问题。我们的理论结果分为事前(即观察样品前)和事后(即观察样品后)适用的结果。对于我们的事前结果,我们引入了“学习”策略空间的概念,并为策略空间的可学习性提供了充分的条件。对于事后结果,我们为特定政策规则的执行提供了理论保证。在本文中,我们还演示了如何将结果应用于同时离散选择示例和程序评估示例。这项工作有许多明显的扩展,可能会很有趣。

74
kedemingshi 在职认证  发表于 2022-4-26 15:02:42
本文特别关注理论发展,其中的例子主要用于教学目的。需要进一步开发示例和实证应用,以清楚地说明和充分调查该方法在实践中的优缺点。此外,本文基本上没有提到实现,在某些环境下,实现可能会很复杂。显然,需要进一步开发有效的算法来实现这些程序。最后,PAC可学习性与频繁决策理论文献之间的关系需要进一步调查和澄清。我们相信所有这些扩展都是未来研究的富有成效的途径。参考Saliprantis,C.D.和Border,K.C.(2006)。有限维分析:搭便车指南。斯普林格。北卡罗来纳州阿隆、南卡罗来纳州本·大卫、北卡罗来纳州塞莎·比安奇和豪斯勒(1997年)。尺度敏感维度、一致收敛性和可学习性。ACM杂志(JACM),44(4):615-631。Andrews,D.W.和Shi,X.(2013)。基于条件矩不等式的推理。《计量经济学》,81(2):609-666。Andrews,D.W.和Shi,X.(2017)。基于许多条件矩不等式的推理。《经济计量学杂志》,196(2):275-287。Angluin,D.和Laird,P.(1988年)。从嘈杂的例子中学习。机器学习,2(4):343-370。Bartlett,P.L.,Boucheron,S.,和Lugosi,G.(2002)。模型选择和误差估计。机器学习,48(1-3):85-113。Bartlett,P.L.,Bousquet,O.,Mendelson,S.,等人(2005年)。本地rademacher的复杂性。《统计学年鉴》,33(4):1497-1537。Bartlett,P.L.,Long,P.M.,和Williamson,R.C.(1996)。脂肪粉碎和真实价值函数的可学习性。计算机与系统科学杂志,52(3):434-452。贝洛尼,A.,布尼,F.A.,和切尔诺朱科夫,V.(2019年)。

75
mingdashike22 在职认证  发表于 2022-4-26 15:02:49
具有许多动量等式的pi模型中的子向量推理。技术报告,cemmap工作文件。Beresteanu,A.,Molchanov,I.,和Molinari,F.(2011)。具有凸现预测的模型中的清晰识别区域。《计量经济学》,79(6):1785-1821。Beresteanu,A.,Molchanov,I.,和Molinari,F.(2012)。使用随机集理论进行部分识别。《计量经济学杂志》,166(1):17-32。Bertsekas,D.P.和Shreve,S.(1978年)。随机最优控制:离散时间情况。学术出版社。Blumer,A.,Ehrenfeucht,A.,Haussler,D.,和Warmuth,M.K.(1989)。可学习性和vapnikchervonenkis维度。ACM杂志,36(4):929-965。S.布切龙、O.布斯克和G.卢戈西(2005年)。分类理论:对一些近况的调查。《概率与统计》,9:323-375。Bousquet,O.,Koltchinskii,V.,和Panchenko,D.(2002年)。凸函数复杂性的一些局部测度和推广界。在计算学习理论国际会议上,第59-73页。斯普林格。Bresnahan,T.F.和Reiss,P.C.(1990)。进入垄断市场。《经济研究评论》,57(4):531-553。Bresnahan,T.F.和Reiss,P.C.(1991)。离散博弈的经验模型。计量经济学杂志,48(1-2):57-81。布罗克,W.A.和杜洛夫,S.N.(2001)。社会互动的离散选择。《经济学研究回顾》,68(2):235-260。Carneiro,P.,Heckman,J.J.和Vytlacil,E.J.(2011)。估算教育的边际回报。《美国经济评论》,101(6):2754-81。张伯伦,G.(2011)。治疗选择的贝叶斯方面。《牛津贝叶斯计量经济学手册》,第11-39页。Chernozhukov,V.,Chetverikov,D.,Kato,K.,等人(2013年)。高维随机向量和的最大值的高斯近似和乘法器引导。

76
kedemingshi 在职认证  发表于 2022-4-26 15:02:56
《统计年鉴》,41(6):2786-2819。Chernozhukov,V.,Hong,H.,和Tamer,E.(2007)。经济计量模型中参数设置的估计和置信域。《计量经济学》,75(5):1243-1284。Chesher,A.和Rosen,A.(2012)。离散结果的联立方程模型:一致性、完整性和识别。工作文件。Chesher,A.和Rosen,A.(2015)。结构计量经济学模型提供的识别集的特征。技术报告,cemmap工作文件。Chesher,A.和Rosen,A.M.(2014)。二元结果的工具变量随机系数模型。《计量经济学杂志》,17(2):S1-S19。Chesher,A.和Rosen,A.M.(2017a)。广义工具变量模型。《计量经济学》,85(3):959-989。Chesher,A.和Rosen,A.M.(2017b)。具有异质性的不完全英文拍卖模型。技术报告,cemmap工作文件。Chesher,A.和Rosen,A.M.(2020年)。同时离散选择的结构建模。工作文件。Chesher,A.,Rosen,A.M.,和Smolinski,K.(2013)。多重离散的工具变量模型。数量经济学,4(2):157-196。Ciliberto,F.,Murry,C.,和Tamer,E.T.(2018)。航空市场的市场结构和竞争。可通过SSRN 2777820获得。科恩·D·L.(2013)。测量理论。斯普林格。Corbae,D.,Stinchcombe,M.B.,和Zeman,J.(2009)。数学分析、经济预测理论和计量经济学导论。普林斯顿大学出版社。Dolgopolik,M.(2016)。线性罚函数精确性的统一理论。优化,65(6):1167-1202。Dontchev,A.L.和Rockafellar,R.T.(2009)。隐函数和解映射。斯普林格·莫诺格。数学达德利,R.M.(2010)。真实分析和概率。剑桥大学出版社。达德利,R.M.(2014)。一致中心极限定理。剑桥大学出版社。达德利,R.M.,金恩,e.和津恩,J.(1991)。

77
何人来此 在职认证  发表于 2022-4-26 15:03:03
统一和通用的glivenko cantelli课程。《理论概率杂志》,4(3):485-510。艾克兰,I.,加利孔,A.,和亨利,M.(2010)。最优运输和不完全特定经济模型的可靠性。经济理论,42(2):355-374。Galichon,A.和Henry,M.(2006)。不完全模型中的推理。工作文件。Galichon,A.和Henry,M.(2009)。部分识别参数的非识别限制和信任区域测试。计量经济学杂志,152(2):186-196。Galichon,A.和Henry,M.(2011)。在具有多重平衡的模型中设置识别。经济研究回顾,78(4):1264-1298。金恩,e.,科尔钦斯基,V.,等人(2006年)。比率型经验过程的集中不等式和渐近结果。《概率史记》,34(3):1143-1216。吉恩·e.,科尔钦斯基,V.和韦尔纳,J.A.(2003年)。经验过程的比率极限定理。InStochastic不等式及其应用,第249-278页。斯普林格。Haile,P.A.和Tamer,E.(2003)。用英语拍卖的不完全模型进行推理。《政治经济学杂志》,111(1):1-51。豪斯勒博士(1992年)。pac模型在神经网络和其他学习应用中的决策理论推广。信息与计算,100(1):78-150。赫克曼,J.J.(2010)。在结构评估和项目评估方法之间建立桥梁,以评估政策。经济文献杂志,48(2):356-98。Heckman,J.J.和Vytlacil,E.(2005)。结构方程、处理效果和经济计量政策评估1。《计量经济学》,73(3):669-738。Heckman,J.J.和Vytlacil,E.J.(1999)。用于识别和界定治疗效果的局部工具变量和潜变量模型。美国国家科学院院刊,96(8):4730-4734。希梅尔伯格,C.(1975)。可测量的关系。《数学基础》,87(1):53-72。平野,K。

78
mingdashike22 在职认证  发表于 2022-4-26 15:03:10
和Porter,J.R.(2009)。统计处理规则的渐近性。《计量经济学》,77(5):1683-1701。Hurwicz,L.(1950年)。识别概念的概括。《动态经济模型中的统计推断》,10:245–57。Ichimura,H.和Taber,C.R.(2000年)。直接估计政策影响。工作文件。Imbens,G.W.和Angrist,J.D.(1994年)。确定和估计当地平均治疗效果。《计量经济学》,62(2):467-475。Io Offe,A.(2016年)。度量正则性——综述第1部分。学说《澳大利亚数学学会杂志》,101(2):188–243。贾平(2008)。沃尔玛进城后会发生什么:折扣零售业的实证分析。《计量经济学》,76(6):1263-1316。约万诺维奇,B.(1989年)。具有多重平衡的模型的可观察含义。计量经济学:计量经济学学会杂志,1431-1437页。Kaido,H.,Molinari,F.,和Stoye,J.(2019年)。部分识别中的约束条件。arXiv预印本arXiv:1908.09103。Kalouptsidi,M.,北村,Y.,利马,L.,和Souza Rodrigues,E.(2019年)。动态模型和反事实的部分识别和推断。工作文件。凯西,M.(2016)。部分认同、分配偏好和政策的福利排名。《经济学与统计学评论》,98(1):111–131。卡恩斯,M.J.和夏皮雷,R.E.(1994)。有效的概率概念无分布学习。计算机与系统科学杂志,48(3):464-497。卡恩斯,M.J.,瓦济拉尼,U.V.,和瓦济拉尼,U.(1994)。计算学习理论导论。麻省理工学院出版社。北川,T.和Tetenov,A.(2018年)。应该治疗谁?治疗选择的经验福利最大化方法。《计量经济学》,86(2):591-616。科尔钦斯基五世(2001年)。Rademacher惩罚和结构风险最小化。IEEE信息论学报,47(5):1902-1914。Koltchinski,V.(2006年)。

79
大多数88 在职认证  发表于 2022-4-26 15:03:16
风险最小化中的局部rademacher复杂性和oracle不等式。《统计年鉴》,34(6):2593-2656。Koltchinski,V.(2011年)。甲骨文在经验风险最小化和稀疏恢复问题上的不平等性:圣面粉经济学院第三十八卷,2008年,第2033卷。斯普林格科学与商业媒体。Koltchinskii,V.和Panchenko,D.(2000年)。Rademacher处理和限制函数学习的风险。在高维概率II中,第443-457页。斯普林格。T.C.库普曼斯、H.鲁宾和R.B.莱普尼克(1950)。测量动态经济学的方程组。动态经济模型中的统计推断,10。科索罗克,M.R.(2008)。介绍经验过程和半参数推理。斯普林格。刘易斯·D.(1979)。反事实依赖和时间之箭。不,我们,第455-476页。Li,L.(2019)。在一大类结构经济计量模型中识别结构和反事实参数。工作文件。罗志强、彭俊生和拉尔夫·D.(1996)。具有平衡约束的数学程序。剑桥大学出版社。Manski,C.和Tetenov,A.(2014)。统计处理规则的分位数性能使用假设专家将一个群体分配给两个处理。技术报告,cemmap工作文件。曼斯基,C.F.(1988)。不确定性下决策的序数效用模型。理论与决策,25(1):79-104。曼斯基,C.F.(2004)。异质人群的统计处理规则。《计量经济学》,72(4):1221-1246。曼斯基,C.F.(2011)。现实主义理性。《理论与决策》,71(2):195-210。Marshak,J.(1953年)。政策和预测的经济衡量。计量经济学方法研究,第1-26页。马萨特,P.(2000年)。集中不等式在统计学中的一些应用。《图卢兹学院科学年鉴:数学》第9卷第245-303页。姆巴科普,E。

80
mingdashike22 在职认证  发表于 2022-4-26 15:03:23
和Tabord Meehan,M.(2019年)。治疗选择的模型选择:惩罚福利最大化。arXiv预印本arXiv:1609.03167。宫内(2016)。具有非负外部性的成对稳定网络的结构估计。《计量经济学杂志》,195(2):224-235。Mogstad,M.,Santos,A.,和Torgovitsky,A.(2018)。使用工具变量推断与政策相关的治疗参数。《计量经济学》,86(5):1589-1619。Mohri,M.,Rostamizadeh,A.,和Talwalkar,A.(2018)。机器学习的基础。麻省理工学院出版社。Molchanov,I.(2017年)。随机集理论。斯普林格科学与商业媒体。摩根,M.S.(1990)。计量经济学思想的历史。剑桥大学出版社。I.穆里菲、M.亨利和R.米恩戈(2018年)。茎主选择罗伊模型的精确界限和可测试性。可从SSRN 2043117获得。I.Mouri Fie和Y.Wan(2020年)。在使用mte的项目评估中进行分层敏感性分析。工作纸。Munkres,J.(2014)。拓扑结构。培生教育。彭俊生(1997)。数学规划中的误差界。数学规划,79(1-3):299-332。Parthasarathy,K.R.(2005)。度量空间上的概率测度,第352卷。美国数学学会。Pearl,J.(2009)。因果关系:模型、推理和推理。斯普林格。Pollard,D.(1990年)。经验过程:理论与应用。NSF-CBMS概率与统计区域会议系列,第i-86页。杰斯特。秦,D.和吉尔伯特,C.L.(2001)。时间序列计量经济学史上的误差项。计量经济学理论,17(2):424-450。罗斯泰克,M.(2010)。决策论中的分位数最大化。《经济研究评论》,77(1):339-371。罗素·T·M.(2019)。治疗效果分析中联合分布函数的锐界。《商业与经济统计杂志》,第1-15页。Schennach,S.M.(2014)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 03:10