楼主: 可人4
1891 61

[量化金融] 计量经济学中的不可能推理:理论与应用 [推广有奖]

21
何人来此 在职认证  发表于 2022-5-30 22:47:43
联合概率分布集P由一个参数θ表示,并允许边际密度P(Zi;θ)具有相同的支配度量(例如Lebesgue)。然后,最大似然估计量(MLE)最小化Xni=1- lnp(Zi;θ)。此估计器bθsolvesXni=1-pZi;bθθ。pZi;bθ= 在通常的正则条件下,bθ是一致的,渐近正态的,并且在正则估计类中是有效的。M的一个常见选择是具有对称厚尾密度的分布集。众所周知,如果观察到异常值的概率ε(从M中提取的样本)存在,则在高斯分布(从P中提取的样本)下得出的优化程序将失效。Huber(1964)提出了M估计。为了给出稳健M估计的具体示例,考虑回归模型Yi=Xiθ+Ui,其中我们观察到Zi=(Yi,Xi),但没有观察到零平均正态误差Ui。MLEbθ最小化Xni=1易- Xiθ,满意度xni=1Xi易- Xibθ= 更一般地,M-估计量bθ最小化xni=1ρ易- Xiθ,满足度xni=1Xiψ易- Xibθ= 0用于选择函数ρ和ψ。在上述极大似然估计的情况下,ρ(u)=u,ψ(u)=u。如果M-估计量bθ最小化Pε中分布的最大渐近方差,则称其为一类估计量中的渐近极大极小最优。与函数ρk(u)=(u/2 if | u |相关的M-估计量≤ kk | u |- 如果| u |>kandψk(u)=max,则为u/2{-k、 对于模型污染,min(k,u)}(3.2)是渐近极大极小最优的。常数k取决于(3.1)中的偏差ε。Asε→ 0,截断参数k→ ∞. 由于模型偏差较小,M估计量接近MLE估计量。如果ε→ 1,参数k→ 由于约束任意大,M估计量接近最小绝对偏差(LAD)估计量。稳健程序的第二个例子是假设检验。

22
大多数88 在职认证  发表于 2022-5-30 22:47:47
考虑在一个简单的备选方案P上测试一个简单的空页的问题。假设两个参数的密度和pwrt都是Lebesgue测度。对于样本X=(X,…,Xn),当且仅当ni=1p(Xi)p(Xi)>cα时,似然比(LR)测试拒绝空值,其中cα是1- 零位下左侧分布的α分位数。NeymanPearson引理断言LR测试是最优的,因为它在大小正确的测试类α内最大化了功率。与上述点估计示例中的模型偏差类似,我们考虑了零假设和替代假设错误的可能性。ε-污染零假设和替代假设,ε={H∈ MF∈ 计划G∈ MH=(1- ε) F+εG},(3.3)对于i=0,1。新的集合P0,ε和P1,ε允许M中任意分布的局部偏差。在P0,ε上具有正确大小的测试类别中,极大极小最优假设检验使P1,ε上的最小幂最大化。Huber(1965)表明,当且仅当ni=1πk时,对这些模型偏差的极大极小检验拒绝了空值p(x)p(x)> cα,其中πk(w)=max{k,min(k,w)},常数k=(k,k)取决于偏离ε的大小。Asε→ 0,常数kapproaches为零,K变为单位。因此,随着偏离的减少,鲁棒测试将接近通常的LR测试。在上述两个稳健程序示例中,任意小的模型偏差(ε→0)不要影响极大极小问题的解决方案。也就是说,当ε接近零时,robustestimator收敛到MLE,鲁棒测试收敛到LR测试。即使我们忽略模型偏差(ε=0),这些极限解仍保持不变。这些推理过程以一个参数为目标,该参数是基础分布P的函数∈ Pε。这些函数随ε平滑变化→ 0

23
可人4 在职认证  发表于 2022-5-30 22:47:51
稳健性与函数的平滑度相关,但这种平滑度在其他设置中可能并不总是出现。我们在不可能推理和不同度量方面的工作与Huber在稳健性方面的工作相联系,当我们看到以下模型偏离的定义时。对于度量空间(M,d),模型偏差集定义为P的ε邻域:Pε={H∈ MF∈ P s.t.d(F,H)≤ ε} 。集合Pε闭合。setTε>0Pε也是闭合的,并且与P(P的闭合)一致。因此,集P是包含P的Huber型模型偏差Pε的最小集。模型偏差的最小集至关重要地取决于度量d的选择。从L'evy Prokhorov(LP)和总变差(TV)度量中,概率度量空间有许多度量的选择:Kolmogorov,Hellinger和Wasserstein等。Gibbs和Su(2002)进行了回顾。我们应该选择哪个指标?模型M空间上度量的选择导致该空间上的拓扑V。感兴趣的参数是函数u:(M,V)→ (R,U),其中U是R空间上的拓扑。稳健性是关于函数u的连续性,这在很大程度上取决于拓扑V和U的选择。对于实线,使用涉及形式(a,b)的所有开集的最小拓扑似乎是合理的。然而,度量值M集有许多拓扑选择。随着拓扑在u域上变得更紧密,连续函数集u增长更大。让我们考虑一个简单的例子来说明这一点。取两个拓扑空间,(R,V)和(R,U),一个函数ψ(x)=x。这个简单函数的连续性需要ψ-1(U)∈ V前开集合U∈ U、 取U=(0,1),然后取ψ-1(U)=(0,1)。如果我们选择最粗糙的地形yv={, R} ,那么即使这个简单的函数也不是连续的。

24
mingdashike22 在职认证  发表于 2022-5-30 22:47:54
要求allIn-fact取任意收敛序列Hn似乎是合理的→ H、 这样Hn∈ Pεn、 显示H∈ Pε,拾取任意F∈ P、 d(Hn,F)是真的≤ εn、 因此,d(F,H)≤ d(F,Hn)+d(Hn,H)≤ ε+d(Hn,H)。取极限为n→ ∞ 给出d(F,H)≤ ε。线性函数是连续的。如果拓扑V由形式(a,b)的所有开集生成,则所有线性函数都是连续的。当然,其他非线性函数也可能是连续的;e、 g.,ψ(x)=x。这个例子表明,连续性在很大程度上取决于与函数域相关的拓扑V。如果函数对于拓扑V是连续的,那么对于内部拓扑也是连续的。这与函数u的鲁棒性和连续性的讨论有关。如果我们选择一个明确的拓扑,那么许多统计程序将被视为稳健的,因为许多函数都是连续的。如果我们选择一个粗略的拓扑,那么更少的统计过程将是稳健的。然而,如果统计过程在粗略拓扑中是稳健的,那么在精细拓扑中也是稳健的。在测度空间中常用的距离概念中,弱收敛或分布收敛背后的距离概念导致了最粗糙的拓扑。LP度量是度量弱收敛的距离概念(Dudley(1976),定理8.3)。保守地说,如果我们选择一个度量,我们会选择一个度量弱收敛的度量。毕竟,如果一个泛函对于LP度量所诱导的拓扑是连续的,那么它对于Kolmogorov或TVmetrics所诱导的更强拓扑也是连续的。另一个问题是,我们是否应该对鲁棒性更加严格,并寻找比LP度量所诱导的弱拓扑更弱的拓扑。

25
mingdashike22 在职认证  发表于 2022-5-30 22:47:58
与实线示例非常相似,弱拓扑是最粗糙的拓扑,它保证了所有函数的连续性,对于g有界和连续,形式为u(P)=Zg dP,(3.4)。毕竟,当μ是有界连续函数时,要求μ是连续的似乎是合理的。如果我们选择一个较弱的拓扑,那么这种形式的u也不会是连续的。在假设检验中,对一组最小模型偏差的稳健性激励着检验Pagainst Pinst而不是检验Pagainst P。考虑到稳健性假设,并有可能保护我们免受数值近似误差、错误指定模型、测量和优化摩擦,以及我们正在测试的模型集的其他偏差。与(3.4)一样简单的u推理过程的稳健性要求拓扑不比LP度量所诱导的拓扑更弱。因此,我们使用LP度量来确定稳健假设检验集合的完备性。我们给出了两个简单的例子来证明为什么LP度量可能是一个明智的选择。使用LP度量进行稳健假设检验的第一个示例比较了零假设和替代假设下极其简单的混凝土分布。取X为伯努利随机变量,取Xn=X+1/(1+n)表示n∈ N、 设px表示X的分布。P之间的最小tv距离=PXN编号∈ N和P=PX等于1。根据Kraft(1955)的Theorem5,存在具有非平凡功率的Pvs P测试。例如,定义一个测试,如果我们观察到值0或1,它将拒绝null,否则将无法拒绝null。此测试的大小等于零,幂等于一。

26
能者818 在职认证  发表于 2022-5-30 22:48:02
我们是否应该将值0和1作为反对null的证据?或者,我们是否应该认为空值可能会导致所有实际目的的相同值?在这个例子中,我们注意到PP、 如果根据LP指标定义了闭包。因此,Pand PI之间的最小TV距离等于零。在我们证明空集为P后,就不可能找到任何幂大于size的测试(推论1)。然而,如果我们定义Pwrt的闭合TV指标,例如PT V,PT和PI之间的最小TV距离为非零,这意味着仍然可以有力地区分这些集合。使用LP度量的稳健假设检验的第二个示例使用连续分布的多项式近似。以多项分布的集合为例,每个支持都是有理数的有限子集。设Pbe为连续分布集。Pand和Pis之间的最小电视距离为1,可以对这些电视机进行强大的区分。稳健性让我们不禁要问,观察有理数是否与零假设无关,或者仅仅是四舍五入或测量误差的问题。closurePwrt LP度量包含连续分布,以及Pand Pis之间的最小TV距离为零。在我们将空集鲁棒化为P之后,就不可能有力地检验这些假设了。在伯努利和多项式的例子中,很明显,全集的LP闭包证明了测试过程的鲁棒性。下一步是检查经过验证的零集和备选集之间的电视距离,以此作为搜索具有非平凡功率的稳健测试的一种方法。

27
何人来此 在职认证  发表于 2022-5-30 22:48:06
第二步中TV度量的使用由Kraft(1955)定理5的推论证明。推论1证明了非平凡幂检验存在的一个必要且充分的条件是,在TV度量的所有分布集中,零集不是稠密的。4应用在本节中,我们将我们的理论应用于多个经济实例。前三个例子是具有不连续性的模型:RDD、标量变量中的聚束和基于聚束的外生性测试。在这些情况下,不可能推理的LP版本的证明遵循类似于Portmanteau定理的论证。也就是说,指示器函数与使用弱距离的陡峭连续函数大致相同。测试是否存在插入标量变量的问题与其他具有不连续性的应用不同,因为存在一个不连续的强大测试。第四个例子是时间序列;它将不可能推理的LP版本与Huber关于稳健统计的工作联系起来。这种联系导致的结论是,不可能从协方差平稳模型中有力地区分错误持续时间或复合泊松模型。事实上,Fn(x)=P(Xn≤ x) =P(x≤ x个- 1/n),Fn(x)→ P(X<X)=Fx个-, F(x-) 6=F(x)<=> x个∈ {0,1}其中{0,1}是F的唯一不连续点,因此px是P.4.1回归不连续和扭结设计的极限点。第一个例子是回归不连续设计(RDD),由Hahn et al.(2001)(HTV01)首次正式化。RDD对经济学各个领域的应用研究产生了巨大影响。RDD的应用在20世纪90年代开始在经济学中普及。

28
mingdashike22 在职认证  发表于 2022-5-30 22:48:09
影响深远的论文包括Black(1999)的论文,他研究了学区质量对房价的影响,其中质量在学区边界上不断变化;Angrist和Lavy(1999年),他们测量班级规模对学业成绩的影响,其中班级规模随入学率不连续变化;以及Lee(2008),他分析了美国众议院的选举和在职情况,其中选举胜利在投票份额上是不连续的。最近的理论贡献包括Porter(2003)对RDD估计器的速率最优性的研究,以及Imbens和Kalyanaraman(2012)和Calonico等人(2014)对数据驱动的最优带宽规则的研究。RDD确定了局部切割效应值的因果效应;有几位作者提出了条件,以推断出离切割效应更远的局部效应。其中包括Dong(2016年)和Dong and Lewbel(2015年)在cuto ff对治疗效果衍生品的估计;Bertanha和Imbens(2019)对模糊RDD治疗效果的同质性进行的测试;Bertanha(2019年)估计RDD的平均治疗效果和cuto ff值的变化。所有这些理论贡献都依赖于点识别和推理,并且它们受制于两种类型的不可能性。测试和构建置信区间的当前实践依赖于Wald检验统计(t(Z)- m) /s(Z),其中t(Z)和s(Z)是a.s.连续的,并且在数据中有界。对于临界值z的选择,假设检验φ(z)=I{|(t(z)- m) 当数据连续分布时,/s(Z)|>Z}是a.s.连续的。置信区间C(Z)={t(Z)-s(Z)Z≤m级≤ t(Z)+s(Z)Z}有a.s.有界长度2s(Z)Z。RDD的设置遵循潜在结果框架。对于每个i=1,n、 定义四个原始随机变量Di、Xi、Yi(0)、Yi(1)。这些变量是独立的,且呈独立分布。

29
mingdashike22 在职认证  发表于 2022-5-30 22:48:12
变量在{0,1}中抖动值,并指示治疗状态。实际值变量Yi(0)和Yi(1)分别表示未治疗和治疗的潜在结果。最后,强制变量XI代表个体的实值特征,不受治疗的影响。强制变量有一个连续的PDF f(x),其间隔支持等于x。计量经济学家观察到Xi,Di,并且每个个体只有两个潜在结果中的一个:Yi=DiYi(1)+(1- Di)Yi(0)。为了简单起见,我们考虑了夏普RDD情况,但很容易将我们的结果推广到模糊情况。在尖锐的情况下,当且仅当强制变量大于或等于支撑X内部的固定政策切割时,代理才会接受治疗。因此,Di=I{Xi≥ c} ,其中I{·}表示指示符函数。我们关注平均治疗效果。在RDD设置中,通常仅在假定平均潜在结果的连续性后,以强制变量为条件,在cuto ff值处获得平均效应的识别。换言之,我们假设E[Yi(0)| Xi=x]和E[Yi(1)| Xi=x]是x的有界连续函数。HTV01表明这会导致识别感兴趣的参数:m=E[Yi(1)- Yi(0)| Xi=c]=limx↓cE[易| Xi=x]- 林克斯↑cE[易| Xi=x]。(4.1)设G表示所有函数的空间G:X→ R是有界的,并且在每个x上连续可微分的无数次∈ X \\{c}。符号X \\{c}表示除c以外的X的每一点的集合。函数在G函数中的连续性表示该部分中不可能的推理。然而,不连续m大小的非参数估计通常认为g中的函数是一阶或二阶连续可微的。

30
何人来此 在职认证  发表于 2022-5-30 22:48:16
我们规定G中的函数在有限的顺序上是连续可区分的,以证明即使在这类更受限制的函数中,这两种类型的不可容许性也是成立的。不连续mat的大小cuto off可以取R中的任何值。每对变量Zi=(Xi,Yi)的iid为P。P的所有可能模型族表示为asP={P:(Xi,Yi)~ Pg级∈ G s.t.EP【Yi | Xi=x】=G(x)}。(4.2)局部平均因果效应是数据P分布的函数∈ P givenby(4.1),提供HTV01持有的识别假设。在一组可能的真模型P中,不连续尺寸的参数m是弱识别的。直觉上,除了跳跃不连续atx=c外,任何连续的条件平均函数E[Yi | Xi=x]都可以很好地近似于连续的条件平均函数序列。这种近似背后的推理类似于Portmanteau定理的部分证明(定理25.8,Billingsley(2008))。众所周知,如果E[f(Xn)]→ E[f(X)]对于在X的分布下a.s.连续的每个有界函数f,然后是Xnd→ 十、 推论3的证明使用了一个近似等于指示函数的连续可微函数f。推论3。假设1满足P0,mm级∈ R、 定理2和3适用于RDDcase。即,(i)不连续m值的a.s.连续试验φm(Z)受尺寸限制;(ii)不连续性m值和有限预期长度的置信度集的置信度为零。备注7。推论3也适用于分位数处理效果,只需将函数u(P)的定义更改为x=c时条件τ-th分位数Qτ(Yi | Xi=x)的侧限差异。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 11:40