楼主: 大多数88
1256 59

[量化金融] 错指定马氏决策过程的均衡 [推广有奖]

41
mingdashike22 在职认证  发表于 2022-5-7 18:11:53
最后,如果我们对实验稳健的均衡感兴趣,我们可以将注意力限制在一组完美的伯克-纳什均衡上。我们的结果适用于正确指定和错误指定的情况,我们不知道这两种情况之前的一般结果。对于正确的特定情况,我们的结果可以证明文献中的常见假设,即如果强识别成立(或存在弱识别,且对实验稳健的平衡感兴趣),那么代理知道转移概率函数。在误判的情况下,我们的结果显著扩大了可能的应用范围。参考Saliprantis,C.D.和K.C.Border,有限维分析:搭便车指南,Springer Verlag,2006年。Arrow,K.和J.Green,“贝叶斯环境下的期望均衡注释”,数学研究所,社会科学工作文件331973号。Battigalli,P.,米兰博科尼大学内乔奇·内尔·西图阿齐奥尼·西图阿齐奥·西图阿齐奥西亚利地区均衡成分研究所,1987年。Berk,R.H.,“模型不正确时后验分布的限制行为”,《数理统计年鉴》,1966年,37(1),51-58。Brock,W.A.和L.J.Mirman,“最优经济增长和不确定性:贴现案例”,《经济理论杂志》,1972年,4(3),479–513。Bunke,O.和X.Milhaud,“可能不正确模型下Bayes估计的渐近行为”,《统计年鉴》,1998年,26(2),617-644。Burdett,K.和T.Vishwanath,“保留工资和学习的下降”,《经济研究回顾》,1988年,55(4),655-665。Dekel,E.,D.Fudenberg和D.K.Levine,“学习玩贝叶斯游戏”,游戏与经济行为,2004,46(2),282–303。Diaconis,P.和D.Freedman,“关于Bayes估计的一致性”,统计年鉴,1986年,第页。

42
能者818 在职认证  发表于 2022-5-7 18:11:56
1–26.Doraszelski,U.和J.F.Escobar,“动态随机博弈中的正则马尔可夫完美均衡理论:泛型、稳定性和纯化”,理论经济学,2010年,5(3),369–402。《概率:理论与实例》,剑桥大学出版社,2010年。Easley,D.和N.M.Kiefer,“用未知参数控制随机过程”,计量经济学,1988年,第1045-1064页。Esponda,I.,“逆向选择经济中的行为均衡”,《美国经济评论》,2008年,98(4),1269-1291。D.Pouzo,《大型选举中的有条件回顾投票》,Forthcominin《美国经济杂志:微观经济学》,2012年。以及《伯克-纳什均衡:用错误模型为代理人建模的框架》,《计量经济学》,即将出版,2016年。Evans,G.W.和S.Honkapohja,《宏观经济学中的学习与期望》,普林斯顿大学出版社,2001年。Eyster,E.和M.Piccione,“在不完全和多样性认知下的资产定价方法”,计量经济学,2013,81(4),1483-1506。和M.拉宾,《诅咒的均衡》,计量经济学,2005年,73(5),1623-1672年。Fershtman,C.和A.Pakes,“信息不对称的动态博弈:实证研究框架”,《经济学季刊》,2012年,第qjs025页。Freedman,D.A.,《离散情形下Bayes估计的渐近行为》,《数理统计年鉴》,1963年,34(4),1386-1403年。《经济理论杂志》,1981年,24(2),296-309。Fudenberg,D.和D.Kreps,“学习混合均衡”,游戏和经济行为,1993年,5320-367。D.K.Levine,“自我确认均衡”,计量经济学,1993年,第523-545页。《游戏学习理论》,第二卷,麻省理工学院出版社,1998年。,G.Romanyuk和P.Strack,“有错误信念的积极学习”,工作文件,2016年。霍尔,右。

43
能者818 在职认证  发表于 2022-5-7 18:12:00
E.,“宏观经济波动和时间分配”,1997年技术报告1。汉森,L.P.和T.J.萨金特,鲁棒性,普林斯顿大学公共关系,2008年。Harsanyi,J.C.,“随机干扰支付的博弈:形成固定策略均衡点的新理论基础”,《国际博弈论杂志》,1973,2(1),1-23。Heidhues,P.,B.Koszegi和P.Strack,“不切实际的期望和错误的学习”,工作文件,2016年。Hoffauer,J.和W.H.Sandholm,“关于随机效应的全球收敛”,计量经济学,2002,70(6),2265–2294。Jehiel,P.,“重复交替博弈中的有限期预测”,《经济理论杂志》,1995年,67(2),497–519。,“学会玩有限的预测均衡”,游戏与经济行为,1998年,22(2),274-298。,“基于类比的预期均衡”,《经济理论杂志》,2005年,123(2),81-104。D.Samet,“估值均衡”,理论经济学,2007年,2(2),163-185。和F.Koessler,“用基于类比的预期重新审视不完全信息的博弈”,博弈与经济行为,2008,62(2),533–557。Kagel,J.H.和D.Levin,“公共价值拍卖中的赢家诅咒和公共信息”,《美国经济评论》,1986年,第894-920页。Kirman,A.P.,“企业对需求状况的学习”,摘自R.H.Day和T。格罗夫斯主编,《适应性经济模型》,学术出版社1975年,第137-156页。Koulovatianos,C.,L.J.Mirman和M.Santugini,“最优增长和不确定性:学习”,《经济理论杂志》,2009年,144(1),280-295。McCall,J.J.,《信息经济学与求职》,经济学季刊,1970年,第页。

44
大多数88 在职认证  发表于 2022-5-7 18:12:05
113–126.McLennan,A.,“长期的价格分散和不完全学习”,《经济动态与控制杂志》,1984年,第7(3),331-347页。Nyarko,Y.,“在错误指定的模型中学习和周期的可能性”,经济理论杂志,1991年,55(2),416-427。Piccione,M.和A.Rubinstein,“对具有不同能力识别均衡模式的机构的经济互动进行建模”,《欧洲经济协会杂志》,2003年,1(1),212–223。波拉德博士,《测量理论概率的用户指南》,剑桥大学出版社,2001年。鲍威尔,W.B.,近似动态规划:解决维度的诅咒,第703卷,约翰·威利父子出版社,2007年。罗斯柴尔德,M.,“在价格分布未知的情况下寻找最低价格”,《政治经济学杂志》,1974年,82(4),689-711。,“市场定价的两臂强盗理论”,《经济理论杂志》,1974年,9(2),185-202。萨金特·T·J.《征服美国的通货膨胀》,普林斯顿大学出版社,1999年。塞尔滕,R.,“重新审视广泛博弈中均衡点的完备性概念”,《国际博弈论杂志》,1975年,4(1),25-55。Shalizi,C.R.,“依赖数据和错误模型的贝叶斯更新动力学”,电子统计杂志,2009年,3,1039–1074。Sobel,J.,“非线性价格和价格接受行为”,《经济行为与组织杂志》,1984年,5(3),387–396。斯皮格勒,R.,《安慰剂改革》,《美国经济评论》,2013年,第103(4)期,1490-1506页。,“贝叶斯网络和有界理性预期”,《经济学季刊》,即将出版,2016a。,“关于有限理性预期的“有限反馈”基础”,工作文件,2016b。附录引理2的证明。

45
可人4 在职认证  发表于 2022-5-7 18:12:08
IQ(σ)是非空的:Mσ,qi是欧几里德空间(有限集Gr(Γ)上的一个凸紧子集上的线性(因此是连续的)自映射;所以,布劳尔定理意味着不动点的存在。IQ(σ)是凸值的:对于所有α∈ [0,1]和m,m∈ (Gr(Γ)),αMσ,Q[M]+(1)-α) Mσ,Q[M]=Mσ,Q[αM+(1)- α) m]。因此,如果m=mσ,Q[m]和m=mσ,Q[m],那么αm+(1- α) m=mσ,Q[αm+(1)- α) m]。IQ(σ)是上半连续且紧值的:固定任意序列(σn,mn)nin∑×(Gr(Γ))这样limn→∞(σn,mn)=(σ,m)并且∈ 由于Mσn,Q[mn]=mn,| | M- Mσ,Q[M]| |≤ ||M- mn | |+|Mσn,Q[mn- m] | |+|mσn,Q[m]- Mσ,Q[M]| |。RHS中的第一项因假设而消失。第二项满足度| | Mσn,Q[mn- m] ||≤ ||Mσn,Q | |×| | mn- m | |也消失了。对于第三项,注意σ7→ Mσ,Q[M]是线性映射,supσ| | Mσ,Q[M]| |≤maxs | P(s,x)∈Gr(Γ)Q(s|s,x)m(s,x)|<∞. 因此| | Mσn,Q[M]-Mσ,Q[M]| |≤ K×| |σn-σ| |对于某些K<∞ , 所以它也消失了。因此,m=mσ,Q[m];因此,IQ(·)有一个闭合图,所以IQ(σ)是一个闭合集。IQ(σ)的紧致性源于(Gr(Γ))。因此,IQ(·)是上半连续的(见Aliprantisand Border(2006),定理17.11)。引理3的证明依赖于下面的断言。本附录中权利要求A、B和C的证据见在线附录。索赔A.(i)对于任何常规SMDP,都存在θ*∈ Θ和K<∞ 这样的话,对我来说∈ (Gr(Γ)),KQ(m,θ)*) ≤ K.(ii)固定任何θ∈ Θ和一个序列(mn)nin(Gr(Γ))使得所有(s,s,x)的Qθ(s | s,x)>0∈ S×Gr(Γ)使得q(S | S,x)>0和limn→∞mn=m。然后是limn→∞KQ(mn,θ)=KQ(m,θ)。(iii)KQis(联合)下半连续:固定任何(mn)和(θn)n,使之成为limn→∞mn=mand limn→∞θn=θ。然后是lim infn→∞KQ(mn,θn)≥ KQ(m,θ)。引理3的证明。

46
能者818 在职认证  发表于 2022-5-7 18:12:12
(i) 利用Jensen不等式和ln(·),KQ(m,θ)的严格凹性≥ -P(s,x)∈Gr(Γ)ln(EQ(·| s,x)[Qθ(s | s,x)Q(s | s,x)]m(s,x)=0,当且仅当所有(s,x)的Qθ(·| s,x)=Qθ(·| s,x),使得m(s,x)>0。(ii)ΘQ(m)是非空的:根据权利要求A(i),存在K<∞ 使得最小值在约束集中{θ∈ Θ:KQ(m,θ)≤ K} 。因为KQ(m,·)在紧集上是连续的,所以存在一个极小值。ΘQ(·)是uhc和紧值:固定任何(mn)和(θn)n,使之满足limn→∞mn=m,limn→∞θn=θ,θn∈ 对于所有n,我们建立θ∈ ΘQ(m)(所以Θ(·)有一个闭图,通过Θ的紧性,它是uhc)。假设,为了得到一个矛盾,θ/∈ ΘQ(m)。那么,根据权利要求A(i),存在^θ∈ ε>0,使得KQ(m,θ)≤ KQ(m,θ)- 3ε和KQ(m,^θ)<∞. 根据规则,limj存在(^θj)jj→∞^θj=^θ,对于所有j,Q^θj(s | s,x)>0对于所有(s,s,x)∈ S×X使得Q(S | S,X)>0。我们将证明序列中有一个元素,^θJ,比θngiven mn“做得更好”,这是一个矛盾。因为KQ(m,^θ)<∞, KQ(m,·)的连续性意味着存在足够大的J,使得KQ(m,^θJ)- KQ(m,^θ)≤ ε/2. 此外,对于矩阵a,| | a | |被理解为算子范数。应用于θ=^θ的A(ii)表示存在Nε,Jsuch,对于所有N≥ Nε,J,KQ(mn,^θJ)- KQ(m,^θJ)≤ ε/2. 因此,对于所有n≥ Nε,J,KQ(mn,^θJ)- KQ(m,^θ)≤KQ(mn,^θJ)- KQ(m,^θJ)+KQ(m,^θJ)- KQ(m,^θ)≤ ε,因此KQ(mn,^θJ)≤ KQ(m,^θ)+ε≤ KQ(m,θ)- 2ε. (15) 假设KQ(m,θ)<∞. 根据权利要求A(iii),存在nε≥ Nε,Jsuch thatKQ(mnε,θNε)≥ KQ(m,θ)-ε. 这个结果和(15)一起意味着KQ(mnε,^θJ)≤KQ(mnε,θnε)- ε. 但这与θnε相矛盾∈ ΘQ(mnε)。最后,如果KQ(m,θ)=∞,权利要求A(iii)暗示存在nε≥ Nε,j如KQ(mnε,θNε)≥ 2K,其中k是权利要求A(i)中定义的界限。

47
大多数88 在职认证  发表于 2022-5-7 18:12:16
但这也与θnε相矛盾∈ ΘQ(mnε)。因此,ΘQ(·)有一个闭图,因此ΘQ(m)是一个闭集。ΘQ(m)的紧性从Θ的紧性派生而来。因此,ΘQ(·)是上半连续的(见Aliprantis and Border(2006),定理17.11)。定理1的证明。设W=∑×(Gr(Γ))×(Θ)并赋予它乘积拓扑(由∑××的欧几里德拓扑给出)(Gr(Γ))和(Θ)). 显然,W6={}. 因为Θ很紧凑,(Θ)在弱拓扑下是紧的;∑和(Gr(Γ))也是紧凑的。因此,根据蒂乔诺·弗夫定理(见Aliprantis and Border(2006)),W在乘积拓扑下是紧的。W也是凸的。最后,W M×rca(Θ),其中M是| S |×|X |实值矩阵的空间,而rca(Θ)是具有弱拓扑的正则Borel符号测度的空间。空间M×rca(Θ)是局部凸的,有一个亚型{(σ,M,u)7族→ pf(σ,m,u)=| |(σ,m)| |+|'Ohmf(x)u(dx)|:f∈ C(Ohm)} (C)(Ohm) 是实值连续有界函数的空间和| |.| |被理解为光谱标准)。此外,我们还观察到(σ,m,u)=0对于所有的f(σ,m,u)=0∈ C(Ohm), thusM×rca(Θ)也是豪斯多夫。让T:W→ 2Wbe使得T(σ,m,u)=∑(`Qu)×IQ(σ)×(ΘQ(m))。注意如果(σ*, M*, u*) 是T的固定点,然后是m*这是一个伯克-纳什均衡。根据引理1,∑(·)是非空、凸值、紧值和上半连续的。因此,每∈ (Θ),∑(\'Qu)是非空的、凸值的和紧值的。此外,由于Qθ在θ中是连续的(通过正则性假设),那么‘Qu在u中是连续的(在弱拓扑下)。从第七题开始→ ∑(Q)是上半连续的,那么∑(`Qu)作为u的函数也是上半连续的。通过引理2,IQ(·)是非空的、凸值的、紧值的和上半连续的。

48
nandehutu2022 在职认证  发表于 2022-5-7 18:12:20
根据引理3和正则条件,对应关系ΘQ(·)是非空的、紧值的、上半连续的;因此,通信(ΘQ(·))是非空的,上半连续的(参见Aliprantis and Border(2006),定理17.13),紧致值的(参见Aliprantis and Border(2006),定理15.11),以及平凡的凸值的。因此,在乘积拓扑下,对应T是非空的、凸值的、紧值的(根据Tychono ff定理),以及上半连续的(参见Aliprantis and Border(2006),定理17.28);因此,它有一个闭合图(见Aliprantis and Border(2006),定理17.11)。由于W是局部Hausdorff空间的非空紧凸子集,因此根据Kakutani Fan-Glicksberg定理(见Aliprantis and Border(2006),推论17.55),T存在一个固定点。对于引理5的证明,我们依赖以下定义和主张。莱克*(m) =infθ∈KQ(m,θ)和let Θ是一个稠密集,对于所有θ∈^Θ,Qθ(s | s,x)>0表示所有(s,s,x)∈ S×Gr(Γ)使得Q(S | S,x)>0。这样一个集合^Θ的存在是基于正则性假设的。索赔B.假设限制→∞国民党- mk=0 a.s.-Pf。然后:(i)对于所有θ∈^Θ,limt→∞T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1) =X(s,X)∈Gr(Γ)EQ(·| s,x)hlogQ(s | s,x)Qθ(s | s,x)im(s,x)a.s.-Pf。(ii)对于Pf几乎所有h∞∈ H∞还有 > 0和α=(infΘ:dm(θ)≥KQ(m,θ)-K*(m) )/3,存在这样一种情况:尽管如此≥ T,T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)≥ K*(m) +α表示所有θ∈ {Θ:dm(θ)≥ }, 式中,dm(θ)=inf≈θ∈ΘQ(m)| |θ-~θ||.引理5的证明。必须表现出这种极限→∞Θdm(θ)ut(dθ)=0 a.s.-Pfover H.设K*(m)≡ KQ(m,ΘQ(m))。对于任何η>0,设η(m)={θ∈ Θ:dm(θ)<η},和^Θη(m)=∩ Θη(m)(集合^Θ在定义6的条件3中定义,即规则性)。我们现在证明u(η(m))>0。根据引理3,ΘQ(m)是非空的。根据^Θ的密度,^Θη(m)是非空的。

49
nandehutu2022 在职认证  发表于 2022-5-7 18:12:27
θ7的非空性与连续性→ Qθ,意味着存在一个非空的开集Uη(m)。通过全支持,u(η(m))>0。此外,注意任何 > 0,{Θ:dm(θ)≥ } 我很紧凑。这源于Θ的紧性和θ7的连续性→ dm(θ)(由引理3和极大值定理的一个应用给出)。{Θ:dm(θ)的紧性≥ } θ7的下半连续性→ KQ(m,θ)(见索赔人(iii))暗示infΘ:dm(θ)≥KQ(m,θ)=minΘ:dm(θ)≥KQ(m,θ)>K*(m) 。让α≡ (minΘ:dm(θ)≥KQ(m,θ)- K*(m) )/3>0。同样,让η>0被选择为kq(m,θ)≤ K*(m) 所有θ的+0.25α∈ η(m)(这样的η总是通过θ7的连续性存在→ KQ(m,θ))。设Hbe为H的子集,其中权利要求B中的陈述适用;注意pf(H\\H)=0。从今往后,fix h∞∈ H我们省略了h∞从记谱到减轻记谱负担。通过简单代数和dmis在Θ中有界这一事实,我们可以得出结论 > 0和某些特定的C>0,^Θdm(θ)ut(dθ)=Θdm(θ)Qθ(st | st-1,xt-1) ut-1(dθ)\'ΘQθ(st | st)-1,xt-1) ut-1(dθ)=Θdm(θ)Zt(θ)u(dθ)ΘZt(θ)u(dθ)≤  + C'{Θdm(θ)≥}Zt(θ)u(dθ)\'^Θη(m)Zt(θ)u(dθ)≡  + 猫()Bt(η)。式中Zt(θ)≡Qtτ=1Qθ(sτ| sτ-1,xτ-1) Q(sτ| sτ)-1,xτ-1) =expn-Ptτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)o、 因此,有必要表明Lim的支持→∞{exp{t(K)*(m) +0.5α)}At()} = 0(16)和lim inft→∞{exp{t(K)*(m) +0.5α)}Bt(η)}=∞. (17) 关于等式(16),我们首先表明→∞sup{Θ:dm(θ)≥}n(K)*(m) +0.5α)- T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1) o≤ 常数<0。为了证明这一点,请注意,根据权利要求B(ii),存在一个T,因此对于所有T≥ T,T-1Ptτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)≥ K*(m) +α,对于所有θ∈ {Θ:dm(θ)≥ }.

50
何人来此 在职认证  发表于 2022-5-7 18:12:31
因此,limt→∞sup{Θ:dm(θ)≥}nK*(m) +α- T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1) o≤ -α.因此,lim supt→∞{exp{t(K)*(m) +0.5α)}At()}≤ 林监督→∞sup{Θ:dm(θ)≥}出口(K)*(m) +0.5α)- T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)o=0。关于方程(17),通过Fatou引理和一些代数,可以证明Lim影响→∞exp{t(K)*(m) +0.5α)}Zt(θ)=∞ > 0(在θ上逐点)∈^Θη(m)),或等效地,lim inft→∞K*(m) +0.5α- T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)> 0.根据权利要求B(i),lim inft→∞K*(m) +0.5α- T-1tXτ=1logQ(sτ| sτ-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)= K*(m) +0.5α- KQ(m,θ)(θ上的点方向)∈η(m)。通过我们选择η,RHS大于0.25α,我们的预期结果如下。定理2的证明。对于任何人来说∈ S和u∈ (Θ),letx(s,u)≡ arg maxx∈Γ(s)E|Qu(·s,x)[π(s,x,s)]δ(s,u)≡ 貂皮∈Γ(s)\\x(s,u)nmax∈Γ(s)E|Qu(·s,x)[π(s,x,s)]- E\'Qu(·s,x)[π(s,x,s)]o^δ≡ 最大值分钟,微秒δ(s,微秒),0δ ≡ 最大值δ ≥ 0 |^δ - 2δ1 - δM≥ 0=^δ/M2+^δ/M,其中M≡ 麦克斯(s,x)∈Gr(Γ),s∈S |π(S,x,S)|。通过引理5,对于所有开集U ΘQ(m),limt→∞ut(U)=1 a.s.-Pfin H.也让gτ(H∞)(s,x)=1(s,x)(sτ,xτ)- Mστ(s,x | sτ)-1,xτ-1) 对于任意τ和(s,x)∈Gr(Γ)和h∞∈ H.序列(gτ)τ是一个鞅差,并通过与权利要求B中的证明类似的参数:limt→∞||T-1Ptτ=0gτ(h∞)|| = 上午0点-下午5点。让H*以H为背景,使所有H∞∈ H*以下内容适用:对于所有OpenSet U ΘQ(m),limt→∞ut(U)=1和极限→∞||T-1Ptτ=0gτ(h∞)|| = 0.注意pf(H\\H*) = 0.从今以后,fix和h∞∈ H*, 我们从符号中省略了它。我们首先确定∈ 智商(σ)。请注意- Mσ,Q[M]k≤ 公里- mtk+国民党- Mσ,Q[M]kwhere(s,x)7→ Mσ,Q[p](s,x)≡P~s,~x∈任意p的Gr(Γ)Mσ(s,x |s,~x)p(~s,~x)∈ (Gr(Γ))。通过稳定性,RHS中的第一项消失,因此有必要表明→∞||mt-Mσ,Q[M]| |=0。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-5 13:34