楼主: 能者818
1944 46

[经济学] 离散博弈中多重均衡的可检验含义 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-4-24 18:04:03
为了实现这一想法,需要遵循以下顺序步骤:(1)利用特征分解恢复给定未观察到的异质性和均衡选择的成分CCPs,(2)估计成分CCPs的支付,以及(3)比较从不同CCPs计算的支付估计。前两个步骤涉及非参数估计,最后一个步骤需要从协变量中发展渐近性,为简单起见,让pi,m=E(Di,m)和pj,n=E(Dj,n),从C(Di,m,Dj,n)=E[(Di,m)开始计算- pi,m)(Dj,n- pj,n)]=E[(E(Di,m | Dj,n)- pi,m)(Dj,n- pj,n)],根据迭代扩张定律。进一步发展这个表达式,我们得到它是等式topj,n[E(Di,m | Dj,n=1)- E(Di,m)](1- pj,n)+(1- pj,n[E(Di,m | Dj,n=0)- E(Di,m)](0- pj,n)=pj,n(1)- pj,n[E(Di,m | Dj,n=1)- E(Di,m | Dj,n=0)]。如果协方差为零,则E(Di,m | Dj,n=1)- E(Di,m | Dj,n=0)=E(Di,m)。一种测试统计理论,可以解释前两步的估计误差。与Aguirregabiria和Mira(2019)不同,本文的目标不是完全识别具有未观察到的异质性和多重均衡的离散贝叶斯博弈。相反,我们的目标是在玩家信息通常相关的情况下,为多重均衡构建一个稳健的测试。其中包括但不限于Aguirragbiria和Mira(2019)中所考虑的情况,即球员的私人信号在同一层面上是独立的、未被观察到的异质性。此外,我们的方法易于实现。它规定了推断多重平衡的任务,作为非参数期望中离散协变量相关性的测试。

22
mingdashike22 在职认证  发表于 2022-4-24 18:04:09
因此,人们可以直接利用上述文献中的现有方法,使用核回归定义检验统计量,并描述其渐近性质。2.5数值例子在我们的模拟练习中,我们研究了选择之间的协方差是如何在不同的静态贝叶斯博弈设计与二进制选择之间变化的。我们首次报告了两名玩家{i,j}的游戏结果。在所有设计中,观察到的状态向量x∈ Rconsist是一个离散X,均匀分布在离散支撑{1,2,3,4}上,和一个连续X,标准均匀分布在[0,1]上。我们从选择动作1的玩家身上试验了三种特定的事后支付:特定1。βX+βX+δDj+i.规范2。βX+βX+βXX+βX+δDj+i.规范3。βX+βX+βXX+βX+β√X+δDj+i.每种设计中玩家j的事后支付以类似的方式指定,下标i和j在Dj和i中交换。斜率系数为β=1/4,β=1/5,β=1/10,β=-1/5, β= -1/10和δ=-2.ollowsa的一对私人信息分量是一个双变量正态分布,具有零均值、单位方差和相关系数ρ6=0。对于每种事后支付,我们分别用ρ=0.5和0.7的两种设计进行实验。对于每一个设计,我们求解多个纯策略,其特征是成对的阈值条件X。给定这些标准杆数值,并使用协方差的总法(条件平衡选择),我们可以计算迪村、Mand DJ、NFROM的游戏条件在状态X上的协方差。表1报告了迪村、Mand DJ、N之间的协方差,在X的支持下平均,用于数据生成过程的各种设计。这些协方差的符号与负相互作用效应δ<0一致。

23
能者818 在职认证  发表于 2022-4-24 18:04:16
随着数据生成过程远离单一平衡的零假设(φ=0,φ表示两个平衡之间混合的概率),这些协方差的大小也会增加。表1。2人玩游戏游戏ρ=0.5 0ρ=0.0ρ=0.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0366-0 0 0 0 0 0 0 0 0 0 0.0364-0 0 0 0 0 0 0 0.0364-0 0 0 0 0 0 0 0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0 6 6 6 6 6 6 6 6 6-0-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 6 6 6 6 6 6-0 0-0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0764-0.0976-0.0970-0.09280.5-0.0840-0.0835-0.0796-0.1017-0.1010-0.0966接下来,我们对有三名玩家的游戏进行了类似的调查,其中三名玩家被i、j、k索引。选择动作i的玩家1的后支付被指定为asXβi+δijDj+δikDk+k;同样,对于另外两个分别具有系数(βj,δji,δjk)和(βk,δki,δkj)的参与者j和k。私人信号(i,j,k)的向量是三元常模,均值和单位方差为零。相关系数为ρij=0.75和ρik=ρjk=0.8。为了简单起见,我们假设βi=βj,δki=δkj=-3.1,δik=δjk=-3.25和δij=δji=-所有设计均为0.95。因此,球员i和j在所有设计中都是事先相同的。观测状态X=(X,X)遵循与上述两个玩家情况相同的分布。我们还对三种指标Xβiin的事后支付进行了验证,其中βi=βj=(1.73,-0.97, 0.155, -0.16, -0.01)和βk=(1.91,-1.645, -0.295,0.29,0.75),其中五种成分对应于上述规范1-3中的(β,…,β)。与两个参与者的情况类似,我们的模拟使用DGPs在极端均衡之间进行混合(在Dk=1的阈值条件下),相邻的g ames共享相同的均衡选择。表2。

24
能者818 在职认证  发表于 2022-4-24 18:04:23
在3个玩家游戏中的协方差分析分析协方差分析的协方差分析在3个玩家游戏中的协方差分析在3个玩家游戏中的协方差分析(Dk,m,m,m,Dk,Dk,Dk,n)cov v(Dk,m,m,m,Dk,n)cov(Dk,m,m,m,d,Dj,n)cov v v v v v v v(Dk,m,m,m,m,m,m,d,Dj,n)n)n)n)v\\\\\\\\\\\\\\\\\\\\\\35\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\96-0.0733-0.05820.5 0.1226 0.1470.0 931-0.0725-0.0763-0.0606类似于两个玩家案例,这些协方差在状态空间上的平均值随着数据生成过程远离零假设而增加(也就是说,当φ在0和0.5之间增加时)。同类型玩家Dk、m、Dk、nis的协方差符号为正,而不同类型玩家之间的协方差符号为负。3.动态博弈多重均衡的检验文献中对具有私人信息的动态博弈进行了广泛的研究。例如,参见Aguirregabiria和Mira(2007年)、Bajari等人(2007年)、Pesendofer a和Schmidt Dengler(2008年)以及Arcidiacono和Miller(2011年)。与静态g ames的情况一样,样本中多个马尔可夫完美均衡的存在对基于条件选择概率的估计和推理提出了挑战。我们引入了不完全信息动态博弈中多重均衡的新检验方法,其中玩家的信息在任何给定的时间段内通过一个时间序列相关的未观察到的异质性进行关联。这个测试的想法与静态情况下的测试有关,因为它也相当于研究“相邻”游戏中的决策之间的相关性。

25
可人4 在职认证  发表于 2022-4-24 18:04:29
具体而言,在动态环境中,不同时段展示相邻游戏的角色,我们通过在不同时段但在同一动态游戏中匹配玩家,形成相邻的动作对。我们还注意到,如果一个人假设折扣因子为零,并将一个“簇”对应于一个这样的动态游戏(折扣因子为零),那么下面的想法可以用于静态游戏。虽然我们没有对三个或更多玩家的这种模式的分析结果,但这是Tone在具有战略替代(即负交互参数)的两人游戏中期望获得的结果。3.1 modelLet i表示一组玩家。每一次我∈ 我做了一系列离散的动作Di,t∈ D按时间段t=1,2。。。∞. 在每个周期t中,玩家i观察一个公共状态(Xt,ξt)和私人冲击i,t的向量≡ (di,t:d)∈ D) 。虽然样本中报告了Xt,但ξ是数据中未记录的时变离散未观测博弈异质性(DUH)。让Dt≡ (迪,t:i∈ 一) 和t≡ (i,t:i∈ 一) 对于每个t,玩家在t时的支付由实值函数πI(Dt,Xt,ξt,I,t)给出。在每个阶段,玩家都会同时做出选择,以最大化收益∞s=tβs-tπi(Ds,Xs,ξs,i,s)|xt,ξt,εi,to,其中β∈ (0,1)是所有玩家都知道的一个常数折扣因子。我们认为(Xt,ξt,t)遵循一个受控的一阶马尔可夫过程,其时间齐次转移密度h满足以下条件独立性:h(Xt+1,ξt+1,t+1 | Xt,ξt,t,Dt)=g(t+1 | Xt+1,ξt+1)f(Xt+1,ξt,Dt),其中私有信号独立于常见状态:g(491t,ξt+1,ξt+1)∈Igi(i,t+1 | Xt+1,ξt+1),其中gi(···,·)表示私有信号的条件边际密度。

26
能者818 在职认证  发表于 2022-4-24 18:04:36
请注意,这种过渡定律的规定允许当代私人信号i,t,j,t仅在Xt条件下通过未观察到的ξt进行关联。在下面的内容中,我们在xt,ξt,Di,t,dt和εi中增加时间下标t,以简化符号。设σi(x,ξ,εi)→ D表示玩家i采用的纯马尔可夫策略;让我们≡ (σi:i)∈ 一) 。设p(σ)i(d)-i | x,ξ)表示D的概率-我≡ (Dj:j)∈ I\\{I}=d-i当策略文件为σ时,i的信息条件(x,ξ);和letf(σ)i(x′,ξ′|x,ξ,di)≡除息的-ip(σ)i(d)-i|x,ξ)f(x′,ξ′|x,ξ,di,d-i) 根据i的信息表示过渡材料ix。如果玩家i在给定其他公司的σ策略的情况下,现在和未来表现最佳,那么让@V(σ)i(x,ξ,εi)表示玩家i的支付。根据贝尔曼最优性原理,V(σ)i(x,ξ,εi)=maxdi∈Dπ(σ)i(di,x,ξ,εi)+βZZ~V(σ)i(x′,ξ′,ε′i)gi(ε′i|x′,ξ′)dε′if(σ)i(x′,ξ′|x,ξ,di)dξ′dx′注:由于εi和εi之间的独立性,εiis不在i的信息集中-i条件on(x,ξ)。其中gi(εi | x,ξ)表示i的私有冲击和∏(σ)i(di,x,ξ,εi)的条件分布≡除息的-ip(σ)i(d)-i | x,ξ)πi(d)-i、 di,x,ξ,εi)是给定其他参与者在σ中的策略,i在时间t中的预期收益。将积分价值函数f或i定义为:V(σ)i(x,ξ)≡Z~V(σ)i(x,ξ,εi)gi(εi|x,ξ)dεi。对于给定的策略文件σ,积分值函数的特征是以下定点方程的唯一解:V(σ)i(x,ξ)=Zmaxdi∈Dπ(σ)i(di,x,ξ,εi)+βZ ZV(σ)i(x′,ξ′)f(σ)i(x′,ξ′|x,ξ,di)dξ′dx′gi(εi | x,ξ)dεi,十、∈ X.马尔可夫性能均衡(MPE)是策略σ的一种形式*对于任何i和(x,εi),σ*i(x,ξ,εi)=arg maxdi∈DΠ(σ*)i(di,x,ξ,εi)+βZ-ZV(σ)*)i(x′,ξ′)f(σ)*)i(x′,ξ′|x,ξ,di)dξ′dx′尽管我∈ I和(x,ξ,εI)。一般来说,该模型允许多个MPE。

27
nandehutu2022 在职认证  发表于 2022-4-24 18:04:42
我们的目标是检验一个无效假设,即数据生成过程是由单个MPE合理化的。3.2检测多个均衡考虑由大量独立动态博弈组成的样本。对于每个游戏,样本报告在一定数量的周期ST=1,2。。。,T我们对数据生成过程保持以下假设。假设7在每个游戏中,玩家遵循固定的MPE策略*在所有时间段t=1,2。。。,T为了X席思想,考虑一个没有状态XT的Simuli模型。在这种情况下,MPE是一组函数(σi:i∈ 一) ,每个σI从(ξt,I,t)映射到Di,t。设M表示模型允许的离散和有限MPE集,设M≡ #M表示它的基数。平衡选择机制φ(·)是一个概率质量函数,它可以通过验证Blackwell充分条件来显示,对于任何给定的i和σ,右手边是积分值函数函数函数空间中的收缩映射。支持度M。K表示ξt的支持度的基数,λ(·)表示ξt的概率质量。让我们将参与者集I划分为IA∪IB和定义≡ (DA,t,DB,t)有DA,t≡ (Di,t)i∈IADB,t≡ (Dj,t)j∈IB.让δA≡ (#D)#Ia和δB≡ (#D)#ib表示DA,tandDB,tIn的支撑的基数。接下来,让p和pξ表示m和ξ在各自支撑上的总和。利用全概率定律,分解DtasP(Dt)=Xm|(m)hXξλ(ξ)Pm(DA,t,DB,t |ξ)i(11)=Xm,ξ|(m)λ(ξ)Pm(DA,t |ξ)Pm(DB,t |ξ),其中Pm(·|ξ)表示单个MPE m隐含的条件概率质量∈ 关于ξ的条件。为了方便起见,设{ωj}j=1,。。,离散向量(m,ξt)联合支撑的Jdenote元素。通过构造,J≡ 让θj≡ Pr{(m,ξt)=ωj}。

28
可人4 在职认证  发表于 2022-4-24 18:04:48
在矩阵表示法中,(DA,t,DB,t)的联合概率质量用p表示≡qA,1··qA,J|{z}QAθ0 0...0θJ|{z}∧q\'B,1。。。q′B,J|{z}=Q′BXjθjqA,jq′B,j,(12)其中qA,jis aδa-by-1列向量{Pm(DA,t=a|ξt):a∈ DA},其中(m,ξt)=ωj,qB,jis aδB-by-1列向量{Pm(DB,t=B|ξt):B∈ 假设8min{δA,δB}>MK;Qabhave和QBhave都是全军衔。秩条件要求条件选择概率inP的向量不是t线性相关的。这种情况在具有离散的、未观测到的异质性的结构模型中很常见。例如,Hu(2008)中的假设2.1和2.2使用这种秩条件来识别具有误分类错误的一般非线性模型。Hu和Shum(2012)中的假设2使用这些条件来识别具有未观测状态变量的动态模型。在这两种情况下,秩条件通常被引入λ(·)不需要是时间齐次的。为了简化符号,我们抑制了这种依赖性。确保混合模型中各成分分布之间的线性独立性。在我们的案例中,这种等级条件基本上排除了病理学,其中,以未观察状态为条件的选择概率是彼此的线性组合。在第3.6节中,我们提供了在MPE中满足这些秩条件的数值示例。我们的计算验证了假设8的普遍适用性,即模型参数的连续变化几乎肯定意味着满足秩条件的均衡选择概率。当参与者的数量或选择的数量相对于支持未观察到的异质性和均衡的基数较大时,这种条件更容易保持。例如,M=2,K=4,玩家面临3个选择。那我们就需要A组和B组各两名球员。

29
能者818 在职认证  发表于 2022-4-24 18:04:56
在接下来的小节中,我们将研究参与者和/或替代者数量不够大的情况。在假设8下,P是一个有限的混合物,每个组分都是秩一矩阵qA,jq′B,jand和wj给出的混合权重。假设8还意味着,不可能将δA×δb矩阵P分解为其他观测上等效的、成分较少的有限混合物。因此,在维持的条件下,MK通常可以被定义为P的秩。接下来,构造一个跨越两个周期的#(I)-行动向量Dt≡ (大卫·t-1分贝,t+1)。通过构造,dt和dt的支持度都是D#I,基数δAδB=(#D)#I.稍微滥用符号,让λm(ξ,ξ′)≡ Pr{ξt=ξ,ξt+1=ξ′|m}表示时变且连续相关的DUHξ和ξt+1的概率质量,包含在由m索引的单个MPE中∈ M设Pm(·|ξ,ξ′)表示给定的CCP,其中ξt=ξ,ξt+1=ξ′隐含在单个MPE中。类似地,设{ωj}j=1,。。,J′表示离散向量(m,ξt,ξt+1)的联合支撑元素。通过构造J′≡ MK.(~Dt,Dt)isP(~Dt,Dt)=Xm,ξ,ξ′(m)λm(ξ,ξ′)Pm(~Dt,Dt|ξ,ξ′)的接合概率质量,其中Pm(~Dt,Dt|ξ,ξ′)=Pm(DB,t+1,DA,t)-1,Dt|ξ,ξ′)=Pm(DB,t+1|Dt,DA,t-1,ξ,ξ′)Pm(Dt|DA,t-1,ξ,ξ′)Pm(DA,t-1|ξ,ξ′)=Pm(DB,t+1|ξ′)Pm(Dt|ξ′,ξ)Pm(DA,t-1|ξ). (13) 为了看到这一点,我们可以编写一个替代分解P=Q^∧∧^Q′,其中∧是一个维数为J<MK的对角矩阵。这意味着P的秩远小于MK。另一方面,假设8和(12)意味着P必须具有满秩J=MK。

30
何人来此 在职认证  发表于 2022-4-24 18:05:02
矛盾上述最后一个等式使用了上述假设的几个含义:(i)Di,由每个MPE中的(ξt,i,t)确定;(ii)i,它独立于(s,ξs)s的过去历史≤T-(iii)ξt+1独立于过去(ξs,s)s≤T-1onceconditional onξt.Let@P表示δaδB×δaδB矩阵,该矩阵总结了(@Dt,Dt)的联合概率质量,行表示@Dt的实现,列表示Dt的实现。设∧θj≡ Pr{(m,ξt,ξt+1)=ωj}。在矩阵表示法中,~P≡~q···~qJ′|{z}Q~θ0 0...0~0θJ′|{z}∧q′。。。q\'J\'|{z}=Q′Xj@θj@qjq′j,(14)其中@qjis aδaδB-by-1列向量{Pm(DA,t-1=dA|ξt=ξ)Pm(DB,t+1=DB|ξt+1=ξ′):(dA,DB)∈ D#I},其中(m,ξ,ξ′)=ωj;qjis aδaδB-by-1列向量{Pm(Dt=d|ξt=ξ,ξt+1=ξ′):d∈ D#I}和(m,ξ,ξ′)=ωj。假设9#Q和Q都有满秩MK。与假设8类似,这是对选择概率条件DUHξ和平衡指数m的限制。还注意到,通过构造,min{δA,δB}>MK意味着δAδB>MK。根据麻原彰晃和岛津(2016)的说法,MK一般等同于维持条件下δAδB乘以δAδB平方矩阵@P的秩。因此,M和K都是从MK=rank(P)和MK=rank(~P)的知识中识别出来的。DGP中的平衡基数被视为[rank(P)]/rank(~P)。命题3假设假设假设7、8和9在具有上述先验信息的动态博弈中成立。然后,数据生成过程中的MPE数量为[rank(p)]/rank(~p)。为了使这种方法发挥作用,我们必须选择对历史进行划分,并将重点放在≈dt和≈P的jo int概率质量上。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 03:37