楼主: 大多数88
2258 71

[量化金融] Berk-Nash均衡:一个具有错误指定的代理建模框架 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-7 02:59:29
然后通过替换p、fi和σ得出主观分布qiθiis-i带pθi,fiθi,σ-iθiin方程(1)。如果玩家不遵守自己的支付,请参见在线附录E。与往常一样,上标-i表示第i个分量被排除在外的文件。为了简单起见,我们假设玩家知道自己信号的分布。在这种情况下,玩家理解其他玩家独立混合,但由于参数θi的不确定性,指数σ-iθi=(σjθi)j6=i,她可能有相关的信念,认为气θ是原始的,我们强调两点。首先,这个物体能很好地描述行为。第二,使用一般的主观分布可以产生更多的一般类型的误判,参与者甚至不必了解决定其支付相关后果的结构要素。我们对主观模型保持以下假设。假设1。尽管我∈ I:(I)Θiis是欧氏空间的紧子集,(ii)QiθI(yi | si,xi)作为θI的函数是连续的∈ Θifor all(一、四、十一)∈ Yi×Si×Xi,(iii)对于所有θi∈ Θi,存在一个序列(θin)ninΘisuch,limn→∞θin=θi,对于所有n,Qiθin(yi | si,xi)>0对于所有(si,xi)∈ Si×Xi,yi∈ fi(xi,X)-i、 ω)和ω∈ 补充(pOhm|Si(·| Si))。条件(i)和(ii)是用于定义统计学参数模型的标准条件(例如Bickel等人(1993))。条件(iii)有两个作用。首先,它保证存在至少一个参数值,将正概率附加到每个可行观测。特别是,它排除了可以被视为明显的误判的可能性,即主观模型的每个元素都将切萨罗概率附加到以正真实概率发生的事件上。

12
mingdashike22 在职认证  发表于 2022-5-7 02:59:32
其次,它在主观模型上引入了一个“丰富性”条件:如果某个可行事件被某个参数值排除,那么该参数值并不是孤立的,因为附近有一些参数值认为每个可行事件都是可能的。在第5节中,我们证明了均衡可能不存在,如果没有这个假设,稳态行为不需要以均衡为特征。2.2示例我们通过展示几个以前未集成到通用框架中的示例来说明环境。在使用单个代理的示例中,我们从符号中删除i下标。例2.1。需求未知的垄断者。垄断者面对需求y=f(x,ω)=φ(x)+ω,其中x∈ X是垄断者策略所选择的价格,如Fudenberg和Levine(1993年a)。Nyarko(1991)研究了例2.1的一个特例,表明纯策略中不存在稳态;Sobel(1984)认为存在类似于示例2.2的错误说明;Tverskyand Kahneman(1973)的故事激发了例子2.3;萨金特(1999年,第7章)研究了例2。4.Kagel和Levin(1986)、Eyster和Rabin(2005)、Jehiel和Koessler(2008)以及Esponda(2008)研究实例2.5。更多示例见Esponda和Pouzo(2014)。ω是分布为p的平均零激波∈ (Ohm). 垄断者观察到了令人震惊的情况,但没有观察到这种震惊。垄断者不观察任何信号,因此我们省略了符号中的信号。垄断者的报酬是π(x,y)=xy(即没有成本)。垄断者关于p和f的不确定性由参数模型fθ,pθ描述,其中y=fθ(x,ω)=a- bx+ω是需求函数,θ=(a,b)∈ Θ是一个参数向量,ω~ N(0,1)(即pθ是所有θ的标准正态分布)∈ Θ).

13
可人4 在职认证  发表于 2022-5-7 02:59:35
特别是,这个例子对应于在标记1中讨论的特殊情况,Qθ(·x)是平均值为a的正态密度- bx和单位方差。例2.2。非线性税收。一名特工选择了e off x∈ X等于成本c(X),并获得收入z=X+ω,其中ω是分布p的零平均冲击∈ (Ohm). 代理人纳税t=τ(z),其中τ(·)是一个非线性纳税计划。代理没有观察到任何信号,因此我们忽略了它们。agent观察y=(z,t)并获得payoffπ(x,z,t)=z- T- c(x)。她知道福利如何转化为收入,但没有意识到边际税率取决于收入。我们比较了两个捕捉这种错误的模型。在模型A中,代理人相信随机系数模型t=(θA+ε)z,其中边际税率和平均税率均等于θA+ε,其中θA∈ ΘA=R。在模型B中,代理人认为t=θB+θBz+ε,其中θBis是恒定的边际税率,θB=(θB,θB)∈ ΘB=R。在两种模型中,ε~ N(0,1)衡量计划的不确定方面(例如税率或抵免的变化)。因此,Qjθ(t,z | x)=Qjθ(t | z)p(z- x) 式中,Qjθ(·| z)是正态密度,模型j=a的平均θa和方差zin,模型j=B的平均θB+θBz和单位方差。例2.3。回归均值。教师观察学生的首字母缩写,并决定表扬或批评他,x∈ {C,P}。然后学生再次表演,讲师观察他的最终表演s。事实是,表演y=(s,s)是独立的标准正态随机变量。

14
kedemingshi 在职认证  发表于 2022-5-7 02:59:38
教师的报酬是π(x,s,s)=s- c(x,s),其中c(x,s)=κ| s |>0,如果s>0,x=c或s<0,x=P,在所有其他情况下,c(x,s)=0。函数c表示说谎(即,在形式上高于平均值的批评,f(x,ω)=(z(x,ω),t(x,ω)),其中z(x,ω)=x+ω和t(x,ω)=τ(x+ω)。没有必要假设一个平衡存在的Θa和ΘBare紧;同样的建议适用于示例2.3和2.4形式上,ω=(s,s),p是标准正态分布的乘积,y=f(x,ω)=ω。(低于平均水平的表现或赞扬)增加谎言的规模。因为讲师无法影响绩效,所以如果s>0,最好表扬,如果s<0,最好批评。然而,讲师不承认回归到平均值的可能性,并且认为s=s+θx+ε,其中ε~ N(0,1)和θ=(θC,θP)∈ Θ参数化她对绩效的感知影响。因此,假设Qθ(·| x)是平均s+θx和单位方差的正态密度,如果^s=s,则Qθ(^s,s | s,x)=Qθ(s | s,x),否则为0。例2.4。货币政策。两个参与者,ZF(G)和公众(P),即i={G,P},分别选择货币政策和通货膨胀预测。它们不观察信号,所以我们忽略了它们。通货膨胀率e和失业率U由=xG+εe(2)U=U确定*- λ(e)-xP)+εU,(3)其中U*> 0, λ ∈ (0,1)和ω=(εe,εU)∈ Ohm = 罕见的冲击,完全支持p分布∈ (Ohm) V ar(εe)>0。公众和ZF观察到了通货膨胀和失业,但没有观察到错误的术语。ZF的政策是π(xG,e,U)=-(U+e)。为了简单起见,我们关注ZF的问题,并假设公众有正确的信念,并选择xP=xG。

15
nandehutu2022 在职认证  发表于 2022-5-7 02:59:42
政府理解其政策xGa对通货膨胀的影响,但没有意识到失业是由意外的通货膨胀影响的:U=θ- θe+εU.(4)主观模型由θ=(θ,θ)参数化∈ 由此得出Qθ(e,U | xG)是方程(2)和(4)所暗示的密度。例2.5。与逆向选择交易。估价为v的买家∈ 卖方提交(投标)价格x∈ X和要价a∈ A、 分别。卖方的要价和买方的价值从p中提取∈ (A×V),所以Ohm = 允许回归到平均值的×VA模型是s=αs+θx+ε;在这种情况下,代理人将正确地了解到所有x的α=0和θx=0。拉宾和瓦亚诺斯(2010)研究了一个相关的设置,在该设置中,代理人认为冲击是自回归的,而实际上它们是i.i.d.形式上,ω=(εe,εU)和y=(e,U)=f(xG,xP,ω)由等式(2)和(3)给出。是状态空间。因此,买方是唯一的决策者。提交aprice后,买方观察y=ω=(a,v)并获得支付π(x,a,v)=v- 如果a≤ 否则为X和零。换句话说,买家会观察到完美的反馈,得到v-如果存在贸易,则为x,否则为0。在提供服务时,她不知道自己的价值或卖家的要价。她也没有观察到任何信号,所以我们忽略了它们。最后,假设A和V是相关的,但买方认为它们是独立的。这可以通过Qθ=θ和Θ=(A) ×(五) 。2.3平衡与真实模型的定义。在均衡状态下,我们将要求参与者的信念将概率1放在主观分布的集合上,而不是“最接近”客观分布的结果上。

16
大多数88 在职认证  发表于 2022-5-7 02:59:46
下面的函数,我们称之为玩家i的加权库尔贝克-莱布尔散度(wKLD)函数,是统计学中标准库尔贝克-莱布尔散度的加权版本(库尔贝克和莱布尔,1951)。它代表了在给定策略绩效σ的情况下,目标分布与i的结果之间的“距离”∈ ∑和θi参数化的分布∈ Θi:Ki(σ,θi)=X(si,xi)∈Si×XiEQiσ(·Si,xi)lnQiσ(Yi | si,xi)Qiθi(Yi | si,xi)σi(xi | si)pSi(si)。(5) 给定σ的游戏者i的最接近参数值的集合是集合Θi(σ)≡ arg minθi∈ΘiKi(σ,θi)。解释是Θi(σ) Θ是一组参数值,在观察到与策略文件σ一致的反馈后,我可以相信这是可能的。备注2。我们在第4节中展示了wKLD在贝叶斯学习模型中是正确的距离概念。在这里,我们为一个贝叶斯代理提供了一个启发式论证(为了清晰起见,我们去掉了i个下标),它的参数集Θ={θ,θ}在t个周期(sτ,xτ,yτ)t上观察数据-1τ=0,这来自于典型故事的反复播放,即有一群卖家,他们每个人都遵循要求估价的弱主导策略;因此,卖出价是卖方估值的函数,如果买方和卖方估值是相关的,那么卖出价和买方估值也是相关的。符号EQdenotes是关于概率分布Q的期望值。同样,我们使用的约定是-ln 0=∞ 0 Ln0=0。战略σ下的目标博弈。让ρ=u(θ)/u(θ)表示代理的先验比率。

17
可人4 在职认证  发表于 2022-5-7 02:59:50
应用贝叶斯规则和简单代数,t个周期后θ上的后验概率为ut(θ)=1+ρ∏t-1τ=0Qθ(yτ| sτ,xτ)Qθ(yτ| sτ,xτ)-1=1+ρ∏t-1τ=0Qθ(yτ| sτ,xτ)/Qσ(yτ| sτ,xτ)Qθ(yτ| sτ,xτ)/Qσ(yτ| sτ,xτ)-1=1+ρexp(-ttt-1Xτ=0lnQσ(yτ| sτ,xτ)Qθ(yτ| sτ,xτ)-tt-1Xτ=0lnQσ(yτ| sτ,xτ)Qθ(yτ| sτ,xτ)!)!-式中,第二个等式后面是乘以和除以∏t-1τ=0Qσ(yτ| sτ,xτ)。通过一个大数定律的论证,以及真正的联合分布(s,x,y)由Qσ(y | x,s)σ(x | s)pS(s)给出的事实,对数似然比的差异收敛于K(σ,θ)- K(σ,θ)。假设K(σ,θ)>K(σ,θ)。然后,对于非常大的t,后验信念ut(θ)大约等于1/(1+ρexp(-t(K(σ,θ)- K(σ,θ))),收敛到0。因此,后验概率最终为零。另一方面,如果K(σ,θ)<K(σ,θ),则后验概率最终为零。因此,后验结果表明,对于不使K(σ,·)最小化的参数值,概率为零。备注3。因为wKLD函数是由玩家自己的策略加权的,所以它不限制关于结果的信念,这些结果只会在失衡之后出现(超出了Θ施加的限制)。下一个结果收集了wKLD函数的一些有用属性。引理1。(i) 尽管我∈ 一、 θI∈ σi∈ ∑,Ki(σ,θi)≥ 当且仅当Qθi(·| si,xi)=所有(si,xi)的Qiσ(·| si,xi),且σi(xi | si)>0。(ii)就我而言∈ 一、 ΘI(·)是非空的、上半连续的、紧值的。证据见附录。Θi(·)的上半连续性将遵循极大值定理,前提是我们假设Qiθito对于所有可行事件和θi都为正∈ Θi,因为WKLD功能将是有限且连续的。

18
能者818 在职认证  发表于 2022-5-7 02:59:54
但在某些情况下,这种假设可能很强。假设1(iii)通过要求它保持Θ的稠密子集来削弱这个假设,并且仍然保证Θi(·)是上半连续的。例如,它排除了玩家认为其他人遵循纯粹策略的情况。最优性。在均衡状态下,我们将要求每个玩家根据自己的信念选择一种最佳策略。给定ui,玩家i的策略σi是最优的∈ (i)如果σi(xi | si)>0意味着xi∈ arg最大值xi∈谢琪ui(·思,\'xi)πi((R)xi,Yi)(6) 式中,\'Qiui(·| si,xi)=\'iQiθi(·| si,xi)ui(dθi)是层i的分布,条件是(si,xi)∈ Si×Xi,由ui诱导。平衡定义。我们提出以下解决方案概念。定义1。战略文件σ是博弈G的Berk-Nash均衡,如果,对于所有参与者i∈ 一、 有我∈ (i)使得(i)给定ui,且(ii)给定ui∈ (Θi(σ)),即如果^θiis支持ui,那么^θi∈ arg minθi∈ΘiKi(σ,θi)。定义1对均衡行为设置了两个限制:(i)优化假设;(ii)对信念的内生限制。为了进行比较,请注意,纳什均衡的定义与定义1相同,只是条件(ii)被替换为参与者有正确信念的条件,即“Qiui=Qiσ”。平衡的存在。这里不能使用纳什均衡的标准存在性证明,因为最佳响应对应的类似版本不一定是凸值的。为了证明存在性,我们首先扰动支付,并确定扰动博弈中存在均衡。然后我们考虑扰动对策的一系列均衡,其中扰动为零,并确定极限是(未扰动)对策的Berk-Nash均衡。证明的非标准部分是证明扰动博弈中均衡的存在性。

19
nandehutu2022 在职认证  发表于 2022-5-7 02:59:57
扰动的最佳响应对应仍然不一定是凸值的。我们的方法是将均衡描述为信念对应的一个固定点,并证明它满足Kakutani的执行点定理的广义版本的要求。扰动的概念和存在证明的策略可以追溯到Harsanyi(1973);Selten(1975)和Kreps and Wilson(1982)也分别用这些观点证明了完美平衡和序贯平衡的存在。定理1。每个博弈至少有一个伯克-纳什均衡。证据见附录。2.4示例:寻找伯克-纳什均衡示例2.1,接第6页。需求未知的垄断者。设σ=(σx)x∈Xdenote是一种策略,其中σxis是选择价格x的概率∈ 由于这是一个单主体问题,目标分布不依赖于σ;因此,我们用Q(·| x)来表示它,这是一个具有平均φ(x)和单位方差的正态密度。类似地,Qθ(·| x)是平均φθ(x)=a的正态密度- bx和单位方差。由方程(5)可知k(σ,θ)=Xx∈XσxEQ(·| X)(Y)- φθ(x))- (Y)- φ(x))=Xx∈XσX(φ(X)- φθ(x))。对于混凝土性,设X={2,10},φ(2)=34,φ(10)=2,和Θ=[33,40]×[3,3.5]。让θ∈ r为需求提供一个完美的函数,即φθ(x)=φ(x)表示所有x∈ 在这个例子中,θ=(a,b)=(42,4)/∈ Θ因此,我们说Monopolist有一个错误的模型。图1中的虚线描述了最优行为:最优价格在左边是10,在右边是2,而垄断者在虚线上的参数值是不同的。为了解决均衡问题,我们首先考虑纯策略。如果σ=(0,1)(即价格为x=10),则一阶条件K(σ,θ)/a=K(σ,θ)/b=0意味着φ(10)=φθ(10)=a- b10和任何(a,b)∈ 图1中AB段上的Θ使K(σ,·)最小。

20
能者818 在职认证  发表于 2022-5-7 03:00:00
然而,这些最小值位于虚线的右侧,在这里,将价格设置为10并不是最优的。因此,σ=(0,1)不是一个平衡。一个类似的论点证明σ=(1,0)不是一个均衡:如果是,则最小值将位于D,而实际上选择2的价格并不是最优的。最后,考虑混合策略。由于两个一阶条件不能同时保持,使K(σ,θ)最小的参数值位于Θ的边界上。一点代数表明,对于任何完全混合的σ,有一个唯一的极小值θσ=(Aσ,bσ),其特征如下。如果σ≤ 3/4,最小值在BC段上:特别是,需求函数的确定部分可以有任何函数形式,只要它通过(2,φo(2))和(10,φ(10))。CSlope=2Slope=10Θbaθ0最优价格=10最优价格=2DABθσ33.53340slope=2Slope=10Θbaθ0最优价格=10最优价格=2DABθσ*33.53340图1:需求函数不明确的垄断者。左面板:使给定策略^σ的wKLD函数最小化的参数值为θ^σ。右面板:σ*是伯克-纳什均衡(σ*给定θσ是最优的*—因为∑*位于差异线上,θσ*最小化给定σ的wKLD函数*).bσ=3.5,aσ=4σ+37K(σ,θ)/a=0。图1的左面板描述了一个示例,其中策略^σ下的唯一极小值θ^σ由K(^σ,·)等高线和可行集Θ之间的切线给出。如果σ∈ [3/4,15/16],那么θσ=C是Θ的东北顶点。最后,如果σ>15/16,最小值在分段DC上:aσ=40,bσ=(380)- 368σ)/(100 - 96σ)解K(σ,θ)/b=0。因为垄断者是混合的,所以最优性要求均衡信念θσ位于虚线上。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 17:18