楼主: nandehutu2022
1905 60

[量化金融] 非近视代理是否会发生信息级联? [推广有奖]

51
能者818 在职认证  发表于 2022-6-14 16:09:14
这意味着r=1的两种类型的玩家也会玩γ*= 0.对于y≥ -1,一个x=1的玩家是不同的或更喜欢全买δ≤ 因此,她可以决定购买-1.≤ y≤ 此外,我们还可以有γ*= φ[1,y,N]=y=-2,因为x=1的球员打成平局。2020年3月10日x=-1和r=0总是喜欢等待或对-1.≤ y≤ 1(她预期的即时回报要么为负,要么为零),因此她可以决定等待-1.≤ y≤ 对于x=-1和r=1表示-1.≤ y≤ 0。对于y=1,x=-1和r=1具有正的预期即时回报,因此她喜欢等待还是购买取决于δ。因为我们知道,当y=1时,x=1且r=1的玩家的行为是购买,所以y=1且r=1的策略应该是1或I。请注意,此策略不会影响其他州玩家的决策(y>1的州无法达到此策略,y<1的解也不取决于y=1时的策略,正如我们刚刚证明的那样)。因此,可根据FPE 3单独确定。接下来我们必须证明策略γ*= φ[r,y,w]=1是y的解≥ 2和所有w和r。根据引理3,如果策略文件为γ*= φ[r,y,w]=1,对于对策的某些状态s=(x,r,y,w),我们有γ*= φ[r,y,w]=1对于所有w>w(这是该定理中建议的策略文件中的情况),然后在所有可从s到达的终止状态(见引理3的证明),代理玩家购买产品。因此,玩家要么漠不关心(δ=1),要么严格倾向于购买(δ<1),并且完成了策略γ的证明*= φ[r,y,w]=1是y的解≥ 2,所有w、r和所有δ≤ 1.附录G定理5的证明我们首先证明定理的第四部分。

52
能者818 在职认证  发表于 2022-6-14 16:09:18
对于y≤ -2,r=0且x=1和x=-另一方面,根据引理3的证明,当γ*= φ(r,y,w)=0。因此,均衡策略不会同时购买x和soγ的值*= φ(r,y,w)=0是y的唯一解≤ -2、对于y≥ 0时,x=1的瞬时奖励为正,因此,γ*= φ(0,y,w)=0(导致值函数为0)不能是均衡策略。第五部分是显而易见的,因为在y=0时,x=-当x=1时为正。因此,γ*= φ[0,0,w]=0 norγ*= φ[0,0,w]=1可以是FPE 3的解。因此,如果一个解存在,我们知道它存在,我们必须有γ*= φ(0,0,w)=I。现在我们证明第六部分。对于一些平衡策略和一些w和y,γ*= φ[0,y,w]=I或γ*= φ[0,y,w]=1,我们不能有γ*= φ[0,y,w]=0,对于w6=w和y 6=-原因是如果forw6=w,我们有γ*= φ[r,y,w]=0,赋值函数Ua(x,0,y,w)=0,如引理3的证明所证明。另一方面,由于γ*= φ[0,y,w]=I或γ*= φ[0,y,w]=1,我们知道qy+1-1qy+1+1>0,对于y 6=-因此,当r=0,y,wis为正,因此γ时,对x=1的玩家的即时奖励为正*= φ[0,y,w]=0不能是均衡策略。因此,γ*= φ[0,y,w]=I或γ*= φ[0,y,w]=1不能与γ一起发生*= φ【0,y,w】=0,对于相同的y。因此,它是γ*= φ[0,y,w]=0或γ的任一项*= φ[0,y,w]=I或γ*= φ[0,y,w]=1,对于所有的w。第七部分通过使用第四部分和引理3来证明。正如我们在引理3中所看到的,一个x=1的玩家在购买和等待y之间是漠不关心的≥ -1,其中包括y=-这意味着她总是可以决定给你买东西≥ -1.

53
何人来此 在职认证  发表于 2022-6-14 16:09:21
另一方面,x=-1有负即时奖励,她不应该在2020年3月10日在y=-因此,由于x=1的玩家的预期奖励为0,因此*= φ[0, -1,w]=I和γ*= φ[0, -1,w]=0可以是所有w的解。我们可以用类似的方式证明第八部分。x=1且r=1的玩家在y=-2,因为即时奖励为0。另一方面,x=-1 andr=1倾向于在y=-2因为她的即时回报是负的,因此*= φ[1, -2,w]=Iandγ*= φ[1, -2,w]=0是解决方案。第三部分是第四部分和第七部分的直接结果。为了证明第一部分,充分证明如果γ*= φ[r,y,w]=I,解是一个阈值策略wrt w,y<y,然后是γ*= φ[r,y,w]=I是w<w的解(注意,它可能不是唯一的情况,我们讨论的是存在性。因此,如果解不是这种类型的,我们可以构造这种类型的解,后面会解释)。假设对于状态s=(x,r,y,w),我们有γ*= φ[r,y,w]=I。这意味着x的瞬时回报=-1在y不超过玩家将购买的终止状态下不购买的预期估值,即奖励的平均值;0在玩家决定不购买产品的终止状态下(见引理3的证明)。不购买决策的最终状态越有可能,不购买的即时回报和预期估值之间的差异就越大。因此,对于具有相同即时奖励的两种不同状态,即相同的y,我们可以比较它们的终止状态,以了解玩家在这两种状态下的决定。当w<w时,考虑s=(r,y,w)。

54
可人4 在职认证  发表于 2022-6-14 16:09:25
由于解决方案是y<y的阈值策略w,很明显,对于玩家决定不购买产品的状态s的每个终止状态sj,该状态s有一个对应的状态sj,其发生的可能性至少与sj相同(有更多玩家可以显示其私人信号并改变状态)。在sj,玩家有机会决定不购买该产品,或稍后决定该产品是否对她有利(这意味着sj可能不是s的终止状态)。在这两种情况下,不在sis买入的估值至少与在s买入的估值一样好,因此,如果在s买入的估值不低于即时回报,则对stoo而言必须为真。因此,如果γ*= φ[r,y,w]=I,我们可以得到γ*= φ[r,y,w]=I表示w<w。如果解不是这种类型,我们可以构造如下策略。根据这个定理的其他部分,我们知道解可以是γ*= φ[r,y,w]=0表示y≤ -2,所有r和w,以及γ*= φ[r,y,w]=I,r=0,-1.≤ y≤ 0和所有w,对于r=1,-1.≤ y≤ 0和所有w。因此,无论其他解决方案是什么,我们都可以将其更改为上述战略文件。接下来,我们从y=1开始,我们知道解决方案是y<y的阈值策略。从w=N开始,逐步返回hr=0和r=1,我们可以更改所有解决方案γ*= φ[r,y,w]=1到γ*= φ[r,y,w]=所有w<w的I,因此溶液为γ*= φ[r,y,w]=I。

55
kedemingshi 在职认证  发表于 2022-6-14 16:09:28
通过这种方式,我们构建了一个战略文件,它是FPE 3的阈值策略wrt wand解决方案。现在我们将注意力限制在阈值策略wrt w的均衡策略上,并证明每当γ*= φ[0,y,w]=1,那么我们必须有γ*= φ[0,y,w]=1,对于所有y>y和γ时*= φ[0,y,w]=我们必须有γ*= φ[0,y,w]6=0,对于所有y>y。类似于该定理第六部分证明中的参数,每当γ*= φ[0,y,w]=I,瞬时回报对于x=1是正的,如果我们有γ*= φ【0,y,w】=0,估值将为0,而即时2020年3月10日Yi的DRAFTreward大于y,因此为正值。因此,我们不能有γ*= φ[0,y,w]=0作为解。为了证明当γ*= φ[0,y,w]=1,那么我们必须有γ*= φ[0,y,w]=1对于所有y>y,weassume这不是真的,因此,我们有一个γ*= φ[0,y,w]=1和γ*= φ[0,y+1,w]=I。在这种情况下,x=-1在y+1时,选择不买而不是买,这意味着- 1季度+1≤δNUa(-1,1,y,w+1)+δN(N- w- 1) Una公司(-1,0,y,w+1)+δNwUna(-1,1,y,w+1),(53)自γ起*= φ[0,y,w]=1,我们知道γ*= φ[0,y,w+1]=1,因此,根据定理4的证明,Ua(-1,1,y,w+1)=qy-1qy+1,Una(-1、0、y、w+1)≤qy公司-1qy+1和Una(-1、1、y、w+1)≤qy公司-1qy+1意味着对于δ<1,qy-1qy+1<qy-问题1,这是一个矛盾。接下来考虑r=1。我们首先证明了玩家在s=(x,0,y,w)和=(x,1,y)状态下的决策之间的关系- 1,w+1)。假设γ*= φ【0,y,w】=I。

56
mingdashike22 在职认证  发表于 2022-6-14 16:09:31
就是这个意思-1.- 1季度-1+ 1≤δNUa(-1,1,y- 1,w+1)+δN(N- w- 1) Una公司(-1,0,y- 1,w+1)+δNwUna(-1,1,y- 1,w+1),(54)另一方面,如果我们写x的固定点=-1,r=1,y- 1,w+1,我们有γ*(-1) =参数最大值δNUa(-1,1,y- 1,w+1)+δN(N- w- 1) Una公司(-1,0,y- 1,w+1)+δNwUna(-1,1,y- 1,w+1),qy-1.- 1季度-1+ 1. (55)根据(54),我们可以说上述固定点的解决方案是买不到的。因此,每当γ*=φ[0,y,w]=I,我们可以得到γ*= φ[1,y-1,w+1]=I。同样,根据引理3,当γ*= φ[0,y,w]=1和γ*= φ[0,y,w]=1,对于w>w,我们必须有γ*= φ【1,y,w】=1。这都意味着,每当我们有一个解决方案,即r=0的阈值策略wrt y时,该解决方案也可以是r=1的阈值策略wrt y。附录H定理6的证明如果Yt在所有t>t的概率为1的情况下保持不变,那么这是定义的信息级联,因为Yt汇总了所有披露的私人信息。因此,“yi”的吸收态是信息级联。我们已经证明了一些“Yi=yL”≥ Yminand?Yi=年≤ Ymaxare吸收。yL和yr的值均与N无关。\'Yiarep+(1)的跃迁概率-p) qyqy+1用于向右移动和1-p+pqyqy+1向左移动,因此它们也与N无关。我们得出结论,吸收时间的分布(特别是预期和方差)与N无关。因此,对于足够大的N,吸收时间大于mn的概率为零。该吸收时间计算在恢复i的数量中。我们得出结论,在恢复mn之前发生级联的概率接近1,即N→ ∞.2020年3月10日DRAFTNow假设φ[r,y,w]=1意味着φ[r,y,^w]=1表示^w>w。

57
nandehutu2022 在职认证  发表于 2022-6-14 16:09:35
表示轮到MN的次数,其中表演选手N的rnt=1或bnt=1乘以R(MN),R(MN)由p=MN和MNtrials sinceP(Yt+1=Yt | wt)=wtN的一个随机分布变量控制≤MNN。(56)因此,我们从[33,定理A.1.11]得到,对于所有N>0PR(MN)≤MNN公司+√≤ e-NMN公司+√NMN。(57)因此,我们得出结论,在高概率情况下,至少MN- 第一轮中有2人是zn=0的球员。假设依次t<MN- 2该演员没有透露自己的私人信息。o如果她等待,那么wt+1=wt和yt+1=yt。zn=0的下一个玩家也将等待,因为她使用相同的策略γ*= φ[r,y,w]。o如果她买了,那么wt+1=wt+1和yt+1=yt。zn=0的下一个表演玩家也将购买forxn=-1,1(且不显示),因为wt+1>wt。相同的论点适用于所有后续zn=0的玩家,并且从定义到zn=1的玩家,因此发生级联。定理7的附录I根据引理3,y的解是显而易见的≤ -2,对于δ=1和δ<1。根据引理3的证明,我们也知道w=N和所有δ的解。对于w=N,这意味着r=1,我们必须有γ*= φ[r,y,w]=1表示y≥ 此外,由于y=0,1,对于x=1且x=-1分别为正和非正,我们可以得到γ*= φ[r,y,w]=I作为解。这证明了δ=1情况的第一、第三和第四部分,以及δ<1情况的第一和第五部分(w=N)。接下来,考虑δ=1情况的第二部分。根据引理3,一个x=1且所有r和w<的玩家在购买和不购买y之间无所谓≥ -因此,她可以决定购买。另一方面,x=-1与y+w无关≥ 所以她可以决定不为这些州购买。

58
能者818 在职认证  发表于 2022-6-14 16:09:38
另一方面,如果所提出的策略是FPE 3的解,那么从y+w<N的状态,x=-1可以达到负y(-1或-2)的终止状态,在该状态下,她严格不愿意购买(这可以通过跟踪从y、w到y可以达到的状态来证明-1,w+1,通过策略γ每次显示*= φ[r,y,w]=I)。因此,对于δ=1,x=-1严格选择等待y+w<N和sostrategyγ*= φ[r,y,w]=I可以是y的解≥ -1和w<N。这就完成了δ=1情况的证明。现在考虑δ<1。与δ=1的情况具有相同的参数,因为x=1的玩家对y无所谓≥ -1和δ=1,如果δ<1,她更愿意购买(她因等待而失去估值,没有任何收获)。同样,一个x=-1严格选择y+w购买≥ N和w<N。因此,策略γ*= φ[r,y,w]=1可以是y+w的解≥ N和w<N。对于y的其他州≥ -1,w<N,y+w<N,一个x=-1严格地倾向于等待δ=1,因此,存在较大的2020年3月10日起征量δ<1,因此该玩家仍然倾向于等待,因此,γ*= φ[r,y,w]=I可以是y的解≥ -当δ<1足够大时,w<N和y+w<N。此外,对于w=N- 这就完成了这个定理的证明。参考文献【1】A.V.Banerjee,“羊群行为的简单模型”,《经济学季刊》,第107卷,第3期,第797-8171992页。[2] S.Bikhchandani、D.Hirshleifer和I.Welch,“作为信息级联的时尚、时尚、习俗和文化变化理论”,《政治经济学杂志》,第992-10261992页。[3] L.Smith和P.Sorensen,“观察学习的病理结果”,《计量经济学》,第68卷,第2期,371-3982000页。[4] D.Acemoglu、M.A.Dahleh、I.Lobel和A。

59
大多数88 在职认证  发表于 2022-6-14 16:09:47
Ozdaglar,“社交网络中的贝叶斯学习”,《经济研究评论》,第78卷,第4期,第1201-12361011页。[5] T.N.Le、V.G.Subramanian和R.A.Berry,“信息与噪声级联”,《IEEE网络信号和信息处理交易》,第3卷,第2期,第239-251页,2017年6月。[6] B.C,elen和S.Kariv,“不完全信息下的观察学习”,《游戏与经济行为》,第47卷,第1期,第72-862004页。[7] G.Schoenebeck、S.-T.Su和V.Subramanian,“带问题的社会学习”,摘自《网络经济》2019年第19期。[8] V.Bala和S.Goyal,“向邻居学习”,《经济研究评论》,第65卷,第3期,第595-621页,1998年。[9] E.Mossel和O.Tamuz,“使共识易于处理”,《ACM经济学与计算交易》(TEAC),第1卷,第4期,第202013页。[10] E.Mossel、A.Sly和O.Tamuz,“贝叶斯社会网络的渐近学习”,《概率论和相关领域》,第158卷,第1-2期,第127-157页,2014年。[11] ——,《战略学习与社交网络拓扑》,《计量经济学》,第83卷,第5期,第1755-17942015页。[12] M.Harel、E.Mossel、P.Strack和O.Tamuz,“关于社会学习的速度”,arXiv,技术代表,2014年。[13] A.Jadbabaie、E.Mossel和M.A.Rahimian,“贝叶斯群体决策:算法和复杂性”,arXiv,技术代表,2017年。[14] K.Dasaratha、B.Golub和N.Hak,“动态环境中的社会学习”,arXiv,技术代表,2018年。[15] B.C,elen和S.Kariv,“区分信息级联与实验室羊群行为”,《美国经济评论》,第94卷,第3期,第484-4982004页。[16] A.Guarino、H.Harmgart和S.Huck,“聚合信息级联”,《游戏与经济行为》,第73卷,第1期,第167-1852011页。[17] H.Herrera和J.H¨orner,《有偏见的社会学习》,《游戏与经济行为》,第80卷,第131-146页,2013年。[18] A.瓜里诺和P。

60
可人4 在职认证  发表于 2022-6-14 16:09:50
Jehiel,“粗略推断的社会学习”,《美国经济杂志:微观经济学》,第5卷,第1期,第147-742013页。[19] M.H.DeGroot,“达成共识”,《美国统计协会杂志》,第69卷,第345号,第118-121页,1974年。[20] G.Ellison和D.Fudenberg,“社会学习的经验法则”,《政治经济学杂志》,第101卷,第4期,第612-6431993页。[21]-,“口碑传播和社会学习”,《经济学季刊》,第110卷,第1期,第93-125页,1995年。【22】P.Molavi、A.Tahbaz Salehi和A.Jadbabaie,“非贝叶斯社会学习的基础”,哥伦比亚商学院研究论文第15-95号,技术代表,2017年。[在线]。可用:https://ssrn.com/abstract=2683607【23】A.Jadbabaie、P.Molavi、A.Sandroni和A.Tahbaz Salehi,《非贝叶斯社会学习》,《游戏与经济行为》,第76卷,第1期,第210-225页,2012年。[24]Y.Peres、M.Z.Racz、A.Sly和I.Stuhl,“信息级联有多脆弱?”arXiv,技术代表,2017年。【25】A.Nedi\'c、A.Olshevsky和c.A.Uribe,《分布式(非贝叶斯)学习教程:问题、算法和结果》,2016年IEEE第55届决策与控制会议(CDC)。IEEE,2016,第6795–6801页。[26]I.H.Lee,“关于信息级联的融合”,《经济理论杂志》,第61卷,第2期,第395-4111993页。【27】W.Hann Caruthers、V.V.Martynov和O.Tamuz,“顺序渐进学习的速度”,《经济理论杂志》,第173卷,第383-4092018页。[28]D.Vasal和A.Anastasopoulos,“动态博弈中的分散贝叶斯学习”,Arxiv,技术代表,2016年。[在线]。可用:http://arxiv.org/abs/1607.06847March10,2020年草案【29】D.Fudenberg和J.Tirole,“完美贝叶斯均衡和顺序均衡”,《经济理论杂志》,第53卷,第2期,第236-260页,1991年。【30】D.Vasal和A。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-16 16:25