楼主: nandehutu2022
1852 60

[量化金融] 非近视代理是否会发生信息级联? [推广有奖]

21
kedemingshi 在职认证  发表于 2022-6-14 16:07:24
对于每n∈ N、 x∈ {-1,0,1}N,b∈ {0,1}我们计算γ*= θ【n,~x,b】如下o如果bn=1,则γ*= 0.o如果bn=0,则γ*是以下方程组的解,xn公司∈ Xγ*(xn)=参数最大值qPmexm-exn+xn- 1qPmexm-exn+xn+1 |{z}1=“购买”,δNNXn=1Vnxn,n,~F(~x,γ*, 0,n),b| {z}0=“不买”(21a)其中该值适用于所有m∈ N满足度vm(xm,N,~x,b)=(21b)0,bm=1δNPNn=1Vmxm,n,~F(~x,γ*, 0,m),b, bm=0,n=m,γ*(xm)=0qPmexm- exm+xm-1qPmexm- exm+xm+1,bm=0,n=m,γ*(xm)=1δNPNn=1EhVm(xm,n,~F(~x,γ*, γ*(Xn),n),b-nBn)i,bm=0,n 6=m,(21c),其中(21b)中的期望值与RVs x和BnwithP(Xn=Xn,Bn=b0n | xm,n,x,b)=P(Bn=b0n | Xn=Xn,xm,n,x,b)P(Xn=Xn=Xn | xm,n,x,b),(21d)其中P(Bn=1 | Xn=Xn=Xn,xm,n,n,n,x,b)=1,如果bn=1或γ*(xn)=10,否则,(21e)和p(xn=xn | xm,n,~x,b)=xn(xn),如果 xn6=0Q(xn|-1) +Q(xn | 1)qPmexm- exm+xm1+qPmexm- exm+xm,如果▄xn=0。(21f)下一个定理通过证明FPE 2等价于FPE 1来结束本节。定理2。如果存在FPE 2的解,则FPE 1的解可以用引理2中给出的∧x和π之间的对应关系来构造。2020年3月10日绘图证明:结果表明,π可以使用ex计算。特别是,使用引理2中的(20)和(15a)中的(14),我们替换πpr(1 | xn)=qPmexm-exn+xn1+qPmexm-exn+xn。(22)类似地,使用引理2的(18),在(15f)中我们得到(21f)。请注意,上述替换使得值函数Vm(·)的域是有限的,尤其是尺寸为2×N×3N×2N的域。五、 通过二次维FPE计算PBE在本节中,我们利用问题的结构进一步简化FPE 2。这种简化分两步完成。第一步产生的FPE值函数的域随N多项式增长,尤其是~ N

22
大多数88 在职认证  发表于 2022-6-14 16:07:27
然而,为了完整起见,我们仅在附录C中给出此结果。第二步是对策略和值函数进行更剧烈的简化,其域仅随N二次增长。这种简化的关键在于,玩家的索引对玩家预计通过等待获得的未来回报没有影响。由于ex包含此信息,因此可以将其减少为下面定义的两个数量。定义4。确定聚合状态信息asyt=NXn=1exnt∈ Y={-NN}。(23)此外,将球员n透露其私人信息的指标定义为rnt=| xnt |。使用znt=max{rnt,bnt},确定在t回合后无法透露其私人信息的玩家数量,bywt=NXn=1znt∈ W={0,…,N}。(24)由于bn=1的玩家的价值函数和策略明显为0和γ*= 分别为0,我们只支持bn=0且从状态变量中删除bn的玩家。我们定义了函数Ua:X×{0,1}×Y×W→ R和Urna:X×{0,1}×Y×W→ Rr∈ {0,1}如下所示。Ua(x,r,y,w)是演技演员n的值函数,其私人信息为xn=x,她揭示了如果r=1,上述状态变量为(yt,wt)=(y,w)。

23
可人4 在职认证  发表于 2022-6-14 16:07:30
类似地,U▄rna(x,z,y,w)是非活动层m的值函数,其私有信息为xm=x,她已经揭示了如果▄r=1,则扮演者n可以在z=0时公开其私有信息,而y,w与之前一样。2020年3月10日草案最后,定义更新函数Gr、Gz、Gy、Gwas followsGr(r、γ)=1,如果r=0,γ=Ir,else,(25a)Gz(z,γ,a)=1,如果z=0和(a=1或γ=I)z,否则,(25b)Gy(z,y,γ,a)=y+(2a- 1) ,如果z=0,γ=Iy,否则,(25c)Gw(z,w,γ,a)=w+Gz(z,γ,a)- z、 (25d)理解为我们也使用符号GEFG来表示(Ge,Gf,Gg)任何e,f,g∈ {r,z,y,w}。我们考虑替代FPE 3。不动点方程3(二次维数)。对于每个r∈ {0,1},y∈ Y、 w∈ W、 我们评估γ*= φ[r,y,w]如下oγ*是γ的溶液*(x) =参数最大值qy+r+x- 1qy+r+x+1{z}1=买入,A{z}0=不买入x个∈ 十、 (26a)式中=δNUa(X,Gryw(r,y,w,γ*, 0))+δN(N- w- 1+r)UGr(r,γ*)na(x,0,Gyw(r,y,w,γ*, 0))+δN(w- r) UGr(r,γ*)na(x,1,Gyw(r,y,w,γ*, 0)) . (26b)值函数满足(x,r,y,w)=Aγ*(x) =0qy+r+x-1qy+r+x+1γ*(x) =1(26c)和所有▄r∈ {0,1}Urna(x,z,y,w)=δNE{Ua(x,r,Gyw(z,y,w,γ*, γ*(Xn)))}+δNEUrna(x,Gzyw(z,y,w,γ*, γ*(Xn)))+δN(w- z- r)EnUerna(x,1,Gyw(z,y,w,γ*, γ*(Xn)))o+δN(N- w- 2+z+r)EUrna(x,0,Gyw(z,y,w,γ*, γ*(Xn))), (26d)其中,最后一个等式中的期望值为wrt RV Xn,其中p(Xn=Xn | er,x,w,y)=Q(Xn |- 1) +Q(xn | 1)qy+r+x1+qy+r+x。具体地说,对于z=1,上述变成rna(x,1,y,w)=δNUa(x,r,y,w)+δN(w- z- r+1)Uerna(x,1,y,w)+δN(N- w- 2+z+r)Urna(x,0,y,w)。(26e)2020年3月10日草案FPE 3中方程式的直观解释如下。

24
可人4 在职认证  发表于 2022-6-14 16:07:33
方程式(26a)量化了现在购买或等待之间的决定,考虑到通过y评估的V的信息质量。具体而言,等待gofor的奖励(26b)平均了代理玩家是否也将在下一个学期(第一学期)进行表演所获得的奖励,或者她是否会不演戏,演戏者是否可以透露她的私人信息(z=0,1的两个术语)。同样,非演戏玩家在(26d)中更新其价值函数,为下一个时代平均四种可能性:她是否将成为演戏玩家(第一学期),她是否将不再演戏,但演戏玩家将与当前时代(第二学期)相同,她是否会继续演戏,演戏演员将是她自己和现在的演戏演员以外的人(前两届)。具体而言,如果当前代理玩家购买了产品或透露了自己的私人信息(z=1),则此方程中的第二项将被吸收到第三项中,如(26e)所示。下一个定理表明,通过找到FPE 3的解,我们得到了FPE 2的解。由于方程(26)在N中具有二次维度,这显著降低了求解FPE 2的复杂性。具体而言,给定解决方案U*对于FPE 3(连同φ),我们构建了以下策略和价值函数。γ*= θn、 x,bn,b-n=φ【rn,y,w】,bn=00,bn=1(27)~Vm·, n、 x,bm,b-m级=Ua(·,| xn |,y,w),bm=0,m=nU | | xm | na(·,max{| | xn |,bn},y,w),bm=0,m 6=n0,bm=1,(28),其中,我们注意到y,w和rnare都由x和n通过(23)和(24)确定。我们将证明这些值函数是原始FPE 2的解。定理3。值函数(¢Vm)m∈(28)中未定义,以及策略映射γ*(27)中定义的满足FPE 2。证明:见附录D.VI。

25
可人4 在职认证  发表于 2022-6-14 16:07:36
存在和结构性质FPE 3的方便形式允许我们研究sPBE的存在。我们首先提出了一个中间引理,它将有助于证明后续结果。引理3。以下内容适用于FPE 3的所有解决方案对于δ=1,x=1的玩家在购买和等待y之间无所谓≥ -1和所有w和r。此外,x=-1对购买和等待y+w漠不关心≥ N和所有r.o对于δ<1,x=1的玩家更喜欢购买而不是等待y≥ 0和所有w和r以及y=-1,r=1,并且在购买和等待y=-1,r=0。此外,x=-我更喜欢购买2020年3月10日DRAFTover等待y≥ 2,y+w≥ N和所有r,以及y=1,w≥ N- 1和r=1,且对y=1、r=0和y=0、r=1无差异对于所有δ≤ 1,对于y<-1,所有w和r都=0,对于x的两个值,玩家更喜欢等待。同样,fory<-2,所有w和r都=1,并且都是x值,玩家更愿意等待。最后,对于y=-2.所有w和r=1且x=1的玩家在购买和等待以及x=-我宁愿等待。证明:见附录EWe评论,在这一点上,上述引理的有用性正是因为这些陈述在没有明确解决FPE 3的情况下得到证明。具体而言,请注意等式(26a)的右侧和左侧均取决于解γ*. 然而,引理3声称,对于所有的解γ*, 上述财产有效。这一节剩下的大部分结果取决于上述引理。下一个定理给出了所有δ值的FPE 3的解≤ 1包括δ=0,这是近视场景。因此,我们将此策略文件称为近视解决方案,尽管它是δ所有值的解决方案。定理4。

26
能者818 在职认证  发表于 2022-6-14 16:07:39
以下策略文件是针对所有δ的FPE 3解决方案。对于r=0和所有w,γ*= φ[r,y,w]=1,y≥ 20,y≤ -2I,-1.≤ y≤ 1.(29a)对于r=1,以及所有w,γ*= φ[r,y,w]=1,y≥ 20,y≤ -2I,-1.≤ y≤ 0。(29b)最后,对于r=1,y=1,以及所有w,γ*= φ[r,y,w]可以作为δ的函数,为y=1进行适当选择(它是1或I。证明:见附录F。该策略图如图1所示(在所有此类图中,我们给出了r=0的情况和r=1的情况,其中x=-1,因为如果一个玩家透露了自己的私人信息,则表示她已经购买了该产品)。注意,它主要由策略γ组成*= 1和γ*= 0,这意味着玩家不会透露他们的私人信号。直觉上,如果一个玩家知道其他人没有透露他们的私人信号,她就不会从等待更多信息中获益。因此,当γ*= 显示的是,当两个玩家的x=1和x=-1有正的即时奖励。因此,对于δ的所有值,近视始终是一种平衡。虽然定理4的策略文件被称为近视策略文件,但它也捕捉到了游戏的非近视视角。例如,在y=1时,r=0且x=-1、不购买该产品,因为2020年3月10日绘图。1、N=11和所有δ的平衡策略≤ 1,包括δ=0。“00”、“01”和“11”分别表示策略0、I和1。r=1和y=1的策略特别适用于δ=0。她的价值函数是积极的,因为她不购买,因此,她从等待中获益。但在近视的情况下,无论是买入还是不买入,hervaluation都是0,玩家在玩a=1和a=0之间是无关紧要的。

27
nandehutu2022 在职认证  发表于 2022-6-14 16:07:43
这意味着如果我们将V的先验信念从Q(V=1)=0.5改为Q(V=1)=0.5+ 对于足够小的, 该策略文件是δ6=0的平衡,但不是δ=0的平衡。这是真的,因为x=-1 aty=1严格来说更喜欢在近视设置下购买,而该玩家仍然喜欢在非近视设置下等待足够小的.FPE 3的sPBE可能比定理4的sPBE更多。然而,正如下一个定理所示,所有这些潜在的sPBE都具有相似的结构。在下一个定理中,我们还给出了阈值策略wrt w和y的解的存在性结果。定理5。对于b=0的FPE 3的解决方案,以下属性适用:oFPE 3的所有解决方案要么是阈值策略(从0到1)wrt w,要么存在与非此类型的解决方案相对应的阈值策略wrt w。o对于δ<1,当所有其他参数固定时,FPE 3的所有阈值函数wrt w的解都必须是r=0的阈值函数wrt y。这意味着如果γ*(x) =φ[0,y,w](x)=1,然后是γ*(x) =φ[0,y,w](x)=1表示y≥ y和w≥ w、 此外,每当r=0的解决方案为阈值策略wrt y时,r=1的解决方案也可以为阈值策略wrt y。此外,对于FPE 3的所有解,我们具有以下属性:o它们是阈值函数wrt y,对于x=1和r=0,阈值为y=-1或y=0表示所有W。o它们是这样的γ*= φ[r,y,w]=0表示y≤ -3和所有其他参数,对于y=-2和r=0。还有γ*= φ[0,y,w]6=0表示y≥ 0.2020年3月10日草案o我们有γ*= φ[0,0,w]=I.o对于y 6=-1, γ*= φ[0,y,w]=0表示所有w(常数wrt w),或只能是γ*= φ[0,y,w]=I或γ*= φ【0,y,w】=1表示所有w。

28
nandehutu2022 在职认证  发表于 2022-6-14 16:07:45
这意味着,通过改变w和其他参数,平衡策略要么不改变,总是0,要么可以在I和1之间改变对于y=-1,两个γ*= φ[0, -1,w]=I和γ*= φ[0, -1,w]=0始终是所有w的解决方案。o对于y=-2,两个γ*= φ[1, -2,w]=I和γ*= φ[1, -2,w]=0始终是所有w的解。证明:见附录G。该定理的前两部分意味着存在FPE 3的解,通过增加y或w,平衡策略从0变为I,然后变为1。这在本文中提出的所有解中都很明显(图1、2、3)。其他部分提供了有关解决方案的更一般性陈述。例如,正如我们在建议的解决方案中所看到的,平衡策略是γ*= φ[r,y,w]=0表示y≤ -2,这是因为玩家的即时奖励是非正的。我们还可以用本文提出的解来验证定理的其他部分。七、信息级联对于具有同质玩家的任何给定游戏,我们上一节的结果允许我们通过求解具有二次数(N)变量的方程来评估游戏的SPBE。这种方法为我们提供了必要的工具来调查信息级联是否发生在有大量玩家的环境中。我们的模型引导玩家向前看,而不是目光短浅,其直接后果是它导致了玩家的多种平衡行为。这种丰富的行为谱包括文献中报道的导致信息级联的短视策略,但更重要的是,还包括更具合作性的策略,引导参与者披露信息,并有可能缓解甚至消除信息级联。

29
nandehutu2022 在职认证  发表于 2022-6-14 16:07:50
接下来的两个小节通过确凿地证明上述主张来探讨这两个极端。A、 δ<1和N的情况→ ∞在这一部分中,我们利用前一节的结果得出结论,即使在固定δ<1的非近视场景中,当参与者数量接近实际时,信息级联确实会发生,概率接近1。我们的方法包括定义马尔可夫链并研究其性质。具体而言,该马尔可夫链不是在绝对时间t上定义的,而是在新的启示发生的随机时间上定义的(即,当玩家播放策略γt=i)。为了实现这一目标,我们提供了以下定义。定义5。设φ[·]为FPE 3的解。确定随机变量(Ht)t≥0实现ηt=(1,φ[rt,yt,wt]=I,rt=0,bt=00,否则,(30)2020年3月10日绘图,指示在t轮行动的玩家是否透露其私人信息。通过T=0和Ti=min{T>Ti,确定i-th揭示的(随机)时间-i为1 | Ht=1}≥ 1、我们进一步定义了随机过程((R)Yi)i≥0带“Yi=YTiwhen Ti<∞ 和“Yi=”Yi-1其他方面。下一个引理描述了级联仍然发生在非近视场景中的原因。事实上,它表明,这些级联将在过程的相对早期发生。引理4。设φ[·]为FP 3的解。诱导过程((R)Yi)i≥0是一个马尔可夫链,其中,对于较大的N,存在yR,yL,对于所有的yL<y<yR,如果Ti+1<∞ 然后“Yi+1=y |”Yi=y=p+(1-p) qyqy+1y=y+11-p+pqyqy+1y=y-1(31)和yL,YR是吸收态。证明:首先我们证明了((R)Yi)i的马尔可夫性≥0便士“Yi+1=y |”Y0:i=Y0:i= PYTi+XNTi=y | YT0:i=y0:i(32a)=PXNTi=y- yi | YT0:i=y0:i(32b)=Q(y- yi | 0)+Q(y)- yi | 1)qyiqyi+1(32c)=P“Yi+1=y |”Yi=Yi. (32d)现在我们描述了吸收态。对于δ<1且Ymax=l1+logq(1+δ1-δ) m<N,我们有qymax+rt+x- 1qYmax+rt+x+1>δ>δUa(x,rt+1,yt+1,wt+1)。

30
kedemingshi 在职认证  发表于 2022-6-14 16:07:53
(33)所以要么yR=Ymax吸收,要么存在一个yR<Ymax吸收。在Yt=yR时,所有球员,无论是x还是其他球员,都喜欢购买。类似地,对于Ymin=-2我们有Q-1.- 1季度-1+1=2p- 1<0<δUa(x,rt+1,yt+1,wt+1)(34),因此yL=Ymin=-2或yL=-1正在吸收。在Yt=yL时,所有球员,无论x,都喜欢等待。因此,在Yt=yLor Yt=Yr中,不会再出现重新排列,并且Yt(和'Yi)在所有t>t中保持不变,概率为1。我们上面定义的马尔可夫链的吸收状态是信息级联。因此,当N增加时,会发生信息级联,概率接近1,就像赌徒破产问题一样。然而,在所有(或几乎所有)玩家都透露了他们的私人信息之后,会出现一种信息级联,这并没有什么意义。事实上,在这种情况下(几乎)所有关于货物质量V的可用信息都已向网络的其他部分披露,因此这种情况很难被视为病理结果。下面的定理表明情况远非如此。定理6。对于δ<1,信息级联在有限时间内发生的概率接近1,即N→ ∞.此外,设mn是一个序列,使得limN→∞明尼苏达州√N=0和limN→∞MN=∞.2020年3月10日DRAFT1)在级联发生之前,只有不到MNPlayer披露其私人信息的概率预计为N→ ∞.2) 此外,如果解为φ[r,y,w]=1意味着φ[r,y,^w]=1,对于所有的^w>w(根据Orem 5,我们知道存在此类解),则级联发生的概率小于mn圈,接近1的概率为N→ ∞.证明:见附录H。该定理的解释如下。首先,信息级联将在某个特定时间发生,随着N的增加,概率接近1。其次,这种情况发生得太早。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 12:39