楼主: nandehutu2022
1855 60

[量化金融] 非近视代理是否会发生信息级联? [推广有奖]

41
kedemingshi 在职认证  发表于 2022-6-14 16:08:40
我们有πt+1(1)πt+1(-1) =QNm=1Pxmγmt(xm)(amt)πt(xm | 1)QNm=1Pxmγmt(xm)(amt)πt(xm |- 1) πt(1)πt(-1) (43a)=Pxntγt(xnt)(antt)πt(xnt | 1)Pxntγt(xnt)(antt)πt(xnt |- 1) πt(1)πt(-1) ,(43b)其中,最后一个等式是由于所有非演艺演员的γmt=0。此外,如果γt6=Ior,则主动参与者已经透露了她的信息,乘法因子将减少到1。否则,系数becomespxntxnt+1(antt)Q(xnt | 1)Pxntxnt+1(antt)Q(xnt |- 1) =Q(2antt- 1 | 1)Q(2antt- 1| -1) =q2antt-1,(43c)从而证明(19)。最后,假设Q(1)=Q,通过重复替换上述方程得到(20(-1) =1/2,为简单起见。附录C通过问题对称性的多项式维F计算PBE,我们确定集合K={00,-10, 01, -11,+11}其中,该集合的元素都是该对▄xibican为每个玩家i取的可能值。请注意,+10在任何策略下都不会发生,因此它不包括在集合中。因此,根据球员的身高和身高,他们被分为5组。我们确定了节理类型(按比例的经验分布),txbof序列(x,b)astxb(k)=NXi=1xibi(k),k∈ K、 (44)对于每种类型的t,t(K)≥ 0和PK∈Kt(k)=N,所以N+4~ n选择可能的类型。注意,根据上述定义,聚合状态信息y=PNi=1xi等于y=t(+11)-t型(-10)-t型(-11).我们定义了以下函数Ua:X×K×T→ R、 尺骨:X×K×T→ R代表所有l∈ K、 这些功能的含义如下。Ua(x,k,t)表示演技演员n的值函数,其私有信息xn=x,她的一对xnbn=k(因此她属于k组)和序列的关节类型(~x,b)为2020年3月10日DRAFTt。

42
何人来此 在职认证  发表于 2022-6-14 16:08:44
类似地,尺骨(x,k,t)表示非代理玩家m的值函数,其私人信息xm=x,她的配对xmbm=l(因此她属于组l),代理玩家n的配对xnbn=k(即属于组k),序列的关节类型(▄x,b)为t。最后,我们定义了更新函数gx,gb和gtas,如下gx(kx,γ,a)=2a级- 1,如果kx=0,γ=Ikx,则为,(45a)gb(kb,a)=a,如果kb=0kb,则为(45b)gt(k,t,γ,a)(k)=t(k)- 1,如果k=k和gxb(k,γ,a)6=kt(k)+1,如果k=gxb(k,γ,a)和gxb(k,γ,a)6=kt(k),否则(45c),其中我们使用符号k=kxkb分解k指数的两部分,并且我们还使用符号gefg表示(ge,gf,gg)任何e,f,g∈ {x,b,t}。我们在FPE 4中考虑以下FP方程。不动点方程4(多项式维数)。

43
大多数88 在职认证  发表于 2022-6-14 16:08:47
每k=kxkb∈ K、 t型∈ T我们评估γ*= φ[k,t]如下所示:如果kb=1,则γ*= 0.o如果kb=0,则γ*是以下方程组γ的解*(x) =arg max{A |{z}0=不购买,qy+x1(kx)- 1qy+x1(kx)+1 |{z}1=购买}x个∈ 十、 (46a)式中=δNUa(X,gxbt(k,t,γ*, 0))+δNXk∈K[t(K)- 1k(k)]Ugxb(k,γ*,0)na(x,k,gt(k,t,γ*, 0))](46b),其中值函数满足a(x,k,t)=0,如果kb=1A,如果kb=0,γ*(x) =0qy+x1(kx)-1qy+x1(kx)+1,如果kb=0,γ*(x) =1,(46c),对于所有l=lxlb∈ 库尔纳(x,k,t)=0,如果lb=1,δNE[Ua(x,l,gt(k,t,γ*, γ*(Xn))]+δNE[尺骨(x,gxbt(k,t,γ*, γ*(Xn))]+δNXk∈K[t(K)- 1k(k)- 1l(k)]E[尺骨(x,k,gt(k,t,γ*, γ*(Xn)))],如果lb=0,,(46d)2020年3月10日绘图,其中最后一个等式中的期望值为wrt RV xnwhere(Xn=Xn | l,x,k,t)=kx(xn),如果kx6=0Q(xn|-1) +Q(xn | 1)qy+x1(lx)qy+x1(lx)+1,否则。(46e)现在我们将证明,如果最后一个FP方程有一个解U*, 那么原始FP方程有一个解V*其中V*可以很容易地从U*.给定解决方案U*在上述FP方程(连同策略φ)中,我们构建了以下策略和价值函数。γ*= θ[n,~x,b]=φ[~xnbn,t ~x,b](47a)~Vm(·,n,~x,b)=Ua(·,~xnbn,tx,b),如果m=nUxBMNA(·,~xnbn,tx,b),如果m 6=n.(47b),我们将证明这些值函数是原始FPE 2的解。定理10。值函数(¢Vm)m∈Ntogether与策略映射γ*= φ[·]满足FPE 2。证明:修复导致t类型具有累积状态y的n、~x和b。活动播放器n属于组k=kxkb=~xnbn。如果bn=1,则kb=1和γ*= 如果bn=0,则(21a)中的第二项显然为平方Y+xn(kx)-1qy+xn(kx)+1,与(46b)中的第二项完全相同(xn=x)。考虑(21a)中的格式。

44
nandehutu2022 在职认证  发表于 2022-6-14 16:08:50
主动参与方n的新组为^k=f(¢xn,γ*, 0)0=gxb(k,γ*, 0)且总类型的新值将更改为^t=gt(k,t,γ*, 0). 上述含义是,(21a)中的第一项将beNXn=1Vn(xn,n,x-nf(¢xn,γ*, 0),b-n0)=▄Vn(xn,n,▄x-nf(¢xn,γ*, 0),b-n0)+NXn=1,n6=nVn(xn,n,x-nf(¢xn,γ*, 0),b-n0)=Ua(xn,^k,^t)+NXn=1,n6=nU^kna(xn,^nbn,^t)=Ua(xn,^k,^t)+Xk∈KNXn=1,n6=n,~xnbn=kU^kna(xn,~xnbn,^t)=Ua(xn,gxbt(k,t,γ*, 0))+Xk∈K[t(K)- 1k(k)]Ugxb(k,γ*,0)na(xn,k,gt(k,t,γ*, 0)),(48),其中t(k)项- 1k(k)枚举向量▄x中的所有参与者n6=n-nf(¢xn,γ*, 0),b-n0,由原始类型t从活跃玩家组中减去一得到。这正是(46b)中的表达式,因此(21a)满足。现在考虑(21b)。固定m并用l=lxlb=~xmbm表示第m个玩家的组。该方程的前三个分支显然是令人满意的。关于第四个分支,我们知道2020年3月10日活跃玩家的新组别DRAFTn将为^K=f(~xn,γ*, γ*(Xn)),B0n=gb(kb,γ*(Xn)),新类型为^T=gt(k,T,γ*, γ*(Xn))。(21b)的左手侧变成尺骨(xm,k,t),lb=0。

45
可人4 在职认证  发表于 2022-6-14 16:08:54
右侧变为1E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E虚拟机xm,m,~x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+ E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+NXn=1,n6=m,nE虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E[尺骨(xm,l,^T)]+E[尺骨(xm,^K,^T)]+Xk∈KNXn=1,n6=n,m,~xnbn=kE[尺骨(xm,~xnbn,^T)]=E[Ua(xm,l,gt(k,T,γ*, γ*(Xn))]+E[尺骨(xm,gxbt(k,t,γ*, γ*(Xn))]+Xk∈K[t(K)- 1k(k)- 1l(k)]E[尺骨(xm,k,gt(k,t,γ*, γ*(Xn)))]。(49)这正是(46d)中的表达式,因此(21b)是令人满意的。我们在这一点上指出,该方法可以推广到δ值不同的异质参与者。所需要的只是考虑向量x,b,δ的关节类型。FP方程的相应维数为~ N4Kδ,其中Kδ是不同类型δ的数量。附录D定理3Proof:修正n,~x,得到总体参数y和w。主动玩家要么没有透露信息(~xn=0),要么透露了错误信号(~xn=-1) ,否则她早就买了产品,退出了游戏。这意味着xn=-r、 很明显,(21a)中的第一项变成了sqy+r+xn-1qy+r+xn+1,与(26a)中的第一项完全相同(xn=x)。考虑(21a)中的第二项。主动播放器n的新参数为^r=| f(≈xn,γ*, 0)|=Gr(r,γ*) 人口参数的新值为(^y,^w)=Gyw(r,y,w,γ*, 0).

46
可人4 在职认证  发表于 2022-6-14 16:08:57
上述含义是,(21a)中的第二项(除了δ/N因子)NXn=1Vnxn,n,~x-nf(¢xn,γ*, 0),b-n(50a)=Vnxn,n,~x-nf(¢xn,γ*, 0),b-n+NXn=1,n6=nVnxn,n,~x-nf(¢xn,γ*, 0),b-n(50b)=Ua(xn,^r,^y,^w)+NXn=1,n6=nU^rnaxn,zn,^y,^w(50c)=Ua(xn,^r,^y,^w)+NXn=1,n6=n,zn=0U^rna(xn,0,^y,^w)+NXn=1,n6=n,zn=1U^rna(xn,1,^y,^w)(50d)=Ua(xn,^r,^y,^w)+(n- w-1+r)U^rna(xn,0,^y,^w)+(w- r) U^rna(xn,1,^y,^w)2020年3月10日草案=Ua(xn,Gryw(r,y,w,γ*, 0))+(N-w- 1+r)UGr(r,γ*)na(xn,0,Gyw(r,y,w,γ*, 0))+(w- r) UGr(r,γ*)na(xn,1,Gyw(r,y,w,γ*, 0)) . (50e)这正是(26b)中的表达式,因此(21a)满足。现在考虑(21b)。固定m并用▄r=▄xm▄表示第m个播放器的参数。该方程的前三个分支显然是令人满意的。关于第四个分支,我们知道活动层的新参数为^Z=Gz(Z,γ*, γ*(Xn)),新的总体参数为(^Y,^W)=Gyw(z,Y,W,γ*, γ*(Xn))。(21b)的左侧变成Urna(xm,z,y,w)。右侧变为1E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E虚拟机xm,m,~x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+ E虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n+NXn=1,n6=m,nE虚拟机xm,n,x-nf(¢xn,γ*, γ*(Xn)),b-nB0n= E[Ua(xm,r,Y,W)]+E[uRNA(xm,Z,Y,W)]+NXn=1,n6=n,m,zn=1E[uRNA(xm,1,Y,W)]+NXn=1,n6=n,m,zn=0E[uRNA(xm,0,Y,W)]=E[Ua(xm r,Gyw(Z,Y,W,γ*, γ*(Xn))]+E[Urna(xm,Gzyw(z,y,w,γ*, γ*(Xn)))]+(w- z- r)E[U]rna(xm,1,Gyw(z,y,w,γ*, γ*(Xn)))]+(N- w- 2+z+r)E[Urna(xm,0,Gyw(z,y,w,γ*, γ*(Xn)))]。(51)这正是(26d)中的表达式,因此(21b)是满足的。引理3的附录EPROOF首先,我们表明,每当γ*= φ[0,y,w]=0,赋值函数都是0,我们必须有γ*=φ【1,y,w】=0。

47
kedemingshi 在职认证  发表于 2022-6-14 16:09:01
根据FPE 3,在状态(x,r,y,w)下,我们有a=δNUa(x,r,y,w)+δN(N- w- 1+z)Urna(x,0,y,w)+δN(w- z) Urna(x,1,y,w),其中,对于两种情况,Urna(x,z,y,w)=δNUa(x,r,y,w)+δN(N- w- 1+z)Urna(x,0,y,w)+δN(w- z) Urna(x,1,y,w)。自γ以来*= φ[r,y,w]=0,我们应该有Ua(x,r,y,w)=A。因此,我们可以求解上述方程中的Ua(x,r,y,w)、Urna(x,0,y,w)、Urna(x,1,y,w)和A。很容易看出,所有这些量的解都是0,因此A=0。因此,Ua(x,r,y,w)=0,很明显,对于y<-2、玩家严格选择等待,因为即时奖励的期望值为负,他们更喜欢得到A,即0。此外,2020年3月10日表格通风量=-2,r=0或r=1且x=-我更喜欢等待,而r=1和x=1的玩家在购买和不购买之间没有区别(她的即时奖励的预期值为0)。它证明了定理的第三部分。现在考虑δ=1。假设γ*= φ[r,y,w]是FPE 3的解。根据γ*, 定义玩家n\'sterminating状态为玩家n决定购买产品(并退出游戏)或从此不再购买,即玩γ*= 当其他人都是时为0(这意味着玩家实际上离开了游戏)。在游戏的每个状态下,γ*对通过不购买代理玩家的决策而达到的游戏未来终止状态施加概率分布。因此,在每个州,玩家将v的预期值与她未来不购买产品所能获得的预期值进行比较,这是她购买产品的终止州的v值与零之间的平均值,对应于她决定永远不购买产品的终止州。引理5。

48
可人4 在职认证  发表于 2022-6-14 16:09:05
假设根据γ*= φ[r,y,w],我们知道代理玩家将在未来所有终止状态下购买产品(如果代理玩家决定不购买,则发生概率为正的状态),然后她对δ=1的购买和不购买产品漠不关心。否则,她更愿意等待δ=1。证据:根据FPE 3,代理玩家将v的预期值与未来终止状态下v的预期值的平均值进行比较,如果代理玩家决定不购买,则有正概率发生。更正式地说,如果我们用s表示当前状态,如果玩家不用s购买,则未来的终止状态将以正概率发生。。。,sk,那么我们有γ*(x) =参数最大值kXj=1E[v | sj]p(sj | s),E[v | s](52)根据总期望定律,我们知道上述条件总是相等的,无论状态如何。。。以及它们发生的概率。唯一的要求是在所有州。。。sk玩家决定购买产品。因此,如果玩家发现自己处于可能导致终止状态的状态。。。sk(通过不购买),她将决定购买所有产品(根据γ*), 事实上,在δ=1的当前状态下,她对购买和不购买漠不关心。接下来,假设在一个终止状态s处。。。sk,比方说sj,玩家严格不愿意购买产品,她在sj的估值为零,因此,v的预期值应该是负的。因此,通过用零代替等式52中的E[v | sj],我们得到了一个大于E[v | s]的项。这意味着,在当前状态下,不购买的预期价值大于v的预期价值,而当前状态表明,玩家严格倾向于不购买产品。

49
mingdashike22 在职认证  发表于 2022-6-14 16:09:08
如果在一个以上的未来状态中,球员严格不愿意购买,同样的论点也成立。引理6。假设根据γ*, 我们知道,对于状态s,至少存在一个未来终止状态J(如果代理玩家不购买产品,则有正概率发生),在该状态下,代理玩家严格地倾向于不购买产品,然后她严格地倾向于在状态s等待足够大的δ≤ 1、2020年3月10日防风:根据引理5第二部分的证明,对于δ=1,表演选手严格选择等待。因此,存在足够大的δ<1,演戏者仍然严格地倾向于等待。接下来,我们证明定理的前两部分。我们首先描述了w=N的平衡策略。很明显,w=N的平衡是什么,因为所有的状态都在吸收,玩家根据预期的即时奖励行动。对于δ的任何值,我们都有γ*= φ【1,y,N】=0表示y≤ -2, γ*= φ[1,y,N]=Ifor y=-1和γ*= φ【1,y,N】=1表示y≥ 我们也知道γ*= φ[r,y,w]=0表示y≤ -2、为了证明这个定理,我们研究了具有y的对策的所有状态的终止状态≥ -1、自γ起*= 0显示在y=-2,y=-2个正在吸收。因此,没有y<-2可从y的状态访问≥ -因此,所有终止状态都有y≥ -2、另一方面,如果γ*= I在当前状态下,x=1的代理玩家只有在r=1时才能达到终止状态。x=1且r=1的玩家在y=-2并且更愿意在所有州购买y≥ -因此,在玩家喜欢购买的所有终止状态下,根据引理5,她在当前状态下购买和不购买之间没有区别。

50
何人来此 在职认证  发表于 2022-6-14 16:09:11
此外,如果γ*= 1在目前的状态下,根据引理5,演艺演员应该对购买和不购买漠不关心(球员应该要么漠不关心,要么严格地选择等待。由于策略γ,后者是不可能的*= 1). 这意味着一个x=1的玩家对于所有有y的州都不在乎买还是不买≥ -1和所有w。这意味着对于δ<1,如果x=1的玩家的即时奖励为正,即y,则他们更愿意购买≥ 0,如果即时奖励为0,即y=-1、接下来考虑x=-1、如果在x=-1我们有y≥ 1或y=0,w=N(她更喜欢购买产品的州),则该玩家应在当前状态下不区分购买和不购买。假设我们有γ*= φ[r,y,w]=每个r,y,w的I(该策略文件向我们展示了每个状态s中最大的可接近终止状态集,尽管它可能不是解决方案)。很明显,对于y+w≥ N和所有r,所有可接近的终止态havey≥ 1或y=0,w=N(在每个状态(r,y,w),玩家可以移动到y- 1和w+1,通过播放γ*= I)。因此,对于δ=1,x=-1对y+w的购买和不购买漠不关心≥ N和所有r。它表示δ<1时,x=-1严格选择y+w购买≥ 如果她的即时奖励为正,即y≥ 2或y=1和r=1,如果她的即时奖励为0,即y=1和r=0或y=0和r=1,则无所谓。定理4的附录F我们通过引理3证明了这个定理。为y提出的战略文件≤ -2是FPE 3的一个明显解决方案,因为r=0的两种类型的玩家都不喜欢购买,因此他们玩γ*= 0

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 11:18