楼主: nandehutu2022
887 17

[量化金融] 论奖金计划的失败 [推广有奖]

11
能者818 在职认证  发表于 2022-5-8 05:38:02
有时,一个简单或直观的奖金计划可能会给各方带来次优结果。下一节给出了由该示例激发的一般结果。定义2。奖金计划f是最优的,如果诱导的k人博弈GFP有一个平衡σf,如<<k"yi“1σf f f”k最大能量。(2)也就是说,如果存在一个平衡σf,则f是最优的,其中所有p层的混合作用是具有最大期望值的纯作用的加权平均值。注1.为了简化计算和符号,我们假设ErxsaErXis,(3)对于每2didn。这意味着奖金计划f是最优的当且仅当pX,Xqis是Gf中的一个平衡。备注2。对于每个奖励计划f和每个纯行动向量X,因此,游戏gf是一个固定和游戏,即所有玩家的预期收益之和为1。对于每一个奖金计划f和每一个游戏gf,我们可以确定一个辅助奖金计划fprq“f prq'`k,…,k对于每一个r P Rk。诱导博弈Gf是一个对称的零和k-玩家博弈。4主要结果在本节中,我们证明了本文的两个主要结果。第一个结果表明,对于每一个有限的随机变量集a,存在一个最优奖金计划f。第二个结果表明,对于每一个非平凡的(即,非常数)奖金计划f,存在一组f不是最优的情况。在考虑合同规划时,这些结果的结合非常重要。一方面,在任何不确定的市场中,DM都可以设计一个合同,以确保代理保留自己的利益。另一方面,如果市场是动态的,这意味着市场在可能的行动方面不断变化,那么任何不平凡的奖金计划最终都可能导致次优结果。

12
mingdashike22 在职认证  发表于 2022-5-8 05:38:05
换句话说,唯一能确保玩家按照DM的偏好行事的奖金计划,是一个自相矛盾的、独立于玩家行为的奖金计划。4.1固定作用集我们证明的第一个定理是构造性的。对于每一组动作A,我们都指定一个op Timal奖励计划f。我们提出的最佳奖金计划f在玩家学习的差异上是线性的。我们从有界集SA的简单情况开始。确定一组纯动作a。确定包含Sa所有值的最小、有限和闭合区间,并确定IA中最大元素的绝对值(w.r.t绝对值)。也就是ωPOhm 而每个动作Xi,都是Xipωq P IAand | Xipωq | MA。通过FIPRQ“$和%k`rkj”1pri\'rjq2kpk\'1qMA,如果r P IkA,k,如果r r IkA,确定线性奖金计划f。可以验证f是否已确定,因为对于每项r P Rk,平等性定理1.对于每一组具有有限支撑SA的纯作用A,MA线性Bonuplan是最优的。证明。我们必须证明pX,…,Xq是Gf中的平衡,或等价地,对于每一个参与者i和参与者i的每一个策略q“rni”1qixio(当q‰X时),不等式E rfipX,XqsaE rfipq,X,Xqs h olds。在不丧失一般性的情况下,假设i“1,因此rfpq,X,…,Xqs”E<<f"yn"yi“1qiXi,X,…,X,ff”E“pk\'1qrni”1qiXi\'pk\'1qX2kpk\'1qMA`k“2kMAE<<n"yi”1qiXi\'X fff\'kak”E rfipX,…,Xqs,当第二个和最后一个等式从f的定义开始跟随f,不等式从q‰X和Erqs“E rrni”1qiXisaErXs这一事实开始跟随。pX,…,Xq是一个平衡的事实并不令人惊讶。它直接从ri中fiprq的线性开始。

13
mingdashike22 在职认证  发表于 2022-5-8 05:38:09
这种线性意味着Xis是每个玩家的主导策略,因此,平衡是唯一的。以下定理给出了一般情况下(即,对于SAI无界的情况)的有界线性奖励计划f,并证明了它是最优的。定理2。对于每一组纯动作A,都存在一个最优奖金计划。证据我们通过构造一个新的最优奖励计划,将eorem 1推广到无界集。让^rq,i“pq,pXqj‰iq是一个动作向量,玩家i选择混合动作q,每个p层玩X。请注意,对于每个q‰X,对于某些cqa0,预期值rq\'Xs“\'cqa0。由于预期值为负且有限,因此存在一个真实的数字mpqqa0,使得对于每M pqqqqe“pq\'xqq1t | q\'Xmuapq,(4)和pql。(5) 伊内克。(4) (5)是严格的,在此之前存在一个包含q的开集Bpqq,这两个不等式适用于每一个qP Bpqq,其中q‰X。混合作用集q是复杂的,因为它可以用一个pn′1q simp lex表示,因此开集TBPQQ是一个开放的覆盖。众所周知,在BA上存在一个有限的亚群。修正c“minqPBAcqa0,让MěM axqpbacpqq为正数,这样对于每MěM和每q‰X,E”pq\'Xq1t | q\'X | muac,(6)和l | M | l | Prpq | Xalqac.(7)注意(7)保持q | X的弱不等式。用有界线性奖金计划f `prq 1241pk“1pri\'rjqkpk\'1qMdk,k,如果不是这样的话。我们可以验证f是一个定义良好的bonu计划。我们通过显示w.l.o.g.thatErfpq,X,…,Xqsak”ErfpX,…,Xqs,来证明pX,…,Xq是由有界线性rbnus计划诱导的博弈中的一个平衡。注意0dk\'j‰ipq\'xq2mdkqd124; X,因此。

14
nandehutu2022 在职认证  发表于 2022-5-8 05:38:13
,Xqs“E^krj‰ipq˙xqkpk˙t | q | Xd2Mu`kPrp | q | X | 2M qdkd2MkE | pq | xqt | q | X | 2Mu‰k | l | 2MPrpq | X“lq。它来自(6)和(7)thaterpq,X,…,Xqsak | c4Mk 2Mk | l | lPrpq | c4Mk |c4Mk“k,如前所述。4.2通用奖金计划通用奖金计划f是一个非恒定奖金计划,因此对于每一组行动,f都是最优的。具体而言,通用奖金计划f是一个非恒定奖金计划,例如对于每一组行动X,…,Xn,其中ErXsaErXjs对于每2djdn,行动pX,…,Xq的比例在Gf中是一个平衡。以下是:这个定理证明这样的计划是不存在的。定理3。如果有两名参与者,则不存在通用奖金计划。证据让xayaz.我们首先证明fpy,yqěfpx,yq。相反,假设fpy,yqafpx,yq。假设A“tX,Xu是两个动作X和X的集合,具有联合概率分布,XzXx yx 0 y 1 0注意erxaerx。然而,ErfpX,Xqs“fpx,yqafpy,yq”ErfpX,Xqs,这意味着pX,Xq在Gf中不是一个平衡,因为玩家1可以从偏差X中受益。因此,fpy,yqěfpx,yq。(8)出于类似的原因,fpy,yqěfpy,Xq接下来我们证明了fpx,xqěfpy,xq。设p是p0中的一个数,1q,设A“tX,xx是两个作用x和x的集合,具有联合概率分布,XzXx yx 0 pz 1\'p 0A直接计算表明ErfpX,Xqs\'ErfpX,Xqs“ppfpx,xq\'fpy,xqq\'p1\'pq pfpz,zq\'fpx,zqq。回想一下,fpz,zq\'fpx,zq是有界的。如果fpx,xqafpy,xq,那么p小于,但非常接近1,因此对于每一个z,ErfpX,Xqs\'ErfpX,Xqsa0。换句话说,ErfpX,Xqs,Xqs。(10)现在人们可以选择z非常大,因此(ErXs)不相等这意味着pX,Xq在Gf中不是一个平衡,因为玩家1可以从偏离X中受益。因此,fpx,Xqěfpy,Xq。

15
kedemingshi 在职认证  发表于 2022-5-8 05:38:16
(11) 类似的原因暗示fpx,xqěfpx,yq。(12) 现在我们将不等式(8)、(9)、(11)和(12)相加,得到fpy,yq`fpy,yq`fpx,xq`fpx,xqěfpx,yq`fpy,xq`fpy,xq`fpx,yq。根据等式(1),我们得到了等式。Thu s,(8)、(9)、(11)和(12)实际上是相等的。因此,fpx,将定理3推广到任意数量的参和者kě3是不容易的。事实上,要求f不为常数是不够的。例如,以任何非常数的f:Rk~nRk为例“对于至少具有两个相同坐标的每个r P Rk。在这种情况下,对于每个动作Xj,策略的性能pXj,…,Xjq是非平衡的,因为单个参与者的任何偏差都不会影响支付。另一方面,要求所有平衡满足等式(2)当f为常数时不成立,因为所有的比例都是平衡。因此,当玩家数量达到三个或更多时,我们增加了一个新的要求。定义3。一个强大的通用奖金计划f是一个奖金计划,其中维持等式(2)的所有活动都是一个平衡。定理4。如果f是一个非常普遍的奖金计划,那么每一项行动都是不平衡的。证据让f成为一个强有力的通用奖金计划。清晰地定理3意味着该结果适用于k的情况“2.修正kě3.我们证明了这个定理,证明了对于每一个结果向量Rk,Bonuplan的坐标fiprq在ri中是不递减和不递增的。相反地,假设存在一个参与者i,一个结果向量Rk,一个dwiP r,使得fipwi,r\'iqafipri,r\'iq其中wiari.定义了随机变量X,比如PrpX“xqa0 i fff x”rj1djdk.使用每个j‰i的PrpX“riqaPrpX”rjq。此外,定义一组i.i.d。

16
kedemingshi 在职认证  发表于 2022-5-8 05:38:20
随机变量Xj“X,其中1djdk.定义向量值随机变量pW,Xdiq byPrppW,X\'iq“xq”PrppXi,X\'iq“xq@X‰r,和prppw,X\'iq“pwi,r\'iqq”PrppXi,X\'iq“rq.显然,pW,X\'iq和W是很明确的。直接计算表明ErW saErXs。然而,向量pXi,X\'iq不是一个平衡点,因为我可以偏离W并增加他的报酬,因为fipwi,r\'iqafipri,r\'iq。因此fip¨,r\'iq对于每个i和每个r\'i都是不减少的。现在假设相反,fipri,r\'iq在ri中严格增加。也就是说,存在玩家i,一个结果r P Rk的向量,和yiP r,使得fipyi,r\'iqafipri,r\'iqari。设z,zpr为两个实数,使得每1djdk为zarjaz,p为p0,1q中的一个数。定义随机变量Y,使得概率p,随后,当1djdk(假设PrpY“riqaPrpY”rjq为每j‰i)时,概率为1`p,随机变量y等于z。此外,定义一组i.i.d.随机变量Yj,其中1djdk.定义向量值随机变量pZ,y\'iq byppz,y\'iq“yq”ppyi,y\'iq“yq@y‰r,yj‰z@j,PrppZ,y'iq”pyi,r'iqq“PrppYi,y'iq”rq,如果y P r中存在坐标j,那么yj“'z,然后是PrppZ,y'iq”pz,y'iqq“PrppYi,y'iq”yq。显然,pz,y'iq和z定义得很清楚。请注意,erfipz,y'iqs“E”fipYi,y'iq1tY'i‰r,yj'z@ju 305;\'fipYi,r\'iqPrppYi,Y\'iq“rq"yyPRk:Dj,yj”\'zfipz,Y\'iqPrppYi,Y\'iq“yqaE”fipYi,Y\'iq1tYjz@juiyPRk:Dj,yj\'\'zfipz,Y\'iqPrppYi,Y\'iq“yq(13)”E rfipYi,Y\'iq\'iq\'yPRk:Dj,yj\'\'zpfipz,Y\'iq Fipyiq,Y)当Y\'fyq遵循假设时,Y\'fiq(13,Y\'。

17
能者818 在职认证  发表于 2022-5-8 05:38:23
式(14)中的和是有界的,在我们可以选择足够接近1的p(但仍然小于1)之前,这样对于每个z,不等式ErfipZ,Y\'iqsaE rfipYi,Y\'iqs成立。取一个足够大的z和一个足够低的z,可以保证每个saerz。总之,向量pYi,Y\'iq不是一个平衡点,因为玩家i可以偏离Z并增加他的报酬。矛盾因此,对于每一个i和每一个i,r\'iq都是不稳定的。这两个结果的结合,证明了fip是独立的。这意味着每一个玩家i的预期收益都独立于他的行为,并且每一个行为都是一种平衡。5结论和补充评论本文给出的结果有两个完整的方面:应用性和理论性。一方面,我们给出了奖金计划的具体描述,该计划保证代理人有动机按照DM的意愿行事。另一方面,我们证明了最优奖金计划根本不存在,除非它与abonus计划(常数,意味着固定支付)一样无用。这项工作基于这样一个假设,即DM努力使其预期收益最大化。尽管这种假设在文献中很常见,但人们仍然可以遵循Holmstrom和Milgrom(1991)的路线,并假设DM试图同时优化新元素。例如,最大化预期收益,同时最小化风险。总的来说,我们可以假设决策者对一系列行动有一定的偏好关系,并试图找到一个在均衡中实现这种偏好的奖金计划。这些问题有待进一步研究。另一个有待进一步研究的元素是定理4中给出的推广。这种概括可以通过多种方式来实现。

18
能者818 在职认证  发表于 2022-5-8 05:38:26
Eg、 我们可以假设,对于每一个r\'i,fip–r\'iq总是依赖于玩家i的行为,然后我们知道在这种情况下是否可能有一个最优奖金计划。参考Carroll,Gabriel,“稳健性和线性合同”,《美国经济评论》,2015105(2),536-63。Dasgupta,Amil和Andrea Prat,“与职业相关的财务平衡”,理论经济学,2006年,1(1),67-93。以及《金融市场中与职业相关的信息聚合》,经济理论杂志,2008年,143(1),83–113。Foster,Dean P.和Peyton H.Young,“投资组合经理的游戏绩效费用”,《经济学季刊》,2010年,125(4),1435-1458年。何学东、桑虎和史蒂文·寇,“通过合同设计区分熟练和非熟练基金经理”,2015年。Holmstrom、Bengt和Paul Milgrom,“多任务委托代理分析:激励合同、资产所有权和工作设计”,《法律、经济与组织杂志》,1991年7月(1991年1月),24-52页。凯恩斯,约翰·M.《就业、利息和货币的一般理论》,帕格拉维马西兰,1936年。埃胡德·莱勒,“任何检查都是可操作的”,计量经济学,2001年9月,69(5),1333–1347。Olszewski,Wojciech和Alva ro Sandroni,“未来独立测试的可操作性”,计量经济学,2008,76(6),1437–1466。Sandroni,Alvaro,“正确预测的可指责属性”,国际博弈论杂志,2003年12月,32(1),151–159。,Rann Smorodinsky和Rakesh V.Vohra,“使用多种检查规则进行校准”,运筹学数学,2003年2月,28(1),141–153。Scharfstein,David S.和Jeremy C.Stein,“羊群行为与投资”,《美国经济评论》,1990,80(3),465-479。Eran Shmaya,“许多检查是可操作的”,理论经济学,2008年9月,3(3),367-382。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 22:52