楼主: kedemingshi
1242 23

[量化金融] 非零和遍历随机微分对策的纳什均衡 [推广有奖]

21
何人来此 在职认证  发表于 2022-5-9 11:27:42
考虑到[3]中建立了相应的存在唯一性结果(对于X在可分Hilbert空间中取值的情况),我们证明了本文的所有结果仍然成立。考虑到可数多个玩家之间博弈的存在性,下一步自然是研究遍历平均场型博弈。这样做的困难在于对哈密顿量的连续性假设,它依赖于z上的拓扑。由于我们的结果是相当普遍的,它允许引入不同参与者的政策之间的额外依赖性,前提是我们仍然有广义艾萨克条件的相应版本。4具有不对称代理的随机博弈在本节中,我们考虑两个不同类型的参与者之间的博弈。主要目的是了解遍历参与者(如上所述)与随着贴现率变得微不足道而对未来打折的参与者之间是否存在根本差异。我们将薪酬结构定义如下:J(x,u,v)=lim supT→∞T-1Eu,v,TZTL(Xt,ut,vt)dt,J(x,u,v)=Eu,v,TZ∞E-αtL(Xt,ut,vt)dt,其中α是一个正常数。在续集中,我们将第一种类型的玩家称为“遍历”,第二种类型的玩家称为“折扣”。我们首先为这种情况提供了定理3的一个类比:定理8。设哈密顿量{Hi}i=1,2如(4)所定义,假设假设假设2成立。进一步假设存在一个三重态(Y,Z,λ)和apair(~Y,~Z),使得(Yt=Yt+RTt[H(Xs,Zs,u*(Zs,~Zs),v*(Zs,~Zs))- λ] ds-RTtZsdWs,~Yt=~Yt+RTt[H(Xs,~Zs,u*(Zs,~Zs),v*(Zs,~Zs))- α~Ys]ds-RTt-ZsdWs(18)适用于所有0≤ T≤ T<0。此外,假设存在两个多项式增长的确定函数y(x),~y(x),使得Yt=y(Xt)和~Yt=~y(Xt)对所有t都保持P-a.s≥ 0

22
kedemingshi 在职认证  发表于 2022-5-9 11:27:47
然后控制(u*(Xs,Zs,~Zs),v*(Xs,Zs,~Zs))是纳什均衡。证明:我们首先注意到,由于哈密顿结构保持不变,遍历游戏者的证明与定理3相同。因此,我们将重点放在折扣上。对于任意容许控制v,则*, v) 生成一个度量单位Pu*,vunder哪个dWu*,vt=dW- R(u)*t、 dt是布朗运动。然后(e)-αtYt)=-E-αt[H(Xt,~Zt,u*电视*t) +ZtR(u)*t、 vt)]dt+~ZtdWu,v*T,因此,整合并接受对Pu的期望*,v、 我们得到了∧Y=Eu*,五、ZTH(Xt,~Zt,u)*电视*(t)-■ZtR(美国)*t、 (vt)- L(Xt,u)*t、 (vt)dt+ E-α标准箱*,五、~YT+ 欧盟*,五、ZTL(Xt,u)*t、 vt)dt.在两边进行lim sup,我们得到Y≤ 欧盟*,五、Z∞L(Xt,u)*t、 vt)dt= J(x,u)*, v) ,v=v的等式成立*.定理9。该系统(18)接受了第8项意义上的马尔可夫解。证据概述:由于严格的证据几乎和第4项的证据相同,我们只概述了细微的差异。我们的第一个目标是使用Picard迭代(7)构造系统(18)的解决方案。对于固定α>0,遍历BSDE的统一估计(8)和(9)与之前一样成立,而对于贴现BSDE,统一估计(8)被| v2,n(x)|代替≤ C/α,|v2,n(x)- v2,n(0)|≤ C(1+kxk),其中常数C>0与n和α无关(详情见[3]中的定理8])。这使得我们只需简单的定义就可以完成定理4的其余部分。我们现在关心的是当我们将贴现率α设为零时会发生什么。其思想是从序列{αn}n中提取一个收敛的子序列∈然后研究极限物体。我们首先展示以下结果:定理10。设yα(x),~yα(x)是马氏解to(18)的y分量,λα是第一个游戏者的遍历值。

23
可人4 在职认证  发表于 2022-5-9 11:27:50
然后存在一个序列αn↓ 0和两个多项式增长函数y(·)和y(·),如yαn(x)→ y(x),λαn→ λ,~yαn(x)- ~yαn(0)→ ~y(x),αn~yαn(0)→λ,适用于所有x∈ 注册护士。证明:我们知道,通过构造,函数yαn(·)和∧yαn(·)是局部的Lipschitz,在n中是一致的≤ C(1+kxk),|yαn(x)- ~yαn(0)|≤ C(1+kxk)适用于所有x∈ 注册护士。通过引理1我们也知道{λαn}n≥放在一个小盒子里。因此,我们可以使用对角化过程来构造RN(例如QN)的adense子集上的极限,然后通过连续性扩展到整个空间。使用与定理4证明中的参数相同的参数,我们得出结论,当第二个参与者的贴现率为零时,我们可以提取一个序列,使得J1,αn(x,u*, 五、*) = λαn→ λ、 αnJ2,α(x,u)*, 五、*) = αnyαn(x)→λ,我们可以通过求解以下系统来找到(λ,@λ):(Yt=Yt+RTt[H(Xs,Zs,u*(Zs,~Zs),v*(Zs,~Zs))- λ] ds-RTtZsdWs,~Yt=~Yt+RTt[H(Xs,~Zs,u*(Zs,~Zs),v*(Zs,~Zs))-λ]ds-RTt-ZsdWs。这符合我们的直觉。具体来说,我们知道,对于一个参和者的情况(即标准最优控制问题),EBSDE是由一组贴现的有限水平BSDE得到的。参考文献[1]R.Buckdahn、J.Li和M.Quincampoix。无Isaacs条件的零和随机微分对策混合策略中的值。安。Probab。,42:1724–1768, 2014.[2] S·N·科恩和R·J·埃利奥特。随机演算及其应用。Birkh–auser,第二版,2015年。[3] S.N.C ohen和V.Fedyashov。具有跳跃和时间依赖性的遍历BSDE。arXiv:1406.43292014。[4] A.Debussche、Y.Hu和G.Tessitor。弱耗散假设下的遍历BSDE。《随机过程及其应用》,121:407–4262011。[5] N.El Karoui和L.Mazliak。倒向随机微分方程。皮特曼研究笔记,第364卷,1997年。[6] M·富尔曼、Y·胡和G。

24
可人4 在职认证  发表于 2022-5-9 11:27:53
特西托尔。Banach空间中的遍历BSDE和最优遍历控制。SIA M控制与优化杂志,48(3):1542-15662009。[7] S.Hamad\'ene和J-P.Lepe-ltier。倒向方程,随机控制和零和随机微分对策。《随机与随机报告》,第221-231995页。[8] S.Hamad\'ene和R.Mu。具有无界系数的Mar-kovian非零和随机微分对策Nash平衡点的存在性。《概率与随机过程国际期刊》,87(1):85–11,2015。[9] 胡耀邦、马德克和李卓群。有限维hjb方程弱解大时间行为的概率方法。暹罗J.控制优化。,53(1):378–398, 2015.[10] 胡耀东和唐诗诗。二维正交二次生成元的多维倒向随机微分方程。arXiv:1408.45792014。[11] I.Karatzas和Q.Li。控制和停止的非零和随机微分对策的BSDE方法。在S.N.Cohen、D.Madan、T.K.Siu和H.Yang中,《随机过程、金融和控制:为纪念Robert J.Elliott而发表的Afestschrift》的编辑,第105-153页。《世界科学》,2012年。[12] N.El Karoui和S.Hamad\'ene。BSDEs和r风险敏感控制,随机泛函微分方程的零和非零和对策问题。St ochastic过程及其应用,第145-169页,2003年。[13] J-P.莱佩蒂尔和J.圣马丁。具有连续系数的倒向随机微分方程。统计与概率信件,1997年。[14] 曼努奇。非连续反馈的非泽o-和随机微分对策。《暹罗J.控制优化》,43:1222-12332004。[15] K·R·帕塔萨拉蒂。度量空间上的概率测度。AMS ChelseaPublishing(2005年再版),1967年。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-25 10:32