楼主: kedemingshi
1197 23

[量化金融] 非零和遍历随机微分对策的纳什均衡 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-5-9 11:26:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Nash equilibria for non zero-sum ergodic stochastic differential games》
---
作者:
Samuel N. Cohen and Victor Fedyashov
---
最新提交年份:
2017
---
英文摘要:
  In this paper we consider non zero-sum games where multiple players control the drift of a process, and their payoffs depend on its ergodic behaviour. We establish their connection with systems of Ergodic BSDEs, and prove the existence of a Nash equilibrium under the generalised Isaac\'s conditions. We also study the case of interacting players of different type.
---
中文摘要:
在本文中,我们考虑了非零和对策,其中多个参与者控制一个过程的漂移,其收益取决于其遍历行为。我们建立了它们与遍历BSDE系统的联系,并证明了在广义Isaac条件下纳什均衡的存在性。我们还研究了不同类型的互动玩家的情况。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
--> Nash_equilibria_for_non_zero-sum_ergodic_stochastic_differential_games.pdf (256.77 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:纳什均衡 随机微分 Differential Quantitative Optimization

沙发
能者818 在职认证  发表于 2022-5-9 11:26:29
非零和遍历随机微分对策的纳什均衡*牛津大学Victor Fedyashovov牛津大学2018年8月26日摘要我们考虑非零和博弈,其中多个参与者控制一个过程的漂移,他们的收益取决于其遍历行为。我们建立了它们与能量型BSDE系统的联系,并证明了在广义Isaac条件下纳什均衡的存在性。我们还研究了不同类型的互动玩家的情况。MSC:91A60,49N70,93E20关键字:遍历博弈,纳什均衡,BSDE1简介非零和随机微分博弈领域在过去几十年中一直是一个深入研究的主题。它处理的情况是,多个参与者都试图最大化他们的报酬,但所有参与者的报酬总和并不是任何常数。基本目标是找到一个纳什均衡点——所有参与者的一套策略,这样他们就不会从单方面的偏离中受益。Hamad`ene、Lepeltier和Peng在[5]中率先研究了这个问题与倒向随机微分方程(BSDE)之间的联系,并在他们之前在Hamad`ene和Lepeltier[7]中关于零和博弈的工作的基础上进行了进一步的研究。从那时起,它在多个环境中被讨论过,例如[11]中的Karatzasand Li的控制和阻止游戏,以及[12]中的El Karoui和Hamad`ene的风险敏感控制游戏。本文的主要目的是证明一个平衡点的存在性,在这种情况下,我们有两个遍历的漂移控制参与者,即他们在有限的视野内选择他们的策略,并优化长期平均值。按照标准方式(s e e,例如Hamad`ene和Mu[8]),我们在哈密顿量上施加所谓的Generalise d Isa ac条件,以确保两个参与者同时达到最小值。

藤椅
能者818 在职认证  发表于 2022-5-9 11:26:32
然后证明了对策鞍点的存在性源于解的存在性*该研究由Oxf-ord-Man定量金融研究所和theOxford-Nie金融大数据实验室支持。具有连续系数的遍历BSDE系统。使用改进版的P ic ard迭代(本质上与胡安和唐在[10]中使用的定点构造相同),以及Debusche、Hu和Tessitor[4]和作者[3]中建立的EBSDE解的一系列估计,我们证明这样的系统确实允许解。然后,我们将这些结果推广到有限或可数多个参与者的情况。作为开发处理e-rgodic博弈所需机制的副产品,我们得到了一类具有连续线性增长驱动的ebsde解的存在性。最后一节讨论了非对称博弈,其中一个博弈者是纯遍历的,另一个博弈者也会在有限的时间内进行优化,但更看重当前而非未来(即使用折扣)。我们证明了这样一个博弈的价值是存在的,并且证明了当贴现率为零时收敛到遍历系统。2.我们首先描述不受控的正向过程{Xt}t≥0,续集中的玩家将对其产生影响。让{Xt}t的动力学≥0受It^o SDE控制:dXt=(AXt+F(Xt))dt+σdWt,X=X∈ RN,(1)其中W表示RN中的标准布朗运动,在测度P下。我们需要一些初步假设。假设1。

板凳
何人来此 在职认证  发表于 2022-5-9 11:26:36
保证存在唯一强大解决方案的条件(1):o三重(Ohm, F、 P)是概率空间,{Ft}t≥0是一个正确的连续过滤,每个t的FTI都已完成。o过程{Wt}t≥0是过滤{Ft}t中具有可预测表示性质的布朗运动≥0.o算子A是耗散的,并生成一个稳定的半群{etA}t≥换句话说,存在常数u>0,M>0,例如hax,xi≤ -ukxk和k≤ 我-uthold适用于所有x∈ R和所有t≥ 0.本文及其他部分k·k证明了欧几里德范数(或矩阵的弗罗贝尼乌斯范数)图F是一致Lipschitz连续且有界的矩阵σ是可逆的。备注1。由于我们将考虑(1)的遍历行为,在各种概率测度下,我们需要小心不要以通常的方式完成过滤。上述要求是不标准的,但很容易看出,所有常见的存在证明都是通过及时粘贴来实现的。下面的结果是Gr–onwall引理和耗散性条件的一个简单应用:定理1。如果假设1满足,则方程(1)存在唯一的强解。此外,EkXtk< C(1+kxk),其中常数C依赖于M,u,但与t无关。证明:假设Lipschitz连续性,则(1)的astrong平方可积解的存在性为标准d。固定常数k>0。应用It^o公式计算EktkxTk,并取期望值,得到EktkxTk=Ekxk+ZtkekskXskds+EZteksG(s)ds,其中g(s)=2hAXt+F(Xt),Xsi+kσk≤ -2ukXsk+hF(Xs),Xsi+kσk。考虑到假设1并应用Cauchy–Schwarz,我们发现,对于任何>0的情况,都存在C,例如g(s)≤ -2(u - )kXsk+C,代表0≤ s≤ t、 然后,选择<u和k<2(u- ),我们到达一个Tekxtk≤ Ekxk+Ckekt,总结证明。备注2。

报纸
mingdashike22 在职认证  发表于 2022-5-9 11:26:40
通过将It^o引理应用于Kxtk,并使用定理1证明中相同的推理,我们还可以证明Ekxtk≤ C(1+kxk),(2)对于一些与时间无关的常数C。备注3。如果漂移的非线性部分F(·)是有界可测映射,则(1)仍存在弱意义下的解。换言之,对于任何T>0,都存在一个度量PT~ P、 还有一个?PT布朗运动?∈ [0,T],Xt=etAx+ZtesAF(Xs)ds+ZtesAFσdW(s),该解决方案在法律上是唯一的(对于不同的ofT<∞, 因此,W是唯一定义的)。此外,由于该解可以通过从强解到方程的测度变换而不产生漂移,{Wt}t∈[0,T]在过滤{Ft}T中具有可预测的表示属性∈[0,T]在PT下,适用于所有T。有关详细信息,请参见[2]中的第15章和第18章。如果我们假设Ohm 是一个标准的维纳空间,那么科尔莫戈罗夫的扩张理论可以用来定义一个测度!≥0,因为在fw中存在太多的空集会有问题。在更一般的情况下,这个扩展是一个非常重要的练习,例如,请参见Parthasarathy[15]。设U×Ube是一个控制的可寓言度量空间,其中(ut(ω),vt(ω))取值。用Li表示:RN×U×U→ R、 i=1,2,有界可测代价函数,使得| Li(x,u,v)- Li(x′,u,v)|≤ Ckx- x′k,对于某些C>0的情况。给定任意一对容许控制(u,v)(即可预测随机过程({ut}t≥0,{vt}t≥0),我们定义了Girsanov密度ρu,vT:=expZTR(ut,vt)载重吨-ZTkR(ut,vt)kds对于某些函数R:U×U→ RN,满足kR(·,·)k≤“有些是C”\'C>0。我们定义了概率Pu,v,T:=ρu,vTP。对于每个代理(i=1,2),我们定义了三次支付(u,v)=lim supT→∞T-1Eu,v,TZTLi(Xt,ut,vt)dt.

地板
nandehutu2022 在职认证  发表于 2022-5-9 11:26:44
(3) 目标是找到一个可接受的控制(u*, 五、*), 这样的*, 五、*) ≤ J(u,v)*) 和J(u)*, 五、*) ≤ J(u)*, v) 适用于所有可接受的(u,v)。为了使用动力学原理来确定最佳的u和v,我们定义了(u,v)的哈密顿函数{Hi}i=1,2,asHi(x,zi,u,v)=ziR(u,v)+Li(x,u,v)(4)∈ U×U。我们注意到,对于一对固定的控制(U,v),对于每一层(i=1,2),支付(3)是一个erg odic平均值。考虑以下遍历倒向随机微分方程(EBSDE),其中哈密顿量起驱动项的作用:Yit=Yit+ZTt[Hi(Xs,Zis,us,vs)- λi]ds-ZTtZisdWs。(5) 假设存在一个三重态(Yi,Zi,λi)到(5),并且存在一个常数C=C(x)>0,与T无关,使得Eu,v,T | Yit |<C为0≤ T≤ T<∞. 然后,通过改变度量并除以T,我们立即得到tJi(u,v)=λi。我们称(5)为响应于值函数(3)的BSDE cor。为了继续进行,我们假设如下:假设2。下面(i)部分被称为广义艾萨克病。第二部分是技术条件,后面将讨论其背后的动机。(i) 存在可测量的地图*, U*, 定义在R3N上,数值分别以uandu表示,例如h(x,z,u*(x,z,z),u*(x,z,z))≤ H(x,z,u,u)*(x,z,z))和h(x,z,u*(x,z,z),u*(x,z,z))≤ H(x,z,u)*(x,z,z),v)适用于所有(x,z,z,u,v)∈ R3N×U×U.(ii)映射(z,z)∈ R2N→ (H)*, H*)(x,z,z)对于任何固定的x都是连续的。考虑上述条件的一种方法是将零和框架中使用的标准假设自然扩展到非零和情况。实际上,考虑两个参与者的情况,一个最大化,另一个最小化函数lj(u,v)=lim supT→∞T-1Eu,v,TZTL(Xt,ut,vt)dt,通过选择控件(ut、vt)∈ U×Ufor t≥ 0

7
nandehutu2022 在职认证  发表于 2022-5-9 11:26:48
将哈密顿量定义为H(x,z,u,v)=zR(u,v)+L(x,u,v)。然后,使用一个可测量的selectionargument,我们可以知道标准Isaac的条件Maxv∈ 乌米努∈呃(x,z,u,v)=分钟∈Umaxv∈ 呃(x,z,u,v),x、 z∈ Rn等价于Borel可测函数u的存在性*: R2N→ Uandv*: R2N→ U、 这样h(x,z,U)*(x,z),v*(x,z))≤ H(x,z,u,v)*(x,z)为了所有的人∈ U、 H(x,z,U)*(x,z),v*(x,z))≥ H(x,z,u)*(x,z),v)对于所有v∈ U.有关详细信息,请参见Hama d\'ene和Lepeltier[7]。考虑到这一点,我们可以看到(i)在假设2中是对艾萨克条件的合理概括。备注4。我们注意到,对于固定的u,v,函数Hiis Lipschitz in zi。然而,假设2只给出了所谓的“闭环”控制的存在性,其中最优过程u*, 五、*依赖于(z,z),并且仅保证HI的连续性。因此,证明相应遍历BSDE解的存在性的标准方法崩溃了。我们应该注意,假设2并不能保证*奥夫*是连续的(类似假设参见Mannucci[14])。备注5。在我们考虑的游戏中,两个玩家都控制漂移。在[8]中,作者考虑了结果R(u,v)可以是无界的,但t是关于基本过程{Xt}t的线性增长≥然而,由于我们处于遍历框架中,我们将注意力限制在有界情况。虽然艾萨克的条件可以说是自然的,但我们应该注意到,在没有这种假设的情况下,已经有关于随机微分对策的研究(例如见Buckdahn、Li和Quincampoix[1])。备注6。人们还可能注意到,广义的艾萨克条件和鞍点定义之间的相似性。

8
nandehutu2022 在职认证  发表于 2022-5-9 11:26:52
事实上,可以将假设2的第(i)部分视为确保在极小规模上存在纳什均衡控制。3具有连续有效性和随机博弈的遍历BSDE在本节中,我们证明,在我们的假设下,博弈具有价值,即存在前一节定义的纳什均衡。我们先把两个遍历型的参和者组合起来,然后将其推广到n的情形∈ N∪ {+∞} 球员们。最后,我们展示了与PDE的连接。3.1具有两个遍历类型参与者的博弈为了确定纳什均衡的存在性,需要执行以下两步规划:o假设存在与控制对(u)相对应的EBSDE解*, 五、*) 如假设2所述,确定其最优性证明了具有连续系数的EBSDE的唯一解的存在性,保证了这一假设成立。为了证明具有驱动因子f的一维遍历矩阵解的存在性,需要对驱动因子进行以下假设:假设3。“司机”f:RN×RN→ R是一个可测量的地图。此外,还存在常数l,κf(x,0)≤ Lf(x,z)- f(x,`z)≤ κkz- 所有x,z,z都适用∈ 注册护士。我们首先陈述了遍历BSDE理论的某些重要结果。下面的定理证明了解的存在性和唯一性。我们省略了证明,因为它可以很容易地用[4]中的参数构造。定理2。让驾驶员f满足第3项要求。然后存在一个解(Y,Z,λ),其中{Yt}t≥0被改编,{Zt}t≥0是可预测的,λ∈ R是常数,对于EBSDEYt=YT+ZTt[f(Xs,Zs)- λ] ds-ZTtZsdWs,这样| Yt |≤ C(1+kxtk)对于某些常数C>0。还存在一个确定性函数v:RN→ R、 使Yt=v(Xt)。

9
nandehutu2022 在职认证  发表于 2022-5-9 11:26:55
此外,该解在马尔可夫解类中是唯一的,对于马尔可夫解,Y分量相对于X是多项式增长的。我们现在证明,如果两个参和者都能通过最优控制对(u*, 五、*),然后通过这样做,他们找到了纳什均衡。定理3。假设存在两个三元组(Yi,Zi,λi),i=1,2,这样的三元组是YiT=YiT+ZTt[Hi(Xs,Zis,u*(Zs,Zs),v*(Zs,Zs))- λi]ds-ZTtZisdWs(6)适用于所有0≤ T≤ T<0,其中*, 五、*) 和假设中一样。此外,假设存在两个多项式增长的确定函数yi(x),i=1,2,使得Yit=yi(Xt)对所有t都保持P-a.s≥ 0.然后控制(u*(Xs,Zs,Zs),v*(Xs,Zs,Zs))是纳什均衡。证据:我们关注的是i=1的情况。弗特≥ 0写你*t=u*(Zt,Zt)和*t=v*(Zt,Zt)。对照组(u*, 五、*) 这显然是可以接受的。对于任意容许控制u,对于任何T>0,对(u,v*) 生成一个度量单位Pu,v*,T、 在这下面,吴,v*t=Wt-RtR(美国,v*s) ds是[0,T]上的布朗运动。那么,因为(Y,Z,λ)解出了EBSDE,λT=YT- Y+ZT[H(Xs,Zs,u*s、 五*(s)- ZsR(ut,v*(s)- L(Xs,us,v)*s) ]ds-ZTZsdWu,v*s+ZTL(Xs,美国,v*s) ds。对Pu,v.抱有期望*,T、 记住λ是常数,我们得到λ≤标准箱*,T[YT- Y] +TEu,v*,TZTL(Xs,美国,v*s) ds,自那时起(Xs,Zs,u*s、 五*(s)- ZsR(ut,v*(s)- L(Xs,us,v)*(s)≤ 0根据(u)的定义*, 五、*). 我们称之为X中多项式l增长的Yi,后者在Pu,v下有所有的矩*均匀分布在t中(有关详细信息,请参见,例如[4])。因此,在两边取lim sup,我们得到λ≤ 林监督→∞标准箱*,TZTL(Xs,美国,v*s) ds= J(u,v)*).对于u=u*世界各地的不平等都是通过对公平的定义而变得平等的*, 五、*) 在假设2中。同样地,我们观察J(u)*, 五、*) = λ≤J(u)*, v) 对于任何可接受的控制v,完成证明。备注7。

10
mingdashike22 在职认证  发表于 2022-5-9 11:27:00
定理3的结果表明,即使在容许控制为非马尔可夫控制的情况下,系统(6)的解λi,i=1,2仍然是最优的。换句话说,利用广义的Isaac条件,我们可以证明在更大的“开环”或“可预测”控制中存在最优的“闭环”或“反馈”控制。我们现在开始我们计划的第二步。我们证明了erg-odic B-SDE s(6)系统存在一个解。下面的辅助结果是遍历值λ比较定理的弱版本,适用于多维。引理1。设fi,i=1,2是两个驱动,使得对于任何(x,z,z)| fi(x,z,z)|≤ Ckzik+\'C对于某些常数C,\'C>0。假设存在对应EBSDE的马尔可夫解(Yi,Zi,λi),i=1,2。设λ为EBSDE解(Y,Z,λ)的遍历部分-dYt=[(CkZtk+\'C)- λ] ds- ZtdWt。然后λi≤ λ表示i=1,2。证明:定义一个度量qt如下:dQTdP:=EZTf(Zt)- f(Zit)kZt- Zitk(Zt)- Zit)dWt,其中f(z)=Ckzk+\'C。然后在QT下,过程{Xt}t≥0是遍历的,具有某种不变度量u。由于我们只考虑马尔可夫解,我们知道Yit=vi(Xt)、Yt=v(Xt)和Zit=ζi(Xt)(有关马尔可夫表示的详细信息,请参见例如Fuhrman、Hu和Tessitore[6])。然后,积分微分vi(x)- v(x),我们得到了zrn(vi(x)- v(x))u(dx)=ZRNEQT(vi(XT)- v(XT))+ZTfi(XT,Zt,Zt)- f(Zit)dt- T(λi)- λ)u(dx)=ZRN(vi(x)- v(x))u(dx)- T(λi)- λ) +ZTZRNfi(x,ζ(x),ζ(x))- f(ζi(x))u(dx)dt,从中我们立即看到λi- λ=ZRN(fi(x,ζ(x),ζ(x))- f(ζi(x))u(dx)≤ 0,完成证明。有两种明显的方法来解决证明(6)的解存在的问题:(i)对于任何t≥ 0,等式(6)给出了一个ma p Yit+1→ 我很高兴∈ 1 , 2.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 08:15