楼主: nandehutu2022
1053 55

[量化金融] 一类随机对策与移动自由边界问题 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-6-10 17:15:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《A class of stochastic games and moving free boundary problems》
---
作者:
Xin Guo and Wenpin Tang and Renyuan Xu
---
最新提交年份:
2021
---
英文摘要:
  In this paper we propose and analyze a class of $N$-player stochastic games that include finite fuel stochastic games as a special case. We first derive sufficient conditions for the Nash equilibrium (NE) in the form of a verification theorem. The associated Quasi-Variational-Inequalities include an essential game component regarding the interactions among players, which may be interpreted as the analytical representation of the conditional optimality for NEs. The derivation of NEs involves solving first a multi-dimensional free boundary problem and then a Skorokhod problem. We call it a \"moving free boundary\" to highlight the difference between standard control problems and stochastic games. Finally, we present an intriguing connection between these NE strategies and controlled rank-dependent stochastic differential equations.
---
中文摘要:
在本文中,我们提出并分析了一类$N$游戏者随机对策,其中包括作为特例的有限燃料随机对策。我们首先以验证定理的形式导出了纳什均衡(NE)的充分条件。关联的拟变分不等式包含了一个关于参与者之间相互作用的基本博弈成分,可以解释为NEs条件最优性的解析表示。NEs的推导涉及首先求解多维自由边界问题,然后求解Skorokhod问题。我们称之为“移动自由边界”,以突出标准控制问题和随机博弈之间的区别。最后,我们提出了这些NE策略与受控秩相关随机微分方程之间的有趣联系。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--
一级分类:Mathematics        数学
二级分类:Analysis of PDEs        偏微分方程分析
分类描述:Existence and uniqueness, boundary conditions, linear and non-linear operators, stability, soliton theory, integrable PDE\'s, conservation laws, qualitative dynamics
存在唯一性,边界条件,线性和非线性算子,稳定性,孤子理论,可积偏微分方程,守恒律,定性动力学
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:边界问题 自由边界 Mathematical Differential Quantitative

沙发
mingdashike22 在职认证  发表于 2022-6-10 17:15:16
一类随机对策与移动自由边界问题Xhin GUO,WENPIN TANG,RENYUAN XUAbstract。在本文中,我们提出并分析了一类N人随机对策,其中包括作为特例的finefuel随机对策。我们首先以验证定理的形式推导出纳什均衡(NE)的充分条件。相关的拟变分不等式包括关于参与者之间相互作用的非感知博弈成分,这可以解释为NEs条件最优性的分析表示。NEs的推导首先涉及解决多维自由边界问题,然后是Skorokhod问题。最后,我们提出了这些NE策略与受控秩相关随机微分方程之间的一个有趣的联系。1、导言最近,受[23,32,33,34]开创性工作所引领的平均场对策理论(MFG)的快速发展的启发,人们对N人非零和随机对策重新产生了兴趣。在本文中,我们建立并分析了一类随机N人博弈,它起源于经典的有限燃料问题。有很多理由考虑这种类型的游戏。首先,有限燃料问题[7、8、26]是随机控制理论中的一个里程碑,因此从数学上讲,博弈公式是自然的。

藤椅
能者818 在职认证  发表于 2022-6-10 17:15:18
其次,除了随机控制理论[4、9、11、40、41]的兴趣外,其简单而深刻的解决方案结构也有着广泛的应用,包括经济与金融[2、10、12、36]、运筹学与管理[19、29、31]和排队论[28]。第三,分析随机博弈对手之前的成功仅限于两人博弈的特殊情况【13、21、22、27、30、37】或没有燃料约束【14、20】。在本文中,我们将分析一类N人随机博弈,其中包括有限燃料随机博弈作为特例。本文给出的随机对策类如下。有些玩家的动态XXXt=(Xt,····,XNt)受以下N维离散过程控制:dXit=bi(XXXt-)dt+σiσiσi(XXXt-)dBBBt+dξi+t- dξi-t、 Xi0-= xi,(i=1,···,N),(1.1),其中BBB:=(B,··,BN)是过滤概率空间中的标准N维布朗运动(Ohm, F、 {Ft}t≥0,P),漂移bbb:=(b,···,bN),协方差矩阵σ∑:=(σ∑,···,σNσN)满足适当的正则性条件。玩家i的控制(ξi,+,ξi,-) 变化有限。每个玩家都可以访问M种资源的部分或全部。玩家通过其目标函数hi(Xt,···,XNt)以及作为其控制“燃料”的共享资源进行交互。玩家对这些资源的可访问性以及他们各自的玩家如何使用这些资源由矩阵AAA:=(aij)i,j控制∈ RN×M。例如,当M=1,AAA=[1,1,···,1]T∈ RN×1,这个游戏(CpCpCp)对应于N个玩家的有限燃料游戏,其中N个玩家共享固定数量的相同资源。当M=N,AAA=INININ时,这是一个N人游戏(CdCdCd),其中每个玩家散列固定数量的资源。

板凳
大多数88 在职认证  发表于 2022-6-10 17:15:22
一般来说,这个矩阵AAA描述了N人游戏的网络结构。玩家i在游戏中的目标是最小化EEZ∞e-αthi(Xt,···,XNt)dt、2 XIN GUO、WENPIN TANG和RENYUAN XUover适当的可容许博弈策略,如第2节所述。注意,不能简单地用MFG方法分析这个N-playergame,因为如果应用聚合方法,网络结构将崩溃。我们将分析这个随机博弈的NEs。我们首先以验证定理(定理3.1)的形式推导出尼泊尔政策的充分条件,该定理揭示了关于参与者之间互动的基本博弈元素。这是随机博弈中NE条件最优性的Hamilton-Jacobi-Bellman(HJB)表示。为了理解theNEs的结构特性,我们进一步从博弈值、NE策略和受控动力学的角度分析了这个随机博弈。从数学上讲,分析涉及首先解决多维自由边界问题,然后解决具有移动边界的Skorokhod问题。边界是“移动”的,因为它随着系统的变化和其他参与者的控制而移动。通过首先研究两个特殊博弈CPCPC和CdCdCd,得出了解析解。分析这两种类型的游戏可以深入了解一般游戏的解决方案结构。最后,我们以受控秩相关随机微分方程(SDE)的形式对NE策略进行了描述,并比较了CPCPCPC和CdCdCd博弈的博弈值。主要贡献。(i) 在N人对策的验证定理中,我们得到了具有奇异控制的一般随机对策的HJB方程的形式。

报纸
大多数88 在职认证  发表于 2022-6-10 17:15:25
与之前所有专注于两人博弈的分析不同,我们表明,除了对应于仓促控制问题的标准HJB之外,还有一个随机博弈特有的基本术语。该术语表示玩家之间的交互,尤其是活跃玩家和等待玩家之间的交互。这个临界项隐藏在两人随机博弈中,以前被(错误地)理解为正则条件。(ii)游戏和控制问题之间的结构差异在N人游戏NEs的明确解决方案中得到了进一步揭示。在控制问题中,自由边界取决于系统的状态;然而,在随机游戏中,边界的“脸”是基于她自己的动作和游戏中玩家之间的互动而移动的(图3)。请注意,具有有限时间范围的托卡斯特博弈的这个自由边界与[11]中关于时间依赖性边界的时间控制问题的自由边界在不同的意义上移动。相反,它的移动是由于系统的变化和游戏中的竞争。(iii)这种差异在受控等级相关SDE的框架中得到进一步强调。据我们所知,这是第一次以更一般的形式将随机博弈与随机依赖SDE明确联系起来。这种新形式的秩相关SDE提出了一类新的尚待研究的SDE(第7.2节)。(iv)我们在受控rankdependent sde的框架内重新构建了博弈解的受控动力学。与著名的秩相关随机微分方程相比,具有附加控制成分的秩相关随机微分方程是新的。我们通过直接构造反射扩散过程来确定解的存在性。(更多讨论请参见第7.2节。)(v) 最后,本文考虑的随机博弈是资源分配博弈。

地板
mingdashike22 在职认证  发表于 2022-6-10 17:15:28
资源分配问题有着广泛的应用,包括库存管理、资源分配、云计算、智能电网控制和多媒体无线网络【16、17、35、39】。然而,现有的文献在分析随机博弈环境下的资源分配问题时并不成功。除了技术贡献之外,我们的分析还提供了一个有用的经济见解:在资源分配的随机博弈中,共享的成本比分割和共享的成本低,每个参与者的成本最低。相关工作。关于具有奇异控制的非零和二人对策,有许多论文。通过将一名球员视为控制器,另一名球员视为阻挡者,Karatzas和Li【27】使用BSDE方法分析了游戏中NE的存在。Hernandez Hernandez、Simon和Zervos【22】研究了值函数的光滑性,并表明当控制器享有第一步优势时,最优策略可能不是唯一的。Kwon和Zhang【30】研究了一个具有单一控制和战略退出的不可逆投资游戏。他们刻画了一类市场有限燃料博弈3完美均衡,并确定了一组条件,在这些条件下,尽管均衡具有多重性,博弈结果可能是唯一的。De Angelis和Ferrari【13】建立了非零和双人游戏中单方控制和最佳停车时间之间的联系。Mannucci【37】和Hamadene以及Mu【21】考虑了有限时间范围内有界速度下的燃料跟随者问题,并通过不同的技术确定了两人博弈中NE的存在性。最近,[20]比较了N人博弈和制造商博弈中的燃料跟随器问题。

7
mingdashike22 在职认证  发表于 2022-6-10 17:15:31
所有这些工作都没有燃料约束,基本上建立在一维随机控制问题上。此外,除[20]外,所有这些论文都限于N=2的情况。据我们所知,我们的工作是第一次完成基于原始二维控制问题的N人随机博弈的数学分析。在我们的工作中,受控动力学是在受控秩相关SDE的框架中重新构建的。无控制的秩相关SDE出现在“上游”问题[1]和随机投资组合理论[15],包括研究充分的Atlas模型[5,24]。符号和组织。在整篇论文中,我们用粗体字母表示向量/矩阵,例如xxx和xxx。实向量xxx的转置表示为xxxT。对于向量xxx,kxxxk表示其lnorm。对于矩阵XXX,kXXXk表示其谱范数。本文的组织结构如下。第2节介绍了N-playergame的数学公式。第3节提供了一个验证定理,用于验证博弈NE的有效条件以及NE策略的Skorokhod问题的存在性。第4节研究游戏CPCPC,第5节研究游戏CdCdCd。根据这两个游戏的见解,第6节分析了一般的N人游戏CCC。第7节比较了游戏CpCpCp、CDCDCDC和CCC,讨论了游戏价值及其经济含义,并在受控等级依赖DES的框架内统一了相应的受控动态。2、问题设置受控动态。Let(Xit)t≥0为玩家i的位置,1≤ 我≤ N

8
nandehutu2022 在职认证  发表于 2022-6-10 17:15:34
在没有控制的情况下,XXXt=(Xt,···,XNt)由随机微分方程(SDE)控制:dxxt=bbb(XXXt)dt+σσ(XXXt)dBBBt,XXX0-= (x,···,xN),(2.1),其中BBB:=(B,···,BN)是过滤概率空间中的标准N维布朗运动(Ohm, F、 {Ft}t≥0,P),漂移bbb(·):=(b(·),··,bN(·))和协方差矩阵σσ(·):=(σij(·))1≤i、 j≤N、 正如后面第3.3节所解释的,我们考虑托卡斯蒂克博弈的弱公式。为了确保SDE的存在性和唯一性,假设bbb(·)和σσ(·)满足条件H1。bbb(·)和∑∑∑(·)是有界连续的,且∑∑(·)是一致椭圆的,即存在α>0,使得ξT∑∑∑(xxx)σ∑>(xxx)ξ≥ α|ξ|,对于所有xxx∈ RN,ξ∈ 注册护士。假设H1确保(2.1)[42]存在弱解。在本文的剩余部分,微型发电机L isL:=Xibi(xxx)xi+xi,j(σσσ(xxx)σσ(xxx)T)i,jxixj,(2.2),其中σσσ(xxx)σσσ(xxx)假设为每个xxx的正定义∈ 注册护士。如果控件应用于Xit,那么Xit将演变为dxit=bi(XXXt-)dt+σσi(XXXt-)dBBBt+dξi+t- dξi-t、 Xi0-= xi,(2.3),其中σσi是协方差矩阵σσ的第i行。这里是控制(ξi+,ξi-) 是一对非递减和c\'adl\'ag进程。换句话说,(ξi+,ξi-) 是有限变量过程ξ的最小分解,ξi:=ξi+- ξi-.4郭欣、汤文彬和徐仁远的目标。游戏是让玩家i最小化,对于所有人(ξi+,ξi-) 在适当的容许控制集中,在有限的时间范围内,以下目标函数EZ∞e-αthi(Xt,···,XNt)dt。(2.4)这里α>0是一个常数贴现因子。在这个游戏中,玩家通过各自的目标函数hi(xxx):RN进行交互→ R+。H2。

9
mingdashike22 在职认证  发表于 2022-6-10 17:15:37
每个hi(xxx)是两次可区分的,k≤ ||你好(xxx)| |≤ 对于某些K>K>0。例如,hi(xxx)=h(xi-PNj=1xjN)带h(·)≥ 0是playeri位置与所有玩家中心之间的距离函数。请注意,在目标函数(2.4)中,没有控制成本。有了这个公式,NE for game(2.4)的明确解决方案结构简洁而富有洞察力。完全有可能考虑一个N人游戏,需要额外的控制成本。例如,我们可以研究[26]的游戏配方,并按比例控制成本。我们推测,虽然分析会涉及更多内容,但解决方案结构会相似。这将是未来分析的一个有趣问题。可接受的控制策略。表示ˇξIta是玩家i到时间t消耗的控件/资源的累积量。当ξ是有限变化时,则存在唯一分解,从而ξit:=ξi+t- ξi-t、 因此71ξit:=ξi+t+ξi-t、 这里ξi+和ξi-是非递减和c ` adl ` ag过程,可进一步以不同形式分解,dξi±t=d(ξi±t)c+ξi±t,(2.5),其中d(ξi±t)cis为连续分量,且ξi±t:=ξi±t- ξi±t-是dξi±t的跳跃分量。等效地,我们可以写出ξi±t=(ξi±t)c+Ps≤t型ξi±s。同时,我们考虑了随机对策的一个弱公式。(有关随机控制问题弱公式的更多讨论,请参见[43,第2章,第4.2节]和[18,第5节])。

10
可人4 在职认证  发表于 2022-6-10 17:15:40
也就是说,(BBBt,t≥ 0)是具有某种过滤(Ft,t)的N维布朗运动≥ 0),N人游戏isSN(xxx,yyyy)的可容许控制集SN(xxx,yyy):=(ξξξ:ξi∈ UiNfor 1≤ 我≤ N、 NXi=1Z∞aijYjt公司-PMk=1aikYkt-dˇξit≤ yj,1≤ j≤ M、 Pξitξkt6=0= 0表示所有t≥ 0和i 6=k),(2.6),其中u:=n(ξ+,ξ-) : ξ+和ξ-Ft是否可逐步测量,c\'adl\'ag,非递减,EZ∞e-αtdξ±t< ∞ 和ξ+0-= ξ-0-= 0o,andYjt=yj-NXi=1ZtaijYjs-PMk=1aikYks-dˇξ为∈ R+和Yj0-= yj,(2.7),aij=0或1表示1≤ 我≤ N和1≤ j≤ M、 对于所有i=1,···,N,PMj=1aij>0,对于所有j=1,··,M,pni=1aij>0。以下是容许控制集SN(xxx,yyy)的直觉。在这个游戏中,我将根据所有玩家的当前位置和可用资源做出决策。除此适应性约束外,允许的控制集SN(xxx,yyy)规定了每个玩家的资源分配策略。对于M种不同类型的资源,定义AAA:=(aij)i,j∈ RN×Mto是aij=0或1的相邻矩阵x。然后,AAA描述了玩家和可用有限燃料游戏5资源类型之间的关系,aij=1表示j类型的资源可供玩家i使用,aij=0表示j类型的资源对玩家i不可访问。对于所有i=1,····,条件pmj=1aij>0表示每个玩家i至少可以访问一种资源,对于所有j=1,····,M,条件pni=1aij>0表示每个资源j至少可用于一个玩家。当玩家i想要行使控制权时,她将消耗与所有可用资源成比例的资源。一旦所有可用资源达到零级,她将停止消费。这导致了(2.7)表达式中的整数形式。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:26