楼主: mingdashike22
918 27

[量化金融] 最优停车的平均场对策 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-5-25 08:25:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《A Mean Field Game of Optimal Stopping》
---
作者:
Marcel Nutz
---
最新提交年份:
2017
---
英文摘要:
  We formulate a stochastic game of mean field type where the agents solve optimal stopping problems and interact through the proportion of players that have already stopped. Working with a continuum of agents, typical equilibria become functions of the common noise that all agents are exposed to, whereas idiosyncratic randomness can be eliminated by an Exact Law of Large Numbers. Under a structural monotonicity assumption, we can identify equilibria with solutions of a simple equation involving the distribution function of the idiosyncratic noise. Solvable examples allow us to gain insight into the uniqueness of equilibria and the dynamics in the population.
---
中文摘要:
我们构造了一个平均场型随机博弈,其中代理解决最优停止问题,并通过已经停止的参与者的比例进行交互。使用连续的代理,典型的平衡成为所有代理所暴露的公共噪声的函数,而特殊的随机性可以通过精确的大数定律消除。在结构单调性假设下,我们可以用一个包含特殊噪声分布函数的简单方程的解来识别平衡点。可解的例子使我们能够洞察平衡的唯一性和种群中的动力学。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Mathematical distribution Optimization Differential Quantitative

沙发
kedemingshi 在职认证  发表于 2022-5-25 08:25:05
最优停止的平均场对策*第一版:2016年5月30日。本版本:2018年8月27日摘要我们制定了一个平均场类型的随机游戏,其中代理解决最佳停止问题,并通过已经停止的玩家的比例进行交互。使用连续介质时,典型的平衡成为所有介质所暴露的共同噪声的函数,而特殊的随机性可以通过一个精确的大数定律来消除。在结构单调性假设下,我们可以用一个包含特殊性分布函数的简单方程的解来识别平衡。可解的例子使我们能够深入了解种群中平衡的唯一性和动力学。平均场对策;最优停车;Bank RunAMS 2010科目分类91A13;60G40;91A15;91A551简介拥有大量n名玩家的随机游戏是出了名的难以对付的。Lasry和Lions【24、25、26】以及Huang、Malhamé和Caines【19、20】引入了平均场博弈,以研究限制区域中的纳什均衡,其中n趋于统一,玩家通过所有玩家私有状态的经验分布对称互动。给定这样的分布u,每个玩家通常解决一个标准控制问题;也就是说,在支付一定费用的同时控制分歧。另一方面*哥伦比亚大学统计与数学系,mnutz@columbia.edu.阿尔弗雷德·P·斯隆奖学金和NSF拨款DMS-1512900支持的研究。

藤椅
何人来此 在职认证  发表于 2022-5-25 08:25:09
这项工作通过与布鲁诺·布查尔德、勒内·卡莫纳、伊奥尼斯·卡拉萨斯、丹尼尔·拉克尔、何塞·谢因克曼、尼扎尔·图齐的讨论以及两位匿名裁判的详细评论得到了极大的支持,作者对此深表感谢。回报(以及可能的差异)取决于u,而u又取决于所有代理的行动。在分析理论中,此类系统由非线性偏微分方程(PDE)耦合系统描述:当给定u时,Hamilton–Jacobi–Bellman方程描述最优控制问题,Kolmogorov型方程描述u随时间的演化作为最优控制的结果。其中一个主要困难是,前一个方程自然地从终端条件开始,并在时间上向后运行,而后一个方程向前运行,以确保u的一致性;我们参考[6,17]了解背景。在该理论的概率版本中,使用了随机极大值原理,并将偏微分方程系统替换为耦合的前向-后向随机微分方程;参见[4、7、8、9]。在最简单的情况下,代理暴露于特殊的i.i.d.噪声(本质上,每个扩散方程都是一个独立的布朗运动),因此平衡被表述为确定性的。最近,额外的公共噪声和随机均衡的存在受到了相当大的关注;参见【10、13、16、22、28】。过去十年中,从生产模型到人口动态,出现了各种各样的应用,其中有几项在[18]中进行了总结;有关系统风险的最新模型,请参见[12],有关金融中的价格影响,请参见[13]。虽然平均场游戏是作为大型游戏的一个易于处理的模型引入的,但它们仍然相当复杂。

板凳
mingdashike22 在职认证  发表于 2022-5-25 08:25:12
据我们所知,唯一可以显式解决的情况是线性二次控制(线性动力学,二次成本)。对此情况进行了详细研究;参见[2、3、5、12]。在其他情况下,通常必须通过非线性方程耦合系统来解决f或抽象描述。本论文的主要目的是制定一个可处理的平均场型博弈,其中可以更直接地理解均衡的性质。在我们的案例中,代理将解决最佳停止问题,而不是扩散控制。虽然在标准的平均场游戏中,玩家的(空间)位置很重要,但这里的状态空间是二进制的:每个玩家要么已经停止,要么仍然在游戏中,而互动是通过已经停止的玩家的数量发生的。由于其简单的解释和从银行挤兑模型到交易优化的广泛可能应用,这种结构似乎很有吸引力。勒内·卡莫纳(Rene Carmona)首先向作者指出了这种游戏的可能兴趣。【18】的第2节可以看作是一个前身,至少在精神上是这样的:在一个托耶的例子中,叫做“会议什么时候开始?”代理人间接控制其到达预定地点的时间。另一方面,它在游戏中产生了一个固有的不连续性:经济学中众所周知(例如,[14,27]),最佳时机的游戏可能很容易退化,因为所有玩家都在同一时间停止。因此,其中一个挑战是产生一类典型平衡不平凡的模型。具体来说,我们将研究一个连续时间的随机博弈,其中有一个连续的参与者。在平衡状态下,每个代理i将解决formsupτE的最优停止问题经验值ZτRSD{θ>τ}∪{θ=∞};它有两种相互竞争的力量。

报纸
nandehutu2022 在职认证  发表于 2022-5-25 08:25:15
过程r可以解释为只要代理不停止,就应计的报酬利率,从而激励代理留在游戏中。另一方面,还有一个违约时间θ(利息支付机构):如果θ发生在代理离开游戏之前,代理将失去一切。虽然违约对代理人来说是一个“惊喜”,但θ的分布受代理人已知的强度过程γ的控制:γi越大,违约越有可能很快发生。更准确地说,θ被建模为强度为γi的Cox过程的第一次。这导致了单主体最优停止问题的可处理解决方案,我们从金融文献(例如,[23,第5章])中获得了灵感,众所周知,类似环境下的可违约债券将像不可违约债券一样定价,但利率调整后r- γi。代理人对犯规分布的看法是不一致的。我们认为强度γias取决于代理人i使用的主观概率。因此,球员面临不同的最优停球问题,可能在不同的时间达到顶点。经纪人对违约强度的看法也将受到多少球员已经停赛的影响;更精确地说,比例ρt∈ [0,1]的玩家在时间t之前离开游戏。所有代理都会观察到这一过程,并创建平均场类型的交互:如果ρ越大,任何玩家的强度也会越大,这意味着感知到的违约会发生得越快。正如在银行挤兑模型中一样,这表明,如果有更多的客户弃船,那么机构违约的可能性更大。虽然我们将设定的一般公式推迟到第5节,但非典型模型可能会假设γiis的形式为γit=Xt+Yit+cρt。

地板
何人来此 在职认证  发表于 2022-5-25 08:25:19
(1.1)这里,X起着共同噪声的作用(所有代理都是一样的),而Yi是一种特殊噪声,在人群中是i.i.d。根据应用情况,可以将X和yi分别解释为公共信号和专用信号,或者将它们的总和视为真实信号X的噪声观测值≥ 0控制交互强度;也就是说,代理的观点在多大程度上受到ρt的影响。假设τiis是代理i选择的停止时间,代理的连续统由无原子概率空间(i,i,λ)表示。那么,ρt(ω)=λ{i:τi(ω)≤ t} (1.2)是在时间t之前停止的玩家的“比例”。这也可以被视为在时间t的累积分布函数(c.d.f.),用于描述系统在I×{0,1}上的演化,记录每个代理I是否停止(1)(0)。如果我们从一个给定的过程ρ开始,就可以确定试剂的强度γiof。假设相关的最优停止问题有解(τi)i∈一、 默认假设一个合适的可测性,我们可以考虑过程λ{I:τI(ω)≤ t} ,如果满足(1.2),我们应表示ρ和(τi)i∈形成平衡。由于我们正在处理一系列的参与者,单个代理的决策不会影响ρ,因此这个概念对应于纳什均衡:给定其他参与者的策略,每个参与者的行为都是最优的。我们的主要结果(定理5.1)将平衡ρ与有限维方程的解联系起来。例如,在(1.1)的情况下,它的读数为1- u=英尺(r- 十、- cu),u∈ [0,1],(1.3),其中FTI是特殊噪声Yt的c.d.f,r是(恒定)利率。

7
kedemingshi 在职认证  发表于 2022-5-25 08:25:22
如果ρ(t,x)是时间t的(最大)解u,xts是公共噪声,那么ρ(t,Xt)描述了一个平衡,也建立了一个相反的平衡。这个简单的方程允许我们更详细地理解平衡的结构和多重性。有两个因素对我们环境的可处理性很重要。一方面,我们使用精确的大数定律来完全消除特殊的随机性(后面将讨论相关的数学设置)。这一思想及其许多体现在经济学中是众所周知的;请参见[1、15、21、31]以引用一些示例。另一方面,我们假设γi- r在增加,正如我们将看到的,这导致了单代理问题的简单解决方案。与平均场对策文献中常见的耦合前向后向方程组相比,可以说汉密尔顿-雅可比-贝尔曼部分变得无关紧要,因为我们知道反馈形式的单主体问题(给定ρ)的解,而我们的方程实际上代表了科尔莫戈罗夫前向方程,我们可以使用(1.3)中的时间导数来找到ρ的偏微分方程,或者在没有常见噪声的情况下找到ODE。虽然本论文的主要目的是模拟一个最佳停车平均场博弈的可处理示例,但有一些重要方面没有讨论。三个主要问题是从一个有n个玩家的游戏到极限的通道,当单调性条件被放弃时会发生什么,以及应用程序的分析。关于这些方面的最新结果可以在[11]中找到,我们想强调的是,这些工作中的大部分是平行进行的,或者在我们之前进行的。特别是,在我们第5.1节的模型中,连续统公式中的均衡策略是大n的n人博弈中的ε-均衡策略。

8
可人4 在职认证  发表于 2022-5-25 08:25:25
此外,还介绍和分析了最优停止(或“定时”)平均场博弈的一般框架,并讨论了其在银行挤兑模型中的应用。本文的其余部分组织如下。在下一节中,我们将更严格地描述游戏,并详细分析单人问题,而第3节将介绍允许精确大数定律的数学设置。第4节分析了一个没有常见噪音的有洞察力的toymodel;我们讨论了(非)唯一性的例子,以及噪声和相互作用强度对平衡时间连续性的影响。最后,第5节处理具有常见噪声的一般模型。2配子(I,I,λ)是概率空间的描述;每个i∈ 我将与一名代理人通信。此外,让(Ohm, F、 P)是另一个概率空间,用作样本空间。我们支持(Ohm, F、 P)配备了右侧连续过滤Gi=(Git)t∈R+和一个指数分布的随机变量,它独立于giforall i∈ 一、 我们将GIA解释为代理I可用的信息。最后,让r是一个实值且局部可积的过程(即,在有界区间上的Lebesgue可积),对于所有I∈ 我也就是说,所有代理都会观察到。2.1单代理问题我们首先考虑固定代理的优化问题i∈ 我和我们用十分之一表示所有Gi停止时间的集合。Letγi≥ 0是局部可积的Gi渐进可测过程,并考虑随机时间θi=inft:Ztγisds=E.人们可能会认为θias是强度为γi的Cox过程的第一个跳跃时间。默认时间θide依赖于i,这将允许我们在公共概率测度P下写出所有最优停止问题。或者,我们可以处理正则空间上的单个随机时间,并赋予代理主观概率Pi。

9
可人4 在职认证  发表于 2022-5-25 08:25:29
我们发现前面的解更容易写,它们是等价的,因为主体的决定(和平衡)只取决于强度的分布。出于技术原因,我们假设R+在[0]上是可积的,∞), P-a.s.,orinf{t:γit- rt公司≥ 0}<∞, P-a.s。(2.1)关于此类条件的必要性,另见下文备注2.2。然后,我们得到了关于单代理问题的以下结果。引理2.1。假设γi- r增大且(2.1)保持不变。那么,τi:=inf{t:γit- rt公司≥ 0}∈ Ti是最优停止问题SUPτ的解∈领带经验值ZτRSD{θi>τ}∪{θi=∞}. (2.2)如果(2.2)的值为有限,则τiis在所有溶液中最小,此外,如果γi- r严格递增,则τiis为唯一解。证据由于γi的增加- r与Gi的右连续性,γi的右极限过程ζ- r存在,且Gi可逐步测量。As{τi≤ t} ={ζt≥ 0}∈ Git,我们有τi∈ Ti。Letτ∈ 使r+在[0,τ),P-a.s上可积。利用E和Gi的独立性,我们得到了{θi>τ}∪ {θi=∞}Giτ= PZτγisds<EGiτ= E经验值-ZτγisdsGiτ.在本文中,增长是从非严格意义上理解的。我们使用的惯例是∞RSD:=-∞ ifR公司∞r+sds=r∞R-sds=∞.因此,E经验值ZτRSD{θi>τ}∪{θi=∞}Giτ= E经验值Zτ(rs- γis)dsGiτ最后经验值ZτRSD{θi>τ}∪{θi=∞}= E经验值Zτ(rs- γis)ds. (2.3)如果我们是(2.1)的第一种情况,我们的可积条件适用于所有τ∈ Tiand as r- γiis减小,右侧的表示表明τiis最优。在(2.1)的第二种情况下,由于r是局部可积的,因此对于每个有限值τ,我们仍然有(2.3)∈ 我们推导出,在所有这些停止时间中,τiis是最优的。

10
mingdashike22 在职认证  发表于 2022-5-25 08:25:33
如果τ是一般停止时间,N∈ N、 Fatou引理和最优性yieldE经验值ZτRSD{θi>τ}∪{θi=∞}≤ lim信息→∞E经验值Zτ∧Nrsdsθi>τ∧N≤ E经验值Zτirsdsθi>τi,因此,τiis实际上是所有s打顶时间中的最佳值。其余的断言也可以从(2.3)中推断出来。我们从引理2.1的证明中可以看出,γi的增加- r导致最优停止问题的简单解,这将有助于平衡点的可处理性。对于这种情况,我们没有什么可说的了。备注2.2。与有限区间停车问题一样,为了确保最优停车时间的存在,需要一个可积性假设。特别是,如果r>γi>0为常数,则τi=∞ 这显然不是最理想的P({θi>τi}∪ {θi=∞}) = 如果我们考虑地平线为T的相同问题∈ (0,∞), 无需额外假设。备注2.3。在引理2.1和本文的其余部分中,我们使用了γi的严格单调性- r作为τi唯一性的简单有效条件。在特定情况下,可能需要使用更尖锐的条件;例如,离散时间问题可以通过使用分段常数过程嵌入到我们的结果中,但随后需要适应严格单调性的概念。2.2交互当第i个代理选择在τi处停止时∈ Ti,代理将通过已经停止的代理的“比例”进行交互。实际上,我们应该根据过程ρ指定γias为泛函,然后平衡将是停止时间τi的集合∈ 对于λ-几乎所有i,其解(2.2)∈ ρt=λ{I:τI≤ t} 。(2.4)当λ为无原子时,单个主体的决策不会影响该数量,因此我们确实存在纳什均衡。很明显,过程ρ必然会增加且[0,1]值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-25 04:29