楼主: 何人来此
1592 49

[量化金融] 相对风险下最优投资的平均场与n-agent对策 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-31 06:45:32
latteris是所有代理人的共同货币,用作计息单位,并提供零利率。如引言所述,股票价格被视为对数正态,每一个都由两个独立的布朗运动驱动。准确地说,价格(Sit)t∈在给定市场参数ui>0,σi的情况下,ithagent交易的股票i的[0,T]解(1)≥ 0和νi≥ 0,σi+νi>0。独立布朗运动B,W,Wn定义在概率空间上(Ohm, F、 P),我们赋予其自然过滤(Ft)t∈[0,T]由这些n+1布朗运动生成。回想一下,单个库存情况是(ui,σi)=(u,σ),νi=0,对于i=1,n、 对于某些u,σ>0独立于i。值得注意的是,在[23]和[25]中研究了单一s股票情况,这是一个更普遍的情况,结合了投资组合约束和更一般的股票价格动态。每个代理i=1,n使用自我融资策略的交易,(πit)t∈[0,T],代表投资于ithstock的金额(按债券贴现)。ITH代理的财富(Xit)t∈[0,T]然后求解dxit=πit(uidt+νidWit+σidBt),(6)Xi=Xi∈ R、 如果投资组合策略属于集合A,则认为其是可接受的,集合A由自融资F-逐步可测实值过程(πt)t组成∈[0,T]satisfyingERT |πT | dt<∞.ithagent的实用程序是一个函数Ui:R→ 她的个人财富x的R和所有代理人的平均财富m的R。它是福尔摩斯的(x,m):=- 经验值-δi(x- θim).我们将参考常数δi>0和θi∈ [0,1]分别作为个人风险承受能力和竞争权重参数。如果代理i=1,n选择容许策略π,πn,agent i的payoff由ji给出(π,…,πn):=E- 经验值-δi退出- θiXT, 当xt=nnXk=1XkT时,(7)注意(δi,θi),i=1。

12
kedemingshi 在职认证  发表于 2022-5-31 06:45:35
n是无单位的,因为所有的财富过程都被无风险债券贴现了。其中(Xit)t的动力学∈[0,T]如(6)所示。或者,我们可以表示上述asJi(π,…,πn)=E- 经验值-δi(1)- θi)XiT+θi(XiT-XT),这突出了竞争权重θide如何决定ITH代理人对绝对财富与相对财富的风险偏好。因此,θi较大(接近1)的代理人更关心相对财富而非绝对财富。在上述投资环境中,应用纳什均衡的概念,竞争性地解决了这些相互依存的优化问题。定义1。向量(π1,*, . . . , πn,*) 对于所有πi,可容许策略是(Nash)均衡∈ A和i=1,n、 Ji(π1,*, . . . , πi,*, . . . , πn,*) ≥ Ji(π1,*, . . . , πi-1.*, πi,πi+1,*, . . . , πn,*). (8) 常数(纳什)均衡是指,对于每个i,πi,*时间常数,即πi,*t=πi,*对于所有t∈ [0,T]。备注2。因为过滤F是布朗的,所以它适用于任何可容许策略π∈ Athatπ是非随机的。考虑到这一点,将使用向量(π1,*, . . . , πn,*) ∈ 注册护士。还要注意的是,对于每一种替代策略的选择,而不仅仅是恒定策略,恒定纳什均衡的定义需要在最优性条件(8)下的th。我们的第一个主要发现为常数纳什均衡的存在和不唯一性提供了条件,并明确地构造了它。定理3。假设所有i=1,n我们有δi>0,θi∈ [0,1],ui>0,σi≥ 0,νi≥ 0,σi+νi>0。确定常数νn:=nnXk=1δkukσkσk+νk(1- θk/n)和ψn:=nnXk=1θkσkσk+νk(1- θk/n)。(9) 有两种情况:(i)如果ψn<1,存在唯一的常数平衡,由πi给出,*= δiuiσi+νi(1- θi/n)+θiσiσi+νi(1- θi/n)Дn1- ψn。

13
能者818 在职认证  发表于 2022-5-31 06:45:38
(10) 此外,我们有恒等式ynnxk=1σkπk,*=^1n1- ψn.(ii)如果ψn=1,则不存在常数平衡。一个重要的推论涵盖了单个s股票的特例。推论4(单株)。假设所有i=1,n我们有ui=u>0、σi=σ>0和νi=0。定义常数δ:=nnXk=1δkandθ:=nnXk=1θk。我们的纳什均衡概念更准确地称为开环纳什均衡。一种流行的替代方法是闭环纳什均衡,在这种均衡中,代理根据反馈函数选择策略,以对抗随机过程。然而,对于常数策略,开环和闭环概念是一致的。也就是说,常数(开环)纳什均衡也是闭环纳什均衡,反之亦然。有两种情况:(i)如果θ<1,存在唯一的常数平衡,由πi给出,*=δi+θiδ1- θuσ。(ii)如果θ=1,则不存在常数平衡。证据应用定理3,注意简化公式Дn=Δu/σ和ψn=θ。备注5。对于一个给定的代理人i,可以说更自然的做法是用所有其他代理人(不包括她自己)的平均收入来代替(7)中定义的国家收入中的平均收入X,即X(-i) T=n-1Pk6=iXkT。幸运的是,这两个公式之间有一对一的映射,因此不需要分别解决这两个问题。事实上,假设ITH代理的报酬- 经验值-δ′i退出- θ′iX(-i) T型,对于某些参数θ′i∈ [0,1]和δ′i>0。通过匹配系数,可以直接显示δ′i退出- θ′iX(-i) T型=δi退出- θiXT,当θi∈ [0,1]和δi>0由δi=δ′i1+n定义-1θ′i和θi=θ′in-1n+nθ′i。我们更喜欢我们的原始公式,主要是因为它导致了定理3和推论4中平衡策略的更简单公式。此外,对于大n,这种选择对策略πi的影响可以忽略,*, 作为差值|δi- δ′i |和θi- θ′i |消失。备注6。

14
可人4 在职认证  发表于 2022-5-31 06:45:41
即使在没有竞争的情况下,在预期效用优化中也存在着指数p参考的众所周知的技术问题,因为财富可能会变得任意负。这一点已经得到了研究和部分解决,主要是通过仔细重新定义可接受控制的类别。特别是,我们可以定义可接受的策略,使得财富过程在具有有限熵的所有鞅测度下都是超鞅。当然,我们必须解决双重问题,但一些技术问题可能仍然存在;参见【21,51】。另一方面,最近的工作确定了财务上有意义的可采性类别,这些类别通常(但不总是)包含所需的优化器;参见【6,7】。定理3的证明。让我来确定一下。假设所有其他代理,k 6=i,遵循常数投资策略,用αk表示∈ R、 Let(Xkt)t∈[0,T]是相关的财富过程,Xkt=xk+αkukt+νkWkt+σkBt,还有定义:=nXk6=iXkt。然后,ithagent解决了优化问题supπi∈AE- 经验值-δi1.-θ英寸退出- θiYT, (11) 其中(Xit)t∈[0,T]和(Yt)T∈[0,T]具有动力学(参见。

15
kedemingshi 在职认证  发表于 2022-5-31 06:45:44
(6) )dXit=πit(uidt+νidWit+σidBt),Xi=Xi,dYt=cuαdt+cσαdBt+nXk6=iνkαkdWkt,Y=nXk6=ixk,其中我们有缩写dcuα:=nXk6=iukαkand cσα:=nXk6=iσkαk。在续集中,我们还将使用缩写\\(να):=nXk6=iνkαk。在(11)中的上确界值等于v(Xi,Y,Y,kαk)。0),当e v(x,Y,t)解HamiltonJacobi-Bellman(HJB)方程vt+maxπ时∈R(σi+νi)πvxx+π(uivx+σicσαvxy)(12)+cσα+n \\(να)vy y+cuαvy=0,对于(x,y,t)∈ R×R×[0,T],带终端条件V(x,y,T)=-e-γi(x-G(y))=- 经验值-δi1.-θ英寸x个- θiy.应用一阶条件,方程式(12)简化为vt-(uivx+σicσαvxy)(σi+νi)vxx+cσα+n \\(να)vy y+cuαvy=0。使ansatz v(x,y,t)=-f(t)扩展-δi((1-θin)x- θiy)产量,对于t∈ [0,T],f′(T)- ρf(t)=0。f(T)=1,ρ:=(ui+θiδ-1iσicσα)2(σi+νi)-θiδicuα-θi2δicσα+n \\(να). (13) 因此,f(t)=e-ρ(T)-t) 反过来,v(x,y,t)=- 经验值-δi1.-θ英寸x个- θiy- ρ(T- t). (14) (12)中的最大值,在πi处达到,*(x,y,t):=-uivx(x,y,t)+σicσαvxy(x,y,t)(σi+νi)vxx(x,y,t)。直接计算得出πi,*是常数,πi,*=δ-1i(1- θi/n)(ui+θiδ-1iσicσα)(σi+νi)δ-2i(1- θi/n)=δiui+θiσicσα(σi+νi)(1- θi/n)。因此,我们构造了HJB方程的光滑解,并计算了其关联反馈策略,该策略是常数,因此是可容许的。利用显式形式(14)和该候选控制的可容许性,我们可以根据随机优化中的著名参数建立验证定理【24、50、55】。或者,我们注意到,随机优化问题(11)可以被视为是责任G(YT):=θi1的“作者”的代理所解决的问题-θi/nYT,具有指数偏好,风险规避γi:=δi(1-θin)。

16
可人4 在职认证  发表于 2022-5-31 06:45:47
类似的问题已经在[31,46]中进行了研究,我们请读者参考这些问题,以了解有关当前特定优化问题的更详细的论据。因此,对于候选投资组合向量(α,…,αn)是常数纳什均衡,weneedπi,*= αi,对于i=1,n、 设σα:=nnXk=1σkαk=cσα+nσiαi。那么,我们必须有αi=πi,*=δiui+θiσiσα(σi+νi)(1- θi/n)-θiσin(σi+νi)(1- θi/n)αi,这意味着αi=δiui+θiσiσα(σi+νi)(1- θi/n)1+θiσin(σi+νi)(1- θi/n)-1=δiui+θiσiσα(σi+νi)(1- θi/n)+σiθi/n=δiui+θiσiσασi+νi(1- θi/n)。(15) 将两侧乘以σi,然后平均i=1,n、 在(9)中给出σα=ψn+ψnσα,(16)和ψn,ψnas。对于等式(15)到h old,等式(16)也必须成立。有三种情况:(i)如果ψn<1,则(16)产生σα=Дn/(1)- ψn),平衡控制由(10)很好地定义和给出。(ii)如果ψn=1且ψn>0,则方程(16)没有解,因此不存在常数平衡。(iii)最小情况是ψn=1和Дn=0,在这种情况下,方程(16)有很多解。然而,这是不可能发生的。事实上,因为所有i的δi,ui>0,所以只有当所有i的σi=0时,我们才能得到νn=0。回顾假设σi+νi>0,这意味着ψn=0,这是一个矛盾。备注7。也可以通过显式计算(13)中定义的ρ来计算代理i的等式值函数v(x,y,t),因为数量cuα、cσα和cνα现在为kn。然而,我们省略了这个繁琐的计算。如果存在非常数的纳什均衡,例如反馈形式πi的均衡,则仍然是一个有待解决的问题,*= πi,*(t,x,…,xn),取决于时间和/或代理人的财富。

17
能者818 在职认证  发表于 2022-5-31 06:45:50
事实上,我们的论点可以证明,我们所追求的常数纳什均衡在涉及财富独立但潜在的时间依赖策略π=π(t)的更广泛的均衡中是唯一的。唯一微妙的一点是HJB方程(12)的可解性,这将迫使我们在适当的平滑度和增长条件下考虑时间依赖性。此外,关注恒定纳什均衡可以如下所示。众所周知,对于对数正态模型,指数效用导致常数策略。这不仅适用于普通投资问题,在没有竞争的情况下,也适用于不同类型的投资问题。我们在(11)中遇到的个别优化问题直接类似于这些标准差异类型的问题。在这种情况下,财富独立性得到了很好的证明,甚至在一般的半鞅模型中也是如此。这正是指数效用在资产价格均衡和差异估值领域如此流行的原因。2.2。平均场游戏。在本节中,我们将极限研究为n→ ∞ 在前一节中分析的n-agent博弈中。我们从非正式的论证开始,以建立直觉并激发即将到来的定义。对于n-代理博弈,我们确定每个代理i=1,n类型向量ζi:=(xi,δi,θi,ui,νi,σi)。这些类型向量产生了一种称为类型分布的经验度量,这是类型空间上的概率度量:=R×(0,∞) ×【0,1】×(0,∞) ×[0,∞ ) ×[0,∞), (17) 由mn(A)=nnXi=1A(ζi)给出,对于Borel集A 泽。然后我们看到,对于每个主体i,平衡策略πi,*在定理3 d中,仅对其自己的类型向量ζi和所有类型向量的分布mn进行计算。实际上,常数νnandψn(cf。

18
何人来此 在职认证  发表于 2022-5-31 06:45:53
(9) )只需在mn下积分适当的函数即可得到。现在假设随着代理数量的增加,n→ ∞, 上述经验测量值为弱极限m,即Rzef dmn→对于Ze上的每个有界连续函数f,RZef dm。例如,如果ζi是来自m的i.i.d.样本,则这几乎是正确的。让ζ=(ξ,δ,θ,u,ν,σ)d成为具有此极限分布m的随机变量。然后,我们应该期望最优策略πi,*(参见(10)),以汇聚到→∞πi,*= δiuiσi+νi+θiσiσi+νiν1- ψ、 (18)式中Д:=limn→∞^1n=EΔuσ+ν和ψ:=limn→∞ψn=Eθσ+ν.接下来定义的平均场博弈(MFG)允许我们将限制策略(18)导出为一个自包含的均衡问题的总体,它直观地表示了一个具有类型分布m的连续代理的博弈。而不是直接建模代理的连续统,我们遵循建模单个代表代理的MFG范式,我们认为他们是从人群中随机挑选出来的。概率测度m表示类型参数在代理连续体中的分布;等效地,代表性代理的类型向量是一个具有m定律的随机变量。启发式地,连续统中的每个代理在两个布朗运动的驱动下以单个股票交易,其中一个是该代理所特有的,另一个是所有代理所共有的。定义9中引入的均衡概念将使这种直觉形式化。2.2.1。制定平均场游戏。为了制定制造量,我们现在假设pr ob能力空间(Ohm, F、 P)支持另一个独立的(一维)布朗运动W,以及一个随机变量ζ=(ξ,δ,θ,u,ν,σ),独立于W和B,且具有(17)中定义的空间值。

19
kedemingshi 在职认证  发表于 2022-5-31 06:45:56
该随机变量ζ称为类型向量,其分布称为类型分布。设FMF=(FMFt)t∈[0,T]表示满足通常假设的最小过滤,其中ζ是FMF可测量的,并且W和B都适用。也让FB=(FBt)t∈[0,T]表示由布朗运动B生成的自然过滤。代表代理人的财富过程solvesdXt=πT(udt+νdWt+σdBt),X=ξ,(19),其中投资组合策略必须属于自融资FMF可测量实值过程(πT)T的容许集amfo∈[0,T]满足ERT |πT | dt<∞. 随机变量ξ是代表性代理的初始财富,其中w(u,ν,σ)是市场参数。在后续研究中,参数δ和θ将影响代表性代理的风险偏好。在该平均场设置中,单一库存案例是指(u,ν,σ)为非随机的情况,其中ν=0,u>0,σ>0。在上述限制性论点的背景下,这对应于n-agent博弈,其中所有i的ui=u,νi=ν=0,σi=σ。请注意,连续统中的每个agent可能仍然有不同的偏好参数,由δ和θ处的th是随机的这一事实捕获。备注8。该模型中有两种不同的随机性来源。其中一个作用力来自布朗运动W和B,这两个运动随时间驱动股票价格过程。第二个来源是静态的,来自随机变量ζ,它描述了类型向量(包括初始财富、个人p参考参数和市场参数)在大量(实际上是连续的)人口中的分布。我们可以想象一个连续的代理,每个代理都被分配了一个i.i.d。

20
kedemingshi 在职认证  发表于 2022-5-31 06:45:59
在时间零点输入vector,代理在完成这些分配后进行交互。为了了解如何制定代表性代理的优化问题,让我们首先重新说明如何构建n代理博弈中的纳什均衡。我们首先解决了每个代理i所面临的优化问题(12),其中其他代理k 6=i的策略被视为fix ed。然而,我们可以确定平均终端财富npk6=iXkT,而不是其他代理的策略,因为这实际上是代理之间交互的唯一来源。这正是定理3的证明背后的想法,这也指导了即将到来的MFG公式。为此,假设X是一个给定的随机变量,表示代理连续统的平均财富。代表性试剂对X没有影响,因为只有一种试剂在连续介质中。因此,代表代理人的目标是最大化预期收益supπ∈AMFE公司- 经验值-δXT公司- θX, (20) 其中(Xt)t∈[0,T]由(19)给出。我们现在准备介绍本节的主要定义。我们也可以在不同的概率空间上从n-代理博弈中推导出MFG,但我们更倾向于避免引入额外的n-旋转。定义9。Letπ*∈ AMFbe是一种容许策略,并考虑FBT可测随机变量X:=E[X*T | FBT],其中(X*t) t型∈[0,T]是(19)中对应于策略π的财富过程*. 我们说π*是平均场平衡(MFE),如果π*对于与此X选择相对应的优化问题(20)是最优的。常数MFE是FMF可测量的随机变量π*如果πt:=π*对于allt∈ [0,T],然后(πT)T∈[0,T]是MFE。通常,MFE计算为固定点。一种是从一般的FBT可测随机变量x开始,求解(20)的最佳π*, 然后计算E[X*T | FBT]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 04:10