楼主: 可人4
914 25

[量化金融] 相对约束下最优消费与投资的多人博弈 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-24 00:42:25
If根据标准验证定理得出,该偏微分方程在莫斯顿可以有经典解。由于效用根据δi=1与否采用不同的形式,我们在证明的下一部分中分别处理这两种情况。δi6=1的情况下:效用函数采用公式(cx)(1-θi/n)(\'c-i(t)y)-θi;δi=1.-δi-1(cx)(1-θi/n)(1-1/δi)((R)c-i(t)y)-θi(1-1/δi)。应用一阶条件,通过πi获得(12)中的上界,*(x,y,t)=-uixvx(x,y,t)+σicσπ-ixyvxy(x,y,t)∑ixvxx(x,y,t),(14)和Ci,*(x,y,t)=x(1-θin)((R)c-i(t)y)-θi(1-1/δi)vx(x,y,t)!1.-(1-θi/n)(1-1/δi)。(14’)我们使用条c表示几何平均值,用帽bc表示算术平均值。相对性能标准7下的消耗和投资让我们引入以下常数:γi=1- (1 - θi/n)(1- 1/δi),(15)Γi=1.-θ英寸γiγi- 1..使用这些常数和表达式(14)和(14’),HJB方程(12)变为0=vt-(uixvx+σicσπ-ixyvxy)∑ixvxx+cσπ-i+n \\(νπ)-我yvyy+(ηi- 卑诗省-i(t))yvy+(vx)1-γi(℃)-i(t)y)-γiθi(1-1/δi)Γi.(16)我们现在使ansatzv(x,y,t)=我1.-δi-1x(1-θi/n)(1-1/δi)y-θi(1-1/δi)fi(t),(17)对于可微函数fi:[0,t]→ R待定。注意,边界条件(13)要求fi(T)=1。将其插入HJB方程(16),我们发现V(x,y,t)/fi(t)因子超出了每个项,我们得到0=fi(t)+ρi+θi1.-δi卑诗省-i(t)fi(t)+-γiiγi′c-i(t)-γiθi(1-1/δi)fi(t)1-γi,(18)其中我们定义ρi=1.-δiγi(1- θi/n)(ui- σicσπ-iθi(1- 1/δi))2∑i+(cσπ-i+n \\(νπ)-i) θi(1- 1/δi)- θicuπ-i+θid∑π-我.(19) 实际上,(18)中的最后一项来自identityvx(x,y,t)1-γiy-γiθi(1-1/δi)=-γii1.-θ英寸1.-γi1.-δifi(t)-γiv(x,y,t)。为了解(18),让我们暂时缩写为ai(t):=ρi+θi(1- 1/δi)bc-i(t),bi(t):=-γiiγi′c-i(t)-γiθi(1-1/δi)。

12
可人4 在职认证  发表于 2022-6-24 00:42:28
(20) 然后(18)重写asfi+aifi+bif1-γii=0。这是伯努利方程的一个例子,一个众所周知的变量变化导致了这个解。实际上,除以f1-γii(注意到γi>0后)并使用替换ui(t)=fγii(t),使(18)成为线性微分方程γiui+aiui+bi=0,终端条件ui(t)=1。该线性方程允许唯一解ui(t)=eγiRTtai(s)ds+ZTtγibi(s)e-γiRstai(r)drds。8丹尼尔·莱克和阿加特·索雷特指出,BI在任何地方都是积极的,因此ui也是积极的。因此,u1/γIIs得到了很好的定义,(18)的唯一解由fi(t)给出=eγiRTtai(s)ds+ZTtγibi(s)e-γiRstai(r)drds1/γi.(21)将该溶液(21)代入ansatz(17)中,得到HJBequation的溶液v(x,y,t),只要我们检查vxx<0且vx>0。但这很简单:vx(x,y,t)=i(1- θi/n)x-1/γiy-θi(1-1/δi)fi(t)>0,vxx(x,y,t)=-iγi(1- θi/n)x-1/γi-1年-θi(1-1/δi)fi(t)<0,这里我们再次使用γi>0。因此,对于fi,我们可以将(14)和(14’)的最优控制表示为πi,*=γi(ui- σicσπ-iθi(1- 1/δi))∑i,ci,*t=-γii(℃)-i(t))-γiθi(1-1/δi)f-γii(t)。(22)δi=1的情况:在δi=1的情况下,我们必须进行不同的处理,但我们将最终得出与(22)中公式一致的最优控制。首先请注意,我们可以大大简化(11)的形式,因为对数效用函数特别意味着其他参与者不再影响参与者i的优化。也就是说,playeri最大化了简化的目标(1- θi/n)EZTlog(citXit)dt+ilog XiT公司. (23)注意到1- θi/n>0,值(23)等于(1- θi/n)w(Xi,0),其中w(x,t)解HJB方程0=wt+maxπ∈Rπuixwx+π∑ixwxx+ 最大值C∈R+[-cxwx+log(cx)],(24)表示(x,t)∈ R+×[0,T),终端条件w(x,T)=ilog x。

13
大多数88 在职认证  发表于 2022-6-24 00:42:31
最大值由πi表示,*(x,t)=-uixwx(x,t)∑ixwxx(x,t),ci,*(x,t)=xwx(x,t)。(25)HJB方程(24)变为0=wt-(uixwx)∑ixwxx- 1.- 记录wx。(26)使ansatzw(x,t)=fi(t)ilog x+gi(t),其中fi和giare待确定,并满足fi(t)=1和gi(t)=0。将其插入(26),定义常数bρi=uii/2∑i,获得ifi(t)+1对数x+gi(t)+bρifi(t)- 1.- 日志我- log fi(t)=0。因为只有一个依赖于x的项,所以我们必须ifi(t)+1=0,fi(t)=1。这将产生fi(t)=-1i(T- t) +1。那么gimust solvegi(t)=-bρi(-1i(T- t) +1)+1+对数((t- t) +i) ,相对性能标准9下的消耗和投资,使用gi(T)=0可以轻松集成,以获得解决方案gi,尽管我们不需要明确使用它。还要注意fi>0,因此wx>0,wxx<0。因此,我们求解了δi=1时的HJB。回顾(25),我们推断最优控制为πi,*=ui∑i,ci,*t=t- t+i、 (27)注意,当δi=1时,上述结果(22)专门用于(27)。事实上,如果δi=1,则ρi=0和γi=1,并且(20)中定义的函数A和B减少为ai≡ 0和BI≡ 1/i、 因此(21)变为fi(t)=-1i(T- t) +1,且(22)变为(27)。完成证明:我们现在完成证明,使用我们在上面找到的表格,根据其他玩家的选择,对玩家i进行最佳控制。即,(22)中的控件给出了参与者i的最佳响应,其中fi定义为(21),我们已经看到,这些公式在δi=1和δi6=1的情况下都有效。注意,如果我们假设其他消耗函数是正的和连续的,那么我们找到的最佳反馈消耗在[0,T]上也是正的和连续的。

14
大多数88 在职认证  发表于 2022-6-24 00:42:34
现在,为了总结证明,请注意,(πi,ci)ni=1的初始选择是一个强平衡,当且仅当每个i=1。。。,n、 我们有πi,*= πI和ci,*t=ci(t)t型∈ [0,T],其中(πi,*, ci,*) 在(22)中给出。我们首先讨论投资政策。注意,我们得到了完全相同的最优控制πi,*在没有消耗的问题中,我们可以在[21,定理14]的证明中得出结论,πi,*= π如果所有i=1。。。,n当且仅当πi,*如(4)所示。此外,我们还证明了恒等式(7),如[21,定理14]所示。回顾(19)中定义的ρ取决于其他代理的投资政策π,但不取决于消费政策;特别是,在平衡状态下,我们有ρi:=1.-δi((1 - θi/n)(ui- σiθi(1- 1/δi)nPk6=iσkπk,*)2(σi+νi)(1- (1 - θi/n)(1- 1/δi))+θi1.-δinXk6=iσkπk,*+nXk6=i(νkπk,*)!- θinXk6=iukπk,*+θi2nXk6=i(σk+νk)(πk,*))(28)接下来,我们讨论消费政策。根据我们上面的论点,为了达到平衡,我们必须同时求解以下方程组,对于i=1,n: ci(t)=-γii(℃)-i(t))-γiθi(1-1/δi)(fi(t))-γi(29)0=fi(t)+(ρi+θi(1- 1/δi)bc-i(t))fi(t)+-γiiγi′c-i(t)-γiθi(1-1/δi)fi(t)1-γi,(30),其中fi(T)=1。事实上,根据其他代理的策略(在(22)中计算)和函数fi,第一个方程给出了代理i的最佳响应。第二个方程正好是决定fi的微分方程,我们在(21)中根据其他代理的策略明确解决了该方程。然而,现在我们已经验证了ansatz对vi(x,y,t)的有效性,为了解决平衡问题,更方便的方法是放弃10 DANIEL LACKER和Aga对fi的SORETexplicit形式,而是同时求解方程(29)和(30)。

15
nandehutu2022 在职认证  发表于 2022-6-24 00:42:37
为此,首先将(29)插入到(30)的最后一项中,以找到fi(t)+ρi+θi1.-δi卑诗省-i(t)+γici(t)fi(t)=0。定义全平均bc(t)=nPnk=1ck(t),注意bc-i(t)=bc(t)- ci(t)/n.重新定义γiin(15),我们推断出fi(t)+ρi+θi1.-δibc(t)+δici(t)fi(t)=0。因此,当fi(T)=1时,这导致tofi(T)=expZTt公司ρi+θi1.-δibc(s)+δici(s)ds公司. (31)现在注意,(29)等于I(t)1-γi(θi/n)(1-1/δi)=-γii’c(t)-γiθi(1-1/δi)fi(t)-γi,其中\'c(t)表示全几何平均值,\'c(t):=(Qnk=1ck(t))1/n。因此,回顾γiin(15)的定义,ci(t)=(ifi(t))-γi1-γi(θi/n)(1-1/δi)(R)c(t)-γiθi(1-1/δi)1-γi(θi/n)(1-1/δi)=(ifi(t))-δi′c(t)-θi(δi-1).接下来,插入fifrom(31)到getci(t)=-δii?c(t)-θi(δi-1) 经验值-δiZTtρi+θi1.-δibc(s)+δici(s)ds公司,这相当于toci(t)expZTtci ds= -δii?c(t)-θi(δi-1) e类-δiρi(T-t) 经验值-θi(δi- 1) ZTtbc(s)ds. (32)取i=1的几何平均值,n、 我们得到\'c(t)expZTtbc(s)ds=δ-1摄氏度(t)-\\θ(δ-1) e类-bΔρ(T-t) 经验值-\\θ(δ - 1) ZTtbc(s)ds,我们定义\\θ(δ- 1) :=nPnk=1θk(δk- 1) ,bδρ:=nPnk=1δkρk,和δ:=Qnk=1δkk1/n。因此,c(t)expZTtbc(s)ds=δ-1+\\θ(δ-1) e类-cδρ1+\\θ(δ-1) (T-t) 。将这个表达式插入(32),我们得到ci(t)expZTtci ds= λieβi(T-t) ,(33)式中,我们定义βi:=θi(δi- 1) bδρ1+\\θ(δ- 1)- δiρi,λi:=-δiiδθi(δi-1)1+\\θ(δ-1)> 0.相对性能标准下的消费和投资11将(33)从t积分到t,并取对数到getZTtci(s)ds=(log1+λiβieβi(T-t)- 1.如果βi6=0log(λi(T- t) +1)如果βi=0。(34)这确实很明确,因为当βi6=0时,函数t 7→ 1+λiβieβi(T-t)- 1.在[0,T]上递减,在T=T时等于1。

16
能者818 在职认证  发表于 2022-6-24 00:42:40
通过区分双方,我们最终得到Ci(t)=βi+λi-βie-βi(T-t)-如果βi6=0(T- t+λ-1i)-1如果βi=0。总之,我们找到了(29)和(30)中给出的方程组的唯一解,证明了我们对HJB方程(12)的ansatz是正确的。根据HJB方程的经典解,通过标准验证论证[13,25],我们得出结论,上述投资组合和消费政策确实提供了独特的最佳响应,从而形成了独特的强均衡。3、平均场博弈我们在本节中研究的极限为n→ ∞ 在前面分析的n人博弈中,我们解释了如何将极限视为具有连续代理的(平均场)博弈的均衡结果。对于每个试剂i,确定类型向量ζi:=(xi,δi,θi,i、 ui,νi,σi)。现在,我们允许这些参数也依赖于n,尽管我们不会给符号增加额外的索引。这些类型向量导出了一个经验度量,类型分布,它是类型spaceZ上的概率度量:=(0,∞) × (0, ∞) × [0, 1] × (0, ∞) × (0, ∞) × [0, ∞) × [0, ∞),由mn=nPnk=1Δζk给出。现在注意,对于每个代理i,消费和投资的均衡策略仅取决于代理自身的类型向量和类型向量的分布mn。因此,如果我们假设mn弱收敛于某个极限概率测度,那么我们期望均衡结果在某种意义上收敛。为了达到极限,我们现在用(x,δ,θ,, u,ν,σ)一个Z值随机变量,ν+σ>0 a.s。此随机类型向量的规律表示连续代理的类型向量分布,此随机类型向量的单个实现将被解释为分配给单个代表代理的类型。我们假设本段中出现的所有期望都是有限的。

17
可人4 在职认证  发表于 2022-6-24 00:42:43
n→ ∞ 定理2.2中定义的常数φ和ψ的极限形式如下:φ=Eδuσσ+ ν, ψ=Eθ(δ - 1)σσ+ ν. (35)为了确定定理2.2中剩余量的极限形式,我们额外删除了i下标,让类型向量的随机性发挥代理名称的作用。由此得出β=θ(δ- 1) E[Δρ]1+E[θ(δ- 1)]- Δρ,(36)12 DANIEL LACKER和AGATHE SORETandρ=1.-δ(δ2(σ+ ν)u - σφ1 + ψθ(1 - 1/δ)+φ1 + ψθ(1 - 1/δ)- θφ1+ψEδu- θ(δ - 1)σuσ+ ν+θE“(Δu- θ(δ - 1)σφ1+ψ)σ+ ν#).(37)λiis的极限形式由λ=-δeE[日志(-δ)]-θ(δ-1) 1+E[θ(δ-1)]. (38)事实上,这是通过注意到Nyk=1来确定的δkk!1/n=expnnXk=1log(δkk)!。代表代理人定理2.2的均衡投资政策则变为π*=δuσ+ ν-θ(δ - 1) σσ+νφ1+ψ(39)和消费政策*t型=β+λ-βe-β(T-t)-1如果β6=0(T- t+λ-1)-1如果β=0。(40)接下来,我们将说明这种策略是如何作为平均场博弈的均衡产生的。让(Ohm, F、 F=(英尺)t∈[0,T],P)是支持独立布朗运动B和W以及随机类型向量ζ=(ξ,δ,θ,, u,ν,σ)如上所述。假设F是最小完全过滤,其中ζ是F-可测的,而Wand B是F-布朗运动。代表代理人的财富过程由dxt=πtXt(udt+νdWt+σdBt)确定- ctXtdt。(41)如前所述,容许策略由满足ERT(πt+ct)dt<∞, 每个可接受的策略都会导致严格的正财富过程。由于这是一个具有共同噪声B的平均场博弈,平均场均衡条件将涉及给定B的条件平均值。

18
大多数88 在职认证  发表于 2022-6-24 00:42:46
直观地说,由于主体之间的相互作用是通过整个群体的(几何)平均数发生的,因此我们期望某种大数定律和主体之间的渐近独立性为n→ ∞. 由于公共噪声的存在,代理之间的任何渐近独立性都必须以公共噪声B为条件,我们参考[7,8]来更全面和精确地处理具有公共噪声的平均场博弈。换句话说,人口平均财富和消费过程应适应完全过滤FB=(FBt)t∈[0,T]由公共噪声B产生。现在,假设代表性代理知道其他代理的几何平均财富和消费(连续统)分别由一些FB适应过程X和Γ控制。然后,代表性代理的目标是最大化预期支付(π,c)∈AMFE公司ZTU公司ctXt(ΓtXt)-θ; δdt+UXTX公司-θT;δ. (42)相对绩效标准下的消费和投资13在均衡状态下,最优(π*, c*) 对于此问题,应导致exp E[log Xt | FBt]=Xt和exp E[log c*t | FBt]=Γt,其中我们注意到exp E[log(·)]是几何平均值的连续模拟。我们在以下定义中将此讨论正式化:定义3.1。Let(π*, c*) 采用可接受的策略,并考虑FB适应的过程Xt:=exp E[log X*t | FBt]和Γt=经验E[对数c*t | FBt],其中(X*t) t型∈[0,T]是(41)中对应于策略(π)的富裕过程*, c*). 我们说(π*, c*) 是平均场平衡,如果(π*, c*) 对于与X和Γ的选择相对应的优化问题(42)是最优的。

19
nandehutu2022 在职认证  发表于 2022-6-24 00:42:49
我们称之为(π*, c*) 强平衡ifπ*是常数(thusF可测量)和if(c*t) t型∈[0,T]是连续的且F-可测的。因为Fis是由类型向量生成的σ场,所以说策略是可度量的,只是意味着它只依赖于类型向量,而不依赖于布朗运动或财富过程。我们现在可以陈述一个定理,解释n→ ∞ 上述计算出的限制策略可被视为平均场博弈的均衡成本。定理3.2。假设a.s.δ>0,θ∈ [0, 1],  > 0, u > 0, σ ≥ 0, ν ≥ 0,σ+ν>0。定义(φ、ψ、β、ρ、λ)如(35)–(38)所示,并假设其中的所有预期。然后有一个唯一的强平衡(π*, c*), 它采用givenby(39)和(40)的形式。推论3.3。(单一股票)假设(u,ν,σ)是确定性的,ν=0,u,σ>0。然后,可以将(36)中定义的β简化为β=u2σ(1- δ)1.-θ-θ临界值δ -θθcrit(δ- 1),其中θcrit:=1+E[θ(δ- 1) ]E[δ],最优投资简化为π*=δ -θθcrit(δ- 1)uσ.我们省略了这个证明,因为它与定理2.2和[21,定理3.6]的证明非常相似。与定理2.2的证明一样,主要思想是确定当X服从F-可测策略(π,c)且π与时间无关时,过程Xt=exp E[log Xt | FBt]的动力学。然后,代表性agent的优化问题可以转化为二维状态过程(X,X)上的(可处理的)随机控制问题。4、平衡的讨论我们现在讨论前一节中计算的平衡的解释以及对各种模型参数依赖的性质。

20
可人4 在职认证  发表于 2022-6-24 00:42:52
首先,请注意,我们的结果与萨缪尔森的[26]是一致的,因为我们获得的投资策略与之前工作中得出的无消费模型中的投资策略相同[21]。更一般地说,投资策略π*不取决于代理人对终端财富与消费的相对重要性,由 在我们的模型中。考虑到这一点,我们参考[21]来讨论投资策略,剩下的讨论集中在消费策略上。我们进一步将对均衡的讨论限制在平均场情况下,对于平均场情况,均衡消费政策由(40)给出,因为n-agent博弈中的均衡基本上具有相同的结构,但公式更复杂。此外,我们限制了14 DANIEL LACKER和AGATHE SORETour的注意力,主要集中在推论3.3的单个股票案例上,它同样更容易处理,但已经相当丰富了。从c的表达式*t、 我们可以区分三种消费行为模式。最优消耗必然是时间t的单调函数,快速计算表明,当β<λ时,最优消耗增大,当β>λ时,最优消耗减小,当β=λ时,最优消耗恒定。回顾(41)中财富过程X的形式,我们发现预期财富回报率ddtE[log Xt | F]也是时间的单调函数,与消费政策的单调性相反。(请注意,对Fis的条件等同于对代表性代理类型的条件。)有关一些典型的消费政策,请参见图1。图1:。平衡消费c*不同δ值的tversus t。参数为u=5,σ=1, = 1,E[日志(δ) ]=0,E[θ(δ- 1) ]=0.8,E[δ]=3,θ=0.8,T=1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 01:22