楼主: mingdashike22
1507 53

[量化金融] 具有价格影响的部分信息下的最优清算 [推广有奖]

21
能者818 在职认证  发表于 2022-5-25 09:58:37
然后,标准参数确保不完全信息下的原始控制问题等价于状态过程等于(K+2)-维过程X=(W,S,π)的完全信息下的控制问题。这个过程是Davis(22)意义上的PDMP,即X的轨迹由一个确定性部分组成,该部分求解一个普通微分方程(ODE),其间穿插着随机跳跃。因此,为了解决最优清算问题,我们将控制理论应用于PDMPs。该理论基于这样一个观察结果:PDMP的控制问题在时间上是离散的:粗略地说,在过程的每个跳跃时间,我们都选择一个控制策略,以跟踪到下一个跳跃时间或直到成熟。因此,我们可以将PDMP的控制问题与离散时间内连续马尔可夫决策模型(MDM)的控制问题联系起来。利用这一联系,我们证明了最优清算问题的值函数是连续的,这是MDM的动态规划或最优性方程的唯一解。这些结果是第5.4.1节“作为PDMP控制问题的最优清算”中值函数粘度解特征的基础。从具有过滤功能的交易员的角度来看,时间t时的经济系统状态∈ [0,T]由Xt=(Wt,St,πT)给出。由于使用自治马尔可夫过程更方便,我们将时间纳入状态和定义:=(t,Xt)。X-iseX=[0,T]×X的状态空间,其中X=[0,w]×R+×sk,其中sk是K维单纯形。设ν为交易员遵循的清算策略。

22
能者818 在职认证  发表于 2022-5-25 09:58:41
从(2.1)、(3.4)和(2.1)、(3.4)可以看出,投标价格是一个纯跳跃过程,在跳跃时间之间,状态过程遵循ODE deXt=g(eXt,νt)dt,其中向量字段g(ex,ν)∈ RK+3由g(ex,ν)=1,g(ex,ν)=-ν、 g(ex,ν)=0,对于k=1,K、 gk+3(ex,ν)=KXj=1qjkπj- πkKXj=1πjZRuk(t,ν,π,z)ηP(t,ej,ν,dz)。对于我们的分析,我们需要g.引理4.1的以下正则性。在假设2.1下,函数g在ex中是Lipschitz连续的,在(t,ν)中是一致的∈ [0,T]×[0,νmax];Lipschitz常数用Kg表示。证明推迟到附录B。状态进程的跳跃率由λ(eXt)给出-, νt-), 对于所有t∈ (0,T),其中对于每(ex,ν)∈eX×[0,νmax],λ(eX,ν)=λ(t,w,s,π,ν):=KXj=1πjηP(t,ej,ν,R)。接下来,我们确定控制x跳跃的转换内核qext。用{Tn}n表示∈X的跳跃次数的N序列。从(3.4)可以看出,对于任何可测函数f:eX→ R+,QeXf(ex,ν):=Ef(eXTn)| Tn=t,XTn-= x、 νTn-= ν=λ(ex,ν)QeXf(ex,ν),其中QeXf(ex,ν)=KXj=1πjZRf给出的非规范化核qaxist、 w,s(1+z),π(1+u),πK(1+uK)ηP(t,ej,ν,dz)。这里ui是ui(t,ν,π,z)的缩写。综上所述,eX是一种PDMP,其特征由向量场g、跳跃率λ和过渡核QeX给出。PDMPs使用所谓的开环控制是控制理论的标准。在当前情况下,这意味着交易者在每个跳跃时间Tn<τ选择一个清算政策ν,以跟进到Tn+1∧ τ。此策略可能取决于状态extn=(Tn,XTn)。定义4.2。用A表示可测映射集α:[0,T]→ [0,νmax]。

23
何人来此 在职认证  发表于 2022-5-25 09:58:45
允许的开环清算策略是映射序列{νn}n∈n带νn:eX→ A.时间t的液化率由νt=P给出∞n=0(Tn∧τ、 Tn+1∧τ] (t)νn(t- Tn,eXTn)。从Brémaud【11,定理T34,附录A2】可以看出,可接受的策略是定义4.2中给出的形式,但对于fstn可测映射νn:Ohm → A代表每n∈ N、 这可能取决于系统的整个历史。马尔可夫决策模型的一般结果(见B"auelle和Rieder[9,定理2.2.3])表明,如果我们考虑较小类别的可容许开环策略,则交易者的预期收益保持不变,因此我们可能会将自己限制在这一类。提案4.3。假设2.1成立。对于每个容许的清算策略{νn}n∈与每个初始值ex相比,存在一个具有上述特征g、λ和QeXas的唯一PDMP。特别是Kushner Stratonovic方程(3.4)有一个唯一的解。证据引理4.1意味着对于α∈ A ODE deXt=g(eXt,αt)dt有一个唯一的解决方案,因此跳跃之间的状态过程是明确的。在任何跳变时间Tn,ext根据可观察数据(Tn,RTn)。此外,由于跳跃强度以λmax为界,因此跳跃时间不能累积。用P{νn}(t,x)(相当于P{νn}ex)表示状态过程定律,前提是Xt=x∈ 交易者使用开环策略{νn}n∈N、 与可容许清算策略{νN}N相关的奖励函数∈由V(t,x,{νn}n)定义∈N) =E{νN}(t,x)Zτte-ρ(u-t) νuSu(1- f(νu))du+eρ(τ)-t) h(Wτ)Sτ,部分信息下清算问题的值函数为V(t,x)=sup{V(t,x,{νn}n∈N) :{νN}N∈不允许的清算策略}。(4.1)备注4.4。

24
mingdashike22 在职认证  发表于 2022-5-25 09:58:48
请注意,补偿器η和过滤器π的动力学与当前出价s无关,清算策略的支付{νn}n∈Nis在s中是正同质的。这意味着清算问题的报酬和价值函数在s中是正同质的,尤其是V(t,w,s,π)=sV(t,w,1,π)。4.2相关马尔可夫决策模型。(4.1)中的优化问题在时间上是离散的,因为控制策略是在离散时间点Tn,n选择的∈ N,这些时间点的状态过程值形成离散时间马尔可夫链(对于Tn<τ)。因此(4.1)可以重写为有限期马尔可夫决策模型中的控制问题。MDM的状态过程由序列{Ln}n给出∈Ln=extnTn<τ且Ln=“” 对于Tn≥ τ、 n个∈ N,其中‘ 是公墓州。为了推导序列{Ln}n的转移核∈和MDM的奖励函数,我们引入了一些符号。对于函数α∈ 由eДαt(ex)或eДt(α,ex)得出的wedenote初值问题的流量Ddtex(t)=geX(t),αtwith initial conditioneX(0)=ex。每当我们想要明确表示对时间的依赖时,我们都会以(t,Дα)的形式写入Дα。此外,我们定义了函数λαubyλαu(ex)=λ(eДαu(ex),αu)=λ((t+u,Дαu),αu)u∈ [0,T- t] ,我们让∧αu(ex)=Ruλαv(ex)dv。接下来,我们仔细看看x的边界。首先注意,过程π取超平面HK={x中的值∈ RK:PKi=1xi=1},因此ex包含在集合H=R×HK中,这是RK+3的超平面。当考虑状态空间的边界或内部时,我们总是指相对于H的相对边界或相对内部。

25
kedemingshi 在职认证  发表于 2022-5-25 09:58:51
对我们来说,特别重要的是状态空间的活动边界Γ,这是x边界的一部分,可以通过从内点x开始的流速eΓα·(ex)达到∈ int(eX)。只有当w=0,t=t,或过滤过程达到k维单纯形的边界时,才能达到x的边界。后者是不可能的:事实上,如果πi>0,那么对于所有t∈ [0,T],因为马尔可夫链没有改变其状态的概率是正的,并且由于给定的FStis的条件分布等于Kallianpur-Striebel公式中的无条件分布。因此,活动边界等于Γ=Γ∪ 式中,Γ=[0,T]×{0}×(0,∞) ×SKandΓ={T}×[0,w]×(0,∞) ×SK,(4.2),其中ski是SK的内部,即SK:={x∈ SK:xi>0表示所有i}。在(4.2)中,Γ是与等于零的库存水平相对应的活动边界的侧面部分,Γ是与到期时状态空间的出口相对应的终端边界。在该方程中,我们用τИ=τИ(ex,α)=inf{u表示流量eДα·(ex)fromeX的第一次退出时间≥ 0:eДαu(ex)∈ Γ}。请注意,(2.5)中定义的停止时间τ对应于状态processeX第一次到达活动边界Γ的时间。使用与B"auelle和Rieder[9,第8.2节]或Davis[22,第44节]中类似的参数,很容易看出序列{Ln}n的转换核ql∈QLF提供的Nis(t,x),α=Zτ~n(ex)e-∧αu(ex)QeXf(u+t,Дu(ex),αudu+e-∧ατИ(¢x)f((R)) ;我们省略了细节。此外,由于公墓州正在吸收,QL{}(“”, α) =1。最后,我们定义了单周期奖励函数r:eX×A→ R+byr(ex,α)=ZτИe-ρue-∧αu(ex)αus(1- f(αu))du+e-ρτИe-∧ατα(ex)h(wτД)s,(4.3)和wτД是eДα的库存成分,我们设置r(“”) = 0

26
nandehutu2022 在职认证  发表于 2022-5-25 09:58:55
对于容许策略{νn}n∈Nwe集J{νn}∞(ex)=E{νn}exP∞n=0r(Ln,νn(Ln)), andJ公司∞(ex):=supnJ{νn}∞(ex):{νn}n∈不可接受的清算策略。(4.4)下一个引理表明,具有过渡核ql和单周期报酬r(L,α)的MDM等价于优化问题(4.1)。引理4.5。对于每个容许策略{νn},它认为V{νn}=J{νn}∞. 因此V=J∞,控制问题(4.1)和(4.4)是等价的。该证明类似于Davis的证明【22,定理44.9】,因此省略。4.3贝尔曼方程。在本节中,我们研究值函数V的Bellman方程。α的定义∈ A和可测函数v:eX→ R+函数Lv(·,α)byLv(ex,α)=R(ex,α)+QLv(ex,α),ex∈例如:。最大奖励算子T由T v(ex)=supα给出∈ALv(ex,α)。由于单周期报酬函数是非负的,我们有一个所谓的正MDM,从B"auelle andRieder[9,定理7.4.3]可以看出,价值函数满足所谓的Bellman或最优方程V(ex)=T V(ex),ex∈例如,V是运算符T的固定点。为了将V描述为与PDMPeX相关的HJB方程的粘度解(见第5节),我们需要一个更强的结果。我们想证明:i.)值函数V是T在适当函数类M中的唯一固定点;ii.)作为起点v∈ 形式为vn+1=T vn,n的M次迭代∈ N1,收敛于V;V是连续的。第i.)点和第ii)点。)遵循下一个引理。引理4.6。定义γ>0时,函数b:eX∪ {} → R+乘以b(ex)=b(t,x):=sweγ(t-t) ,ex∈eX和b(“”) = 0

27
nandehutu2022 在职认证  发表于 2022-5-25 09:58:58
然后,在假设2.1下,b是MDM的一个有界函数,具有转移核Ql和奖励函数r,即存在常数cr,Cq,因此对于所有(ex,α)∈eX×A.| r(eX,α)|≤ crb(ex)和QLb(ex,α)≤ cQb(ex)。此外,对于γ足够大的情况,它认为cQ<1,即MDM正在收缩。证明推迟到附录B。在续集中,我们用BB表示函数集BB:=v:eX→ R使supex∈eX公司v(ex)/b(ex)< ∞,我们定义了v∈ BB标准kvkb=supex∈eX | v(eX)/b(eX)|。那么下面的结果成立了,seeB"auelle和Rieder[9,第7.3节]:a)(Bb,k·k)bis a Banach空间;b) T(Bb) Bb;c) kT v型- T ukb≤ cQkv- ukb。如果MDM是收缩的,则最大报酬算子是(Bb,k·k)b上的收缩,而值函数是Bb的一个元素。因此,巴拿赫不动点定理给出了性质i.)和i.)以上M=Bb。为了建立属性iii.)(V的连续性),我们观察到setCb:={V∈ Bb:v是连续的}是(Bb,k·k)b的闭子集,参见b"auelle和Rieder【9,第7.3节】。此外,我们在Proposition 4.8中显示,在某些连续性条件下(见假设2.1和4.7),T映射到自身。因此,根据Banach的不动点定理,V∈ Cb。假设4.7。1、j的测量ηj(t,ν;dz)∈ {1,…,K}在弱拓扑中是连续的,即对于所有有界和连续φ,映射(t,ν)7→RRφ(z)ηj(dz)在[0,T]×[0,νmax]上是连续的。对于命题3.3中介绍的函数ujintroduced,以下情况成立:对于任何序列{(tn,νn,πn)}n∈Nwith(tn,νn,πn)∈ 每n,[0,T)×0,νmax]×sk∈ N、 这样(tn,νN,πN)---→N→∞(t,ν,π),一个haslimn→∞supz公司∈supp(η)| uj(tn,νn,πn,z)- uj(t,ν,π,z)|=0。提案4.8。假设假设假设2.1和4.7成立,并让v∈ Cb。然后T v∈ Cb。证据考虑一些序列exn→ ex代表n→ ∞.

28
可人4 在职认证  发表于 2022-5-25 09:59:03
自| T v(exn)-T v(ex)|≤ supα∈A | Lv(exn,α)-Lv(ex,α)|,有必要估计差异supα∈A | Lv(exn,α)- Lv(ex,α)|。首先,注意在引理4.1中建立的g的Lipschitz连续性,我们有eИαt(exn)- eИαt(ex)≤ |exn公司- ex |+KgZteДαu(exn)- eИαu(ex)杜。Gronwall不等式因此产生了thatsupt∈[0,T],α∈A.eИαt(exn)- eИαt(ex)≤ |exn公司- ex | eKgT,(4.5),因此n一致收敛→ ∞ 流量eДα(exn)至eДα(ex)。然而,这并不意味着τИn,即eИα(exn)进入状态空间活动边界的时间,收敛于τИn→ ∞. 为了解决这个问题,我们区分了两种情况:案例1。流量eДα·(ex)在终端边界Γ处退出状态空间ex(见(4.2))。这意味着τД=T- 并且库存水平wu对于u<t是严格正的- t、 因此,我们可以从(4.5)中得出结论,τИnConverge to t- t、 在假设2.1和4.7下,一致收敛极限→∞supα∈A | Lv(exn,α)- 因此,使用r的定义和映射(ex,ν)的连续性,Lv(ex,α)|=0紧随其后7→在引理B.1中建立的Qv(ex,ν),见附录B案例2。横向边界Γ处存在流速eДα·(ex),因此wτД=0。在这种情况下(4.5)意味着lim infn→∞τИn≥ τИ;然而,这种不平等可能是严格的。我们展示了这种情况下奖励函数的连续性。我们将r(exn,α)分解如下,为简单起见设置ρ=0:r(exn,α)=sZτν∧τИne-∧αu(exn)αu(1- f(αu))du(4.6)+sZτИnτИ∧τИne-∧αu(fxn)αu(1- f(αu))du+se-∧ατИn(exn)h(wτИn)。(4.7)现在从(4.5)得出,(4.6)中的积分收敛于n→ ∞ 至r(ex,α)uniformlyinα∈ A、 (4.7)中的术语从上方以swτИ为界∧τИn;这可以通过引理4.6的证明中类似的部分积分论证来证明。此外,wτИ∧τИnConvergesunformally inα∈ A到wτД=0,因此(4.7)收敛到零。

29
nandehutu2022 在职认证  发表于 2022-5-25 09:59:06
接下来,我们转向transitionkernel。我们分解QLv:QLvexn,α=ZτИ∧τИne-∧αu(~xn)Qv(eИu(exn),αu)du+ZτИnτИ∧τИne-∧αu(~xn)Qv(eДαu(exn),αu杜。对于n→ ∞, 第一个积分收敛到QLvex,α使用(4.5)和映射(ex,ν)7的连续性→ Qv(ex,ν)(引理B.1)。要估计第二项,请注意Qv(ex,ν)≤kvkbswλ(ex,ν)(因为λ′Q是概率转移核),所以积分以kvkbswτν为界∧τИnZτИnτИ∧τИnλαue-∧αu(exn)du≤ kvkbswτИ∧τИn,n的最后一项收敛到零→ ∞, α中均匀∈ A、 备注4.9。请注意,Lv(·,α)的现有连续性结果,如Davis【22,定理44.11】假设气流Дα以匀速到达活动边界,与所选控制无关。为了在我们的框架中确保这一假设,我们必须对可接受的清算率施加严格的正下界。这在经济学上是对战略空间的难以置信的限制,这就是为什么我们更喜欢依赖直接的论点。我们在下面的定理中总结了这一部分的结果。定理4.10。假设假设假设2.1和4.7成立。然后,值函数V是连续的oneX,满足横向边界Γ中ex的边界条件V(ex)=0,V(T,x)=sh(w)。此外,V是Bb中Bellman或最优性方程V=eT V的唯一解。5控制问题II:粘度解在本节中,我们证明了值函数是与受控马尔可夫过程(W,π)相关的标准HJB方程的粘度解,并推导了该方程的比较原理。

30
mingdashike22 在职认证  发表于 2022-5-25 09:59:09
这些结果对于确保HJB方程合适的数值模式的收敛性,从而确保最优清算问题的数值解至关重要。在第5.2节中,我们提供了一个示例,表明通常HJB方程不提供经典解。5.1粘度溶液特性。作为第一步,我们写下Bellman方程,并使用投标价格中V的正同质性(见备注4.4)从状态变量集中消除SF。定义=[0,T]×[0,w]×sk,由inteY和eY的相对内部和eY相对于超平面R×HK的相对边界。弗雷∈我们设置V(eY)=V(t,w,π):=V(t,w,1,π),使值函数满足关系V(ex)=sV(eY)。对于ν∈ [0,νmax],ey∈eY和任何可测函数ψ:eY→ R+,defineqψ(ey,ν):=KXj=1πjZR(1+z)ψt、 w,(πi(1+ui(t,π,ν,z)))i=1,。。。,KηP(t,ej,ν,dz),注意QV(ex,ν)=sQV(ey,ν)。从现在起,我们用eДαu(ey)表示向量场g的流量,并将价格分量gomitted,我们首次将τД表示为该流量达到Γ给出的有效边界:=[0,T]×{0}×SK∪ {T}×[0,w]×斯科菲。通过正齐性,V的Bellman方程简化为V的以下最优性方程:V(ey)=supα∈AnZτИe-(ρu+∧αu(ey))αu(1- f(αu))+QV(eДαu(ey),αu)du+e-ψ:ey的(ρτИ+∧ατИ(ey))h(wτИ)o.(5.1)→ R+有界,定义函数“ψ:eY×[0,νmax]→ R+和算符Tby′ψ(ey,ν)=ν(1- f(ν))+Qψ(ey,ν),(5.2)Tψ(ey)=supα∈AnZτИe-(ρu+∧αu(ey))`ψeИαu(ey),αu)du+e-(ρτИ+∧ατИ(ey))h(wτИ)o.(5.3)注意,对于固定ψ,vψ:=Tψ是具有瞬时奖励ψ和边界值h的确定性出口时间最优控制问题的值函数。Barles[6]广泛研究了该问题的粘度解。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-27 03:21