楼主: 何人来此
1666 43

[量化金融] 潜在alpha模型中的带学习的交易算法 [推广有奖]

21
何人来此 在职认证  发表于 2022-6-10 03:39:18
热图显示交易者如何以与其预测一致的方式调整仓位:0.5 1Time00.20.40.60.81模型1的概率(:1t)4.955.15.25.35.4Midprice Value in USD(St)0.5 1Time00.20.40.60.81模型1的概率(:1t)4.955.1Mmidprice Value in USD(St)图2:具有Ornstein-Uhlenbeck过程的样本模拟路径。当投资者发现Θ=5.15美元时,她预计资产价格会随着时间的推移而上涨。因此,她最初会放慢清算速度,以便在交易期结束时以更高的价格出售herasset。然后,她必须在接近终点的时候加速上升,以便放松自己的位置。左下角的面板显示了最优控制相对于AC控制的每股超额收益直方图,其中超额收益定义为asXν?T-XνACTXνACT×10和XνACTis是使用AC清算策略的交易方的总现金。如柱状图所示,在至少73%的模拟中,过滤策略优于AC策略。最后,右下角的面板显示了交易员在交易期间的每股清算价值。图2显示了资产价格和过滤器的样本路径。左上图展示了交易员如何根据资产轨迹快速检测正确的模型。在此模拟中,资产价格最初下降,但随后持续上升。模型1的后验概率相应调整,最初上升,但随后迅速下降并保持较低。在中间面板的模拟路径中,中间价格的路径在整个时间段内约为5美元。交易者对模型1的后验概率的估计根据她观察到的价格变动而变化。

22
mingdashike22 在职认证  发表于 2022-6-10 03:39:21
过滤器过滤所产生的策略对交易方有利,因为过滤更准确地反映资产价格路径的实际行为,而不是确定真正的模型是模型2。最后,图的底部面板显示了40个中等价位路径轨迹样本的集合。6.2. 均值回复纯跳跃过程在本节中,我们研究了交易员开始时没有库存的情况,旨在通过使用往返交易策略从她的阿尔法模型中获得收益。假设资产价格完全由市场秩序流驱动,因此未受影响的中间价格没有差异或漂移。我们假设资产价格均值恢复到交易者必须检测到的未知水平。更具体地说,美元资产中间价满足SDEdFt=b(dN+t- dN-t) ,(6.3),其中N+tand N-强度为λ+和λ的皮重双随机泊松过程-tde由λ+t=u+κ(Θt)定义- Ft)+和λ-t=u+κ(Θt- 英尺)-, (6.4)其中(x)+和(x)-分别表示x的正部分和负部分。我们假设Θ是一个具有生成矩阵CCC的马尔可夫链,如表2所示。无法明确计算Θtca的滤波器,但可以通过SDE的EulerMaruyama方案对滤波器的对数进行近似计算(见定理3.1中的SDE)。如果在{tk}Kk=1时观察到N的值,则滤波器值的最终近似值,其中t=0,tk=t通过递归公式∧jt=πj,(6.5a)和∧jtk+1=∧jtkexp获得(1.- u -κ|θj- Ftk公司|k+1+JXi=1∧itk∧jtk!Cj,ik+1)×u+κ(θj- Ftk)+N+tk+1×u+κ(θj- Ftk)-N-tk+1,(6.5b)k≥ 1,其中N±tk=N±tk- N±tk-1和k=tk=tk-或者,可以使用远期方程找到Θ的交易者滤波器,附录D和第7.1节将对此进行更详细的讨论。

23
kedemingshi 在职认证  发表于 2022-6-10 03:39:24
对于时间步长,建议使用正向方程法kare相对较大,这给上述Euler-Maruyama近似引入了不精确性,从而得出了定理3.1中过滤SDE的解。我们假设交易者有一个小时的交易期限,并在交易期结束前完全平仓。此设置中的最优控制可以在闭合形式中找到。让我们定义常数κ?=bκ和J×J基质CCC?=CCC+κ?I(J×J),其中I(J×J)表示J×J单位矩阵。让我们也定义函数ψψψ:[0,T]×RJ×J→ RJ×J,ψψ:【0,T】×RJ×J→ RJ×J,ψ:[0,T]×R→ R和ψ:[0,T]×R→ R其中ψψψ(τ,YYY)=eτγ- e-τ γ-1eτYYYψψ(τ,γI(J×J)-YYY)+ψψ(τ),-γI(J×J)-YYY),ψψ(τ,YYY)=YYY-1.eτYYY- I(J×J),其中ψ和ψ是上述函数的标量形式,定义为ψ(τ,y)=eτγ- e-τ γ-1eτy(ψ(τ,γ- y) +ψ(τ,-γ - y) )和ψ(τ,y)=y-1(eτy- 1) .此设置的最佳交易速度,让α↑ ∞ 是ν?(t,F,Q,∧)=- γcoth(γ(T- t) )Q+κ?h类- Fψ(T- t、 κ?+π|(∧)ψ(T- t、 CCC)θθ- κ?π|(∧)CCC?-1.ψ(T- t、 CCC?)- ψ(T- t、 κ?)I(J×J)θθi,式中θθ=(θj)j∈Jis一个列向量,包含所有可能的Θtcan值。在数值实验中,我们假设Θt有两种可能的潜在状态:θ=$4.9和θ=$5.1,并且投资者有一个未知先验:π=π=0.5。其余参数见表2。注意,我们假设潜在过程的生成矩阵是对称的,因此交易者对资产的价格轨迹没有先验偏好。u、κ和CCC的参数均被视为与英特尔公司(INTC)股票数据的2状态模型的校准参数在同一范围内。这些校准参数见附录E,并在第7.1节中进行了更详细的讨论。

24
可人4 在职认证  发表于 2022-6-10 03:39:27
附录E中的参数是以秒为单位的,这里的参数是以小时为单位的,所以我们必须将它们乘以3600,得到表2中的参数。N=0,F=5美元,b=0.01美元φ=3×10-6,CCC=-10 1010 -10,κ=1077,u=481,a=10美元-5, β = $10-表2:纯跳跃均值回复模型中的参数。所有时间敏感参数均以小时为单位定义。对于该模拟,我们确定了潜在过程的路径,以便在t期间,Θtstaysat的价值为5.1美元∈ [0,0.5]之后,它会跳到4.9美元,并一直保持到交易期结束。这种设置将使交易者处于不利地位。根据表2中定义的生成器矩阵,交易者预计潜在过程在一小时内平均跳跃10次,而我们为Θ定义的路径仅跳跃一次。图3显示了交易员在一小时内的表现。这意味着交易者的行为将基于这样的假设,即潜在过程的活跃程度平均是模拟过程的10倍。图3右上部分表明,平均而言,过滤器检测到从Θt=5.1美元到Θt=4.9美元的跳跃。此外,右下角的面板显示,在100%的模拟场景中,贸易商都取得了积极的成绩。左侧面板分别显示交易速度(左上)和库存(左下)的热图。

25
何人来此 在职认证  发表于 2022-6-10 03:39:30
正如策略构建一样,代理在交易期限结束时解除库存。0.0.2 0.4 0.6 0.8Time-500005000交易速度(8美元)0.0050.010.0150.020.0250.030.0350 0.2 0.4 0.6 0.8Time-2000-1500-1000-5000500库存股票大小(qt)00.020.040.060.08-500 0 500 1000 1500损益(USD00.050.10.15)概率(损益>0)=100%,因为她发现,在战略的上半年,Θt=5.1美元,但预计体制的转变会导致资产价格下降。7、模型校准本节介绍如何通过期望最大化(EM)算法使用最大似然估计(MLE)将第2节中的模型校准到市场数据。该程序将同时使我们能够利用历史数据对隐藏状态进行分类,并确定哪种动态控制着每个隐藏状态中的中间价和订单流行为。EM算法基于onDempster等人(1977)和Baum-Welch算法(Baum等人,1970)。一旦描述了一般程序,我们将其用于校准第6.2.7.1节中的purejump均值回复模型的广义版本。EM算法本节介绍第2节资产和市场动态的离散化版本及其相关校准算法。我们假设在离散、均匀间隔的时间T={tk=t×k:k=0,K} ,其中t>0是两次观测之间的时间间隔。定义离散时间过程Yk=(Ftk,Ntk,λtk)和Zk=Θtk∈ T根据第2节中的假设,(Y,Z)={(Yk,Zk)}k=0。。。Kis是马尔可夫过程。

26
nandehutu2022 在职认证  发表于 2022-6-10 03:39:33
此外,过程Zk的转移矩阵和Zare的分布已知,可以写成asPPP=[P(Zk=θj | Zk-1=θi)]Ji,j=1=et CCC和(7.1)πππ=[P(Z=θi)]Ji=1=πiJi=1。(7.2)此外,根据过程F,N+,N的定义-和Θ,进程Y和z继承了图4所示的有向图中描述的条件独立结构。重要的是要注意,这里我们允许可见状态Y之间的依赖性,即使是在以潜在状态为条件的情况下(即,后续Y之间存在连接)。这与通常的HMM设置不同,在HMM设置中,当以Z.zzpzPzPyyyfψYfψYfψYfψ为条件时,Y是有条件依赖的。图4:价格和订单流量模型的有向图形表示。更具体地说,我们有P(Yk∈ B、 Zk=θi | Yk-1,Zk-1) =P(Yk∈ B | Yk-1,Zk-1) P(Zk | Zk-1) ,(7.3)对于每个k=1。K和任何Borel可测集B。让我们也假设Yk的转移度条件为(Yk-1,Zk-1) 已知每个k=1,K、 给定一组合适的参数ψ,我们可以写出(Yk∈ dy | Yk-1=y,Zk-1=θi)=fψ(tk,y;tk-1,y,θi)u(dy),(7.4),其中每个固定值(y,θj)∈ R2J+3×{θj}j∈J、 和固定时间0≤ tk公司-1<tk≤ T,fψ是概率密度函数,其中u是勒贝格测度。在机器学习语言中,函数fψ通常被称为发射概率。可通过求解适当的Kolmogorov/Fokker-Planck正演方程找到。

27
何人来此 在职认证  发表于 2022-6-10 03:39:37
如果我们将fψ(t,y)=fψ(t,y;s,y,θi)考虑为Yan的固定值和0≤ s≤ t型≤ 那么fiψ是偏微分方程的解( t+Pj∈Jet CCCi、 jbL+j)fiψ(t,y)=0fiψ(s,y)=δ(y-y) ,(7.5),其中δ(y)是diracδ函数,运算符bl+jis是过程的伴随整数生成器Yt=(Ft,Nt,λt),条件是事件{ω:Zt(ω)=θj,t型∈[0,T]},其中et CCCi、 tCCC矩阵指数的jis元素(i,j)。实际上,可以使用任意数量的近似值来获得排放概率密度。在本节的其余部分中,我们使用符号Ydkand和ZDkt来表示在时间tkin上观察到的过程y和Z,这是数据后独立观察到的路径。我们还介绍了符号Ydm:n,Tm≤k≤nω:Ydk∈ dydk公司其中每个ω:Ydk∈ dydk公司, 表示我们观察到的可见过程Ydkhaving取值ydk的事件。目标是确定参数集Γ=(π,PPP,ψ)∈ 最大化过程Y的观测概率{ydk}K,Dk,d=1,其中G是一组允许的参数,定义为asG=nπππ=(πi)Jt∈[0,T]∈ RJ:1 | Jππ=1,πi∈ [0,1]o×nPPP=(Pi,j)Jt∈[0,T]∈ RJ×J:1 | JPPP=1J,Pi,J∈ [0,1]o×Gψ,(7.6),其中1Jis是1的列向量,Gψ是我们限制ψ的集合。G定义中的前两个集合确保ππ和的条目为1,而PPP分别是有效的Markovchain转移矩阵。由于未观测(潜在)状态Z的存在,过程Y的离散观测的对数似然中的项数随观测数呈指数增长。因此,有必要使用EM算法,该算法提供了一系列改进的参数估计{k}∞k=1。序列中的每一项都有比前一项更大的可能性。EM算法如下所示。

28
大多数88 在职认证  发表于 2022-6-10 03:39:40
从模型参数的初始猜测开始(例如,从没有潜在状态的等效模型估计),Γ∈ G、 生成参数{n}的递归序列∞n=1,由关系n+1=arg sup定义∈GEPΓn对数LΓ{Yd0:K}Dd=1, (7.7)其中,log LΓ是在给定参数集Γ的情况下观察到过程(Y,Z)的D条独立路径的联合对数似然,其中PΓ是以具有参数Γn的(Y,Z)的动力学为条件的概率度量。我们模型的联合对数似然产生分解log LΓ=DXd=1JXi=1logπi{Zd=θi}+DXd=1K-2Xk=0JXi,j=1log(Pi,j)1{Zdk=θi,Zdk+1=θj}+DXd=1K-1Xk=0JXi=1logfψ(tk+1,ydk+1;tk,ydk,θi){Zdk=θi}。(7.8)然后我们有EpΓn对数LΓ| Y0:K,YD0:K=DXd=1JXi=1logπiγi,d+DXd=1K-2Xk=0JXi,j=1log(Pi,j)ξi,j,dk+DXd=1K-1Xk=0JXi=1logfψ(tk+1,ydk+1;tk,ydk,θi)γi,dk,(7.9),其中较平滑的γi,dk和两片边缘ξi,j,dk定义为γi,dk=PΓnZdk=θi | Yd0:Kξi,j,dk=PΓnZdk=θi,Zdk+1=θj | Yd0:K. (7.10)这些系数可以使用前向-后向算法计算,对于我们的模型,该算法在附录D中提供。接下来,由于方程(7.9)的每一行仅依赖于ππ、PPP和ψ中的一个,因此可以独立地获得参数的更新估计。得到的更新规则(最大化(7.9))是πj=DDXd=1γj,d,j∈ J、 (7.11a)P?i、 j=PDd=1PK-2k=0ξi,j,dkPDd=1PK-2k=0PJj=1ξi,j,dk,i,j∈ J、 (7.11b)ψ?=arg maxψ∈Gψ(DXd=1K-1Xk=0JXi=1logfψ(tk+1,ydk+1;tk,ydk,θi)γi,dk)。(7.11c)因此,Γn+1=(πππ?,PPP?,ψ?)。

29
nandehutu2022 在职认证  发表于 2022-6-10 03:39:43
在一些模型中,排放概率(7.11c)的更新估计值可能在分析上易于处理(例如,高斯混合或离散分布),而在其他模型中,可能必须求助于数值优化方案。Rabiner(1989)概述了方程(7.7)最大化和各种其他相关计算问题的更多细节。本节中提出的模型与经典隐马尔可夫模型(如Rabiner(1989)中发现的模型)之间的一个细微差异是,即使在隐过程Z.7.2的路径上条件化时,可见过程Y也表现出时间相关性。均值回复纯跳跃模型在本节中,我们将展示如何为第6.2节中介绍的模型实现EM算法。假设观测频率足以观测到中间价格中的一次或无跳跃,我们采用了该模型的删失版本。如第6.2节所述,我们假设区间[tn,tn+1)内的中间价格Ft增量满足tn+1- Ftn=b氮+总氮- N-田纳西州, (7.12)如果N±t∈ {0,1}是截尾的、条件独立的泊松随机变量,具有各自的随机速率参数λ+tt和λ+tt,其中λ±t=JXj=1λ±,jt{Θjt=θj},(7.13),我们假设λ±,jt在每个观察周期内有恒定的路径(这很容易放松)。此外,λ+,jtn=uj+κj(θj- Ftn)+和λ-,jtn=uj+κj(θj- Ftn)-. (7.14)这概括了第6.2节中的模型,因为所有参数u、θ和κ可能会根据隐藏过程Θt的状态而变化。排放概率的参数ψ={ujκj,θj}Jj=1,分别表示(在每个状态内)基本噪声水平、平均回复率和中间价格的平均回复水平。

30
大多数88 在职认证  发表于 2022-6-10 03:39:46
有了这些成分,我们现在可以用ψ(tk+1,Yk+1;tk,Yk,θj)表示发射概率=e-tλ-,jtk公司1.- e-tλ+,jtk, 如果Ftn+1>Ftke-tλ+,jtk1.- e-tλ-,jtk公司, 如果Ftn+1<Ftke-t(λ+,jtk+λ-,jt)+1.- e-tλ+,jtk1.- e-tλ-,jtk公司, 否则(7.15)有了这个表达式,我们可以应用第7.1节中的EM算法来获得参数估计。在该模型中,我们无法从(7.11c)中获得ψ的显式更新,而是使用数值优化。7.3. 示例适用于INTC股票数据在本节中,我们将第7.2节中的模型适用于日内价格数据。我们将该模型与2014年每个营业日10:00至11:00之间的每秒钟纳斯达克交易所国际股票的中间价进行比较。为了规范化这两天之间的数据,我们从每个数据点中减去当天10:00的价格,以便我们将第7.2节中的模型与每天10:00以来的国际贸易中心价格变化进行拟合。此外,我们假设价格路径在几天内是独立的。从该数据集中,我们设置t=1,因此所有参数估计都可以在一秒的尺度上进行解释。在附录E中,我们给出了具有1到6个潜在状态的模型的参数估计。所有这些参数估计都是使用第7.1节中描述的EM算法获得的,该算法适用于第7.2节中的截尾纯跳跃模型。使用潜在状态校准模型的一个重要部分是估计模型应具有的状态的可能数量。为了选择“最佳”的最新状态数,我们使用两个信息标准:贝叶斯信息标准(BIC)和综合完成可能性(ICL)。在我们的论文中,我们使用比尔纳基等人(2000)的ICL代用词。附录E中给出了这两个标准的定义和一些相关计算细节。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 05:45