楼主: 可人4
493 18

[量化金融] 基于模式匹配的零成本投资组合学习 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-15 16:08:59
特定代理持有的对象集合将被称为代理的对象集群。表示代理的参数通常是代理决定使用的对象集群的索引,以及算法特定参数;通常是一个数据窗口参数k,确定要包含多少过去的数据,以及一个更特定于给定算法(如果需要)的参数,如分区参数\',以及一个与预测时间相关的参数τ。本文实现的学习算法可以使用任意四个有用的参数。然后,代理的数量是这四个自由参数的函数。然后,学习算法将根据代理过去对这四个参数所列举的代理的性能执行加权平均过程。参数分别表示为τ、w、k和`。我们为算法特定参数保留了参数k和`这是为了与之前文献[20]中的图像保持一致。层位参数τ最多有w值,K值,L值和τn值。地平线参数的默认值为1:τ=1。为了简单和计算速度,短期抛售的结果是,以少量费用借入一项资产,然后从出售中筹集的资金可以用于其他交易或投资活动,例如,募集的资金可以通过多头仓位购买另一项资产。当初始投资组合的总价值为零时,多头和空头头寸的组合可以是现金中性的。这种投资组合被称为零成本或现金中性投资组合。本文中的语句使用了默认值。这些参数的选择将决定系统中代理的数量。

12
kedemingshi 在职认证  发表于 2022-5-15 16:09:03
代理数用n表示,其中代理总数为n=τnW KL。第n个代理由一个元组表示,该元组包含给定时间的控件及其性能(Hnm、t、Sn、t)。这个元组通常用向量表示为(Hn,t,Sn,t),其中对象索引m被抑制。对于从t=1到某个最大时间t的连续时间的离散值,代理控制H是t个时间顺序(N,M)维矩阵的集合,这些矩阵在软件中表示为多维双精度矩阵。时间t时,第m个对象的第n个代理控件的值为Hnm,t表示离散的时间值。代理的性能表示为(N,T)-维矩阵,其中第N个代理在第T个时间间隔内的性能为Sn,T。最多有M个对象。所以m可以取整数区间[1,m]上的值,这将枚举对象。agiven agent的对象数量保持不变,即使它们可能在特定agent中实现零位置。从学习算法的角度来看,代理生成的机制并不重要,需要在每个时间增量正确地枚举所有N个代理。在每次时间增量开始时,实施在上一次时间增量结束时确定的控制,然后将其保持到时间段结束,在该时间段结束时,确定代理性能,然后使用学习算法调整代理控制。学习算法更新了agent混合控制qn,它是一个给定agent对总投资组合贡献的度量。q变量控制着一段时间内代理人的相对混合,因为他们根据过去的表现完成任务。

13
能者818 在职认证  发表于 2022-5-15 16:09:07
一般来说,混合控制不能被视为概率,这使得它们的使用和符号与之前的一些文献[20]有所不同。在线学习算法学习算法的灵感来源于[17,18]开发并由[22]定义的universalportfolio方法。学习代理可以被认为是一个多重管理者,使用资产管理语言,多重管理者从一系列投资组合中选择和汇总基础战略,然后使用某种选择方法将其聚集到单个投资组合中,该组合在每个投资或交易期间t实施。有趣的是,学习水平参数有优势,但这不会改变本文中的基本点。基本学习算法是在线逐步实施的,但它可以很容易地与交叉剂平行。学习算法有五个关键步骤:1。更新投资组合财富:第m个资产的投资组合控制bm、TF用于更新第t个期间的投资组合回报St=“Xmbm,t(xm,t- 1) #+1(2)St=St-1.St.(3)此处,第t个期间和第m个资产的价格相关系数xm,t与刚刚结束的期间的投资组合控制相结合,以计算该期间t的已实现投资组合回报。投资组合控制在前一期间结束时计算,并在当前期间开始时实施。假设在此投资期间没有现金流入或流出投资组合,投资组合中每个对象的相对金额将随着相对价格的变化而变化。2.更新代理人财富:代理人控制Hnm,t时间段结束时确定- 1.对于N个代理和M个对象,通过一些代理生成算法,代理对其进行专家级的资本分配决策。

14
何人来此 在职认证  发表于 2022-5-15 16:09:10
在第t个时间段结束时,每个代理的性能Sn,t可以通过使用开始时的价格pm,t来计算投资宇宙中M个对象的相对价格xm,t的变化-1,以及使用代理控件的第t个时间增量pm,t的末尾。Sn,t=“XmHnm,t(xm,t- 1)#+ 1. (4) Sn,t=Sn,t-1.Sn,t.(5)3。更新代理混合物:我们考虑了三种不同的代理混合物更新规则:1。)普遍一致的选择,以及2。)指数梯度选择[23]和3.)指数加权移动平均值。我们通常将这些在线更新称为规则g。在实践中,如果试图在部署前初始化算法,或在系统实时实施过程中在线使用,则会在在线培训期间选择三个更新规则中的一个。对于本文介绍的数值实验,我们采用了受[18,22]启发的普遍共识方法,因为这证明了这一原理。我们可以定义控制的混合,因为累积的代理财富被用作下一次未实现增量的更新功能,并进行一些归一化,因此,下一次增量t+1的第n个代理的代理混合控制与财富的度量成正比:qn,t+1=Sn,t、 (6)替代选择可以包括[23]的指数梯度(EG)方法或基于指数加权移动平均(EWMA)的学习策略。我们采用最简单的更新规则来混合控制,应该注意的是,使用更具适应性的方法(如EG和EWMA学习)可能会有实际优势,其中学习率可以用作额外参数,以使用厚建模框架[15]进行BELERNT。重新标准化试剂混合物:如果试剂混合物被认为是正概率,那么我们需要Pnqn=1,并且所有的qn≥ 0

15
何人来此 在职认证  发表于 2022-5-15 16:09:13
这就是完全投资的代理人不允许做空的情况。我们将这些类型的代理称为绝对代理:qn,t+1=qn,t+1Pnqn,t+1。(7) 对于我们将考虑活跃的代理人,零成本投资组合的杠杆设置为unity:(1)Pnqn=0和(2)ν=Pn | qn |=1。在这里,由于一个代理对另一个代理的短缺,混合控制变为灰色,投资组合变成了自筹资金。混合控制不再被认为是正概率。qn,t+1=qn,t+1-NPnqn,t+1Pn |qn,t+1-NPnqn,t+1 |(8)为了确保学习算法和代理生成算法之间的一致性,杠杆被标准化。5.更新投资组合控制:投资组合控制SBM,皮重在时间段t结束时更新,时间段t+1使用代理混合控制SQN,t+1来自更新的学习算法,代理控制Hnm,t+1来自代理生成算法,使用时间段t的信息,对所有n个代理进行平均。bm,t+1=Xnqn,t+1Hnm,t+1。(9) 基于指数梯度(EG)的学习:qn,t+1=qn,teηSn,tPnqn,tSn,t基于指数加权移动平均(EWMA)的学习:qn,t+1=λqn,t+(1)- λ)qn、tSn、tPnqn、tSn、t该策略是实施组合控制,直到增量结束,测量特征,更新代理,然后重新应用学习算法来计算下一次增量的代理混合和组合控制。算法1在线学习算法(OLA)要求:1。更新的代理控制Hn,t+12。当前功能实现xt3。目前的投资组合控制着bt4。目前的特工控制着Hn,t5。前探员财富序列号-16

16
大多数88 在职认证  发表于 2022-5-15 16:09:17
过去的投资组合财富-1对于t-state doStep 1:投资组合财富更新St=St-1(bt(xTt)- 1) +1)步骤2:代理财富更新Sn,t=Sn,t-1(Hn,t(xTt- 1) +1)步骤3:根据规则gqn,t+1=g(qn,t,Sn,t)更新试剂混合物步骤4:试剂混合物重新标准化dqn,t+1=(Pnqn,t+1=1,qn,t+1≥ 0Pn | qn,t+1 |=1,Pnqn,t+1=0。第5步:投资组合控制被更新bt+1=Pnqn,t+1Hn,t+1平均值校正如果(ν=Pm | bm,t |)6=1,然后重新规范化控制sbn,t+1=νbn,t+1非线性混合序列qn,t+1=νqn,t+1结束返回(bt+1,Sn,t,St,qn,t+1)3。代理生成算法代理生成算法的目的是为第m个对象的n-t代理依次生成代理控件Hnm、TF,以便在第t个时间段开始时实现。这些将用矢量表示法表示为Hn,t。我们最初考虑了三种不同的代理生成算法,在这些算法上进行了厚建模,以了解各种算法的自由参数:1。)一种模式匹配算法[20],2.)我们称之为anti-BCRP(因为它与给定k-元组数据的最佳常数再平衡投资组合进行交易)的反向曼方差投资组合算法,以及3。)反正统的反BCRP算法可用于学习均值算法[16]。这些算法的各种自由参数,例如窗口大小k和分区,被用来枚举在学习算法中竞争资本分配的代理。在本文的数值实验中,我们采用了模式匹配方法[20],因为我们发现,寻找更一般的模式比仅仅针对均值回归效应具有性能优势,而且更重要的是,模式匹配算法更通用,因为它们不需要对所学习的结构进行任何先验选择。

17
大多数88 在职认证  发表于 2022-5-15 16:09:21
这被认为是为了更忠实于本文的意图——我们希望表明,可以通过一种方式学习未指定的模式,这种方式既可以击败股票领域中最好的单一股票,也可以击败自我融资策略中的现金投资组合。3.1. 注释第m个对象xm,t在时间t的特征实现也用向量表示法表示为xt。agent控制和特征时间序列是在线学习算法中的关键输入,用于确定agent的混合度qn,t。在线学习算法依赖于路径,因此,它既是代理控件历史的函数,也是特征时间序列历史的函数。在之前的工作之后,我们将随机特征变量表示为X,并将其实现为X[20,22],其中对于一些向量值平稳和遍历过程{Xt}+∞-∞用x,x,Xt及其相应的随机变量X,X,Xt。然而,我们将进一步定义符号,以便更有效地计算我们具体实施的代理。这些策略基于为m对象构建所选特征的k元组。我们将用xk`w表示代理元组,并将k元组表示为xt-kt。ktuple是当前时间t中长度为k、宽度为m的数据片段,用于枚举所有对象。我们将把k元组符号修改为{xt-kt}s(n),`表示从给定对象群w=s(n)的数据`-分区中提取的k元组。这里是n-thagent的聚类指数。我们正在抑制m索引,并使用向量表示法将k元组写入x。代理元组对于第n个代理是唯一的,其中n是唯一的代理索引,枚举k、`和w的特定组合。k元组用于确定代理控件Hn,t。

18
kedemingshi 在职认证  发表于 2022-5-15 16:09:25
使用的初始特征是历史价格序列,这些序列被认为是从某个随机过程中实现的。然后,模式匹配算法将k元组重新定义为最近邻组,这些最近邻组通过直接使用每个对象过去的k个性能实现,在给定的分区中,通过找到平均方差财富最小化投资组合(以实现反向投资),即完全投资或零成本,来反映历史选择的结果,从而更好地反映回归,并使用特定窗口和分割参数的试剂组合权重:Hn,t+1=Hn,t+1(γ,-u(xn,t),∑(xn,t))与等式n比较。(25)和(26)。未来的结果不仅仅是上一次的价格变化或价格变化顺序。这是通过比较CurrentRealization xt来实现的-回顾过去。这样,给定一组枚举第n个代理的参数,我们将根据算法参数,使用一些选择函数fxn,t=xn(k,`,w),t=xk`w,t=f`,w(xt,xt),从现有的数据实现中选择所需的元组-kt)(10),其中k元组的第m个分量是xmn,t.3.2。对数最优策略在平稳性和遍历性假设下的对数最优策略已被证明是长期策略的最佳选择[14]。这种类型的分析已扩展到半对数最优情况[20],其中导出了弱化条件。令人惊讶的结果是,即使使用这种较弱的公式,最优性的损失也是如此,在所有实际目的中,对数最优性仍然是使用半对数最优性选择的等效性能拓扑组合[20]。

19
三江鸿 发表于 2022-5-16 22:53:09 来自手机
感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 11:57