楼主: mingdashike22
1529 63

[量化金融] 基于模式匹配的零成本投资组合学习 [推广有奖]

31
何人来此 在职认证  发表于 2022-5-18 14:02:44
算法最初将使用合成数据(见第4.2节)进行测试,然后使用priorresearch[17,22](见第4.3节)中使用的真实世界测试数据,即每日采样收盘价序列。数据和算法可以很容易地扩展,以容纳附加的特征作为辅助信息[18];如交易量、价差、各种财务指标以及资产特定属性和状态属性。这些附带信息可以简单地用于将数据重新划分为其他代理集,然后用作学习算法的输入。与边信息扩展相关的财富绩效提升并未在本文给出的数值实验中得到证明。OHLC条形图数据通常由蜡烛刺图表示,如图(1)所示。图1:特征时间序列数据最好被认为是OHLC(开放-高-低-关闭)条形数据。蜡烛图中的填充框表示收盘价低于开盘价的情况,反之,未填充框的收盘价高于开盘价。时间序列数据使得时间增量t的收盘价不一定在时间t+1时,startAlgorithm 3匹配算法(MTA)要求:1。前瞻规则τ2。分区{p`}3。k元组{xtt-k} s(n)4。

32
何人来此 在职认证  发表于 2022-5-18 14:02:49
t状态dofor p的数据分区{xt}(p`,s(n))`∈ j-态的{p`}dos∈ p `确定测试tuplest(j)t(j)-k={xt(j)t(j)-k} (p`,s(n))查找到k元组的距离k、 j={xkt-k} s(n)- st(j)t(j)-kif k=1,然后计算向量的2-范数1,jj=Pm∈对象SPm1,j2=p1,jT1,D尺寸(物体)的距离测量{j} p`← m、 j=J矩阵的melsecolumn-wise 2-范数j、 k{j} p`← m、 j=Pkk=1qmk,jend ifend for statesif dim({p`})=1然后切换NN算法分区选择[22] 尺寸(j)=`{j} Elsef在每个\'partitionsj`=minj中找到最佳匹配项p`∈{p`}{j} p`end ifend for partitionsupdate前瞻规则jn=j`+τ更新代理tuplexn,t={xt}t∈Jn更新平均值和协方差u=u(xn,t- 1) ∑=∑(xn,t- 1) 更新t-statereturn Hn的代理控制shn,t+1=Hn,t+1(γ,u,∑)end,t+1时间增量t+1。对于一些任意数据特定的时间增量δ,收盘价实际上可以超过某个时间t+δ。一个低频率的例子是JSE上的一个典型交易日,市场在上午9点以某个开盘价ot开盘,然后市场可能在某个收盘时间17点收盘,在一个收盘拍卖期后,正式收盘价ct在市场收盘后不久(可能在一段随机期后)打印出来。然后,市场在夜间关闭一段时间,直到第二天市场再次开放。有一段时间,δ,市场关闭,因此此类信息不会持续被定价到交易数据集中。随后,通过公开拍卖和各种资产的后续交易过程,夜间积累的信息将被定价为市场价格。我们处理OHLC数据的方法适用于各种同步采样或重新采样的数据集,包括日内数据:1。

33
大多数88 在职认证  发表于 2022-5-18 14:02:52
收盘价:此处第m项资产的价格pm、TF是收盘价的时间序列。然后根据收盘价格时间序列cm,txm,t=cm,tcm,t计算价格相对值xm,皮重-1.(31)该算法试图利用从一个时间增量交易结束到下一个时间增量交易结束的价格变化相关信息。2、开盘至收盘:此处m-th资产的价格pm、tf是相同数据上开盘和收盘价格的有序时间序列对,然后将价格相关系数计算为xm,t=cm,tom,t。(32)此处试图利用交易增量中的价格相对变化,例如,从开盘到收盘的一天内,忽略夜间价格变化。3.收盘至开盘:此处第m资产的价格pm、Tf表示交易期结束后t的价格变化- 1到下一个交易周期,时间为txm,t=om,tcm,t-1.(33)在这里,人们希望利用交易期之间的价格变化,在下一个交易期开始之前,信息还不能在交易中充分反映出来。4、开盘价:此处第m资产的价格pm、TF为开盘价的时间序列。然后,根据期初价格估算出与xm、皮重相关的价格- δtt+1- δt+第1个交易期交易gapcm,t-1om,tcm,tom,t+1特征δt图2:第t个时间增量的特征时间序列投资期表明,第t个增量的结束并不总是必须与下一个(此处为第t+1个)投资期的开始一致。开盘价为om,收盘价为cm,T为第m项资产。om,txm,t=om,tom,t-1.

34
可人4 在职认证  发表于 2022-5-18 14:02:56
(34)这是为了寻找从市场开放到市场开放的价格变化的效率。信息中重要的缺失部分是与交易量相关的信息(以及其他特征,如差价、订单不平衡和订单簿对日内数据的弹性)。例如,当确定开盘价的交易量明显低于典型收盘价时,开盘价的可靠性较低。如果某个特定市场的收盘拍卖比典型的开盘拍卖有更多的数量,那么价格的相对不确定性可能很大。图2给出了典型的时间增量。我们提倡使用状态检测算法和边信息分区来解决这些类型的问题。在这项工作的背景下,这样的问题不会改变我们的结论。预计学习算法仍将尝试最大化给定特征集的特定生成算法的长期财富。对于每日数据和日内数据,我们在本研究中最感兴趣的特征集将是与“收盘价”和“收盘价”价格相关特征相关的特征集。4.2。合成数据该算法在主动和绝对投资组合的四个合成数据案例(SDC)上进行了测试。生成了1000个时间段内10支股票的合成数据。每个时间段内每个股票的价格相对值xm、TF是根据对数正态分布随机生成的(MATLAB中的lognrnd函数使用Mersenne Twister psuedo随机数生成器生成,并使用特定的种子值初始化),每个合成数据案例定义了用于生成数据集的平均值u和方差v。

35
mingdashike22 在职认证  发表于 2022-5-18 14:02:59
相关正态分布的平均值,|u和标准偏差,|σ由以下公式给出:|u=logupv+u!(35)“σ=吃力”vu+1(36)表1总结了四个合成数据案例,每个案例生成30次,并用种子值1、2、…、,分别是30。1.合成数据案例1(SDC 1):由对数正态分布生成,平均相对价格u=1,方差v=0.0002,以模拟股票价值随时间无显著增减的股市。预期的结果是,无论是主动投资组合还是绝对投资组合,都无法了解应该持有多头头寸还是空头头寸的股票。2.合成数据案例2(SDC 2):由对数正态分布生成,平均相对价格u=1.001,方差v=0.0002,以模拟股票价值随时间增加的股票市场。预期的结果是,绝对投资组合将了解持有多头仓位的股票,但活跃投资组合将无法了解持有空头仓位的股票,因为没有股票价值随时间而增加。3、合成数据案例3(SDC 3):由对数正态分布生成,随机平均价格相对u≥ 1,分配给每个股票和avariance,v=0.0002。随机平均值的计算如下:um=1+max[0,min(0.0005+0.0005δ,0.001)](37),其中δ是从标准正态分布生成的随机数(使用MATLAB中的randn函数和Mersenne Twister伪随机数生成器[31],并使用特定种子值进行初始化)。

36
何人来此 在职认证  发表于 2022-5-18 14:03:02
这模拟了一个股票市场,其中一些股票的价值在不断增加,而一些股票的价值在不断下降。预期结果是,主动投资组合和绝对投资组合都将学会在价值随时间增加的股票上持有多头头寸,并在价值随时间减少的股票上持有空头头寸,然而,由于股票价值随时间增加的增长率,预计绝对投资组合将超过主动投资组合。随机数据集摘要数据集uvSDC 1 1.000 0.0002SDC 2 1.001 0.0002SDC 3随机≥ 1 0.0002SDC 4混合0.0002表1:生成合成数据集时选择的平均值和方差。DC 3的随机平均值用等式n计算。(37)并按照第4.4节所述生成DC 4的平均值。合成数据案例4(SDC 4):根据对数正态分布生成,将混合均值分配给价格相关者,将u=0.999分配给3只股票,将u=1.001分配给剩余股票,方差v=0.0002。这个数据集模拟了一个股票市场,其中一些股票的价值在上升,而一些股票的价值在下降。预期结果是,主动投资组合和绝对投资组合都将学会在价值随时间增加的股票上持有多头头寸,并在价值随时间减少的股票上持有空头头寸。4.3。真实数据该算法在表2中总结的四组真实数据上进行了测试,两组数据来自于[32]获得的纽约证券交易所(NYSE),两组数据来自于[33]获得的约翰内斯堡证券交易所(JSE)。1。【参考译文】这是纽约证交所的股票价格。这与Gy¨or fi等人在【20,22】和【17】中使用的数据集相同。2。

37
可人4 在职认证  发表于 2022-5-18 14:03:06
纽约证券交易所合并数据:如[32]所述,该数据集包含1962年至2006年在纽约证券交易所上市的23只股票的近距离价格相关数据。1962-1984年间23支股票的数据与上文第1.3点所述数据相同。JSE OHLC数据:这是从汤森路透Tick History(TRTH)[33]获得的,包含1995-2015年在约翰尼斯堡证券交易所(JSE)上市的42只股票的数据(使用RICchain 0#.JTOPI),但并非所有42只股票的数据集都来自Yoram Singer[32]的网站。该数据最初来源于雅虎!财务和财务报告由G’abor Gelencs’er清理和编制,并在其网站上公布【32】。真实数据集摘要数据集时间段#StocksNYSE[32]1962-1984 36纽约证券交易所合并[32]1962-2005 23JSE daily OHLC[33]1995-2015 42JSE Intraday[33]2013 40表2:算法测试的真实数据集描述。1995年上市,这些股票的数据稍后才开始。数据列出了所有42只股票的开盘价、高价、低价和收盘价。这些原始数据被处理成四个数据集,分别包含接近-关闭、打开-关闭、关闭-打开和打开-打开价格关系。拆分、合并和丢失的数据通过为当天指定相对价格1来处理。4、JSE日内数据:交易数据来自汤森路透Tick History(TRTH)[33],包括2013年在约翰内斯堡证券交易所(JSE)上市的40只股票在RIC链0#中的账面顶部和交易更新。JTOPI。使用交易价格和交易量加权平均值将交易数据转换为5分钟的bardata。在正常交易日,5分钟条形图数据从9h30开始,在16h30结束,在早盘收盘日从9h30开始,在11h30结束。

38
mingdashike22 在职认证  发表于 2022-5-18 14:03:09
JSE的正常交易数据始于8h30至9h00之间的开盘拍卖,9h00至16h50之间的连续交易,16h50至17h00之间的收盘拍卖。5、实现利用算法1(OLA)确定投资组合实现的财富和代理人实现的财富。算法1中使用的第2节中介绍的代理控件Hn,t是通过使用算法2(PMA)确定的,该算法调用算法3(MTA)来确定每个代理的代理控件。算法3更新管理者财富,如等式所述。(25). 在实验中,使用了50种药剂,K=(1,2,…,5)和L=(1,2,…,10),类似于Gy–or Fi等人在[20,22]中使用的药剂选择(“专家”)。所有结果和数据处理均在MATLAB中完成。该算法使用我们命名为pattern的MATLAB类针对绝对和活动情况实施,数据具有隐式生存偏差,但这不会影响本文的结果。拆分和合并分别被确定为具有xm,t<0.7和xm,t>1.3。日历效应没有得到充分考虑。通过投资合成数据端口获得的财富。财富最佳代理最佳平均SDC 1Abs。行为1.2311.4510.9921.0521.8061.7531.2501.358SDC 2Abs。行为3.2411.4512.6121.0524.6541.7533.2701.358SDC 3Abs。行为2.3201.4901.6851.1713.0911.7822.0901.451SDC 4Abs。行为2.4552.9271.8962.0552.9313.2702.2502.297表3:每个合成数据案例30次运行的主动和绝对投资组合所获得的财富。使用MATLAB类代替函数,因为这样可以轻松地将算法扩展到更在线的方法。模式类被扩展,以包括Gy¨or fi et al Nearest Neighbor[22]算法的恢复版本,因此第6节中的运行时间比较将是准确的。

39
大多数88 在职认证  发表于 2022-5-18 14:03:12
Cover等人[17]的UniversalPortfolios算法是通过创建实现该算法的MATLABfunction来恢复的。6、结果与分析6。1、合成数据该算法在四个合成数据案例(SDC)上进行了测试,以说明该算法在不同类型的市场中的表现。表3显示了30次使用种子值1、2、…、初始化的每个合成数据案例的主动和绝对投资组合实现的最佳和平均财富,分别是30。在所有数据集上,当使用绝对投资组合时,该算法最终会学习SDC 2、3和4中观察到的随时间而增值的股票。类似地,当使用主动投资组合时,该算法最终学会在价值随时间增加的股票上持有多头头寸,并在价值随时间减少的股票上持有空头头寸;如SDC 3和SDC 4所观察到的。图3、4、5和6显示了主动和绝对投资组合所获得的财富,以及使用初始种子值7随机生成的每个合成股票所获得的财富。表4和表5显示了两个样本Kolmogorov-Smirnov测试的平均p值,比较了从投资组合中获得的总财富、从投资组合中的最佳代理人获得的财富和从最佳股票获得的财富的以下组合:1。S> S:另一种假设是,在5%显著水平上,从投资组合的最佳代理人S获得的财富的累积分布函数(CDF)大于从投资组合S获得的总财富的CDF。ActivePortfoliosBest代理的财富平均p值。托特。最富有的代理人。最好的股票最好的股票。托特。财富炒作。

40
能者818 在职认证  发表于 2022-5-18 14:03:16
S> SS>SS>S\'p p p>S\'p p p>p\'p p p>pSDC 1 0.809 0.172 0.031 0.000 0.654 0.013SDC 2 0.809 0.172 0.000 0.000 0.873 0.407SDC 3 0.830 0.172 0.000 0.000 0.904 0.563SDC 4 0.725 0.013 0.000 0.622 0.006表4:从活跃投资组合中获得的财富平均p值的比较。每个列中的第一个p值是每个案例30个数据集的平均p值,使用两个样本Kolmogorov-Smirnov检验进行替代假设(Hyp)。第二个p值来自两个样本的Kolmogorov-Smirnov检验,用于替代假设,即每种情况下30个数据集的p值的累积分布函数(CDF)大于5%显著水平下平均p值的CDF。2.S>S:另一种假设是,在5%显著水平上,从投资组合的最佳代理人S获得的财富CDF大于从最佳股票S获得的财富CDF。3.S>S:另一种假设,即从最佳股票S获得的财富的CDF大于从投资组合S获得的总财富的CDF,显著性水平为5%。之所以选择两样本Kolmogorov-Smirnov检验,是因为它是一种非参数检验,并且不对数据集的分布进行假设。6.2. NYSE数据该算法在NYSE数据集上运行,用于[17]中Cover和[20,22]中Gy–or Fi等人使用的同一对股票的溶质和活跃投资组合。表8显示了主动投资组合和绝对投资组合所获得的财富,并与文献中使用Gy¨or fi等人的最近邻策略(GNN)[20,22]和通用投资组合策略(UP)的参考结果进行了比较。G*NN表示我们对最近邻策略结果的最佳恢复[20,22]。通用投资组合策略所取得的结果同样得到了恢复[17]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 21:36