楼主: 可人4
1135 31

[量化金融] 基于递归神经网络的极限订货簿序列分类 [推广有奖]

21
能者818 在职认证  发表于 2022-6-1 04:02:40
这种订单流量近似值可以更好地预测下一个事件的价格变动,尽管单独使用很难解释买入(红色)和卖出订单流量(绿色)是否较小或大小是否可比。因此,在时空特征集中,我们将订单流量近似值与其他价格水平的流动性失衡、中间价格和深度相结合。12-1-0.5 0.0 0.5 1.0时间增量中部-价格16:37:52.56016:37:52.56516:37:52.56916:37:52.57316:37:52.57816:37:52.58116:37:52.5846:37:52.59016:37:52.594图5:此图显示了表4中用于模型比较的一些预测变量。黑线表示从16:37:52.560到16:37:52.594的34毫秒期间观察到的中间价格变化。流动性失衡(蓝色),此处按比例表示为[-1,1]区间虽然有助于预测下一次价格变化的方向,但对于预测何时会发生价格变化而言,它通常是一个糟糕的选择。该订单流量是下一次活动价格变动的更好预测指标,尽管当买入(红色)和卖出订单流量(绿色)都很小时很难解释。表4比较了不同分类机构在以下特征集上的表现:(i)使用最佳买卖比的即时流动性失衡;(ii)使用流动性不平衡、买入或卖出攻击者的数量到静止数量和中间价格的瞬时订单流量;以及(iii)订单的时空表现,结合侵略者的历史。我们使用均匀白噪声作为性能比较的控制。首先,将RNN与logistic回归(LR)和线性Kalman滤波(KF)模型进行比较,该模型是针对指数分布族中的yf观测而设计的,其中伯努利分布是其中的一个成员。

22
何人来此 在职认证  发表于 2022-6-1 04:02:43
Wee强调,应用于前两个特征集的任何一个模型中都没有历史记录。由于后两种模型仅支持伯努利随机变量的建模,我们遵循多分类器的标准多模型表示,训练3个单独的二进制分类器来表示a3状态输出。预测每个正态的概率阈值设置为0.5。LR模型在glm R包中实施,KF模型在KFAS R包中实施(Helske,2017)。KF模型通过在一个大小为108035的测试集的一部分上模拟1000次试验来近似后验密度,与其他分类相比,该模型的计算量和内存消耗量要大得多。应用于流动性失衡预测因子的KFmodel的召回率和F1得分,以及分别应用于订单流量预测因子的KFmodel得分,均高于RNN和LR模型,尽管某些精度不高。与流动性失衡相比,所有方法在订单流量预测中的表现都要好得多。时空特征集包含32个预测值,每个预测值滞后多达10倍。为了避免在LR模型中包含多个滞后特征的多重共线问题,我们使用elasticnet方法,该方法在glmnet R包中实现(Friedman et al.,2010;Simon et al.,2011)。13Kf型号不适用于此功能集。RNN与两层前馈架构进行了比较,第一层隐藏200个单元,第二层隐藏100个单元。前馈体系结构并不是针对时间序列明确设计的,因此,与弹性网络方法一样,我们通过将每个功能延迟到标签9,从而产生320个输入变量,从而确保与RNN相比的一致性。正则化和学习速率的调整参数的选择可能会导致较大的性能变化。

23
kedemingshi 在职认证  发表于 2022-6-1 04:02:46
此处报告的结果使用了0.01的初始学习率和λ=0.1,尽管存在几个候选值。在这里没有报道的单独实验中,我们观察到深度前馈体系结构的性能可以与RNN的性能一样好,但是由于隐藏单元太多,该方法计算量更大,对初始参数的选择不太可靠。特征方法^Y=-1^Y=0^Y=1精度召回f1精度召回f1精度召回f1流动性不平衡物流0.010 0.603 0.019 0.995 0.620 0.764 0.013 0.588 0.025卡曼过滤器0.051 0.540 0.093 0.998 0.682 0.810 0.055 0.557 0.100RNN 0.037 0.636 0.070 0 0.996 0.673 0.803 0.040 0.613 0.075订单物流0.042 0.712 1 0.079 0.991 0.590 0.740 0.047 0.688 0.088卡尔曼滤波器0.068 0.594 0.122 0.996 0.6150.751 0.071 0.661 0.128RNN 0.064 0.739 0.118 0.995 0.701 0.823 0.066 0.728 0.121时空弹性网0.063 0.754 0.116 0.986 0.483 0.649 0.058 0.815 0.108RNN 0.084 0.788 0.153 0.999 0.729 0.843 0.075 0.818 0.137FFWD NN 0.066 0.758 0.121 0.999 0.657 0.795 0.065 0.796 0.120白噪声0.004 0.333 0.007 0.993 0.333 0.499 0.003 0.333 0.007表4:此表显示了以下特征集上的各种分类:(i)使用最佳买卖比的瞬时流动性失衡;(ii)即时订单流量,使用流动性失衡、买入或卖出攻击者的数量到静止数量和中间价格;以及(iii)订单的时空表示与侵略者的历史相结合。我们使用均匀白噪声作为性能比较的控制。

24
mingdashike22 在职认证  发表于 2022-6-1 04:02:49
通过将正极设置为{Y=-1,Y=0,Y=1},在108035大小的单个测试集上记录精度、召回率和f1分数。图6比较了2016年8月4日从16:37:52.560到16:37:52.594的34毫秒期间,RNN和KF模型估计的下一次事件上升勾号(红色)或下降勾号(绿色)的概率。上图显示了仅以流动性不平衡作为预测因子的卡尔曼滤波器的估计概率。黑线表示观察到的中间价格变化。中间图显示了使用卡尔曼滤波器和预测因子(流动性不均衡、中间价格和市场订单与剩余数量的比率)估计的概率。下图显示了使用时空订单簿表示和市场订单与剩余数量的比率。我们观察到,RNN通常能正确预测涨跌走势,但当中间价为中性时,RNN也能错误预测涨跌走势。当观测到的ID价格平稳时,这些误报(或否定)通常会导致不必要的订单取消和队列位置丢失。虽然可以通过增加检测价格变动的阈值概率来降低误报率,但这可能会导致不利的价格选择增加,即当观察到的中间价波动时,对固定中间价的错误预测。

25
nandehutu2022 在职认证  发表于 2022-6-1 04:02:52
因此,在市场标记策略中应使用概率或概率阈值。14-1-0.5 0.0 0.5 1.0时间增量中部-价格16:37:52.56016:37:52.56516:37:52.56916:37:52.57316:37:52.57816:37:52.58116:37:52.5846:37:52.59016:37:52.594-1-0.5 0.0 0.5 1.0时间增量中部-价格16:37:52.56016:37:52.56516:37:52.56916:37:52.57316:37:52.57816:37:52.58116:37:52.5846:37:52.59016:37:52.594-1-0.5 0.0 0.5 1.0时间增量中部-价格16:37:52.56016:37:52.56516:37:52.56916:37:52.57316:37:52.57816:37:52.58116:37:52.5846:37:52.59016:37:52.594图6:(顶部)使用卡尔曼滤波器,仅以流动性失衡作为预测因子,对账簿下一个事件上升刻度(红色)或下降刻度(绿色)的估计概率。黑线表示从16:37:52.560到16:37:52.594的34毫秒期间观察到的中间价格变化。(中间)使用卡尔曼滤波器和预测因子(流动性失衡、中间价格和市场订单与静止数量的比率)估计下一个事件上涨(红色)或下跌(绿色)的概率。(底部)使用时空订单簿表示和市场订单与静止数量的比率,估计RNN下一个事件上升滴答声(红色)或下降滴答声(绿色)的概率。图7显示了RNN的F1得分,以每小时为单位进行测量。我们观察到,F1得分在上升和下降预测中变化不大,因此没有证据表明F1得分长期衰减,因此需要在一天内对模型进行再训练。

26
大多数88 在职认证  发表于 2022-6-1 04:02:55
事实上,当我们观察到F1分数与预测无书籍移动相反15时,我们观察到F1分数在一天中逐渐增加。0.140.160.180.206-7am7-8am8-9月9日-10am10-11am11-2012年12月12日-1pm1-2平方米-3立方米-4月1日(-1) 不确定性中间值0.60.70.86-7am7-8am8-9月9日-10am10-11am11-2012年12月12日-1pm1-2平方米-3立方米-4pmdaysF1(0)不确定性中间值0.130.150.170.190.216-7am7-8am8-9月9日-10am10-11am11-2012年12月12日-1pm1-2平方米-3立方米-4pmdaysF1(1)不确定性median(a)F1评分^Y=-1(b)F1成绩^Y=0(b)F1成绩^Y=1。图7:日内F1得分显示为(左)向下、(中)中性或(右)向上的下一次价格走势预测。图8显示了每天重新培训模型的重要性。当模型没有每天重新训练,而是只在月初训练时,观察到F1分数表现出长期衰减。虽然长期衰退的证据很清楚,但令人惊讶的是,在本月初训练的模型在一周后仍然有效。通常,非平稳时间序列的计量经济学模型在不经常使用新数据时表现很差。这一令人惊讶的模型稳健性(无需重新训练)表明,流动性失衡与价格波动之间存在着不稳定的关系。图9比较了二元RNN分类在不同预测层位上的接收算子特征(ROC)曲线。该图是通过在区间内改变正分类Y=1的概率阈值(也称为切入点)来构建的[0.5,1)并估计每个模型的真阳性率和真阴性率。虚线显示了白噪声分类器的性能。我们观察到,随着我们将预测范围从下一次图书更新事件增加到未来的1s,RNN的性能会下降。

27
mingdashike22 在职认证  发表于 2022-6-1 04:02:58
交易系统和交易所之间的延迟取决于多个因素,包括执行平台、共用服务器到交易所的距离,甚至到CME匹配引擎的传入交易量。然而,这种延迟通常在100微秒到1ms之间。根据初步调查,我们估计,在现代CPU上,RNN的c/c++实现可以在大约100微秒的时间内预测编译器优化,但没有用于代码优化的低级编程技术。160.100.140.182016-08-042016-08-052016-08-082016-08-092016-08-102016-08-112016-08-122016-08-152016-08-162016-08-172016-08-182016-08-192016-08-222016-08-232016-08-242016-08-252016-08-262016-08-292016-08-302016-08-31天1(-1) 中位数(有)中位数(无)0.700.750.800.850.902016-08-042016-08-052016-08-082016-08-092016-08-102016-08-112016-08-122016-08-152016-08-162016-08-172016-08-182016-08-192016-08-222016-08-232016-08-242016-08-252016-08-262016-08-292016-08-302016-08-31天F1(0)中值(有)中值(无)0.100.150.202016-08-042016-08-052016-08-082016-08-092016-08-102016-08-112016-08-122016-08-152016-08-162016-08-172016-08-182016-08-192016-08-222016-08-232016-08-242016-08-252016-08-262016-08-292016-08-302016-08-31天F1(1)中位数(有)中位数(无)(a)F1得分^Y=-1(b)F1成绩^Y=0(b)F1成绩^Y=1。图8:RNN每日再培训(红色)和无(蓝色)的日历月F1得分显示为(左)向下、(中)中性或(右)向上的下一次价格走势预测。图9:二元RNN分类器在不同预测层位上的接收算子特征(ROC)曲线。

28
mingdashike22 在职认证  发表于 2022-6-1 04:03:01
在实践中,应选择预测范围,以充分考虑交易执行平台和交易所之间的延迟。175结论递归神经网络(RNN)是一种非常适合预测和序列分类的人工神经网络(ANN)。本文解决了一个序列分类问题,即使用对限价订单簿深度和市场订单的短序列观察来预测下一事件的价格波动。根据这一预测调整报价的能力降低了不利价格选择的可能性。我们的结果表明,RNN能够捕捉短期价格波动和限价订单簿时空表示之间的非线性关系。根据2016年8月CME上市的ESU6二级数据,我们的评估是,RNN非常适合在下一次事件中间价格变动和最近的流动性失衡历史、订单流量和限额订单簿的其他属性时表达非线性关系。由于我们的功能中较长的内存似乎可以忽略不计,我们推测使用LSTM几乎没有什么好处。为了实现RNN用于aHFT做市策略,我们建议采取以下措施:(i)首先设计一种做市策略,在考虑RNN预测计算时间产生的额外延迟后,该策略是可行的;(ii)评估回溯测试期间误报和漏报的利益影响;和(iii)相应地扩展该策略,以“加权”因取消而导致队列位置丢失的abook FLIP的模型概率。参考资料M。Abadi,P.Barham,J.Chen,Z.Chen,A.Davis,J.Dean,et al.《TensorFlow:大规模机器学习系统》。

29
nandehutu2022 在职认证  发表于 2022-6-1 04:03:04
《第12届USENIX操作系统设计与实现会议记录》,OSDI\'16,第265–283页,2016年。R、 Bloom field、M.O\'Hara和G.Saar。电子市场中的“决定或采取”决策:流动性演变的证据。《金融经济学杂志》,75(1):165–1992005。五十、 布雷曼。统计建模:两种文化(有作者的评论和反驳)。《统计科学》,16(3):199–2312001年。ISSN 0883-42372168-8745。C、 Cao、O.Hansch和X.Wang。未结限额订单簿的信息内容。《未来市场杂志》,2009年29:16–41。J、 查韦斯·卡西利亚斯和J·E·菲格罗·洛佩斯。具有内存和可变排列的一级限制订单簿模型。《随机过程及其应用》,127(8):2447–24812017。ISSN 0304-4149。内政部:http://dx.doi.org/10.1016/j.spa.2016.11.005.统一资源定位地址http://www.sciencedirect.com/science/article/pii/S0304414916302150.R.Cont和A.de Larrard。将波动性与订单流量联系起来:重交易近似和订单动态的DIF融合极限。工作文件,2010年。R、 Cont和A.de Larrard。马尔可夫限价订单市场中的价格动态。《金融数学杂志》(SIAMJournal on Financial Mathematics),4(1):1–252013年。内政部:10.1137/110856605。统一资源定位地址https://doi.org/10.1137/110856605.R.Cont、S.Stoikov和R.Talreja。订单动态的随机模型。运筹学,58(3):549–56320010。ISSN 0030364X,15265463。统一资源定位地址http://www.jstor.org/stable/40792679.R.Cont、S.Kukanov和S.Stoikov。订单簿事件的价格影响。《金融经济计量学杂志》,12:47–882014.18P。D、 和I.Pollak。限价订单簿中的中间价格预测。IEEE信号处理精选主题杂志,2014年10月。M、 Dixon、D.Klabjan和J.H.Bang。使用深度神经网络进行基于分类的金融市场预测。算法金融,2016年。M、 Dixon、N.Polson和V.Sokolov。

30
大多数88 在职认证  发表于 2022-6-1 04:03:07
时空建模的深度学习:动态流动和高频交易。arXiv预印本arXiv:1705.098512017。D、 Dobrislav和E.Schaumburg。高频跨市场交易:无模型测量和应用。技术报告,纽约联邦储备银行,2016年。J、 L.埃尔曼。分布式表示、简单的递归网络和语法结构。机器学习,7(2):195–225,1991年9月。ISSN 1573-0565。内政部:10.1023/A:1022699029236。统一资源定位地址http://dx.doi.org/10.1023/A:1022699029236.R.F.Engle和J.R.Russell。自回归条件持续时间:不规则空间事务数据的新模型。《计量经济学》,66(5):1127–11621998年。ISSN 00129682、14680262。统一资源定位地址http://www.jstor.org/stable/2999632.J.Faraway和C.聊天区。使用神经网络进行时间序列预测:使用航空公司数据的比较研究。皇家统计学会杂志:C辑(应用统计),47(2):231–2501998。J、 Friedman、T.Hastie和R.Tibshirani。广义线性模型的坐标下降正则化路径。《统计软件杂志》,33(1):2010年1月至22日。十、 格洛特和Y.本吉奥。了解训练深度前馈神经网络的难度。《国际艺术情报与统计会议记录》(AISTATS?10)。艺术情报与统计学会,2010年。五十、 格洛斯滕。电子开放式限额指令簿是否不可避免?《金融杂志》,第1127–116111994页。A、 格雷夫斯。使用递归神经网络生成序列。更正,abs/1308.08502013。统一资源定位地址http://arxiv.org/abs/1308.0850.S.古尔特金和J.佩斯利。散度最小的非线性卡尔曼滤波。arXiv预印本XIV:1705.007222017。J、 B.Heaton、N.G.Polson和J.H.Witte。金融深度学习:深度投资组合。《商业和工业中的应用随机模型》,33(1):2017年3-12月。J、 赫尔斯克。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 13:37