楼主: 大多数88
449 9

[量化金融] 使用监督学习和OCA进行交易选择 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.8997
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-11 06:20:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Trade Selection with Supervised Learning and OCA》
---
作者:
David Saltiel and Eric Benhamou
---
最新提交年份:
2018
---
英文摘要:
  In recent years, state-of-the-art methods for supervised learning have exploited increasingly gradient boosting techniques, with mainstream efficient implementations such as xgboost or lightgbm. One of the key points in generating proficient methods is Feature Selection (FS). It consists in selecting the right valuable effective features. When facing hundreds of these features, it becomes critical to select best features. While filter and wrappers methods have come to some maturity, embedded methods are truly necessary to find the best features set as they are hybrid methods combining features filtering and wrapping. In this work, we tackle the problem of finding through machine learning best a priori trades from an algorithmic strategy. We derive this new method using coordinate ascent optimization and using block variables. We compare our method to Recursive Feature Elimination (RFE) and Binary Coordinate Ascent (BCA). We show on a real life example the capacity of this method to select good trades a priori. Not only this method outperforms the initial trading strategy as it avoids taking loosing trades, it also surpasses other method, having the smallest feature set and the highest score at the same time. The interest of this method goes beyond this simple trade classification problem as it is a very general method to determine the optimal feature set using some information about features relationship as well as using coordinate ascent optimization.
---
中文摘要:
近年来,最先进的监督学习方法利用了越来越多的梯度增强技术,主流的高效实现如xgboost或lightgbm。生成熟练方法的关键点之一是特征选择(FS)。它包括选择正确的有价值的有效特性。当面对数百个这样的功能时,选择最佳功能就变得至关重要。虽然filter和wrappers方法已经达到了一定的成熟度,但嵌入式方法确实是找到最佳特征集所必需的,因为它们是结合特征过滤和包装的混合方法。在这项工作中,我们解决了通过机器学习从算法策略中找到最佳先验交易的问题。我们使用坐标上升优化和块变量推导了这种新方法。我们将我们的方法与递归特征消除(RFE)和二进制坐标上升(BCA)进行了比较。我们在一个真实的例子中展示了这种方法先验地选择好交易的能力。该方法不仅优于初始交易策略,因为它避免了损失交易,而且优于其他方法,具有最小的特征集,同时得分最高。这种方法的兴趣超出了这个简单的贸易分类问题,因为它是一种非常普遍的方法,可以使用有关特征关系的一些信息以及使用坐标上升优化来确定最佳特征集。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Trade_Selection_with_Supervised_Learning_and_OCA.pdf (420.5 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:OCA Optimization Applications Increasingly relationship

沙发
nandehutu2022 在职认证  发表于 2022-6-11 06:20:13
采用监督学习的权衡选择和OCADavid Saltiel1 2 Ric Benhamou1 3抽象监督学习利用了越来越多的梯度推进技术,主流有效方法是特征选择(FS)。它认为选择最佳功能至关重要。虽然filter和wrappers方法已经相当成熟,但嵌入方法对于发现过滤和包装的组合特征确实是必要的。在这种机器学习中,最好的先验交易来自算法策略。我们使用变量推导出这种新方法。我们将我们的方法与递归特征消除(RFE)和二进制协调进行了比较。这种方法能够选择好的交易策略,因为它避免了损失交易,也优于其他方法,因为它是一种非常通用的方法,可以使用一些关于特征优化的信息来确定最佳特征集。简介:在金融市场中,算法交易变得越来越活跃。机器在法国巴黎75016的liquid and elecDauphine尤为重要。通信地址:David Saltiel<David。saltiel@aisquareconnect.com>.电子市场,如外汇和期货市场(Chaboud et al.,2015),了解各种市场的更多详情)。当一些交易信号和信息以很高的重复概率识别模式或趋势时,这些策略更加集中。

藤椅
大多数88 在职认证  发表于 2022-6-11 06:20:16
与最少的亏损交易一样令人满意。除了交易策略之外,增加补充也是有意义的。问题是从经验上验证一种受监管的机器学习方法是否可以先验地识别好坏交易,从而在系统交易中进行选择。在这一挑战中,复杂性在于识别决定基于机器的交易成功几率的特征。协调上升,将NP难问题转化为工作。使用监督学习和OCA进行权衡选择图1。首先,使用专有交易策略,在单独的测试集上生成交易策略的一些样本性能,以验证电弧过度匹配。2、经验描述2.1。质询描述生成交易条目。但一旦我们到位,下一个问题就是交易退出策略。有多重力量的成功和明确的收益或限制损失,一种常见的做法是将战略与盈利目标和2010年的stop2010相关联),(Giuseppe Di Graziano,2014),(Fung,2017),或(维茨比限价指令。限价指令实际产生的止损通过限制损失来保护整体风险。每当市场回潮并与预设的xGBoost或lightgbm相矛盾时,该算法的性能就会很差,如图1.2.2所示。在我们的数据中,与我们的预测建模问题最相关的特征选择。它一直是一个活跃而富有成效的研究领域RCH在理论和实践中都被证明是有效和有用的,原因有很多:提高了学习效率,增加了理解难度,提高了绩效(见(Almuallim和Dieterich,1994),(Koller和Sahami,1996)和(Blum和Langley,1997)),缩短了列车避让时间,增强了泛化能力,减少了过度匹配,所采用的方法各不相同。

板凳
何人来此 在职认证  发表于 2022-6-11 06:20:19
简而言之,methWrapper方法和Embedded方法。然而,这些方法并没有利用某些特殊性,例如,重新组合变量,这些变量是在不同时间观察到的一些物理量(如金融市场策略的速度,如患者在不同时间的体温或心跳等)。OCA方法此处采用的方法被称为最优坐标上升(OCA)方法,该方法将我们的变量描述为两组:oB。Bnblock不同长度的变量。从数学上讲,块变量用RLi中的biwithbitakingvalue表示,我∈ 1.noSpvariables。从图形上看,我们的变量如下所示:Bz}{B1,1…B1,noooooooooooo…Bnz}}{B1,1…B1,noooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo此外,我们在块变量n=NB+pNB=Pni=1Li之间拆分了变量。3.1. 算法描述有监督学习和OCAPperformance的trade Selection使用每个varikeach块的基尼指数计算。b为了找到最佳初始猜测,在算法主循环的第一步中不修改唯一变量。从向量开始kk、 Tp执行坐标上升优化以发现特征。每当我们达到最大迭代次数或当前最优解没有在两个步骤之间移动时,坐标上升循环就会停止。算法1 OCA algorithmJ最佳优化我们从已安装的模型中检索特征重要性我们找到索引K?对于相同大小的可变块k:k,这会给出最好的分数?∈ argmaxk∈RLminScore(k,…,k,p){Lmin=最小值∈RnLi}初始猜测:x=(k?,…,k?,p),而|得分(xi)-得分(xi-1)| ≥ εi≤ Iter maxdoxi∈ argmaxj∈RLScore公司j、 xi-1、xi-1.xi-1n,p...xin公司∈ argmaxj∈RLnScore公司xi,xi,xi。

报纸
kedemingshi 在职认证  发表于 2022-6-11 06:20:22
,j,pi+=1结束时全坐标上升优化使用以前的解决方案:X*= (xi,…,xin,p){i是上一个while循环}Y中的最后一个索引*= 分数(X*)而| Y- Y*| ≥ ε和迭代≤ Iter maxdofor i=1。N doX=X*Xi=非(X*i) {非(0)=1,非(1)=0}如果分数(X)≥ 分数(X*) 然后*= Xend ifend forY=分数(X*)迭代+=1结束时返回X*, Y*用ε表示收敛停止条件的公差。为了控制提前停止,我们使用精度变量deε,ε迭代maxIteration maxScore(k,…,kn,p)双变量保留Kibest变量,并保留单变量all。备注3.1。如(Zarshenas和Suzuki,2016)所述,这种坐标上升optiAscent(BCA)的独创性停车条件可以改变,以适应其他停车条件。备注3.2。jbest每个特征类的代表性特征,尤其是与集合、人工变量和冗余消除的特征选择相反的观点(Tuv et al.,2009)。4、理论收敛速度虽然可能很难确定收敛速度模型。坐标i的minxf(x)ei。它是正则基的向量。假设4.1。我们假设函数f是关于欧几里德范数f(y)的二次可微且强凸的≥ f(x)+f(x)T(y- x) +σky- xk(4.1)σ>0x,y∈ r每个梯度的坐标是uniformlylipschitz,即存在一个常数Lisuch,对于任何x∈ Rn,t∈ R|[f(x+tei)]i- [f(x)]i |≤ Li | t |(4.2)Lmax系数:Lmax=maxi=1。。。nLi(4.3)ff?able和关于我们的初始起点xis的铭文的左值有界,ismaxx{kx- x?k:f(x)≤ f(x)}≤ R(4.4)与监督学习和OCARemark 4.1进行权衡选择。该功能在本质上正在增加。提案4.1。根据假设4.1,坐标上升优化(参见。

地板
可人4 在职认证  发表于 2022-6-11 06:20:26
算法1)收敛到全局minf*2nLmaxRisE[f(xk)]- f≤2nLmaxRk(4.5)证明。见(Saltiel和Benhamou,2018)附录A.1第一部分证明。提案4.2。在与命题4.1相同的条件下,在σ>0的情况下,我们还有一个以指数速度递减的收敛速度,如下所示:E[f(xk)]- f≤1.-σnLmaxk(f(x)- f?)(4.6)证明。第二部分论证。备注4.2。σ收敛速度比第一个快得多。备注4.3。我们要最大化的函数显然是非凸的。然而,在凸情况下,线性速度是相当渴望的方法推广,这仍在研究中,这个收敛速度是一个很好的暗示,该方法的效率。5、数值结果我们在此给出了一个真实交易策略的机器学习实验结果。为了完全再现性,敏感数据要么匿名,要么删除(例如,最终pnl曲线)。我们首先将我们的方法与其他两种最先进的方法进行比较:递归特征消除(RFE)和BinarySuzuki,2016)。递归特征消除(RFE)(如(Mangal和Holm,2018)所示)首先确定模型并删除特征搜索特征,RFE递归消除每个迭代中权重最小的特征。主要限制方法之一OCA RFE 24特征BCA RFE 28特征16.6 16.6 27.08 19.4得分(in%)62.8 62.39 62.19 62.8表1。方法比较:对于每一行,我们以红色提供最佳(最热)方法,以蓝色提供最差(最冷)方法,中间方法以橙色提供。我们可以注意到,OCA使用最小的特征集可以获得更高的分数。对于自然设置。最佳功能集。通过每次迭代优化每个维度中的目标函数,对输入变量进行二进制编码。

7
可人4 在职认证  发表于 2022-6-11 06:20:30
由于坐标上升优化中使用的方法没有相似之处,因此与OCA方法相比执行速度较慢。良好分类百分比)。OCA方法达到了帕累托最优,因为它达到了62.80%的分数,使用了16%的特征,与使用了62.80%的RFE相比。如果从效率标准来看,得分最高的特征较少,那么OCA方法是这三种方法中最有效的。相比之下,对于相同数量的特征,即16%,RFE的得分为62.40%。表1总结了所有这些数据。如图3.6所示,我们可以观察到两个峰值对应于我们的交易策略的合并货币,以避免外汇噪音。讨论只需要350个迭代步骤就可以收敛,而BCA需要多达700个迭代步骤,因为它会忽略不同变量之间的相似性而盲目计算变量。从图形上看,我们可以使用监督学习和OCA计算fourTrade选择的最佳候选人图2。PnL的柱状图(美元金额)(重新规范化利润目标和止损水平。这是合乎逻辑的,因为此处检查的交易策略是固定的利润目标和止损策略。如果市场停留在交易范围内且未达到该水平,则直方图中会出现webars。图3.避免货币噪音的算法交易策略。与图2相比,唯一的区别是观察不存在的利润和损失。)美洲驼,但以欧元为单位,因为我们在欧元区整合了所有交易策略。这不是一个好的做法,因为它在我们的标签中引入了一些额外的噪音,因为欧元兑美元汇率略微随机化了NL结果,因此一些超时退出可能会与一些糟糕的退出混淆。图4:。OCA方法位于左侧,BCA位于右侧。

8
kedemingshi 在职认证  发表于 2022-6-11 06:20:32
我们看到OCA需要大约350个迭代步骤才能收敛,而BCA需要大约700个迭代步骤才能收敛图5。4种方法之间的比较。要获得最佳成绩,橙色的成绩略低,而蓝色的成绩最差。图6:。OCA和RFE之间的比较。放大方法。对于RFE,我们以蓝色提供各种功能集的分数。RFE表现最好的两个分数是橙色十字标记,它是该分数的最高分数和最小特征集。执行方法以橙色绘制。为了获得已用特征的RFE结果,将百分比从10%设置为30%。我们可以注意到,对于与OCA相同的功能集,RFE的分数较低,同样,要获得与OCA相同的分数,RFE需要一个较大的功能集。然后,我们看一下最终目标,即比较传统的本土化培训和测试集。我们保留三分之一的数据用于测试,以发现任何潜在的过度匹配。如果我们使用标准且天真的方法随机抽取三分之一的数据作为测试集,我们就打破了数据的时间依赖性。这有两个后果。我们在培训中使用了测试集之后的一些数据,这些数据与现实生活相比是不现实的。我们还使用监督学习和oca方法忽略了任何制度变化内部决策选择,并将交易策略与蓝色曲线进行比较,蓝色曲线代表我们的算法交易策略和oca方法的组合,通过避免不良交易,oca方法高于策略。图7:。方法训练我们的xgboost方法如果我们将数据集分成两个连续的数据集,当有时间排序时,作为测试集,最后三分之一的数据,我们会得到更好的结果,因为蓝色和橙色曲线之间的差异更大。

9
大多数88 在职认证  发表于 2022-6-11 06:20:35
对训练集的非随机化解释使我们可以学习图8。图8:。PnL的演变,以及最后三个测试集。结合我们的算法交易策略和OCA方法来训练我们的xgboost方法。最后但并非最不重要的是,我们可以缩放两条曲线,如图9所示。图9:。以及OCA方法来训练我们的xgboost方法7。结论在订单以电子方式发送到交易所之前,高度利用了特征之间的相似性。这种方法不适用于实际案例策略,我们可以从经验上验证监督学习方法提高了整体交易能力。正如我们所要求的,本文开发的预交易检测算法非常通用,可以应用于任何方法,以调整我们的方法的容量限制,因为这是监督学习方法的一个限制。在存在许多不相关特征的情况下,使用监督学习和OCReferencesConcepts进行权衡选择。艺术情报69、279–305。Blum,A.L.,Langley,P.,1997年。相关特性的选择271。查布德、阿兰·p·和奇奎因·B.、哈贾马尔森·E.、维加,外汇市场。《金融杂志》692045–2084。Chan,E.,2013年。算法交易:获胜策略及其原理。第1版,威利出版社。有界的事务数。更正。Giuseppe Di Graziano,D.B.A.,2014年。最佳交易止损点和算法交易。SSRN URL:https://ssrn.com/abstract=2381830.2014.算法交易、流动性和价格发现:spi 200期货的日内分析。《金融评论》(FinancialReview)第49245–270页。和特征选择。J、 马赫数。学第31157–1182号决议。和预测,第二版。统计中的斯普林格系列,斯普林格。金融危机:电子市场的高频交易。《金融杂志》72967–998。Koller,D.,Sahami,M.,1996年。

10
能者818 在职认证  发表于 2022-6-11 06:20:38
走向最佳特征选择,摘自:美国第十三届国际ConCA会议录,第284-292页。拉巴迪,M.,莱哈勒,C.A.,2010年。优化算法交易和市场微观结构。工作文件。哈尔。在材质中。ArXiv电子打印。模式肛门。机器。内尔。24, 301–312.arXiv:1811.12064 arXiv:1811.12064.1366。macd交易系统。J、 风险财务管理11,56。Zarshenas,A.,铃木,K.,2016年。二元坐标上升:一种有效的机器学习特征子集选择优化技术。基于知识的系统110191-201。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:09