楼主: 大多数88
1668 59

[量化金融] 深度学习能预测风险散户投资者吗?中的案例研究 [推广有奖]

41
mingdashike22 在职认证  发表于 2022-6-11 06:51:44
在评估图7时,重要的是要注意,logit模型并不是要对astrong基准做出贡献。如表3所示,具有特征选择的正则化logit模型的性能优于随机模型。图7的目的是评估深层架构的整体效果,并将其与使用原始特性进行比较,这促使使用普通logit模型进行比较。分析得出的总体结论是,深层架构会影响DNN的预测性能。ROC/精度-召回曲线调用/假阳性率精度0.0 0.2 0.4 0.6 0.8 1.00.2 0.4 0.6 0.8真阳性率0.00.20.40.60.81.0Logistic[0.092,0.481]深度学习[0.286,0.812]图7:DL和logit的ROC(黑色)、精度召回曲线(灰色)。6.2.2. 无监督预训练提出的DNN使用无监督预训练进行表征学习和特征提取。为了证实预训练的优点,我们在无监督的预训练阶段检查每个神经元的辨别力。我们的目的是检查DNN是否学习分布式表示,以帮助区分A和B-book客户机与未标记数据。为此,图8提供了DNN第一dA层神经元激活值的组织图。柱状图显示,当从B-book客户处收到交易时,ActivationValue往往小于0.4。来自A-book客户的交易通常会导致激活值为0.4及以上。虽然激活值的大小无关紧要,但不同类型客户的交易激活值的差异说明,即使使用未标记的数据,第一dA层的神经元也不同于B-book客户交易。

42
mingdashike22 在职认证  发表于 2022-6-11 06:51:47
由于激活值和输入信号之间的关系不再是单调的,层之间复杂的非线性变换禁止了这种分析在更高层的复制。然而,图8提供了初步证据,表明利差交易数据有助于使用预训练提取更高层次的生成性特征。为了更深入地了解激活值与不同类型交易者的交易之间的联系,我们研究了在神经元中触发高激活值的交易是否值得对冲。我们首先计算第一层每个神经元的最大和最小激活值,以及这些边界之间的20个等距阈值。后续分析基于单个神经元。我们选择了神经元和相应的阈值,通过手动检查,可以在A和Bbook客户端交易之间进行最纯粹的分离(见图8)。使用这个神经元,我们找到了100个最能激活神经元的交易。图9绘制了这些交易的总体损益分布图。结果表明,在少数假阴性的情况下,97%的交易最大程度地激活了神经元激活值密度0.0 0.2 0.4 0.6 0.8 1.00 0.5 1.0 1.5 2.0 2.50.0 0 0.2 0.4 0.6 0.8 1.00.0 0.5 1.0 1.5 2.0 2.5图8:a-book(深色)和B-book(浅色)客户交易的第一dA层激活值直方图。-5000 0 50000.0000 0.0005 0.0010 0.0015利润与亏损约翰逊苏美:-97.35,倾斜:-88.02,峰度:753381图9:测试集的前100个最佳神经元刺激结束,让做市商损失惨重。如神经元的激活水平所示,对冲这些交易在经济上是明智的。

43
kedemingshi 在职认证  发表于 2022-6-11 06:51:50
虽然最终的对冲决策是基于DNN的整体预测,但单神经元分析提供了进一步的证据,证明SdA层的无监督预训练可以提取指示交易风险的模式。这证实了DNN从输入数据中学习分布式表示,这最终有助于区分其他客户的高风险交易员。6.2.3. 阶级不平衡效应的分析越来越多关于深度不平衡学习的文献表明,DL模型继承了其ML祖先对阶级不平衡的脆弱性【64】。另一方面,预训练可以使所提出的DNN对类倾斜具有一定的鲁棒性。预培训是在无监督的情况下进行的,这样班级不平衡就不会妨碍模型培训。图8表明,在没有类别标签的情况下,预培训提取了有助于区分高风险交易员和B-book客户的模式。只有DNN可以访问此信息,这可能会使其在表3的比较中优于ML基准。为了测试这一点,我们在使用SMOTE(合成少数类过采样技术)算法解决类不平衡后重复比较。通过在实际少数群体案例附近创建艺术少数群体案例,打击补救措施类倾斜【65】。我们执行SMOTE,直到arti-ficially createdA book客户端的数量与B-book客户端的数量相等,然后重复对过采样数据进行分类比较。由于SMOTE增加了观察次数,进而增加了训练amodel的时间,我们将交叉验证次数减少到5次。请注意,过采样仅在训练数据中发生。验证折叠反映了数据中真实的类分布,从而对模型性能给出了无偏的看法。

44
可人4 在职认证  发表于 2022-6-11 06:51:53
表4详细说明了分类器对过采样数据的预测性能。我们发现SMOTE可以改善所有分类。除了极少数例外,表4中的结果显示出比表3更高的性能,而且改进的幅度通常很大。表4:应用SMOTEP&L AMC AUC敏感度规格精度G-均值F-得分DNN 283.31 243.17 0.889 0.815 0.996 0.992 0.896 0.804Logit 260.45 525.57 0.806 0.600 0.983 0.979 0.751 0.397ANN 233.55 484.19 0.858 0.632 0.974 0.967 0.785 0.438随机森林262.85 581.22 0.792 0.557 0.988 0.979 0.742 0.519AdaBoost 259.45484.19 0.803 0.632 0.974 0.967 0.785 0.438SVM 204.35 930.26 0.825 0.619 0.992 0.984 0.779 0.522例如,使用SMOTE时,DNN的AUC高出9%(0.889 c.f.0.814)。其他分类机构也有类似或更大的改进。例如,使用SMOTE(0.858 c.f.0.635)时,ANN分类器的anAUC值比使用SMOTE时高35%。敏感性结果实质上更好,这证实了SMOTE提高了一个阶层对少数族裔的认识。更高的灵敏度往往以降低规格和精度为代价。然而,表4显示,分类性能在规格和精度方面几乎与应用Smote之前一样好。因此,G-mean和F-score强调,SMOTE分别在敏感性(回忆)和特异性与精确度之间实现了更好的平衡。同样,损益表和资产管理公司对SMOTE的评级也更高。我们还发现一些证据表明,DNN优于ML基准的利润率下降。例如,考虑到AUC对分类者的辨别能力进行了全面评估,过采样后最强的基准是ANN,DNN的表现优于3.6%(0.889 c.f.0.858)。

45
mingdashike22 在职认证  发表于 2022-6-11 06:51:56
在表3中,DNN相对于AUC亚军的优势为13%(RF为0.814立方英尺0.720)。对这种趋势的一种解释是,表3给出了NN性能的乐观图。DNN和ML基准之间的精度差距小于表3所示的精度差距,如果ML基准以使用SMOTE补救类不平衡的形式接受辅助调整。然而,这一观点也意味着DNN对类不平衡更为稳健。虽然得益于SMOTE,但与ML基准相比,SMOTE准确识别高风险交易者的能力较少依赖于对少数群体的过度抽样。这一解释源于表4与表3相比,表4中的性能改进幅度,表3通常比ML基准更接近DNN。对不平衡的更高鲁棒性与图8中关于无监督预训练优点的结果一致。6.3. 风险管理的影响基于模型的对冲政策包括对冲按模型分类为A-book的客户的交易,并承担所有其他交易的风险。为了阐明拟议DNN的管理价值,我们将其损益与基于规则的对冲策略进行了比较。一种基于规则的方法是STX当前的政策,该政策涉及在前20次交易中获得5%以上回报的客户的对冲交易。此外,我们还开发了三种自定义套期保值启发式算法。我们的第一项政策Custom 1依赖于图10:DNN的平均每笔交易损益(以英镑计)和基于规则的对冲政策Sharpe比率,并挑选出在过去20笔交易中达到高于平均Sharpe比率的交易员。

46
可人4 在职认证  发表于 2022-6-11 06:51:59
我们认为,确保风险调整后的回报高于平均水平表明交易员的专业技能。由于专业精神只是成功交易历史的一个原因,Custom 2启发式解决了另一组交易者,我们将其描述为过度自信。此类交易者可能会表现出比其他市场参与者更高的收益,并表现出积极的交易行为,表现为更大的批量、更高的频率和更短的时间间隔交易【66】。因此,自定义2启发式方法考虑了平均交易持续时间和交易次数,以推断出可能构成更大风险的交易者。第三种策略,Custom 3,对冲自与STX交易以来业绩良好的客户的交易。理由是,在早期经历中失败的交易员可能会退出。有长期记录的交易者要么是真正成功的(应该对冲),要么是预期价值为负的赌徒(不应该对冲)。按照这一思路,STX面临的最重要的挑战来自新的A-book客户。与Custom 3的比较揭示了DNN识别此类新客户的能力,因为相比Custom 3的改进表明DNN认识到Custom 3基于跟踪记录的逻辑无法捕获的高风险交易员。我们还考虑了一组通过多数投票构建的自定义基于规则的启发式算法。基于规则的策略利用领域知识,采用演绎方法。为了补充分析,我们以分类树的形式添加了归纳法。树木被视为一种美丽的分类植物。然而,决策者对树的理解程度取决于树的深度。

47
nandehutu2022 在职认证  发表于 2022-6-11 06:52:02
为了便于解释,我们考虑了两个层次的分类树(ctree)。图10显示STX的当前政策是最合适的演绎对冲策略。《习惯逻辑1-3》借鉴了金融理论。然而,这三种方法中的每一种,以及其中的一个组合,都比STX不会对冲任何交易的假设基线设置表现更差。观察自定义1-3的性能低于此基线支持这样一种观点,即focaltrader分类任务是一个具有挑战性的问题。按照这条推理路线,图10我们感谢一位匿名评论员,他提出了Custom 3启发式的逻辑。还强调STX政策的合理性。与演绎STX方法不同,基于树的启发式方法从过去的数据中学习。我们观察到这棵树使用了三个特征:交易员在与STX的最初20次交易中的平均损益,在过去20次交易中直到平仓的最小分钟数,以及过去20次交易中的平均夏普比率。这些特性显示出与自定义启发式的相似性。例如,考虑交易者的初始表现遵循Custom 3的逻辑。风险调整回报的会计处理类似于自定义1。最后,考虑到交易者对损失的反应,该树使用其中一个变量来捕捉处置效果。我们观察到两级树产生的P&L略大于STX启发式。这表明,交易员过去的平均表现(体现在TSX方法中)在一定程度上近似于更复杂的树规则集。

48
mingdashike22 在职认证  发表于 2022-6-11 06:52:06
尽管利差交易市场中准确套期保值的重要性表明,STX方法采用基于树的方法进行了修订,但图10中的另一个结论是,与当前政策和我们考虑的其他基于规则的套期保值策略相比,实施基于DNN的套期保值策略使STX能够进一步改善损益。与STX启发式方法相比,DNN将每笔交易利润提高121.67-88.28=33.40英镑,这意味着大幅改善。STX启发法代表了合作公司的既定业务实践,反映了多年的行业经验。此外,启发式算法执行速度非常快,并且完全透明。DNN的情况截然不同。对传入交易进行更准确的分类,基于DNN的对冲政策比基于规则的方法更具可行性。提高准确性和可靠性的主要成本是相应风险管理系统的黑箱特性。DNN中的客户分类规则源自自动提取的高风险交易员分布式表示。决策者无法解释这些规则中封装的业务逻辑,这也禁止测试这些规则与领域知识的一致性。DNN性能的改善使风险经理有责任决定性能改进是否足够大,以弥补DNN的不透明性和相关缺点,如缺乏公正性、较高的计算要求等。对于STX,我们期望准确对冲交易的必要性以及从其数据中观察到的绩效改善的幅度,以证明采用基于DNN的复杂对冲策略的合理性。

49
mingdashike22 在职认证  发表于 2022-6-11 06:52:09
其他利差交易公司可能也是如此,尽管这些公司首先需要复制本研究的结果,以证实DNN的有效性。论文中对DNN配置的详细描述,尤其是在线附录,将简化此任务(参见在线附录中的算法1)。一个更具战略性的考虑是,如果竞争对手部署相应的解决方案并利用它们为散户投资者提供更好的价格,那么不愿采用新技术(如基于DNN的虚拟对冲政策)可能会损害STX的竞争地位。同时,我们警告不要对基于DL的高级决策辅助工具过于乐观。本研究中观察到的实证结果来自一个单一的数据源,虽然数据量很大,但反映了STX市场地位和客户结构的可靠性,并且需要在未来的研究中复制不同的数据,以提高我们在这里观察到的DL优势的可信度。图11:散户交易员在差价交易市场上不同类别投资的平均赢家比率和平均损益点(黑暗中盈利,灰色中亏损)。讨论实证结果表明,DNN优于基于规则和ML的基准。它比其他分类更准确地识别高风险交易员,并在用于对冲决策时提供更高的财务收益。为了解释ML基准的劣质表现,我们注意到预测交易者在动态市场条件下的风险承担行为和未来盈利能力是一项艰巨的任务。交易者的特征和交易行为有所不同,随着时间的推移,两者都可能发生变化。由于行为(输入)和绩效(输出)的高度差异,识别非熟练交易员尤其困难。

50
mingdashike22 在职认证  发表于 2022-6-11 06:52:12
与真正优秀的交易者相比,很难为差劲的交易者确定统一的交易模式。对STX Staff的采访暗示,熟练的交易员具有某些特征,如捕捉市场反弹的能力、遵循一致的策略、设置和调整限额等。穷人交易员有无数种方式赔钱,包括忽视上述规则。在高维行为空间中,穷人交易者的潜在变异数量是数不清的。这与ML方法先前的假设相矛盾,即分布P(标签特征)是平滑的,并且在训练数据中表现良好。尽管基于经济理性,但与过去风险调整后回报、交易频率等相关的输入特征不利于准确区分虚假交易者和真正的优秀交易者。这是因为几个特征值可能重合。在交易者特征的行为特征空间中,虚假和真实的好交易者的纠缠使交易者分类问题复杂化。此外,在价差交易市场获利的机会非常嘈杂。即使是差劲的交易者也能幸运地赢钱。事实上,图11显示,与STX交易的大多数客户的赢/输比率都超过了五分之一。然而,图11还显示,平均亏损比平均盈利大得多。因此,将交易员归类为B客户并避免对冲他们的交易通常是明智的,即使他们之前的许多交易都以盈利结束。深层架构为DNN配备了更高的表达能力,以存储交易行为的大量变化。深度的增加使DNN能够实现行为变量的新组合,并推广到培训数据中较少表示的新交易模式。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:16