楼主: 大多数88
1666 59

[量化金融] 深度学习能预测风险散户投资者吗?中的案例研究 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-11 06:50:13
利差交易市场中的风险承担和行为预测利差交易正变得越来越重要。伦敦证券交易所每年交易的1.2万亿美元中,有40%与股票衍生品有关,其中25%(1200亿美元)与扩散交易有关[30]。价差交易通常指股票成对交易或期货市场的价差交易。然而,我们的研究重点是与差价零售合同(CFD)相关的差价交易形式。在该市场中,散户投资者和做市商签订了与特定金融工具(如股票、商品或指数)相关的合同,并在合同结束时交换该金融工具收盘价和开盘价之间的差异。因此,投资者根据金融工具的变动方向和幅度进行交易。例如,客户可能会向标准普尔500指数下一个长期订单,每点的股份规模为10美元。如果标准普尔500指数以特定增量上涨,客户将获得10美元的利润* 定期的加薪否则,拒绝支付该金额。做市商对有市场的工具进行报价和询价。非股票经纪人帮助客户与其他投资者进行交易,做市商从自己的库存中买卖金融工具。如果客户满足保证金要求,他们可以随时打开和关闭头寸。做市商有义务接受这些指令,并面临逆向选择的风险。预测哪些交易者构成的风险最大(即那些可能获利最多的交易者),并决定在主要市场对冲哪些风险对做市商至关重要。知情的交易员可能会利用内幕信息,让做市商在市场反弹时持有仓位。理论上,做市商在一次交易中的潜在损失是无限的。

12
nandehutu2022 在职认证  发表于 2022-6-11 06:50:16
例如,英国最大的零售金融服务提供商IGGroup由于缺乏科学的风险控制和灵活的对冲策略,最近损失了3000万英镑。由于类似的问题,全球现货外汇市场最大的做市商FXCM破产。报价和要价之间的价差是做市商的主要收入来源。对于流动性市场,如标普500或美元/英镑市场,扩散交易市场的利差大于基础市场。然而,对于流动性较低的金融工具(如DAX或FTSE100指数),利差小于基础市场的利差。当利差交易公司需要在流动性较低的金融工具的基础市场进行大宗交易时,往往会面临这种情况。如果做市商对交易进行套期保值,无论是否有必要进行套期保值,做市商都会利用价差中的潜在利润。做市商拉尔索在对冲头寸时面临交易成本,包括佣金和一些市场在对冲大宗交易时的较高利差。因此,设计一个预测分类模型来区分a-book客户(即对做市商构成最大风险的客户)和B-book客户(风险较小的客户)至关重要。做市商将对冲A-book客户的头寸以防止损失,并将承担B-book客户头寸的风险以增加利润。通常,总收入的90%来自B-book客户【45】。我们研究是否对冲进入交易的决策。这项任务转化为一个分类问题,我们通过开发DNN来预测高风险(a-book)交易者来解决这个问题。

13
kedemingshi 在职认证  发表于 2022-6-11 06:50:19
如果DNNL从观察到的交易行为中获得模式,有助于准确预测交易者未来的成功,它可以通过建议对冲决策和加强日常运营中的风险管理来帮助做市商。图1说明了启用DNN的对冲策略。图1:对冲策略如何对做市商起作用的工作流程参见https://www.forbes.com/sites/steveschaefer/2015/01/16/swiss-bank-stunner-claims-victims-currency-brokerfxcm-bludgeoned/#7e94f5466de03.1.交易员分类和对冲策略A-book客户的定义是主观的,取决于做市商的业务策略。提供数据的公司倾向于匿名(我们在下文中称之为STX),但它是英国价差交易市场的一家大公司。通过对从事日常风险管理的前台交易员的访谈,我们发现,在研究时,STX将客户i定义为高风险交易员,前提是他/她从之前的20笔交易中获得的回报率超过5%。STX的策略是对冲这些客户的交易。部署的对冲策略是动态的,因为STX根据客户前20笔交易的表现来确定客户(a或B账簿)的状态。因此,客户状态可能会因单笔交易而改变。因此,我们经常观察到这样一种情况,即STX承担客户i的交易j的风险,同时与客户i的交易j+k相抗衡。在投机市场中,一组过去交易的总体回报可能会对交易员的未来盈利能力产生误导性的指导。例如,一个技术熟练的交易者,如果遵循一致的策略,表现出高度的交易纪律,经常使用和更新止损限额等,可能会由于环境的随机性而经常亏损。

14
kedemingshi 在职认证  发表于 2022-6-11 06:50:22
同样,一个糟糕的交易者,如果违反了上述所有原则,偶尔也会做出贡献。这表明交易者过去的表现不一定是他们真正能力的可靠信号。因此,开发客户分类模型的目标是通过考虑数据中可用的分配者特征,为套期保值决策生成更好的信号。我们开发了DNN,以从过去的交易数据中了解交易者的潜在性质。目标概念,交易者能力,是高度可变的,被噪音破坏,很难适应预先定义的静态交易者特征集。因此,DNN必须从transactionaldata中提取目标概念的高级分布式表示,这些表示捕获解释交易行为变化的潜在生成因素。在这方面,交易员分类的成功将证明DL能够自动提取信息特征。3.2. 交易者行为预测和决策支持表征学习在风险管理中的效果并不明显。信用评分、客户流失预测或交易员分类等应用程序都涉及到对人类行为的预测。人们会期望行为预测模型中可达到的最大准确度低于人脸检测。例如,预测目标不太明确(例如,STX使用了5%的阈值,但这是主观的),特征-目标关系通常较弱。我们的交易者行为预测研究旨在阐明表征学习和DL在决策支持中的潜力。我们认为,预测任务代表了决策支持(decisionsupport)中的一系列建模挑战,因为它展示了数据驱动预测模型的企业应用程序中经常出现的几个特征。

15
何人来此 在职认证  发表于 2022-6-11 06:50:25
更具体地说,我们面临的挑战削弱了培训数据的代表性。首先,为了应对之前的损益和宏观环境的变化,个体交易者的行为可能是可变的、不稳定的和动态的。其次,关于个体交易员、资产价格及其基本面和更广泛的市场情绪指标(如经济增长)的详细、按时间顺序排列的信息很容易获得,这导致了高维度。第三,变量之间相互关联并控制交易者利益的具体方式是复杂的、非线性的,并且可能会随着时间的推移而演变。如果成功的话,自动特征提取是应对这些挑战的一种很有希望的方法。第四,利差交易环境显示出阶级不平衡,只有少数交易者成功获得5%以上的系统正回报,而绝大多数客户都在花钱。最后,有效的风险管理需要在单个交易员的层面上进行准确的预测。准确性是预测性决策支持的一般要求。4、MethodologyDL在风险分析中的应用尚不多见。我们重新回顾了DL的原则,并详细介绍了我们如何配置DNN来对利差交易者进行分类。在线附录详细介绍了这些概念和DNN培训。最近一项关于DL for business analytics的研究也提供了有价值的背景知识[15]。4.1. 深度学习原则DL旨在从数据中学习多层次的表示。更高的级别表示更多的抽象概念。与传统的浅层ML方法相比,具有多层抽象的深层体系结构及其学习分布式表示的能力提供了一些优势。深层建筑。ML方法学习变量之间的函数关系,描述观察和预测目标之间的关系。

16
mingdashike22 在职认证  发表于 2022-6-11 06:50:28
此函数的高度可变性使ML方法复杂化,并可能导致泛化能力差。高可变性的来源包括对决策模型运行环境的外部冲击。学习理论表明,为了表示函数关系,深度为k的学习机比深度为k+1的学习机需要的计算单元要成倍增加[26]。常用机器学习方法的深度如下【3】:线性回归和逻辑回归(深度1);提升和叠加组合:基础学习者的深度(深度+1,额外一层用于组合基础学习者的投票);决策树、单隐层人工神经网络(ANN)、支持向量机(深度2);人脑的视觉系统(深度5-10,[46])。深度的概念解释了大量的经验发现,例如,ANN或支持向量机优于简单回归模型或集合分类器优于个体学习者【10】。深度的增加使这些方法能够从数据中隐式地学习额外级别的表示。附加级别有助于泛化到新的特征组合,这些特征在训练数据中的表示较少。扩大的容量还允许学习机在目标函数中捕获更多变化,从而准确地区分类。此外,模型可以提供的计算单元数量受到训练示例数量的严格限制。因此,当目标函数中存在感兴趣的变化时,浅层架构需要极端的复杂性(大量的计算单元)来适应该函数。因此,与深度更大的模型相比,他们需要指数级更多的训练示例[3]。分布式表示。DL方法从数据中学习分布式表示。

17
能者818 在职认证  发表于 2022-6-11 06:50:31
一个分布式表示的例子是主成分分析(PCA)。主成分分析按特征向量的方向重新确定数据集的方向,特征向量根据其对解释的变化的贡献进行排序。这是一种分布式表示,其中原始变量协作生成一个主组件。在预测ML中,主成分可以代替原始变量。然后,要学习的函数关系是目标变量和主要组件之间的函数关系。这可以简化学习任务,提高预测精度,并有助于特征缩减[47]。然而,ML方法学习局部、非分布式表示。使用数据集中的原始变量,它们将输入空间划分为相互排斥的区域。例如,支持向量机从彼此最接近的相邻类的局部训练示例中推断决策边界。ML的目标是对不属于训练集的新示例进行分类。然而,培训数据可能缺乏代表性(例如,由于环境的变化)。分布式表示能够更好地适应训练数据不能很好地表示的新观察结果。以我们的交易员分类问题为例:交易员表现出不同的交易风格;他们使用不同的策略,遵循不同的止损规则等。假设交易员被分成5个不同的集群,同一集群中的交易员共享一种交易风格。使用非分布式表示,我们需要5个不同的特征来专门表示每个集群,0=00000,1=01000。。。,4 = 00001. 分布式表示只需要dlog5e=3个特征来建模集群(作为二进制代码),0=000,1=001。。。,4 = 100.

18
mingdashike22 在职认证  发表于 2022-6-11 06:50:34
使用三个分布式特征,这种表示也可以适应一种新类型的交易者(即,使用培训样本中未采用的交易策略):5=101。这说明了分布式表示的一个优势,即表示可以区分的模式数量随特征数量呈指数增长。然而,对于非分布式表示,这个数字最多呈线性增长。4.2. 构建深层神经网络DL方法由多个具有非线性变换级别的组件组成。典型的实例是具有多个隐藏层的神经网络[35,25]。训练DNN需要解决一个非凸优化问题,这很难,因为存在消失梯度问题[48]。梯度消失禁止将错误信息从上层传播回网络中的下层,因此无法调整下层的连接权重[49]。因此,优化通常会以较差的局部极小值结束。解决此问题的方法包括无监督的预培训、参数校正单元(ReLu)、Xavier初始化、退出和批量标准化。我们利用这些技术开发了用于风险管理的交易员分类DNN。下面,我们将介绍预培训和辍学。感兴趣的读者可以在在线附录中找到其他概念的类似描述。4.2.1. 无监督预培训预培训的目标是找到不变的生成因素(即分布式表示),这些因素解释了数据中的变化,并放大了对后续描述很重要的变化。通过一系列非线性变换,预训练可以创建固有特征检测器的层,而无需数据标签。

19
可人4 在职认证  发表于 2022-6-11 06:50:37
这有助于连接权重的局部学习。避免错误信息通过多层网络传播,预训练有助于克服消失梯度问题。堆叠多层逐步复杂的特征检测器,DNN可以初始化为合理的起始值。在发现数据中的结构关系后,可以在预先训练的网络上添加监督学习技术(如逻辑回归),并使用反向传播调整参数。无监督的预培训,即目标标签的使用推迟到最终调整阶段,在班级不平衡是常见问题的管理决策支持中尤其有用【50】。预训练的两个经典实现是由受限Boltzmann机器预训练的深度信念网络(DBN)[51]和由自动编码器预训练的堆叠去噪自动编码器(SdA)[48]。这两种策略都最小化了generativemodel的对数似然近似值,因此通常表现出类似的性能【52,53】。这一点,再加上深层信念网络在风险分析文献中已经得到了一些关注(见表1),使得我们使用了叠加去噪自动编码器的框架【53】。去噪自动编码器。去噪自动编码器(dA)从输入样本中学习分布式表示(称为“代码”)。假设我们有N个样本,每个样本有p个特征。接收输入x∈ dA的学习过程包括四个步骤:步骤1:腐败。第一个数据会破坏输入x。

20
何人来此 在职认证  发表于 2022-6-11 06:50:40
通过从二项分布(n=n,p=pq)采样(其中损坏率qp是需要在模型外调整的超参数),dA随机损坏观察样本的子集,并故意引入噪声。例如,如果输入以二进制为特征,则损坏对应于浮动位。步骤2:编码器。dA确定地将损坏的inputex映射到更高级别的表示(代码)y中∈ Rk。编码过程通过普通的单隐层神经网络进行(隐单元数k是一个超参数,需要在模型之外进行调整)。对于权重矩阵W、偏差b和编码函数h(·),例如sigmoid函数,y被给出为:y=h(W·ex+b)(1)步骤3:解码器。解码器将代码y映射回重构z,重构z具有与输入x相同的形状。给定代码y,z应视为x的预测。此类重构表示去噪过程;它试图从嘈杂(损坏)的输入中重建输入。与编码器类似,解码器具有权重矩阵xfw、biaseseb和解码函数g(·)。重建z为:z=g(fW·y+eb)(2)步骤4:训练。优化dA(W,b,fW,eb)的参数包括最小化重建误差L(x,z);通过让代码y学习一个分布式表示来实现,该表示捕获x中的主要变化因素。理论上,如果我们使用均方误差(LH(x,z)=| | x- z | |)作为编码器h(·)和解码器g(·)的成本函数和线性函数,dA等效于PCA;代码y中的k个隐藏单位表示数据的前k个主成分。成本函数的选择取决于投入x的分配假设。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:09