楼主: 可人4
1146 22

[量化金融] 一种多因素自适应统计套利模型 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.1643
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-5-6 05:09:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《A Multi-factor Adaptive Statistical Arbitrage Model》
---
作者:
Wenbin Zhang, Zhen Dai, Bindu Pan, Milan Djabirov
---
最新提交年份:
2014
---
英文摘要:
  This paper examines the implementation of a statistical arbitrage trading strategy based on co-integration relationships where we discover candidate portfolios using multiple factors rather than just price data. The portfolio selection methodologies include K-means clustering, graphical lasso and a combination of the two. Our results show that clustering appears to yield better candidate portfolios on average than naively using graphical lasso over the entire equity pool. A hybrid approach of using the combination of graphical lasso and clustering yields better results still. We also examine the effects of an adaptive approach during the trading period, by re-computing potential portfolios once to account for change in relationships with passage of time. However, the adaptive approach does not produce better results than the one without re-learning. Our results managed to pass the test for the presence of statistical arbitrage test at a statistically significant level. Additionally we were able to validate our findings over a separate dataset for formation and trading periods.
---
中文摘要:
本文研究了基于协整关系的统计套利交易策略的实现,其中我们使用多个因素而不仅仅是价格数据来发现候选投资组合。投资组合选择方法包括K均值聚类、图形套索以及两者的组合。我们的结果表明,在整个股票池中,聚类似乎平均比单纯使用图形套索产生更好的候选投资组合。将图形套索和聚类结合使用的混合方法仍能产生更好的结果。我们还通过重新计算潜在投资组合一次,以考虑随着时间推移关系的变化,来检验交易期间适应性方法的效果。然而,自适应方法并不比不进行再学习的方法产生更好的结果。我们的结果在统计显著水平上通过了统计套利测试。此外,我们能够通过一个单独的数据集验证我们的发现,包括形成期和交易期。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Portfolio Management        项目组合管理
分类描述:Security selection and optimization, capital allocation, investment strategies and performance measurement
证券选择与优化、资本配置、投资策略与绩效评价
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> A_Multi-factor_Adaptive_Statistical_Arbitrage_Model.pdf (468.79 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:统计套利 套利模型 多因素 Quantitative relationship

沙发
可人4 在职认证  发表于 2022-5-6 05:09:30
一个多因素自适应统计套利模型——张文斌、戴珍、潘彬都和米兰·贾比罗夫特佩尔商学院,卡内基梅隆大学布罗德街55号,纽约,NY 10005 USA摘要本文研究了一种基于协整关系的统计套利交易策略的实施情况,在这种策略中,我们使用多个因素而不仅仅是价格数据来发现候选投资组合。投资组合选择方法包括K-均值聚类、图形套索和二者的组合。我们的结果表明,与单纯地在整个股票池中使用图形套索相比,平均而言,聚类似乎能产生更好的候选投资组合。将图形套索和聚类结合使用的混合方法仍能产生更好的结果。我们还通过重新计算一次潜在的投资组合,以解释随着时间推移关系的变化,来检验交易期间适应性方法的效果。然而,自适应方法不会产生比无需重新学习的方法更好的结果。我们的结果在统计显著性水平上通过了统计学比特率检验。此外,我们能够在一个单独的数据集上验证我们的发现,以确定形成期和交易期。介绍过去发表的探索协整和配对交易的论文,通过发现那些价格在历史上同步变动的股票,来识别“类似”股票的投资组合。我们认为,在协整的情况下,这个过程可以通过寻找“相似”的股票而不是仅仅通过价格来改善,因为特征相似的公司的股票价格或多或少会一起移动。

藤椅
kedemingshi 在职认证  发表于 2022-5-6 05:09:33
直觉是,如果我们能够识别出在多个维度上相似的投资组合,那么它们的线性组合(在价格上)在任何暂时的分歧之后,都更有可能恢复为协整。通过增加额外的维度,在选择过程中注入更多信息,以便在未来的价格变动中确定更强的关系,似乎值得探索。与图形套索相比,另一种机器学习技术——聚类是使用的自然选择。在简要浏览了有关协整、配对交易和其他统计套利方法的已发表文献后,我们没有发现任何其他人尝试这个概念。开发统计套利的三个主要组成部分是确定交易的正确资产、通过反向测试模拟交易,以及验证统计套利的存在。下面是我们对这些要素的研究概述。第一部分,选择过程,突出了我们的大部分努力:  因素选择:我们使用PCA技术来确定一组独立的因素。我们使用了这些因素本身以及这些原始因素的线性组合,这些原始因素是通过PCALOADING计算出来的。  聚类:我们使用K-均值聚类。通讯作者。电子邮件地址:wenbinz@tepper.cmu.edu.  结合聚类和图形套索。我们提出了两种不同的方法——“聚类Glasso”和“Glasso聚类”。对于第二部分,我们遵循标准策略套利交易程序:  我们测试了每个确定的投资组合的协整关系。  我们检查了投资组合在形成期间是否产生了正利润。

板凳
nandehutu2022 在职认证  发表于 2022-5-6 05:09:36
如果是这样,我们继续交易这些投资组合。  我们试图在交易阶段重新平衡策略,以考虑集群和协整关系可能会随着时间的推移而变化。最后,我们使用基于JTTW的方法来测试交易结果,并交叉验证我们的策略。数据收集和标准化我们的原始数据主要来自彭博社。我们根据基础、统计和动量相关因素选择了19个不同维度。该数据集涵盖了从2004年第一个交易日到2011年最后一个交易日期间标普500指数的所有美国股票。我们最初考虑的维度是:波动性(60天)股票未完成销售增长RSI(相对强度指数)价格与账面比率价格与销售比率价格与息税折旧摊销前利润比率/E合理化ROE市场资本自由现金流增长现金流增长股息(每股)彭博估计分析师评级卖出建议总数与买入建议总数Sprice(closeAskBidWe通过删除所有非交易日和缺失值来清理初始原始数据集。在整个期间,共有109只股票在所有19个维度上都没有缺失值。我们的实施是基于这些股票。我们注意到,选择2004年的标准普尔500指数股票,并加强我们处理缺失基本面数据的方法,可能更合适在不同的形成时期。不幸的是,我们没有获得获取这些数据的手段。这有可能引入幸存者偏见。关于数据选择和潜在偏差的单独章节在本文后面再次讨论了这个问题。接下来,在应用任何附加过滤之前,我们规范化了所有维度。买入/卖出建议的数量被合并为一个单一因素(买入/卖出)/(买入+卖出)。

报纸
kedemingshi 在职认证  发表于 2022-5-6 05:09:39
我们还计算了市值和流通股数量的对数。这一步的动机是Axtell,他指出,美国公司规模在对数标度(排名与频率)上绘制时,表现出类似Zipf定律的分布。然后通过减去平均值并除以样本标准偏差,对因子进行归一化。我们的日期集将分为两部分:  常规实验阶段:2004年1月至2007年12月。前两年是信息期,后两年是交易期。  交叉验证阶段:从2008年1月到2011年12月。前两年是信息期,后两年是交易期。PCA分析为了选择影响最大的因素,我们对标准化数据应用了PCA。下图显示了结果分析:根据载荷的输出,我们确定了7个最重要的组成部分对95的贡献。总差异的5%。鉴于这些数据,我们使用了两种不同的方法进行因子选择。基于主成分分析产生的独立主成分,选择最重要的原始因子,我们可以很容易地观察到对我们的数据方差起主要作用的维度。在这种情况下,我们没有直接使用线性组合。7个最重要的因素是:市盈率价格与销售额比率现金流量增长价格价格与息税折旧摊销前利润比率进化选择PCAWe产生的主成分也直接选择了7个最重要的主成分进行分析。在接下来的结果中,我们基于这两种选择方法运行了聚类算法。K-均值聚类有许多常用的聚类算法。我们觉得,就我们的目的而言,最具启发性的选择是K均值聚类。

地板
大多数88 在职认证  发表于 2022-5-6 05:09:42
为了在形成期间为每个集群生成合理的大小,我们选择了K=30,这似乎可以生成平均约2-4个股票的集群大小。候选投资组合生成为了使每种选择方法的投资组合规模具有可比性,我们实施了每个投资组合2-4只股票的政策。

7
nandehutu2022 在职认证  发表于 2022-5-6 05:09:46
在这项研究中,我们应用了两种简单的方法(聚类和图形套索)和两种混合方法(聚类Glasso和Glasso聚类)来生成候选交易组合。均值聚类法  如果集群只包含一个股票,请忽略。  如果一个集群包含2、3或4只股票,则将整个集群作为候选投资组合。  如果一个集群包含5只或更多的股票,将它们分成2或3只股票的子组,并将每组作为候选投资组合处理。在我们的初始形成期,该方法生成了35个候选交易组合,平均每个组合2.89只股票,选择了7个原始因子;它产生了37个候选交易投资组合,平均每个投资组合有2.73只股票,前7个主成分。图形套索(Glasso)  如果逆相关矩阵的给定行中只有一个非零项,则忽略。  如果给定的逆相关矩阵行中有2个、3个或4个非零项目,则将相应的股票作为候选投资组合。  如果在逆相关矩阵的给定行中有5个或5个以上的非零项目,则将具有最大绝对值的相应4只股票作为候选投资组合。在我们的初始形成期,该方法生成了55个候选交易组合,平均每个组合3.82只股票。K-均值聚类-图形套索(聚类玻璃)  运行K=3的K-means,创建3个大集群。  在整个场景中运行图形套索。  如果逆相关矩阵的给定行中只有一个非零项,则忽略。  如果逆相关矩阵的给定行中有2个、3个或4个非零项,请检查以确保它们属于同一个簇。

8
大多数88 在职认证  发表于 2022-5-6 05:09:49
如果没有,请忽略。  如果在逆相关矩阵的给定行中有5个或5个以上的非零条目,则取绝对值最大的4只股票。在我们的初始形成期,该方法生成了49个候选交易组合,平均每个组合3.61只股票,选择了7个原始因子;它生成了50个候选交易投资组合,平均每个投资组合有3.7只股票,其中包含前7个主成分。首先运行K-means聚类将生成最多109个候选投资组合,因为我们在逆相关矩阵中每行确定0或1个投资组合。图形套索-K-均值聚类(Glasso聚类)  在整个场景中运行图形套索。  运行K=3的K-means,创建3个大集群。  根据簇成员关系过滤逆相关矩阵,即通过逆相关矩阵设置3个单独的路径。在一个簇下搜索时,其他簇的成员在逆相关矩阵中的条目将设置为0。  对于每个过程,如果逆相关矩阵的给定行中只有一个非零条目,则忽略。  如果给定的逆相关矩阵行中有2个、3个或4个非零项目,则将相应的股票作为候选投资组合。  如果在逆相关矩阵的给定行中有5个或5个以上的非零项目,则将具有最大绝对值的相应4只股票作为候选投资组合。在我们的初始形成期,该方法生成了132个候选交易投资组合,平均每个投资组合有3.53只股票,并选择了7个原始因素。

9
大多数88 在职认证  发表于 2022-5-6 05:09:52
在这种设置中,逆相关矩阵的每一行可以产生多达3个候选投资组合,并且正如预期的那样,考虑到我们选择的方法,通过第二次尝试ata混合搜索方法,发现的候选交易投资组合的数量显著增加。我们认为第二种方法可能产生了太多的候选投资组合。事实上,我们有很大的空间进行额外的选择,仍然有相当数量的投资组合相对于其他选择方法。为此,我们根据逆相关矩阵中非零项目的绝对值之和,对132个投资组合中的每一个进行排名。从这张图中,我们可以看到50是选择投资组合的合适分界点。为了进行公平的比较,我们选择了55个投资组合,这是仅使用图形拉索法检测到的数字,用于下一步的模拟。投资组合模拟我们对每种选择方法确定的候选投资组合应用标准Johansen协整关系检验。那些通过测试的投资组合在2004年1月至2005年12月的形成期内进行了实验性交易。在形成期产生净正利润的股票在2006年1月至2007年12月的交易期继续交易。我们对未平仓交易的多头和空头进行了标准化,使其绝对值之和为2美元。下表显示了仅基于聚类或图形拉索方法的投资组合模拟结果。聚类(基于Sig)。

10
大多数88 在职认证  发表于 2022-5-6 05:09:55
原始因素)聚类(基于主成分)图形分类模拟结果Marks模拟结果Marks模拟结果Marks模拟结果Marksportfolios确定的平均每个Portfolio的库存量2。892.733.82投资组合通过了约翰森测试11。4%116.2%130.9%1在形成期产生净正利润的投资组合75%283.3%264.7%2在交易期产生净正利润的投资组合100%360.0%345.5%3在交易期产生净正利润的交易总额82。4%483.9%483.6%4平均每笔交易净利润0。0190.0310.012每对投资组合的平均净利润0。1090.1940.067净利润总额。3270.970.737通过Johansen测试的投资组合与投资组合总数的比率形成期间产生正利润的投资组合与通过Johansen测试的投资组合交易期间产生正利润的投资组合与形成期间产生正利润的投资组合的比率交易期间产生正利润的交易与所有交易的比率openedWe观察到,聚类算法识别的候选投资组合较少。此外,从百分比来看,通过约翰森测试的投资组合较少。然而,其中更大比例的公司在交易期间实现了净正利润。每笔交易和每对投资组合的平均净利润也显著高于图形套索法。总的来说,聚类和图形套索在为基于协整的统计套利策略生成候选交易组合方面取得了相当的性能。聚类发现投资组合较少,但平均而言,它们的利润更高。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-18 01:29