楼主: gr23
35298 19

[交易策略] 多因子选股方法文献简述(近几年) [推广有奖]

  • 0关注
  • 6粉丝

博士生

11%

还不是VIP/贵宾

-

威望
0
论坛币
4041 个
通用积分
182.3236
学术水平
8 点
热心指数
9 点
信用等级
4 点
经验
7668 点
帖子
106
精华
0
在线时间
335 小时
注册时间
2011-7-12
最后登录
2023-12-28

楼主
gr23 学生认证  发表于 2016-7-21 12:35:11 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
个人最近结合文献的一个整理,期望和大家讨论交流。

目录
一、理论背景
多因子选股模型理论
二、因子的选取
候选因子的选取
候选因子有效性检验
有效但冗余因子的剔除        
三、选股策略
基于因子打分
基于因子排序
基于因子回归
现代分类技术


理论背景
    对股票等金融资产进行合理定价是金融理论研究的重点内容。研宄股票以及其他证券资产的定价的对于解释和预测这些标的物价格的未来走势具有十分重要的意义。以股票为例,目前在中国股票市场,分析市场价格走势的预测方法主要分为两个流派:
    一派是技术分析流派,技术分析关注市场的动态,股价的历史走势。技术分析者将大量的精力投入到历史行情的研宄中,基于历史可以重演这一假设,通过图表分析或者指标分析来寻找股价历史走势的规律并以此为依据预测股价的未来走势。技术分析的优点在于可以告诉投资者应该在哪个时间买入股票或者卖出股票。然而,技术分析依赖于历史的重演,由于股票市场在现实中是不断变化的,技术分析的有效性常常会受到挑战,这一点也是技术分析的局限性所在。
    另外一种流派是基本面分析流派。这个流派,主要从经济学理论的角度,利用目前较为完善的宏观分析,行业分析以及公司财报分析等方法,提取决定股价高低的有用信息来对股票市场进行分析。基本面选股主要看重股票的成长性,以及股票的价值是否被低估等情况。另外,基本面选股也需要考虑市场一些动态信息,包括并对政策信息和行业信息进行分析。基本面分析可以帮助投资者选择出更优秀的股票,但是对于股票的择时问题,却没有给出明确的答案。
    量化投资可以将两者的优点相结合。通过量化的理念将原来属于定性分析范畴的基本面分析定量化,同时加上技术分析本身就具有定量分析的特性,量化投资就可以将这两者相结合在一起,可以同时满足投资者对选股和择时的需求。
多因子选股模型理论
    随着计算机科学与现代金融理论的发展,借助于计算机技术与数理方法实现证券组合构建以及自动交易的量化投资技术孕育而生。凭借其成本低廉、业绩出色、能够充分克服人性的弱点等特点,自其诞生来,量化投资就受到了广泛的关注,也创造了诸多奇迹。
    简单来讲,量化投资是指利用计算机技术与数学建模等手段来实现投资理念和投资策略的过程。与传统投资不同,量化投资主要依靠数学模型和数据来寻找投资标的,执行投资策略,追求稳定而持续的收益。量化投资在西方投资界被称为是传统投资哲学的"投资革命",它在过去的40年的发展中,被证明是一种可对冲市场风险并以概率取胜的高收益投资模式。量化投资与传统投资模式在本质上是相同的,他们都是基于市场非有效或弱有效的理论基础,试图战胜市场而获取超额收益。但量化投资又区别于传统投资,其至少在以下几个方面具有明显的优势:
(1)量化投资打破了传统投资的投资范围局限,由于其借助强大的计算机运算能力,大大增强了挖掘信息的广度和速度,所以,量化投资的范围可覆盖整个市场;
(2)量化投资可避免投资者主观因素影响,贪婪、恐惧、过度自信、饶幸也理,即使是最优秀的交易员,也难免会在投资中受到人性弱点的影响,而量化投资在操作中可严格执行交易规则,避免非理性带来的决策失误;
(3)系统化、科学化,量化投资以严谨的数学分析和统计检验为基础,时刻捕捉市场定价偏差,对冲风险暴露,追求概率获胜,其每一个投资决策都有严谨的理论支撑,使得投资更加科学化、系统化。
    量化选股是量化投资的核心内容,它是采用数量的方法判断某个公司是否值得买入的行为。根据某个方法,如果该公司满足了该方法的条件,则放入股票池如果不满足,则从股票池中剔除。多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票被买入,不满足的则卖出。多因子模型相对来说比较稳定,因为在不同的市场条件下,总有一些因子发挥作用。
    多因子选股模型的基础是Fama和French在1933年提出的Fama-French模型。三因子模型可以看做是CAPM模型的一个拓展,也可以看做是对APT模型的应用。它明确了影响股票超额收益的因素有三个,分别是市场因子、规模因子和价值因子。经国内学者的大量数据验证,表面三因子模型对中国股市是有效的。但是三因子模型也有自身的缺点,比如三因子模型的因子都是宏观因素,不适合做短期投资。而本文正是追求短期投资的超额收益,但是三因子模型正好给了一个启发,来寻找更能解释股票超额收益的因子的一个方向,同时无论是CAPM模型还是三因子模型,都是通过一个线性方程来解释股票超额收益的组成结构,在计算机和数理金融日渐发达的今天,国内国外也越来越多的人开始将数学挖掘算法以及数理统计知识应用到金融投资领域

因子的选取
候选因子的选取
    影响股票收益的因素很多,最常用的候选因子是估值类指标,如市盈率、市净率等,价值相比于同行业较低的股票往往被市场认为价值被低估,如果不存在其他可能导致股票不被市场认可的因素,此类股票很可能被低估;盈利类指标是从盈利水平的指标衡量股票的价值,比较适合长期投资的决策者适用,如ROA、ROE;现金流量类指标被很多投资者称之为企业经营状况的晴雨表,一般不太容易被操纵,因而也受到很多投资者的青睐。另外企业资产负债率、速动比率、流动比率等是从公司偿债能力的角度分析企业财务状况,存货周转率、应收账款周转率则是从运营情况来分析企业财务状况。选择更多、更有效的候选因子无疑将会增强模型信息捕获能力,提高稳定性,是获得超额收益的关键因素之一。
    当然有不少文献参考了其他文献的因子,并进一步添加了因子,比如2014年曹正凤等人在《使用随机森林算法实现优质股票的选择》中用了2009年焦健等人在《基于CART决策树的行业选股方法》中用到的六个因子。国信证券工程师焦健等人提出的六因子量化选股模型, 由市净率、市盈率、ROA、前一月股票收益率、EPS一致预期变化率和EPS—致预期六个指标构建。前两个指标都是价值因子,是衡量市场及股票是否合理的常用指标,曹正凤给予保留。后四个指标体现了成长因子的概念, 由于前一月股票收益率稳定性较差,予以剔除,保留ROA、EPS一致预期变化率和EPS—致预期三个指标。这样共有五个指标,在一般的选股模型中都有这五个指标, 或者是其线性组合。为了使模型的稳定性更好,曹正凤又加上以下四个指标:一是净资产收益率(ROE),又称股东权益报酬率,是报告期净利润与报告期末净资产的比值。它是判断上市公司盈利能力的一项重要指标,一直受到证券市场参与各方的极大关注。二是存货周转率,它是衡量和评价企业购人存货、投人生产、销售收回等各环节管理状况的综合性指标。它是销货成本被平均存货所除而得到的比率, 或叫存货的周转次数, 用时间表示的存货周转率就是存货周转天数。存货周转率反映了企业销售效率和存货使用效率。三是资产负债率,它是企业负债总额占企业资产总额的百分比。这个指标反映了在企业的全部资产中由债权人提供的资产所占比重的大小,反映了债权人向企业提供信贷资金的风险程度。四是流通市值,它是公司的股票在证券市场里的交易价格乘以总股本的结果,反映了市场在某个时期对公司的看法,是公司价值的一种市场体现。
候选因子有效性检验
    2014年王昭栋在《多因子选股模型在中国股票市场的实证分析》中主要做了因子与未来收益之间的线性关系的检验,具体的检验准则按照下面的步骤进行:
(1)排序分组。
    先对备选因子逐个按照因子的大小进行排序并分组。进行的所有测试将备选股票池的股票分为5组。每组160只股票。
(2)因子的有效性检验。
    在历史回测中观察第五组收益率比第一组投资组合收益高或者低的频率,并观察第一组和第二组的合并组与第四组和第五组的合并组之间的检验差值。如果这两个度量指标显示的数值的符号相同,并且合并组具有较高的收益差值,就可以初步认定该因子具有有效的可能。用这个方法筛选出所有满足条件的备选因子。
(3)考察因子的分组与因子收益率之间的关系。
    需要说明的是:这一步只是对因子进行粗筛选,并不需要因子与收益率之间满足严格的递增或者是递减关系,只要保证满足一定的相关关系即可。经过有效性的检验的因子可以纳入到备选因子库。
丁鹏在《量化投资-策略与技术》一书中提到了另一种一般性的采用排序方式的检验方法。具体而言,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。组合构建完毕后,计算这n个组合的年化复合收益、相对于业绩基准的超额收益、在不同市场状况下的高收益组合跑赢基准和低收益组合跑输基准的概率等。
    2015年赵智辉在《基于三层过滤模式的多因子选股模型研究》中进行因子筛选研究时的因子显著性t检验和因子的胜率和相关收益率计算本质上也是排序的方法。
有效但冗余因子的剔除
    不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好、区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。
    冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为:
(1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高;
(2)按月计算个股的不同因子得分间的相关性矩阵;
(3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值;
(4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其他因子则作为冗余因子剔除。

选股策略
基于因子打分
    2011年吴荻在《中国股票市场选股模型实证分析》中采用了多因素综合评分选股方法,它是业界流行的多因素选股模型之一。它包括首先选择影响股票收益的选股指标,并将每个选股指标转换为评分后,通过不同加权方法获得多因素综合评分,并以此为选股依据对股票进行筛选和构建投资组合。运用多因素综合评分对股票进行排序分为上等、下等和其他三个等级,并将上等和下等中的股票按照市值加权构建最优和最劣两个投资组合。
基于因子排序
    2014年王昭栋在《多因子选股模型在中国股票市场的实证分析》中运用了基于因子排序的多因子模型,其主要思想是按照多个因子的大小分别排序,选择出排名靠前的股票构建投资组合。该模型认为因子的大小与股票的未来收益之间存在着一定的相关关系。不论这个相关关系是正向的还是反向的,只要这个相关关系得到确认,就可以为我们所用,作为选股的依据。基于因子排序的多因子模型在排序前需要明确因子的重要程度。重要的因子放在前面,次要的因子放在后面。也就是说先按照重要的因子排序选出一个股票集合。然后再按照次要的因子排序,选出一个股票集合。最终选出符合要求的投资组合。
    基于因子排序因子的选择需要考虑单因子的表现以及各因子之间的相互关系。同时该模型的构建也可以参考现有的选股逻辑。之所以采用一些现有的选股逻辑主要是为了避免基于单因子排序选股的盲目性,可以更有效地利用选股过程中的一些先验信息。对于提高选股成功率具有一定的指导意义。该模型的具体操作步骤如下:
(1)明确需要因子的个数,以及因子的类型,构建合理的选股逻辑。
(2)从各大类因子中选择合适的具体因子。这个过程可以通过计算机进行遍历操作,寻找最优秀的因子组合对因子组合进行排序,确定主要选股因子和次要选股因子。
(3)依次按照主要选股因子和次要选股进行排序。例如我们想选出的股票作为第一档组合,可以按照主要选股因子排序先选出前的股票,然后再按照次要因子选出前的股票,这样股票数目就可以与单因子的结果相一致。
(4)对因子组合的超额收益和因子组别进行相关性分析。因子排名最高的一档的超额收益率与组别排名最低的一档的超额收益率的取值是异号的,并且因子的大小与各档投资组合的收益率大致上是呈现正相关或者负相关关系,我们就可以认为该因子组合通过了因子的有效性检验。然后,从时间序列维度对因子组合的历史表现的稳定性做进一步的检验。如果不能通过稳定性检验就认为该因子组合是无效的。这时需要重复第二步到第四步的操作。
(5)跟踪从上一步筛序出来的因子组合的表现,对于能够在实盘中能够获得稳定收益的因子组合我们予以保留;对于在实盘中表现较差的策略,直接删除。
基于因子回归
    2014年曹春晓在《中国A股市场多因素选股模型实证分析》中采用了基于因子回归的多因子模型,通过多元线性回归,对因子和未来收益之间的线性关系进行评估。基于回归的多因子模型具有基于数据挖掘量化投资模型的特性。可以更高效的在历史数据中发现一些有效的因子组合,指导我们的投资工作。回归方程的系数可以看成是我们选股因子的权重。假定这个回归关系是可以在下一期继续得到保留,将最新一期的因子值代入到回归方程中,得到回归方程的预测值,然后根据预测值的大小对股票进行排序,选择出取值较高的那一组股票作为我们的投资组合。这样在m个样本考察期中,我们就可以这样得到m组投资组合。根据多因子选出的股票直接代入系统进行历史回测,得到回测报告。直接根据回测报告中投资的收益的稳定性和盈利性,通过观察投资组合在历史行情中的表现检测稳定性。通过对投资组合的平均收益率分析来验证其收益性。
现代分类技术
    从技术上看,股票的选取可以归结影响股票价格的多因素分析问题,其中每一个因素可以看作一个维度的指标,这样股票的价格就由多个维度的指标体系决定,从众多的股票中选取优质的股票,就归结为大量信息的统计分析,其本质是一个多维空间的分类问题。众多的文献采用了形形色色的现代分类方法。
    2009年焦健等人在《基于CART决策树的行业选股方法》中借鉴Eric H, Keith L和Chee K在2000年的“The Decision Tree Approach to Stock Selection - An evolving tree model performs the best”一文中所提出的决策树方法并参考其指标,我们对国内科技股板块从2003年到2009年的数据进行静态树和动态树模型的检验,并构造相应的多空头组合。后期又通过事前修剪、事后修剪以及节点过滤,对静态和动态CART决策树进行了修正以增加其拓展性。检验结果表明,修正后的模型多空组合收益差明显提高,而动态CART决策树分类后的股票多空差异显著,达到了2.98%的水平,且多头组合财富曲线显著超越了空头组合和科技股全样本平均表现。从选股数量上来看,多空头组合所含股票不足全样本的一半,有效降低了选股难度,体现出分类的准确性。
2012年石煜在《基于数据挖掘的数量化模型选股分析平台》中提出了基于SQL的公式分类法算法。根据已知的投资模型,也就是不同的投资理论抽象出一个分类挖掘的规则,既挖掘公式,假设每个元数据都属于特定的类,然后使用公式算法模型进行分类,利用数据库技术的查询语言来分类并描述预期要得到的数据类或数据集。通过按照公式挖掘规则分析数据库中带有预定属性的元数据,得出分类结果,并按特定属性要求显示。
    2013年苏治等人构建了基于核主成分遗传算法改进的支持向量回归机人工智能选股模型( KPCA-GA-SVR),采用SVR 模型对股票收益率进行回归分析,首先利用核主成分分析( KPCA) 方法对输入向量进行特征提取,然后采用遗传算法最佳化模型参数,构建了基于KPCA-GA-SVR的人工智能选股模型,并分别从短期和中长期两个时段对模型的选股性能进行评价与对比。
    2014年曹正凤等人在《使用随机森林算法实现优质股票的选择》一文中,采用了随机森林算法进行选股,因其训练集随机和属性随机两个随机性特点使得算法具有很好的容错性和鲁棒性,这和当前股票市场异常情况和干扰项比较多的情况相适应;和支持向量机相比,在进行多分类选择时,随机森林算法性能显著占优;另外,随机森林算法具有很高的预测准确率,且不容易出现过拟合。
    2015年徐步云在《基于SOM算法的轨迹聚类选股策略》一文中采用了基于SOA神经网络的轨迹聚类方法选股,聚成的每一类中都有一篮子的股票数据,把每一类看做是一个股票组合,并计算分析每一股票组合在接下来一段交易日时间内的收益表现,找出收益表现最好的类,记为topcluster。由topcluster股票组合在未来一段时间都表现出了很好的收益,所以把topcluster的聚类特征视为优胜的选股条件。在选股时,所有的聚类特征均参加选股,每一种聚类特征都筛选跟自己的特征最相近的股票。而被topcluster选中的股票就是该策略选出的股票,这些股票被认为有更大的可能性在未来一段时间内会有不错的表现。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多因子选股 选股方法 多因子 近几年 Selection 量化投资 多因子 选股方法 文献 股票市场

已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
accumulation + 100 + 1 + 1 + 1 精彩帖子
fantuanxiaot + 22 精彩帖子
一缕阳光等你 + 66 + 16 精彩帖子

总评分: 经验 + 166  论坛币 + 38  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
一缕阳光等你 学生认证  发表于 2016-7-22 10:47:28 |只看作者 |坛友微信交流群
学习一下,谢谢楼主

使用道具

藤椅
robertdoo 发表于 2016-7-22 15:12:10 |只看作者 |坛友微信交流群
多谢分享!!

使用道具

板凳
yanjk120 发表于 2016-8-19 11:46:59 |只看作者 |坛友微信交流群
收藏。。。待我下班后好好研究。。。

使用道具

报纸
sysustar 发表于 2016-8-20 11:17:08 |只看作者 |坛友微信交流群
多谢!

使用道具

地板
MemMao 发表于 2016-8-20 14:00:27 |只看作者 |坛友微信交流群
学习学习,如果有外文文献整理就更好了。

使用道具

7
MemMao 发表于 2016-8-20 14:18:52 |只看作者 |坛友微信交流群
大概看了一下,国内学界研究的东西实在是缺乏深度啊,集中于方法上的应用创新,没有把因子选股本质讲清楚,和国外学界的研究差距很远,另外业界主流的投资方式和学界真的是差异好大。

使用道具

8
gr23 学生认证  发表于 2016-8-20 16:52:37 |只看作者 |坛友微信交流群
MemMao 发表于 2016-8-20 14:18
大概看了一下,国内学界研究的东西实在是缺乏深度啊,集中于方法上的应用创新,没有把因子选股本质讲清楚, ...
没办法,最近几年这方面学界的研究都是一些硕士论文做的。

使用道具

9
冰族王子 发表于 2016-12-21 09:57:54 |只看作者 |坛友微信交流群
谢谢楼主分享~

使用道具

10
conleyfang 发表于 2017-1-30 17:44:27 |只看作者 |坛友微信交流群
MemMao 发表于 2016-8-20 14:18
大概看了一下,国内学界研究的东西实在是缺乏深度啊,集中于方法上的应用创新,没有把因子选股本质讲清楚, ...
理论本身就是拿来创新的,因子选股的本质这些是理论知识,只有理论透彻了才懂得创新。想要懂得本质应当拜读一下原始论文而不是在这里批判国内外的学术界差异大

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-10 21:49