楼主: JoinQuant
688 0

[程序化交易] A股市场高频量价因子探索 [分享]

  • 0关注
  • 16粉丝

等待验证会员

博士生

17%

还不是VIP/贵宾

-

威望
0
论坛币
100 个
通用积分
12.0654
学术水平
12 点
热心指数
9 点
信用等级
9 点
经验
3401 点
帖子
97
精华
0
在线时间
132 小时
注册时间
2015-9-9
最后登录
2019-9-2

JoinQuant 企业认证  发表于 2019-7-13 13:49:58 |显示全部楼层
本帖最后由 JoinQuant 于 2019-7-13 14:15 编辑








未经授权,严禁转载

引言


>>> 研究目的
传统的因子指标挖掘主要集中于财务报表、个股中低频率的价量等相关的数据维度,而这部分数据维度的增量价值的挖掘已逐渐饱和,需从其他新的数据维度中挖掘新的因子指标,本篇研究内容参考海通证券研报《高频量价因子在股票与期货中的表现》,本篇报告从个股日内高频数据出发,将目光聚焦于日内价量信息和交易特征,使用分钟数据构建一系列高频因子,实证各因子在股票市场中的表现(本研究主要探讨股票部分,原研报期货部分未做研究)。




>>> 研究框架
高频因子可以分为收益率分布、成交量分布、量价复合、资金流和日内动量等几个主要的类别,各类因子还可以做进一步的细化,例如收益率分布因子包括已实现偏度、已实现峰度和上下行波动率等。按照这个思路,展开研究:

1)因子数据获取:

  • 从设置股票池,获取指定时间范围的分钟数据,按照研报思路,获取每分钟的数据,进行因子值计算函数构造,按日期将因子值存入字典

2)因子数据处理:

  • 将计算出来的因子值按日期遍历获取,根据需要进行数据处理
  • 在T期因子值中加入T+1期收益值,方便因子分析统计

3)因子统计分析:

  • 针对每期截面进行因子IC统计
  • 汇总为时间序列上的IC数据,进行展示

4)分组回测分析:

  • 根据所选的因子,在每个调仓日进行股票排序,分层进行收益净值观察
  • 根据所选因子,在每个调仓日进行股票排序,进行多头组合收益分析

>>> 参数设置
1)时间范围:

  • 2014.6 ~ 2019.6

2)研究指数:

  • 上证50、沪深300、中证500

3)股票池:

  • 上证50、沪深300、中证500指数成分股以及全部A股
  • 剔除 ST、停牌、涨跌停、上市不满 6 个月
  • 月初调仓

4)费用设置:

  • 暂无交易成本设置

>>> 研究内容及结论
1)收益率分布因子。

  • 高频偏度因子与高频峰度因子具有一定的选股效果,统计期高频偏度因子 IC均值达到0.034 与0.0198,负值占比为 69.5% 与 71.2%,多空组合年化收益差分别为 14.45% 和 15%,最优分组年化收益为 18.02% 和 20.9%,且因子在股票中呈现出反转效应,即高频偏度与峰度小的股票未来收益表现更好,下行波动占比因子未有良好表现(最优分组默认头尾分组)。

2)成交量分布因子。

  • 日内不同时段的成交量分布能够反映投资者的行为特征。上午10 点-11 点成交量占比因子和股票下月收益显著正相关,而收盘前半小时成交量占比因子和股票下月收益显著负相关,IC均值达到0.040 与0.0565,负值占比为 35.6% 与 72.9%,二者分层效果明显,多空组合年化收益差均可以到达 17%左右,最优分组年化收益率分别为 22.33% 和 25.21%(默认头尾分组)。

3)量价复合因子。

  • 高频量价相关性因子具有显著选股效果,日内走势呈现出“量价背离” 特征的股票未来收益表现好于“量价同向”的股票,IC均值达到 -0.047 ,负值占比为 62.7%。分层效果较为明显(最优分组在中间),多空组合年化收益差可以到达 21%,最优分组年化收益率为 19.12%。

4) 资金流因子。

  • 资金流向来自交易时产生的委托信息,反映的是微观层面的供求关系,IC均值达到 -0.0519,负值占比为 55.9%,分层效果很显著,多空组合年化收益差可以到达 30%,最优分组年化收益率为 26.57%。

5)趋势强度因子。

  • 股票趋势强度因子选股效果一般,IC统计均值为 -0.009,负值占比为 0.491 %,分层效果比较显著,多空组合年化收益差为 13%,最优分组年化收益率为 18.77%。

6) 改进反转因子。

  • 除了直接使用分钟级别数据构建因子之外,我们还可以使用日内信息对传统因子做增强。剔除了隔夜和开盘后小时涨幅的一个月反转因子的多投组合日均收益达到0.106%,分层效果明显,多空组合年化收益差可达27.6%,最优分组年化收益到达24.12%

>>> 因子数据获取
根据现有的研究成果,我们可以把高频因子分为收益率分布、成交量分布、量价复合、资金流和日内动量等几个主要的类别,各类因子还可以做进一步的细化, 例如收益率分布因子包括已实现偏度、已实现峰度和上下行波动率等等。








>>> 因子数据处理
  • 进行因子值数据处理、如有必要可进行去极值、标准化、中性化
  • 加入收益数据:将T期因子值中加入T~T+1的收益数据进行记录

>>> 因子分析
  • IC统计

在下面的内容中,我们将对所有因子IC值进行统计记录,并记录各因子值IC均值、IC标准差、IC最小值、IC最大值、负IC占比,并将IC值与累计IC进行统计展示:





图1-已实现方差因子 IC值与累计IC值







图2-已实现偏度因子 IC值与累计IC值







图3-已实现峰度因子 IC值与累计IC值







图4-下行波动占比因子 IC值与累计IC值







图5-9:30~10:00成交量占比因子 IC值与累计IC值







图6-10:00~10:30成交量占比因子 IC值与累计IC值







图7-10:30~11:00成交量占比因子 IC值与累计IC值









图8-11:00~11:30成交量占比因子 IC值与累计IC值







图9-13:00~13:30成交量占比因子 IC值与累计IC值







图10-13:30~14:00成交量占比因子 IC值与累计IC值







图11-14:00~13:30成交量占比因子 IC值与累计IC值







图12-14:30~15:00成交量占比因子 IC值与累计IC值







图13-量价相关性因子 IC值与累计IC值







图14-资金流因子 IC值与累计IC值







图15-趋势强度因子 IC值与累计IC值







图16-改进反转因子 IC值与累计IC值



>>> 分组回测
  • 多头收益
  • 分组收益

接下来,我们将对所有因子值进行分组收益统计,并记录各分组总收益、年化收益、夏普率、最大回撤、每日收益情况,并将分组年化收益进行统计展示:





图17-已实现方差因子 分组收益







图18-已实现偏度因子 分组收益







图19-已实现峰度因子 分组收益







图20-下行波动率因子 分组收益







图21-9:30~10:00成交量占比因子 分组收益







图22-10:00~10:30成交量占比因子 分组收益







图23-10:30~11:00成交量占比因子 分组收益







图24-11:00~11:30成交量占比因子 分组收益







图25-13:00~13:30成交量占比因子 分组收益







图26-13:30~14:00成交量占比因子 分组收益







图27-14:00~14:30成交量占比因子 分组收益







图28-14:30~15:00成交量占比因子 分组收益







图29-量价相关性比因子 分组收益







图30-资金流因子 分组收益







图31-趋势强度因子 分组收益







图32-改进反转因子 分组收益



这里我们将表现较好的因子取出,对其分组收益情况进行展示,可以看到头尾收益差额较大,分组效果明显。

>>>因子相关性检查
股票高频因子秩相关系数矩阵如下表所示,大多数因子间具有较低的相关性,而下行波动率占比和高频偏度因子间具有较高的负相关性。

  • 成交量占比中我们发现,9:30-10:00成交量占比与下午11:00以后的所有分段成交量占比负相关关系较强
  • 高频峰度因子与 高频偏度因子、资金流入因子成较强的正相关关系
  • 趋势强度因子与改进反转因子,因为在描述同一件事情,虽然处理方式上有所不同,但是二者仍然有着较强正相关关系。





结论
本篇报告中我们使用分钟级别数据构建了一系列高频因子,并对比各因子在股票中的表现,具体的因子表现看参见研究前面的结论内容。

1)高频偏度、量价相关性因子、以及改进反转因子具有显著的选股效果。成交量分布因子在上午和下午呈现出不同的选股效果,收盘前成交量越大的股票未来表现越差,而上午 10-11 点成交量越大的股票未来表现越好。

2)通过日内信息对传统因子进行改进,反转因子在进行改造后分层效果明显,多空组合年化收益差可达27.6%,最优分组年化收益到达24.12%。

3)多数高频因子在股票中体现出反转效应,可能与交易机制和投资者结构有关。股票市场以单向做多机制为主,相比于可以多空双向 T+0 交易,机构参与度高,程序化交易应用广泛的期货市场,股票市场散户交易占比较高,更容易出现过度反应和定价偏误。


点击【阅读原文】,查看更多内容~


关键词:量化投资 机器学习 人工智能

已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
accumulation + 100 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 100  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-10-23 18:53