单因子组合排序分析(量化投资因子回测)方法
用于检验某个异象/量化因子是否有效的最常用的方法是投资组合分析法(Portfolio sort analysis),该方法被广泛应用于学界和业界。
根据某个因子对股票进行排序分组,构建投资组合并持有一定的时期,计算组合的收益,比较不同投资组合的超额收益是否存在显著的差异。具体而言,根据排名变量x的值计算分位数,将样本划分为区间,本贴以十分组为例,第一组代表因子值低于10分位的股票组合(空头组合),第十组是因子值高于90分位的组合(多头组合),计算每个投资组合的股票收益率,用第十组减去第一组,得到多空组合的收益率。每个投资组合中股票的权重可以设置为相等的权重或市场价值作为权重。设定投资组合的持有期为一个月。在持有期结束时重复上述过程以持有新组合。从而得到每个组合的收益率时间序列。如果多空组合具有显著的超额收益,那么该因子便是有效的因子(由于A股市场的做空限制较多,所以也可以只考虑多头组合是否显著)。
此外,通常还使用资本资产定价模型计算风险调整后的收益,也就是常说的alpha。方法是利用资产定价模型对因子收益序列进行回归检验,回归的截距项即为alpha。值得说明的是,由于时间序列数据存在自相关性和/或异方差从而导致t统计量不准确,通常采用Newey和West(1987)的方法进行调整(即NW-t检验),方法是将收益率序列对一个常数项为1的时间序列进行回归,估计t值即为NW-t检验的值。NW-t检验需要输入滞后期,Newey和West(1994)指出偏移量可以设置为4*(T/100)^ a,其中T是时间序列的周期数,a取2/9或4/25。
附件为数据、stata及python代码。