协方差矩阵的估计在量化投资中有广泛的应用, 许多量化策略都会使用到协方差矩阵(或其逆矩阵)。 例如多因子选股中,最大化复合因子 IC_IR 的加权方式会用到因子 IC 序列协方差矩阵的逆;在组合优化中,需要使用股票收益率序列的协方差矩阵来估计组合未来的波动率。 工欲善其事,必先利其器,如何准确估计协方差矩阵是一个很重要的议题。本文梳理了常用的协方差估计方法,然后在一套新的评价体系下比较了不同协方差的估计效果。
常见的改进股票收益率协方差估计的方法有因子模型、压缩估计、随机矩阵理论模型等。
因子模型
可以通过给协方差矩阵加以一定的结构,从而减少数据的维数,降低估计误差。这种结构可以来源于因子模型,如单一指数模型(市场模型)、多因子模型(行业因子、宏观因子、基本面因子、统计因子)。压缩估计
为了避免因子模型中的因子选择问题,可以将样本协方差矩阵与其他结构化模型进行加权,以此来设定结构。随机矩阵理论模型
可以根据随机矩阵理论分离样本协方差矩阵中的信息与噪声, 通过调整相关系数矩阵的特征根来降低协方差矩阵的估计误差。
固定相关系数模型
固定相关系数模型假设股票之间的相关系数是相同的,并以所有股票间的样本相关系数的平均值作为固定相关系数的估计。其他模型
其他协方差矩阵的估计方法还有固定相关系数模型、时变模型、合成聚类模型等。
协方差矩阵估计量的评价指标
本文采用了一种基于协方差矩阵特征分解的评价指标,通过比较与两个协方差矩阵相关的组合风险能够达到的最大差别,来比较不同的协方差矩阵。该评价指标具有明确的经济意义及统计意义。应用与实证
实证结果表明,常用的 Ledoit & Wolf 压缩估计及包含风格及行业因子的多因子模型的表现较好,以多因子模型为压缩目标的压缩估计量表现最好。然而,使用多因子模型作为压缩目标既没有回避因子选取的问题,也没有简化运算,无法体现出压缩估计的优势。基于此,在实务中,本文较为推荐以固定相关系数或者对角阵为压缩目标的 Ledoit & Wolf 压缩估计,以及包含风格及行业因子的多因子模型。
风险提示: 市场环境变动风险,模型失效风险。