|
预测模型可以通过将模型(计算公式)应用于当前股票价格和财务报表数据来实时挑选股票。本文中开发和回溯测试的预测模型方程没有显示,原因有二。首先,本文介绍了预测建模作为一种系统价值投资方法。支持单一模型并非本意,而且会误导预测建模框架的灵活性。其次,建模过程使用一组模型规范周期性地跟踪模型(附录3)。每次重新训练模型时都会使用相同的规范,但结果会产生不同的方程组。没有必要在每个训练实例之后显示每个模型,因为过程设计更多有许多机器学习算法可供选择。本文使用分类树、Logistic回归和随机森林。本文将一个特定的建模规范称为“模型XX”,但如下一篇文章所述,该规范将在每次重新培训时生成不同的模型。比结果模型更重要。本文全面描述了建模过程,使模型和结果得以再现。4、数据结构和准备数据集包含1977年12月31日至2016年12月31日期间的712415个月度观察数据,包括年度财务报表数据、季度财务报表数据和CRSP/Compustat合并数据库(CCM)中的股价数据。由于CCM数据库包括上市公司的财务报表和股票价格数据,因此该数据集不会受到survivorshipbias的影响。
|