|
它取一只股票在回望窗口上的平均交易量乘以该股票的最新股价。据Quantopian称,这是衡量股票流动性的更好方法,而不仅仅是原始数量。Remorov(2014)研究了市场崩盘期间交易量对股价的影响,发现了市场低迷期间交易量与价格之间的关系。数据标准化的最简单方法是对每个特征相对于所有其他股票的排名(即,对价值最高的股票给予1,对价值最低的股票给予500)。3.1模型选择使用机器学习scikit学习库(见Pedregosa et al.,2011),我们在研究环境中确定了一系列不同的分类,并对每个分类进行交叉验证,以评估预测稳健性(见Browne,2000)。将独立的Smart Beta策略与投资组合优化7相结合,虽然我们使用了不同时期的不同培训和测试集,多次进行交叉验证,以真实反映每个类别的绩效,但每个类别都使用了相同的培训和测试集。我们发现Adaboost分类法是这些分类法中最有效的(见R¨atsch,Onoda&M¨uller,2001)。AdaBoost是自适应Boosting的缩写,是一种机器学习元算法,最初由Freund和Schapire(1999)开发,与其他算法相比,它不太容易过度拟合。交叉验证准确率为53%,成功率很高,但如果使用得当,可能会非常显著。我们发现,使用前两个月的数据对分类员进行培训是最佳的培训期。使用超过两个月的时间意味着分类师反应太慢,无法响应当前的市场趋势,也无法跨越多个市场趋势,导致学习效果不佳。
|