|
因此,我们采用与Freyberger、Neuhierl和Weber(2020)以及Kelly、Pruitt和Su(2019)相同的方法,仅使用在给定月份具有所有公司特征的股票,这有额外的好处,即去除了市值非常小的主要股票。请注意,我们不要求一只股票在其整个时间序列中都具有特征。如果在这个时间点上,股票i具有所有特征,即股票i不一定有一个完整的时间序列,那么我们只包括股票i的回报时间t,这在我们的方法中是允许的。Kelly、Pruitt和Su(2019)以及Kozak、Nagel和Santosh(2020)以这种方式构建因子。在本文的第一个版本中,我们使用了传统的长短因子。然而,我们的经验结果表明,长短腿在SDF中的权重不同,这种额外的灵活性提高了线性模型的性能。这些发现也符合Lettau和Pelger(2020)的观点,他们从单排序投资组合的极端十分位数中提取线性因子,并表明它们不受长短因子的影响,而长短因子对每个特征的极端十分位数的权重相等。我们从三个来源收集了178个宏观经济时间序列。我们从FRED-MD数据库中提取了124个宏观经济预测因子,详见McCracken和Ng(2016)。接下来,我们为46个企业特征中的每一个添加横截面中值时间序列。每个特征的分位数分布与中值水平相结合,接近于表示与原始特征信息相同的信息,但以规范化形式表示。
|