|
为了说明交叉验证如何缓解问题,假设折叠数为K=2,并且部分资产j的平均值相对较高,第一次折叠的方差相对较低。根据这一倍数,在这项资产中投资正数将是最佳选择。然而,如果第二次折叠显示相反的情况;同一资产的低均值和高方差,正权重将很难推广到第二倍。一般来说,如果资产在各个层面上表现出不稳定的时刻,则在遗漏的层面上会产生较高的样本外均方误差。通过增加λ来减少此类资产的风险敞口将降低估计风险。显然,随着观察次数的增加,整个fo lds的资产动量将趋于稳定,因此asn→ ∞, 最佳惩罚水平将接近零。所以,任何形式(15)的ML算法都将接近传统方法,后者再次接近最优投资组合权重。2.3.3模拟研究:机器学习与传统方法作为传统方法与ML之间差异的一个例子,我使用多元正态分布的m=5 0资产的模拟回报。θ的预期(a)估计*0 10 20 30 40 50 60 70 80 90 100 0.10.20.30.40.50.60.7广义误差偏差平方方差(b)偏差方差0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1标准偏差0.51.52.5人口传统岭估计风险0 5 10 15 20 30 35 40 45 50资产数量0.20.40.60.8广义误差训练与广义误差图4:传统方法与机器学习。图4a:θ的估计值*基于1000次重复提取的训练数据,采用传统方法和岭回归进行5倍交叉验证。
|