2# zsushenye
谢谢您的购买,希望大家在统计学知识方面共同提高。
这篇文章像是个介绍性的手本,很简洁,可以说是简单。因为Cross-validation 本身就是一种计算方法,知道了就很简单,就是和知道如何电脑开机和关机一样。所以仅仅就是告诉你它是怎么算的。至于它的用途里面也介绍了,本来也就那么些个用途。就像是如何求T检验一样,非常简单的一个计算方法,至于它如何用,也就是说在什么什么情况下要用到T检验。我个人觉得这个文章就是简单,好像是中国人写的,所以理解起来还是没有什么困难的。我是最近写的一个迭代广义最小二乘算法中需要cross-validation来检验算法的稳定性和预测有效性,才发现cross-validation的作用的。其实对于大多数的统计模型都要考虑它的稳健性。像PROC MIXED好像是自己自动输出PRESS的值。PRESS就是leave one out Cross-validation计算出来的。对于接触过偏最小二乘法的同学们来说,Cross-validation 再熟悉不过了。另外像做时间序列建模时,有时候要分内样本(in-sample)和外样本(out-of-sample),外样本的功能其实就是检验内样本拟合出来的模型的有效性。这就和Cross-validation 的思想有点接近。个人觉得文章简单易懂,不复杂。因为cross-validation本身就是一个1+1=2的简单计算方法。