请大家去看我的言论
https://bbs.pinggu.org/thread-271986-1-1.html&page=1
我觉得这些问题确实对于加深概念的理解很重要,所以我来发表我的看法,可能是不对的,但是希望能够借此机会来一起讨论.
首先,注意到在回归模型 ESS中, 平方和的形式和卡方分布的标准定义有所区别. 在卡方分布定义中, 一共有k项互相独立的标准正态分布的变量的和, 然后df = k, 而在回归的ESS 中, 一共有n 项(n 个观测值), 然后有k 个可以变化的变量, 就是k个x, 自由度也是k.
楼主现在的问题是, ESS 作为分子和 RSS 作为分母, 是不是可以有相同的方差, 然后在F 分布中, 把它们可以消去, 使得上下都是标准正态分布的平方和.
我觉得, 虽然我不知道怎么去证明,是不是可以从统计的思想来理解, 为什么ESS 和RSS 其实是从概念上设定是具有相同的方差的卡方分布, 只是它们的自由度不一样.
也许我说的不对,而且我也没有文献根据,只是自己想的:
1) (经典)统计的思想是从灵活的样本, 去估计总体那个不变的,但是未知的参数.
2) 如果只有一些散点, 不知道有什么关系, 就只能用总体的均值和标准差去表示.在回归方程里,就是 y的观测值减去 y的平均值, 当然这个均值是点估计, 去掉一个自由度.
3) 问题来了,如果不知道回归, 以上的这个方差, TSS, 就是全部由残差或者误差造成的, 服从一个正态分布, 不是标准的, 假设方差是σ, 那么这个时候, TSS的方差σ应该和RSS的方差σ相等.
4) 如果全部是回归造成的, 残差等于0, 那么 TSS的方差σ应该和ESS的方差σ相等, 这个时候, F的比值应该是无限大吧? 所以拒绝原假设, 回归显然成立, 两个卡方的比值显然远大与1.
5) 那么, 是不是可以由(3)和(4)推出: 在回归的假设中,就是看回归的ESS和残差的RSS的比值究竟是怎么样的? 那么可不可以认为, ESS 和 RSS, 如果要标准化的话, 它们应该是有相同的方差?