在涉及线性回归的教材中,都会有F检验以检验总体是否是线性显著的,
F统计量=(ESS/d)/(RSS/m-d-1)
假设检验中,H0:总体回归模型中所有解释变量的对应系数全为0,
(此处不是样本回归模型),总体回归模型(误差项服从正态分布)是进行线性回归的前提,
假设的初衷是,如果系数全为0了,表示变量都与Y无关了,如果被接受,那么数据集不是线性的。
后面的很容易理解。
我的困惑是,F与H0假设 是怎么建立关系的?
很多教材没有说明,只是说H0成立的条件下,统计量F为上式。
换句话说,假如没有这个总体中的H0假设,关系式F就不服从F分布了吗?
TSS=ESS+RSS,其实对任何散点图数据集都能成立,因为只是进行了最小二乘,
再糟糕的数据集总是能拟合出一根直线(一元的话),
ESS、RSS也都是来自真实数据集,
为什么它们的关系式F会对F分布的置信临界值产生比较价值?