一、一元回归分析
1、构造最能说明因变量水平的自变量
2、采用最小二乘法拟合系数项和常数项
3、相关系数是否能通过相关系数检验(一元回归分析中,相关系数检验 = F检验 = t检验)
二、多元线性回归(当各个自变量之间量纲不同,即单位不同时,需要中心化和标准化)
1.1、计算各自变量和因变量之间的增广相关阵,初步查看各变量的相关系数
1.2、如果明显存在共线性:剔除变量、增大样本或有偏估计回归系数(岭回归、主成份法、偏最小二乘法等等)
1.2.1、剔除变量中:
选择自变量,选模型较全模型来说,系数估计是有偏的,但预测方差是较小的,自由度更高更稳定:(2^m种组合)
1.2.1.1、自由度调整复决定系数最大
1.2.1.2、赤池信息量AIC最小
1.2.1.3、Cp统计量最小
通过以上3个统计量当自变量不多时可以使用,但当自变量个数过多时,采用
1.2.1.4、前进法
1.2.1.5、后退法
1.2.1.6、逐步回归法
确定回归方程中使用的自变量个数。(前进法、后退法、逐步回归法)
1.3、如果不能明显判断是否变量间存在共线性,需要使用方差扩大因子法或特征判定法进行统计量判别
1.4、F检验各自变量总体是否能解释因变量
1.5、t检验各个自变量本身是否能解释因变量
1.6、判断是否仍存在明显共线性的情况(重要变量没有通过显著性检验、自变量回归系数符号与常识相悖,变量间相关系数较大等)
2、预测方程是否满足基本假设
2.1、异方差检验(残差图、等级相关系数法)
2.2、若存在异方差,使用加权残差与自变量的相关系数为参考构造权函数进行加权最小二乘法
2.3、残差自相关检验(残差图、自相关系数、DW检验)
2.4、若存在残差自相关,使用迭代法或差分法(残差自相关系数为1时使用)处理
2.5、异常值与强影响点检验和处理
3、偏最小二乘回归
当样本少变量多 或者 挑选出来的自变量在逻辑上并不能很好解释因变量 或 自变量间拥有极强自相关性时,可以尝试采用偏最小二乘的方式来解决。
偏最小二乘 = 多元线性回归+ 典型相关分析 + 主成份分析