回归模型有多种,一般在数据分析中用的比较常用的有线性回归和逻辑回归。其描述的是一组因变量和自变量之间的关系,通过特定的方程来模拟。这么做的目的也是为了预测,但有时也不是全部为了预测,只是为了解释一种现象,因果关系。
还是按照老风格,不说空泛的概念,以实际的案例出发。
还是先前的案例,购房信息,我们这次精简以下,这 8 位购房者我们只关注薪水和年龄这两个因素
我们用这个案例说明我们提到的线性回归模型和逻辑回归模型。
线性回归
首先我们看线性回归模型。如果我们想试图看下收入和年龄是否有什么直接的关系,这里,我们把收入看成自变量,年龄是因变量,那么线性模型的关系图自然是直线,按照方程,我们可以得出:
y(收入)=a + bx(年龄)
这里,b 是回归系数,a 是回归常数。但是俗话说,理想很丰满,现实很骨干,偏差一定存在,所以实际上还有残差 e 存在。所以这个方程更精确的应该是:
y(收入)=a + bx(年龄) + e
现在我们来计算具体的回归系数和回归常数。具体计算公式如下:
b = ∑(y - Y)(x - X)/∑(x - X)(x - X)
a = Y - bX
这里,大写的 X 和 Y 代表平均值,我们先计算除了回归系数,然后在通过平均值计算出回归常数。


雷达卡


京公网安备 11010802022788号







