楼主: CDA网校
763 1

[每天一个数据分析师] CDA LEVEL 1 考试,知识点汇总《回归分析》 [推广有奖]

管理员

已卖:189份资源

泰斗

4%

还不是VIP/贵宾

-

威望
3
论坛币
120347 个
通用积分
11135.8062
学术水平
278 点
热心指数
286 点
信用等级
253 点
经验
229009 点
帖子
6985
精华
19
在线时间
4387 小时
注册时间
2019-9-13
最后登录
2026-1-21

初级热心勋章

楼主
CDA网校 学生认证  发表于 2022-5-17 10:32:06 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一、基本概念

1.线性回归的出现

当被解释变量和解释变量都为连续型,且存在线性关系时,可以采用线性回归对被解释变量进行预测。

多元线性回归的出现是非常自然的,由于在一元线性回归中,因变量只能依赖一个自变量来解释,换一句话说,就是我们 只能在一维空间中来解释世界,这是十分糟糕的,毕竟事物之间的关联是非常复杂的,只用其中一个变量来解释,总是显 得那么苍白和无力。

下面我们就来以“房价”和“客户价值”为因变量,探索一下影响他们的自变量。首先,影响房价的因素有哪些呢?

CDA LEVEL 1 考试,知识点汇总《回归分析》

CDA LEVEL 1 考试,知识点汇总《回归分析》

因此,我们不难发现,在用更多变量来解释因变量,显然会更加全面、丰富、合理和科学。与一元线性回归类似,一个含

有k个自变量的多元线性回归模型可以表示为:

y= Bo+Bixl+B2x2++bx+8

,β,B1,B,为模型参数,E为误差项,来解释不能被自变量线性关系解释的部分。

二、基本假设

多元线性回归的基本假设

CDA LEVEL 1 考试,知识点汇总《回归分析》

三、检验方法

1.线性关系假设——线性关系检验

CDA LEVEL 1 考试,知识点汇总《回归分析》

2.线性关系检验——回归系数检验

CDA LEVEL 1 考试,知识点汇总《回归分析》

3.期望为0的假设

(1)假设检验方法:(图形法)可以直接绘制散点图,查看残差是否对称分布在0的两侧;(统计检验)可以用假设检验 中的t检验方法,其原假设为H0:E=0,具体操作将在案例中展示。

(2)假设失效的影响:如果残差的期望不等于0,而等于其他的某个常数,那么这个常数就应该出现在多元线性回归的常 数项内。

(3)假设失效解决方法:如果失效,考虑是否强制将常数项设置为,或考虑异常值问题。

4.同方差假设

假设检验方法:(图形法)对残差以及因变量的拟合值作图。

如果没有异方差,那么残差和因变量拟合值构成的散点应该是完全 随机的,其趋势线应该是几乎是水平的。上图中间的趋势线存在弯 曲,即存在一定的异方差。

CDA LEVEL 1 考试,知识点汇总《回归分析》

除了作图,我们也可以选择Breusch-Pagan检验,注意该检验的原假设是同方差,备择假设是异方差,这 样读者根据输出的P值就可以直观判断了。

假设失效的影响:如果误差是异方差的,那么OLS估计的标准误差将不可靠。

假设失效解决方法:克服异方差性的影响,我们可以尝试对因变量做一些非线性变换,如等等。

5.正态性假设

假设检验方法:(图形法)做QQ图。

QQ图的解读十分简单,如果散点在直线上或者直线附近,那么我 们就可以认为数据是正态分布的,否则就任务不是正态分布。 对于正态分布的统计检验,我们可以选择KS检验(Kolmogorov– Smirnov test),其原假设:数据是正态分布的。这样读者可以直 接根据输出的P值来对检验结果进行分析。

CDA LEVEL 1 考试,知识点汇总《回归分析》

假设失效的影响:如果误差项不是正态分布的,则OLS估计的标准误差将不可靠。然而对于正态性假设对于线性回归的 重要性,目前各方还有一些有价值的观点。

假设失效解决方法:关注样本中两端的异常值是否合理,如异常值不合理,可以考虑删除异常值。也可以尝试对变量做 非线性变换。

CDA LEVEL 1 考试,知识点汇总《回归分析》

6.横截面和时间序列数据在回归建模上的差异

横截面是指在同一时间平面上的数据,例如2013年各个上市公司的财报数据,如果研究其不同变量之间的线性关系,可 以用多元线性回归模型。但是如果数据包含时间趋势,例如2001-2018年全国各个省市的宏观经济指标数据,如果要研 究不同宏观指标之间的线性影响,就要用面板回归模型了(计量模型的一种)。

四、参数估计

1.多元线性回归的参数估计

CDA LEVEL 1 考试,知识点汇总《回归分析》

五、判定系数

CDA LEVEL 1 考试,知识点汇总《回归分析》

六、例题精讲

  1. 工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y=60+90x,下列判断正确的是( )?

A. 劳动生产率为1000元时,工资为50元

B. 劳动生产率提高1000元时,工资提高150元

C. 劳动生产率提高1000元时,工资提高90元

D. 劳动生产率为1000元时,工资为90元

答案:C 解析:根据回归直线方程 y=60+90x 得到,劳动生产率为1千元时,工人月工资=60+90*1=150元,劳动生产率提高1千元 时,工资提高90元。

  1. 以下哪个假设不是线性回归分析的前提假设? A. 解释变量之间必须严格独立

B. 解释变量之间不能强线性相关

C. 扰动项独立同分布

D. 扰动项服从正态分布

答案:A 解析:回归分析的前提假设中,包含解释变量之间非线性相关、扰动项独立同分布,扰动项服从正态分布

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CDA LEVEL Level 回归分析 Leve EVE

沙发
逐梦的太阳 在职认证  发表于 2024-7-17 13:50:07
CDA level | 最牛复习资料:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
【更新中】CDA level | 最全备考攻略:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
最全CDA认证考试1级辅导资料:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
CDA持证人阿涛一级教材串讲系列资料:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
CDA 一级2024最新模拟题一(全网最详细有答案):https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
CDA教材《精益业务数据分析》试读下载:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
数据分析高频面试50题下载:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
35个数据分析模型下载:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css
【可下载】2024数字化人才指数报告:https://edu.cda.cn/group/4/threa ... ce=bbs-cda-exam-css

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-22 01:41