考点三 分布形态的测度
分布形态的测度指标包括偏态系数和标准分数。
一、偏态系数
偏态系数有关知识点
项目 主要内容
偏度 数据分布的偏斜方向和程度,描述的是数据分布对称程度
偏态
系数 测度数据分布偏度的统计量,取决于离差三次方的平均数与标准差三次方的比值
偏态系数=n/((n-1)(n-2)) ∑_1^n▒〖{离差/标准差〗}3
偏
态
系
数
的
取
值 等于0 数据的分布是对称的
偏态系数>0 分布为右偏
(1)取值在0和0.5之间,轻度右偏;
(2)取值在0.5和1之间,中度右偏;
(3)取值大于1, 严重右偏;
偏态系数<0 分布为左偏
(1)取值在0和-0.5之间,轻度左偏;
(2)取值在-0.5和-1之间,中度左偏;
(3)取值小于-1, 严重左偏;
偏态系数的绝对值越大 数据分布的偏斜程度越大
【经典例题】
【例题:2015年多选题】某企业员工年收入数据分布的偏态系数为3.0,则该组数据的分布形态为()。
A.右偏 B.左偏 C.严重倾斜 D.轻度倾斜 E.中度倾斜
【答案】AC
【解析】偏态系数等于3,说明该组数据是严重右偏。
二、标准分数(也称为“Z”分数)
一、标准分数适用及计算
在统计上,均值和标准差不同时,不同变量的数值是不能比较的,来自不同分布的变量值不可比,但是每个数值在变量分布中相对于均值的相对位置是可比的,因此可以通过计算标准分数来比较不同变量的取值。标准分数可以给出数值距离均值的相对位置。
标准分数Z=(原始分数Xi-平均分数X)÷标准差s
【例题:标准分数举例】某公司进行了两项考核,相关资料及标准分数计算如下表:
考核类别 考核A中 考核B中
均值(平均分) 80分 60分
标准差 20分 5分
张三得分 80分 80分
张三标准分数 (80-80)/20=0 (80-60)/5=4
张三在两项考核中的相对排名 中等水平 名列前茅
二、标准分数的实际应用
在实际应用中,当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例。
约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内;
约有95%的数据与平均数的距离在2个标准差之内;标准分数在【-2,2】范围内;
约有99%的数据与平均数的距离在3个标准差之内;标准分数在【-3,3】范围内;
【考点小贴士】标准分数实际应用中所涉及的标准分数和数据比例的对应关系可以简单记忆为“168、295和399”。
【经典例题】
【例题:单选题】根据经验法则,当数据从对称的钟形分布时,与平均数的距离在3个标准差之内的数据项所占比例约为( ) 。【2017年真题】
A. 99% B. 68% C. 95% D. 100%
【答案】A
【解析】本题根据“168/295/399”来选择。根据经验法则,当数据从对称的钟形分布时,与平均数的距离在3个标准差之内的数据项所占比例约为99%。
【例题:单选题】某班2017年中级经济师考试中,已知公共课考试的全班平均分为100分,标准差为10分,如果学生的考试分数服从正态分布,则依据经验法则法,可以判断成绩在80-120分之间的学生大概占全班学生的()。
A.68% B.95% C.99% D.100%
【答案】B
【解析】100-120分与平均分的差为正负2个标准差,可根据“295”选择。
考点四 变量间的相关分析
一、相关关系的分类
客观现象的相关关系可以按照不同标准来分类,具体如下表所示。
相关关系的分类
分类标准 类别 含义
相关的程度 完全相关 一个变量的取值变化完全由另一个变量的取值变化所确定,称这两个变量完全相关。如价格不变的条件下,某种商品的销售总额由其销售量决定
不完全相关 介于完全相关和不相关之间,一般的相关现象都属于不完全相关。大部分相关现象均属于不完全相关
不相关 两个变量的取值变化彼此互不影响。如股票的价格与气温的高低
相关的方向 正相关 一个变量的取值由小变大,另一个变量的取值也相应的由小变大,即两个变量同方向变化。(两个变量同方向变化)
负相关 一个变量的取值由小变大,另一个变量的取值由大变小,即两个变量反方向变化。(两个变量反方向变化)
相关的形式 线性相关 两个相关变量之间的关系大致呈现为线性关系
非线性相关 两个相关变量之间的关系近似于某种曲线方程的关系
【提示】相关关系并不等于因果关系。比如夏天雪糕和遮阳伞的销售量
【例题:单选题】 工人的工资随着劳动生产率的提高而增加,工资与劳动生产率存在( )关系。
A.正相关 B.不确定 C.不相关 D.负相关
【答案】A
【解析】两个变量同向变化,应为正相关。
二、相关系数的度量(散点图和相关系数)
(一)散点图
两变量之间的关系可以用散点图来展示,具体见下图 :
(二)相关系数
相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。相关系数的取值范围在【-1,1】之间。关于相关系数的取值含义如下表所示。
相关系数的取值含义
r的取值 两变量之间的相关关系
0<r≦+1 正线性相关
-1≦r <0 负线性相关
r=1 完全正线性相关
r=-1 完全负线性相关
r=0 不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系
|r|的取值 两变量之间的相关程度
|r|≧0.8 高度相关
0.5≦|r|<0.8 中度相关
0.3≦|r|<0.5 低度相关
|r|<0.3 相关程度极弱,可视为无线性相关关系
【考点小贴士】散点图和相关系数通常会结合在一起考核,给出散点图需要知道相关系数的大致取值范围。给出相关系数的范围也应能大致判断散点图的形状。重点考核正线性相关和负线性相关。
【经典例题】
【例题:多选题】根据变量X和变量Y的散点图,下列表述正确的是()。
A.两个变量正相关 B.两个变量不相关
C.两个变量负相关 D.两个变量线性相关
E.两个变量的相关系数大于0,小于1
【答案】ADE
【解析】从散点图上可看出,X和Y同方向变化并呈线性,所以二者正线性相关,A选项正确、D选项正确;当相关系数0<r≦+1时,两变量正相关,但因为并不是所有的点都在一条直线上,所以两变量不是完全的正相关,相关系数不能取1,因此,本题E选项正确。
【例题:单选题】变量X和变量Y的Pearson相关系数r=-1,这说明变量X和变量Y间的相关关系是( )。
A. 完全负线性相关 B. 低度线性相关
C. 完全正线性相关 D. 不存在线性相关
【答案】A
【解析】r=-1表示两变量完全负线性相关关系。
【例题:2015年单选题】根据2014年某城市金融业和制造业各1000人的年薪样本数据来比较这两个行业从业人员年薪的离散程度,应采用的统计量是( )。
A.标准分数 B.相关系数 C.变异系数 D.偏态系数
【答案】C
【解析】本题通过题干中的“离散程度”判断应选择反应离散程度的指标。离散系数也称为变异系数,消除了测度单位和观测值水平不同的影响
【第24章重要知识点总结】


雷达卡





京公网安备 11010802022788号







