楼主: 胖胖小龟宝
4783 2

[其他] 集中趋势——位置平均数 [推广有奖]

大师

21%

还不是VIP/贵宾

-

TA的文库  其他...

龟宝的档案室

威望
3
论坛币
793110 个
通用积分
21961.2355
学术水平
2211 点
热心指数
2133 点
信用等级
1424 点
经验
978980 点
帖子
10001
精华
25
在线时间
4757 小时
注册时间
2012-7-27
最后登录
2020-12-21

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

位置平均数,就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观的代表性,因此,常用来反映分布的集中趋势。常用的众数、中位数。

一、众数(Mode)

(一)众数的含义

某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场某季度男皮鞋的销售情况,得到资料如表5–7。

表5–7 某商场某季度男皮鞋销售情况

男皮鞋号码/厘米

销售量/双

24.0

12

24.5

84

25.0

118

25.5

541

26.0

320

26.5

104

27.0

52

合计

1200

从表5–7可以看到,25.5厘米的鞋号销售量最多,如果我们计算算术平均数,则平均号码为25. 65厘米,而这个号码显然是没有实际意义的,而直接用25.5厘米作为顾客对男皮鞋所需尺寸的集中趋势既便捷又符合实际。

统计上把这种在一组数据中出现次数最多的变量值叫做众数。用Mo表示。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。上面的例子中,鞋号25. 5厘米就是众数。

(二)众数计算

注:Excel函数MODE是计算众数的现成工具,参见Excel帮助。表5-7不是原始数据,而是经过预处理的数据,每个尺码的数量都统计出来了。MODE函数针对的是原始数据,比如5-7的数据就应该是84个24.5;118个25.0……总共1200个数据。

由品质数列和单项式变量数列确定众数比较容易,哪个变量值出现的次数最多,它就是众数,如上面的两个例子。

若所掌握的资料是组距式数列,则只能按一定的方法来推算众数的近似值。计算公式为:

(5–7)

式中: L——众数所在组下限;

U——众数所在组上限;

Δ1——众数所在组次数与其下限的邻组次数之差;

Δ2——众数所在组次数与其上限的邻组次数之差;

d——众数所在组组距。

例5–8 根据表5–2的数据,计算50名工人日加工零件数的众数。

解:从表5–2中的数据可以看出,最大的频数值是14,即众数组为120~125这一组,根据公式(5–7)得50名工人日加工零件的众数为:

或:

众数是一种位置平均数,是总体中出现次数最多的变量值,因而在实际工作中有时有它特殊的用途。诸如,要说明一个企业中工人最普遍的技术等级,说明消费者需要的内衣、鞋袜、帽子等最普遍的号码,说明农贸市场上某种农副产品最普遍的成交价格等,都需要利用众数。但是必须注意,从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在;如果有两个最高峰点,也可以有两个众数。只有在总体单位比较多,而且又明显地集中于某个变量值时,计算众数才有意义。

(三)众数特点

1.众数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,它不受分布数列的极大或极小值的影响,从而增强了众数对分布数列的代表性。

2.当分组数列没有任何一组的次数占多数,也即分布数列中没有明显的集中趋势,而是近似于均匀分布时,则该次数分配数列无众数。若将无众数的分布数列重新分组或各组频数依序合并,又会使分配数列再现出明显的集中趋势。

3.如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,而下一组的次数较少,则众数在众数组内会偏向该组下限;如果与众数组比邻的上一组的次数较少,而下一组的次数较多,则众数在众数组内会偏向该组上限。

4.缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。

二、中位数(Median)

(一)中位数的含义

中位数是将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据就是中位数。中位数用Me表示。

从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

(二)中位数的计算

注:Excel函数MEADIAN是计算中位数的现成工具,在Excel里称为中值,参见Excel帮助。

确定中位数,必须将总体各单位的标志值按大小顺序排列,最好是编制出变量数列。这里有两种情况:

1.对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为:

则中位数就可以按下面的方式确定:

(5–8)

例如,根据例5–2的数据,计算50名工人日加工零件数的中位数。中位数的位置在(50+1)/2 = 25.5,中位数在第25个数值(123)和第26个数值(123)之间,即Me = (123+123)/2=123(件)。

2.由分组资料确定中位数

由组距数列确定中位数,应先按的公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。

(5–9)

式中: Me——中位数;

L——中位数所在组下限;

U——中位数所在组上限;

fm——为中位数所在组的次数;

——总次数;

d——中位数所在组的组距;

Sm–1——中位数所在组以下的累计次数;

Sm+1——中位数所在组以上的累计次数。

例5–9 根据例5–2的数据,计算50名工人日加工零件数的中位数。

解:

表5–8 某企业50名工人加工零件中位数计算表

按零件数分组(个)

频数(人)

向上累计(人)

向下累计(人)

105~110

110~115

115~120

120~125

125~130

130~135

135~140

3

5

8

14

10

6

4

3

8

16

30

40

46

50

50

47

42

34

20

10

4

由表5–8可知,中位数的位置 = 50/2 = 25,即中位数在120~125这一组,L = 120,Sm–1 = 16,U=125,Sm+1=20,fm = 14,d = 5,根据中位数公式得:

(三)中位数特点

1.中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。

2.有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。

3.缺乏敏感性。

三、众数、中位数和算术平均数的比较

(一)众数、中位数和算术平均数的关系

算术平均数、众数和中位数之间的关系与次数分布数列有关。在次数分布完全对称时,算术平均数、众数和中位数都是同一数值,见图5–1;在次数分布非对称时,算术平均数、众数和中位数不再是同一数值了,而具有相对固定的关系。在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大,见图5–2;在尾巴拖在左边的负偏态(或左偏态)分布中,众数最大,中位数适中,算术平均数最小,见图5–3。

图5–1

图5–2

图5–3

在统计实务中,可以利用算术平均数、中位数和众数的数量关系判断次数分布的特征。此外还可利用三者的关系进行相互之间估算。根据经验,在分布偏斜程度不大的情况下,不论右偏或左偏,三者存在一定的比例关系,即众数与中位数的距离约为算术平均数与中位数的距离2倍,用公式表示为:,由此可以得到三个推导公式:

(二)应用

众数、中位数和算术平均数各自具有不同的特点,掌握它们之间的关系和各自的特点,有助于我们在实际应用中选择合理的测度值来描述数据的集中趋势。

众数是一种位置代表值,易理解,不受极端值的影响。任何类型的数据资料都可以计算,但主要适合于作为定类数据的集中趋势测度值;即使资料有开口组仍然能够使用众数。众数不适于进一步代数运算;有的资料众数根本不存在;当资料中包括多个众数时,很难对它进行比较和说明,应用不如算术平均数广泛。

中位数也是一种位置代表值,不受极端值的影响;除了数值型数据,定序数据也可以计算,而且主要适合于作为定序数据的集中趋势测度值,而且开口组资料也不影响计算。中位数不适于进一步代数运算,应用不如算术平均数广泛。

算术平均数的含义通俗易懂,直观清晰;全部数据都要参加运算,因此它是一个可靠的具有代表性的量;任何一组数据都有一个平均数,而且只有一个平均数;用统计方法推断几个样本是否取自同一总体时,必须使用算术平均数;具有优良的数学性质,适合于代数方法的演算。算术平均数是实际中应用最广泛的集中趋势测度值,主要适合于作为定距和定比数据的集中趋势测度值;最容易受极端值的影响;对于偏态分布的数据,算术平均数的代表性较差;资料有开口组时,按相邻组组距计算假定性很大,代表性降低。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:集中趋势 平均数 excel函数 median EXCEL 集中趋势 中位数 众数 平均数

已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
xddlovejiao1314 + 100 + 5 + 5 + 5 精彩帖子
fantuanxiaot + 5 + 1 精彩帖子

总评分: 经验 + 100  论坛币 + 5  学术水平 + 5  热心指数 + 5  信用等级 + 6   查看全部评分

本帖被以下文库推荐

沙发
xddlovejiao1314 学生认证  发表于 2015-8-2 11:01:10 |只看作者 |坛友微信交流群
好贴,谢谢分享。

使用道具

藤椅
tianwk 发表于 2019-4-22 00:19:07 |只看作者 |坛友微信交流群
thanks for sharing

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 21:54