|
一、问题描述
(3-2)分类数据的整理—Book2.xls
(28.5 KB)
各位网友好!我现在看的统计学教材是中国人大贾俊平主编的2004年7月出的第一版。今天上午,我在学习本书第三章《数据整理与展示》第二节“分类和顺序数据的整理与显示”中的第一点“频数与频数分布”时碰到了一个问题。这个问题来自于例3.2(本书第44页)如下: 一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一品牌饮料的名字记录一次。 教材提到,为了用Excel建立一张频数分布表,首先需要将不同品牌的饮料用一个数字代码来表示,比如,我们对各种品牌饮料指定的代码是: 1 可口可乐; 2 旭日升冰茶; 3 百事可乐; 4 汇源果汁; 5 露露。 然后,将各品牌的代码输入到Excel工作表中。 Excel现在把代码视为数值型数据。为建立频数分布表和条形图,Excel要求将每个品牌的代码单独作为一列,我们将代码上限输入到工作表中,这时Excel可以对数值小于或等于每一品牌代码的数据进行计数。这样,Excel提供的合计数就是各品牌的频数分布。Excel输出的结果另附图。 二、我的问题 为了使用Excel对顾客购买某一品牌饮料的频数进行统计,对各品牌指定代码是容易理解的,问题是教材中后面又突然提到代码上限,在教材中的3-10图中显示了各品牌的代码及代码上限,这里就是我理解不了的地方了,我把3-10图中的一部分表示如下: 品牌名称 代码 代码上限 旭日升冰茶 2 1 可口可乐 1 2 百事可乐 3 3 可口可乐 1 4 汇源果汁 4 5 对于这一部分,有三点让我无法理解: 第一, 旭日升冰茶的代码是2,但它的代码上限为什么是1,为什么比它的代码还小? 第二, 可口可乐的代码是1,但它的代码上限有两个,一个是2,一个是4。为什么会有两个代码上限?两个不同的代码上限分别表示什么意思? 露露的代码是5,但它没有代码上限。为什么? |