SPSS技术能为开展教育信息处理提供强有力的技术支撑,对教育信息化,教育现代化以及当前的教育改革、创新人才的培养也有重要的意义。SPSS是“社会科学统计软件包;(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件,简单实用,将其应用于教育信息处理中,能简单、快捷、准确地得到处理结果。 一、SPSS技术在教育信息处理中的使用方法
(一)统计描述。统计描述就是在教育信息处理研究过程中,借助SPSS统计功能将收集到的大量数据进行分析、综合、绘图等处理工作,从而初步描述一组数据的全貌,显示其分布特征,表现数据出现次数的频数,表示事物之间相关程度等。它不仅可以使研究者了解事物的性质,还可以利用统计结果对事物进行推断。
(二)统计检验。统计检验就是在教育信息处理研究过程中,利用SPSS检验功能对教学试验中的样本的特征数量能否反映总体特征的检验处理工作,从而确认研究结果是否具有较高的信度。
(三)量表分析。量表分析是指在教学实践中获取原始数据后,利用SPSS技术对两个或多个变量之间的相互关系、密切程度、因果关系、交互效应以及不同因素或因素的不同水平造成不同的结果等的分析。
二、SPSS技术在聚类分析中的应用
(一)系统聚类分析基本数学原理。系统聚类分析是聚类分析中应用最为广泛的一种方法。它的基本原理是:首先将一定数量的样品或指标各自看成一类,将样品最高的两类进行合并。然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,直至将所有的样品合并为一类。衡量亲疏程度的指标有两种,即距离和相似系数。距离是将每个样品看成是m个变量对应的m维空间中的一个点,然后在该空间中所定义的,距离最近,则亲密程度越高。相似系数接近于1或-1时,认为样品或指标之间的性质比较接近;相似系数接近于0时,认为样品或指标之间是无关的。常用的聚类方法主要有:最短距离法;最长距离法;中间距离法等方法。
(二)SPSS技术在聚类分析中的应用。SPSS软件有聚类分析的功能,其中包括系统聚类法、K均值聚类法、分裂法等多种方法。而系统聚类法是聚类分析中应用最为广泛的一种方法,因此,这里主要研究系统聚类分析。
三、实际案例分析
下面以一个实际的案例来说明SPSS技术在系统聚类分析中的应用。笔者利用《SPSS统计分析方法及应用》中的数据,作为例子来说明。操作步骤如下:
1、选择Analyze→Classify→Hierarchical Cluster 命令。
2、将左侧列表框中相关的变量加入到右侧Variable列表框中。在Cluster选项组中选择Cases单选按钮,在Display选项组选中Statistics复选框和Plot复选框。
3、单击Statistics按钮,在出现的对话框中选中Agglomeration schedule(群数凝聚过程)复选框,单击Continue按钮。
4、单击Plot按钮,在出现的对话框选中Dendrogram(树状图)复选框,在Icicle(冰柱图)选项组中选择All clusters单选按钮,在Orientation选项组中选择Vertical单选按钮,以呈现垂直冰柱图,单击Continue按钮
5、单击Method按钮,弹出如图5所示的对话框,在Cluster Method 下拉列表中选择默认的方法Between-groups linkage(群间联结法)选项,在Measure选项组中,选择默认的Interval单选按钮,在其右下边下拉列表会中选择Squared Euclidean distance(欧几里得直线距离平方)选项,在Transform Values选项组的Standardize下拉列表中选择Z scores选项,然后选择默认的By variable单选按钮,单击Continue按钮和OK按钮,即可得到聚类结果如表1、表2和图六所示。
表1 聚结表
Stage Cluster Combined
Cluster 1 Cluster 2 Coefficients
Stage Cluster First Appears
Cluster 1 Cluster 2 Next Stage
1 4 5 .09 0 0 3
2 1 2 .46 0 0 4
3 3 4 .89 0 1 4
4 1 3 6.28 2 3 0
表1为聚结表,表中各项的意义分别为:Stage表示聚类步骤号。Cluster Combined表示在某步中合并的个案(如第一步中第4个个案和第5个个案合并,合并以后用第一项的个案号表示生成的新类)。Coefficients表示距离或相似系数,个案之间亲密程度最高的,最先合并。Stage Cluster First Appears表示对应于各聚类步骤的参与合并的两项中,如果有一个是新生成的类,则在对应列中显示出该新类在哪一步第一次生成(如第4步中该栏第一列显示值为2,表示进行合并的两项中第一项是在第2步第一次生成的新类)。Next Stage表示对应步骤生成的新类将在第几步于其他个案或新类合并(如第一行的3表示第一步聚类生成的新类将在第3步与其他个案或新类合并)。