变量测量类型:
SPSS区分三种测量类型:名义测量、次序测量与标度测量(scale measurement)。其中标度测量(scale measurement)包括间距测量与比率测量。
a、名义测量(normial measurement)是最低的一种测量等级,也称定名测度。其数值仅代表某些分类或属性。比如,用来表示性别(1或2)、民族(1、2、3…)等。这类变量一般不做高低大小区分。
对这种类别的处理常用的方法是卡方分析,主要用于度量不同分类间的关联程度。与此模型息息相关的是对数线性模型,它主要是通过线性方程来对已经进行对数转换后的联合概率进行回归,不过对数线性模型只在分类水平或分类特别庞大的时候其价值才能淋漓精致的发挥出来,否则我们一般常用logistic回归分析。在此模型后,更进一步的是潜在类别分析,其基本的原理是对概率和对数均参数化进行估计。
其他相关性的度量可以使用名义相关性指标,诸如常用的是相依系数、不确定系数。
对应分析也是常用的分类变量间的分析技术,主要以图形来呈现结果。很清晰,很难提供相关关系的假设检验。
b、次序测量(ordinal measurement)的量化水平高于名义测度,用于的测量的数值代表了一些有序分类。例如用于表示受教育程度高低的数字(1,2,3…),具有一定的顺序性。
对这种类别的处理常用的方法是方差分析及其均值趋势、非参检验、有序相关性指标(gamma系数、kendall系数)。其中最常用是非参检验的方法,这是一个大类的方法群,里面很多的算法都可以用,以秩和检验为代表。
c、间距测量(interval measurement)的量化程度更高一些,它的取值不再是类的编码,而是采用一定单位的实际测量值。可以进行加减运算,但不能进行乘除运算,因为测度等级的变量所取的0值不是物理上的绝对0。比如考试成绩的0。
d、比率测量(ratio measurement)是最高级的测量等级,他除了具有间距测度等级的所有性质外,其0值具有物理上的绝对意义,而且可以进行加减乘除运算。例如增长率。(本期-前期)/前期。
由于c、d这两种测度在spss或其他统计软件里均不做细致的区分,大部分的模型均适用,他们使用的方法也基本相同,只是在很特殊的情况下,才做区分。例如在使用一些交互模型或高阶模型时需要考虑一下所得样本数据的测量等级,因为统计模型里一般是用变量的相加来表示线性,用相乘或高次来表示非线性。