以下单词皆来自《结构方程模型原理及AMOS应用》林嵩著,华中师范大学出版社
这本书的感觉基本上就是……作者在念博士写论文的时候记的笔记加点相关背景就成稿了……但是很实用很靠谱有木有!
general linear model:一般线性模型
一般线性模型(the General Linear Model, GLM)是一个统计学上常见的线性模型。这个模型在计量经济学的应用中十分重要。其公式一般写为:Y=XB+U,其中Y是一个包含反应变量的矩阵。X是一个包含独立自变量的设计矩阵。B是一个包含多个估计参数的矩阵。U 是一个包含误差和剩余项的矩阵。
iterative method:迭代法
迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程,跟迭代法相对应的是直接法,即一次性解决问题。迭代法又分为精确迭代和近似迭代。“二分法”和“牛顿迭代法”属于近似迭代法。迭代算法是用计算机解决问题的一种基本方法。它利用计算机运算速度快、适合做重复性操作的特点,让计算机对一组指令(或一定步骤)进行重复执行,在每次执行这组指令(或这些步骤)时,都从变量的原值推出它的一个新值。
observed variable: 观测变量
measured variable:测量变量
manifest variable:外显变量
latent variable:潜变量
潜变量是指不能被直接精确观测或虽能被观测但尚需通过其它方法加以综合的指标,是在记录单元之间变化且其变化影响记录特征的任何未记录到的特征.结果是记录特征之间的联系,这种联系实际上并不是由记录特征本身的任何因果关系产生的。在结构方程模型中包括两种主要变量:潜变量(Latent Variable),显变量(Manifest Variable)。潜变量是实际工作中无法直接测量到的变量,包括比较抽象的概念和由于种种原因不能准确测量的变量。一个潜变量往往对应着多个显变量,可以看做其对应显变量的抽象和概括,显变量则可视为特定潜变量的反应指标。
posteriori:事后型
prioi:事前型
exploratory factor analysis:探索性因子分析
探索性因子分析是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。对于主因子分析法来说,不存在异常值、等距值、线形值、多变量常态分配以及正交性等情况。
一个典型的EFA流程如下:
1、辨认、收集观测变量。
2、获得协方差矩阵(或Bravais-Pearson的相似系数矩阵)
3、验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett球型测验、反图像协方差矩阵、KMO测度)。
4、选择提取因子法(主成分分析法、主因子分析法)。
5、发现因素和因素装货。因素装货是相关系数在可变物(列在表里)和因素(专栏之间在表里)。
6、确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。
7、解释提取的因子(例如,在上述例子中即解释为“潜在因子”和“流程因子”)。
探索性因子分析法的优点
1、EFA法便于操作。
2、当调查问卷含有很多问题时,EFA法显得非常有用。
3、EFA法既是其他因子分析工具的基础(如计算因子得分的回归分析),也方便与其他工具结合使用(如验证性因子分析法)。
探索性因子分析法的缺点
1、变量必须有区间尺度。
2、沉降数值至少要要变量总量的3倍。
confirmatory factor analysis:验证性因子分析
验证性因子分析是对社会调查数据进行的一种统计分析。它测试一个因子与相对应的测度项之间的关系是否符合研究者所设计的理论关系。
探索性因子分析和验证性因子分析的差异之处
1.基本思想不同:探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以试图揭示一套相对比较大的变量的内在结构。而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力,以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预期一致。
2.应用前提不同:探索性因子分析没有先验信息,而验证性因子分析有先验信息。
3.理论假设不同:探索性因子分析的假设主要包括:
①所有的公共因子都相关(或都不相关);
②所有的公共因子都直接影响所有的观测变量;
③ 特殊(唯一性)因子之间相互独立;
④ 所有观测变量只受一个特殊(唯一性)因子的影响;
⑤ 公共因子与特殊因子(唯一性)相互独立。
验证性因子分析克服了探索性因子分析假设条件约束太强的缺陷,其假设主要包括:
① 公共因子之间可以相关,也可以无关;
② 观测变量可以只受一个或几个公共因子的影响,而不必受所有公共因子的影响;
③特殊因子之间可以相关,还可以出现不存在误差因素的观测变量;
④ 公共因子与特殊因子之间相互独立。
4.分析步骤不同 :探索性因子分析主要有以下七个步骤:① 收集观测变量② 构造相关矩阵③确定因子个数④ 提取因子⑤ 因子旋转⑥解释因子结构⑦计算因子得分。
验证性因子分析主要有以下六个步骤:① 定义因子模型② 收集观测值③获得相关系数矩阵④ 拟合模型⑤ 评价模型⑥修正模型。
5.主要应用范围不同:探索性因子分析主要应用于三个方面:①寻求基本结构,解决多元统计分析中的变量间强相关问题;② 数据化简;③发展测量量表。验证性因子分析主要应用于以下三个方面:① 验证量表的维度或面向性,或者称因子结构,决定最有效因子结构;② 验证因子的阶层关系;③ 评估量表的信度和效度。
local independence:区域独立性
non-deterministic function of observed variable:观测函数的不可决定性
downstream variable:下游变量
upstream variable:上游变量
mediator :中介变量
error: 残差项
残差项:真实值与估计值之间的差
uniqueness: 独特量
constrained parameter: 限定参数
model identification: 模型识别
just-identified :恰好识别
underidentified: 识别不足
overidentified: 过度识别
the number of data points: 数据资料点数目
recursive rule: 递归法则
equivalent mode: 等价模型
population: 总体
simple random sampling: 简单随机抽样
简单随机抽样:一般地,设一个总体含有N个个体,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,则这样的抽样方法叫做简单随机抽样。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
stratified sampling: 分层抽样
分层抽样:分层抽样,也叫类型抽样。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
multi-stage sampling: 多级抽样
多级抽样:又叫多阶段抽样,在很多情况下,特别是复杂的、大规模的市场调查中,调查单位一般不是一次性直接抽取到的,而是采取两阶段或多阶段抽取的办法,即先抽取大的单元,在大单元中再选取小单元,再在小单元中选取更小的单元,这种抽样方式称为多级抽样。多级抽样可以把上述各抽样方法的优势互补,因此大规模现况研究多采用此方法。
cluster sampling: 整群抽样
整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
systematic sampling: 系统抽样
等距抽样也称为系统抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。特点是:抽出的单位在总体中是均匀分布的,且抽取样本可少于纯随机抽样。
accidental sampling: 偶遇抽样
偶遇抽样又称为便利抽样,是指研究者根据实际情况,为方便开展工作,选择偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。例如在广场选择对来往行人进行调查。
judgmental sampling: 判断抽样
判断抽样又称“立意抽样”,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法。
snowball sampling: 雪球抽样
滚雪球抽样是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。
scale: 量表
semantic differential: 语意区别
Likert scale: 李克特/态度量表
skewness: 偏度
偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
kurtosis: 峰度
峰度:又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了顶的尖锐程度。
missing completely at random:完全随机缺失
missing at random: 随机缺失
nonignorable: 非随机缺失
listwise deletion: 列表删除
casewise deletion: 样本删除
pairwise deletion: 配对删除
expectation maximization: 期望最大化
sample realization: 样本合理性
independent model: 独立模型
baseline mode: 基线模型
noncentral chi-squared distribution: 非中心化卡方分布