楼主: spssau
171 0

[数据挖掘理论与案例] 因子分析全流程汇总 [推广有奖]

  • 0关注
  • 34粉丝

教授

22%

还不是VIP/贵宾

-

威望
0
论坛币
165 个
通用积分
1001.5595
学术水平
20 点
热心指数
22 点
信用等级
20 点
经验
16842 点
帖子
535
精华
0
在线时间
636 小时
注册时间
2018-1-14
最后登录
2024-4-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

探索性因子分析(以下简称因子分析),是毕业论文中常用的数据分析方法,用于研究多个变量之间的关系,并通过提取公共因子来简化数据集。

信息浓缩是因子分析最常见的应用,除此之外,因子分析还可以进行综合竞争力分析、量表结构效度分析、因子权重计算、指标权重计算、共同方法偏差检验等,今天一文讲解因子分析的这六类应用,方法用对了,你的论文绝对能够轻松完成。

一、信息浓缩

使用因子分析进行信息浓缩,即将分析项浓缩成几个因子,使用这几个因子能够代表所有分析项的大部分信息,得到因子后可以进行后续如回归分析等。因子分析进行信息浓缩的步骤如下:

1、指标数据标准化处理

由于指标数据性质不同,具有不同的数量级和量纲,会导致分析结果不准确或产生误差。因此,先对原始数据进行标准化处理
SPSSAU因子分析将自动进行标准化处理,因此不需要再对数据进行处理。标准化计算公式:(X-Mean)/ Std
SPSSAU进行因子分析软件操作如下图:

2、因子分析适用性检验

进行因子分析的前提是数据适合使用该方法,通常采取KMO检验和Bartlett球形检验。KMO检验用于检查变量间的相关性,取值为0~1。KMO值越接近于1,变量间的相关性越强,一般KMO值大于0.6即可进行因子分析。Bartlett球形检验用于检验变量是否各自独立,通常显著性小于0.05时,说明符合标准,适合做因子分析。
本案例输出KMO和Bartlett球形检验结果如下:

从结果来看,KMO值为0.722大于0.6,所以可以进行因子分析。同时Bartlett球形检验结果显示p值小于0.05,可以进行因子分析。

3、提取公因子

默认以特征根大于1为标准提取公因子(也可主动选择公因子个数),SPSSAU得到各因子的特征根以及方差解释率见下表:

分析上表可知,特征根大于1的因子共有两个,说明本次分析提取2个公因子。这2个公因子的累计方差解释率为78.808%,第一个因子的方差解释率为41.346%,第二个因子的方差解释率为37.462%,说明提取的两个公因子能够代表原来6个铁路运输能力指标78.808%的信息,整体来看信息变量丢失较少,因子分析效果比较理想。

另外,从特征根的碎石图可以更为直观的看出拟提取的公因子。如上图,前两个因子的让特征根值均大于1,且曲线比价陡峭,剩下4个特征根值均小于1且特征根值曲线逐渐变得比较平缓,即提取前2个因子可以代表所有原始铁路运输指标的绝大部分信息,与方差解释率得到结果一致。

  1. 公因子命名与解释

找到公因子后,为了理解公因子的实际意义以及方便对问题进行分析,需要继续进行因子旋转。旋转常用方法为最大方差法。旋转后的因子载荷矩阵可以直观反映各个变量对主成分的贡献程度,一个变量在某个公因子上的载荷系数的绝对值越大,说明变量与该公因子越具有相关性。
下表为使用最大方差法进行旋转后得到的因子载荷系数表格:

分析上表可知,因子1在铁路货运总量、铁路营业里程、铁路货物总周转量上具有较大的载荷,因此这3个变量归为一类命名为货运因子(记作F1)。因子2在铁路客运量、铁路旅客周转量、铁路运输职工人数上具有较大的载荷,因此这3个变量归为另一类命名为客运因子(记作F2)

5、计算因子得分

确定因子后,进一步计算各因子得分,SPSSAU输出成份得分系数矩阵如下:

根据成份得分系数矩阵,得到公因子F由变量X表示线性组合的因子得分函数:
F1(货运因子)=-0.203Z铁路客运量-0.178Z铁路旅客周转量+0.537Z铁路货运总量+0.294Z铁路营业里程+0.333Z铁路货物总周转量+0.135Z铁路运输职工人数F2(客运因子)=0.506Z铁路客运量+0.488Z铁路旅客周转量-0.321Z铁路货运总量+0.025Z铁路营业里程-0.014Z铁路货物总周转量+0.197Z铁路运输职工人数
这一过程可通过手算完成,但要注意使用的是标准化后的数据代入公式。使用SPSSAU进行因子分析前,勾选【因子得分】,会自动保存公因子得分,如下图:

因子得分可用于进一步分析,比如聚类分析,回归分析使用等。以上即为使用因子分析进行信息浓缩的全流程。接下来介绍如何使用因子分析的“综合得分”进行综合竞争力分析

二、综合竞争力分析

如果使用因子分析的目的在于进行综合竞争力分析,比如银行的绩效排名,上市公司竞争力排名等,此时可计算综合得分,用于竞争力排名。
接上述因子分析案例,将指标数据代入因子表达式,计算综合得分,分析结果并进行综合竞争力分析。即以2个公因子得分为基础,再以每个因子的方差解释率为权数进行线性加权平均,最后得到一个综合得分模型:

注:分子为两个公因子旋转后方差解释率,分母为旋转后累计方差解释率。勾选【综合得分】后,SPSSAU将自动保存综合得分,结果见下图:

得到综合得分后,可将数据下载至本地,使用Excel对综合得分进行排序,该排名就代表了31个省份的铁路运输能力的综合竞争力。以上即为因子分析进行综合竞争力分析的全过程。

接下来介绍因子分析进行量表结构效度分析

三、量表结构效度分析

效度用于测量量表设计是否合理,结构效度通过因子分析方法进行检验。研究人员心中预期着变量与题项对应关系,进行因子分析后,因子与题项对应关系二者预期基本一致时,则说明具有良好的结构效度。

例如:在林岩星《视频网站用户付费意愿影响因素研究》这篇论文中,研究者使用SPSSAU探索性因子分析进行问卷的结构效度研究。

四、因子权重计算

因子分析提取出公因子后,如果想计算各个因子的权重值,可以使用旋转后方差解释率进行因子权重分析
查看因子分析的 “ 方差解释率 ” 表格,计算因子权重只需要看两个值——各个公因子旋转后方差解释率和旋转后累计方差解释率。如下表:

归一化:旋转后方差解释率 / 旋转后累计方差解释率,即可得到各因子权重:因子1权重=41.346%/78.808%=0.525因子2权重=37.462%/78.808%=0.475

五、指标权重计算

**各个指标项的权重也可以使用SPSSAU因子分析得到。**SPSSAU系统在进行因子分析时,自动输出线性组合系数及权重计算结果,找到此表,最后一列即输出各个指标的权重值。

上表涉及的各指标计算公式如下:

  • 线性组合系数=载荷系数 / 对应特征根的平方根
  • 综合得分系数=累积(线性组合系数*方差解释率)/ 累计方差解释率
  • 权重=归一化综合得分系数

虽然计算公式看起来比较复杂,但SPSSAU进行分析时可直接得到计算结果,无需手动计算。

六、共同方法偏差检验

共同方法偏差(Common Method Bias,简称CMB或CMV)是一种系统误差,它源于数据收集过程中使用的相同或相似的测量方法、评分者、测量环境、项目语境以及项目本身特征等因素,导致预测变量与效标变量之间出现人为的共变。这种偏差可能会对研究结果产生严重的混淆,并对结论产生潜在的误导。
共同方法偏差可以使用Harman单因子检验法——将所有指标放在一个因子下进行因子分析,如果该因子的方差解释率低于40%(常见标准),则认为研究数据并不存在严重的共同方法偏差,反之,则认为存在共同方法偏差
SPSSAU因子分析进行共同方法偏差检验操作如下:

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:因子分析 Bartlett 探索性因子分析 Bartle Common

www.spssau.com
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 00:01