楼主: ruisi500
15324 7

[问答] 关于使用主成分分析做回归的问题 [推广有奖]

  • 0关注
  • 0粉丝

大专生

86%

还不是VIP/贵宾

-

威望
0
论坛币
33 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
232 点
帖子
10
精华
0
在线时间
109 小时
注册时间
2009-9-26
最后登录
2022-8-19

楼主
ruisi500 发表于 2010-12-11 21:32:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
为了衡量一地区的基础设施水平,本人选取了公路里程、铁路营运里程、能源消费总量、邮路总长度和长途光缆长度几个变量,想用SPSS做主成分分析得到一综合指标,然后用其作为因变量进行回归。请问用主成分分析得到的变量可以作为因变量吗?还有这一变量应如何选取,是取第一主成分,还是将所有主成分用方差贡献率进行加权?能否推荐几篇相关文章?
希望知道的能给予解答,不胜感激!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:主成分分析 主成分 基础设施 SPSS 能源消费 主成分分析 主成分分析法 spss主成分分析 逐步回归分析 多元回归分析 因子分析法 应用时间序列分析

回帖推荐

colinwang 发表于4楼  查看完整内容

一般来说principal component analysis是在covariates之间有potential collinearity的情况下使用 来通过线形变化生成多个不相关的变量用于回归 LZ选取的几个变量间的collinearity很难确定 如果说里程有潜在关系 但是能源就不好说了 这样的话很有可能需要选取多个成分来包含这些原始协变量的信息 而线性组合的成分之间也有可能出现线性关系来误导回归模型 当然具体的步骤要建立在具体的数据上 建议LZ输出这些covariates的corre ...

本帖被以下文库推荐

沙发
gdczlhd 发表于 2010-12-11 21:38:41
可以 有论文这样做。。。。。。。。。。。。

藤椅
ruisi500 发表于 2010-12-11 22:22:47
谢谢二楼的回答!
还想问下能否推荐几篇这样的文章,谢啦!

板凳
colinwang 企业认证  发表于 2010-12-12 08:39:32
一般来说principal component analysis是在covariates之间有potential collinearity的情况下使用
来通过线形变化生成多个不相关的变量用于回归
LZ选取的几个变量间的collinearity很难确定 如果说里程有潜在关系 但是能源就不好说了
这样的话很有可能需要选取多个成分来包含这些原始协变量的信息 而线性组合的成分之间也有可能出现线性关系来误导回归模型
当然具体的步骤要建立在具体的数据上
建议LZ输出这些covariates的correlation coefficients和matrix scatter plot来判断他们之间的关系
并选取潜在相关的变量做主成分分析 而独立的变量最好直接输入模型来保持信息的完成
pca会根据相关变量的个数生成主成分 一般选取1到2个主成分来包含80%以上的variance就可以了
至于对于主成分的加权 我认为应该相当小心 如果样本很小 还是不要了 以免无法满足回归的假设

报纸
ruisi500 发表于 2010-12-12 14:49:00
谢谢各位的解答,很有帮助!
但本人还有两个疑问:1、主成分分析后得到的主成分得分有正有负,用该得分作为因变量进行回归,是否需要将其全部转换为正值,如何转换?
                                      2、算主成分得分时,是用原始数据的标准化数据进行的,那么将主成分得分作为因变量进行回归时,是否需要将解释变量也进行标准化,还是有其他方法可以把主成分得分还原成与原始数据相关的指标。
望知情者给予进一步的解答,多谢了!

地板
colinwang 企业认证  发表于 2010-12-12 20:19:34
是不需要转化正负的 保持线性变换后的数值就可以
应该是用原始数据来算主成分

7
215130669 发表于 2011-11-10 13:23:23
能否理解为:荷载系数绝对值大小,反应这个影响因素对因变量的影响越大?

问题描述:滑坡受到多因素影响(断层距,加速度,上下盘,坡脚,坡高,岩性,岩体结构),我想通过主成分分析寻找上述因素对滑坡的影响大小。

我的疑问:按照常理,距离断层的距离越远,滑坡越少,为什么这里的系数为(0.812),同样,对于加速度(PGA,-0.851),为什么是负数,负数的意思是不是表示:加速度越大,滑坡越不容易。如果这样理解也和常识不符。

8
215130669 发表于 2011-11-10 13:23:36
能否理解为:荷载系数绝对值大小,反应这个影响因素对因变量的影响越大?

问题描述:滑坡受到多因素影响(断层距,加速度,上下盘,坡脚,坡高,岩性,岩体结构),我想通过主成分分析寻找上述因素对滑坡的影响大小。

我的疑问:按照常理,距离断层的距离越远,滑坡越少,为什么这里的系数为(0.812),同样,对于加速度(PGA,-0.851),为什么是负数,负数的意思是不是表示:加速度越大,滑坡越不容易。如果这样理解也和常识不符。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-22 07:22