楼主: HN-yifan
13711 12

[统计软件与数据分析] 关于主成分分析--方法是否适用 [推广有奖]

  • 2关注
  • 3粉丝

已卖:1636份资源

博士生

74%

还不是VIP/贵宾

-

威望
0
论坛币
8087 个
通用积分
5.6450
学术水平
11 点
热心指数
19 点
信用等级
6 点
经验
49495 点
帖子
203
精华
0
在线时间
386 小时
注册时间
2013-6-23
最后登录
2022-8-27

楼主
HN-yifan 发表于 2015-3-20 11:30:06 |AI写论文
200论坛币

1.现在有31个省会城市 10年的 20个各项经济发展指标
2.要对中国城市的经济发展状况做分析,目的是找到影响中国经济发展状况的因素(或因素集)
3.问题:是否可以用主成分分析
              1.若不能用,该用什么方法
              2.若能用,是用一年的数据分析31市的20个指标,还是用各指标31市的均值做10年的分析                3.若两种都可以分析,那个代表性更好




答谢:回帖回复,自己上传多个标价均为10币的随机文件(如空白word),看回复情况购买数量,最高10*10=100币/人。
谢谢!



关键词:主成分分析 主成分 中国经济发展 经济发展 发展状况 主成分 统计 悬赏
Nothing is impossible!

沙发
陌上花开ideal 发表于 2015-3-20 15:40:01
可以的,对20个经济指标做主成分分析即可。
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

藤椅
HN-yifan 发表于 2015-3-20 16:02:04
陌上花开ideal 发表于 2015-3-20 15:40
可以的,对20个经济指标做主成分分析即可。
那是做31个市某年的地区比较,还是31市均值的10年比较?
(请上传空白文档,设置标价)

板凳
HN-yifan 发表于 2015-3-20 16:02:14
陌上花开ideal 发表于 2015-3-20 15:40
可以的,对20个经济指标做主成分分析即可。
那是做31个市某年的地区比较,还是31市均值的10年比较?
(请上传空白文档,设置标价)

报纸
陌上花开ideal 发表于 2015-3-20 16:29:10
HN-yifan 发表于 2015-3-20 16:02
那是做31个市某年的地区比较,还是31市均值的10年比较?
(请上传空白文档,设置标价)
找影响中国经济的主要因素不需要再分省市了吧,直接对整体的做不就好了吗
已有 1 人评分论坛币 热心指数 收起 理由
HN-yifan + 2 + 1 热心帮助其他会员

总评分: 论坛币 + 2  热心指数 + 1   查看全部评分

地板
悠游的快乐 学生认证  发表于 2015-3-20 16:36:22
可以用主成分分析,用31个市某一年的20个经济指标进行分析,找出其中特征值较高的指标,就是对经济影响较大的因素。如果有10年的数据,可以求均值做主成分分析,得出10年内平均影响较大的经济指标。但是我认为,10年时间影响经济的指标应该不会完全一样吧,有可能不同年份由于宏观环境、政策的不同,导致影响经济的主要指标不同。也可以每一年做一次主成份分析,得出每年的主要影响指标,进行对比分析,内容更充实一点。不过我没有用具体数据做过这样的分析,只是推测10年时间影响因素会不完全一样,可以用实际数据验证一下,反正你已经有数据了,操作过程也不是非常麻烦
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
HN-yifan + 5 + 1 + 2 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 2   查看全部评分

7
vivi121 发表于 2015-3-20 20:33:44
你已经有10年的20个指标数据了,如果做一个年份的话可能会显得太单薄了,可以根据有特殊拐点的年份,对两到三个结点年份做主成分分析,或者做面板回归分析
已有 1 人评分论坛币 热心指数 收起 理由
HN-yifan + 2 + 1 精彩帖子

总评分: 论坛币 + 2  热心指数 + 1   查看全部评分

8
谁zhu沉浮 发表于 2015-3-20 21:28:42
变异系数法、熵权法、层次分析法不都是多指标评价的方法嘛,干嘛非要用主成分分析?而且主成分分析对指标的要求相对较高,你的KMO和巴特莱特球形检验不一定能够通得过啊亲
已有 1 人评分论坛币 热心指数 收起 理由
HN-yifan + 3 + 1 精彩帖子

总评分: 论坛币 + 3  热心指数 + 1   查看全部评分

9
maeswnc 发表于 2015-3-21 01:41:10
样本量小于变量个数,可以尝试使用sparse PCA 方法做,选出重要的变量,详见 zhouhui 的sparse PCA
已有 1 人评分论坛币 热心指数 收起 理由
HN-yifan + 3 + 1 精彩帖子

总评分: 论坛币 + 3  热心指数 + 1   查看全部评分

10
superlaw 发表于 2015-3-21 09:43:05
不适合用主成分分析,原因如下:当你使用主成分分析的时候,你实际做了一个假设,就是这31个省份,十年间的数据都是相互独立的,你做出来的PCA数据抹掉了省份和年份的差别,做出来PCA结论相当有问题。但是实际上的前提并不是独立的,为什么这么说了,我们直观上来说,你是希望研究总体来说,哪一项指标是真正影响全国的十年来增长的原因。
所以我建议你使用回归来做
GDP~ Province(哑变量) + Year(离散数值变量) + 其他变量(建议对变量可以先做一下归一化处理,保证最后得到的回归系数可以比较影响力)。
这样你得到的其他变量的权重就是对gdp最大的影响因子。同时你又可以通过获得总体而言,随着时间推移,GDP的总体趋势。再加上省份哑变量的系数,你又可以推断出各省之间的区别。

如果你把Year也当成哑变量处理,你就可以获得面板数据,但是结果分析起来有点麻烦,你数据量也未必够,还是不要弄了,就当离散数值变量处理就可以。
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
admin_kefu + 50 热心帮助其他会员
HN-yifan + 5 + 1 + 1 精彩帖子

总评分: 论坛币 + 55  学术水平 + 1  热心指数 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 07:29