楼主: johnmy
20202 8

[实际应用] 主成分分析中各指标的贡献率超过多少才重要 [推广有奖]

  • 2关注
  • 5粉丝

已卖:702份资源

讲师

37%

还不是VIP/贵宾

-

威望
0
论坛币
6961 个
通用积分
93.6701
学术水平
42 点
热心指数
55 点
信用等级
20 点
经验
8631 点
帖子
563
精华
0
在线时间
374 小时
注册时间
2008-4-10
最后登录
2026-1-2

楼主
johnmy 发表于 2017-7-6 09:02:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在factoextra包中对贡献率有一个绘图。图中有参考线,高于此线的认为变量是显著的,有没有哪位知道这个线的值是多少,随着变量的多少这个值是不同的。




  1. library(factoextra)
  2.     library(FactoMineR)
  3.     df <- decathlon2[1:23, 1:10]
  4.     res.pca <- PCA(df,  graph = FALSE)
  5.     fviz_contrib(res.pca, choice = "var", axes = 1, top = 10)
复制代码
包的帮助中说了这个参考线,但没说这个线对应的值是多少:
A reference dashed line is also shown on the barplot. This reference line corresponds to the expected value if the contribution where uniform. For a given dimension, any row/column with a contribution above the reference line could be considered as important in contributing to the dimension.




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


学习R

沙发
johnmy 发表于 2017-7-6 20:40:13
在函数的原文件中找到了答案。

是100/length(contrib)
也就是100除以变量个数

藤椅
foozhencheng 学生认证  发表于 2017-7-9 03:03:22 来自手机
感觉这个并没有一定道理,相当于强行规定只有本征值大于100的才视为重要,然而实际数据并不见得要满足这一条件~

板凳
foozhencheng 学生认证  发表于 2017-7-9 03:04:37 来自手机
不对,我再看一下~

报纸
foozhencheng 学生认证  发表于 2017-7-9 03:09:02 来自手机
等价于本征值大于1

地板
lww1993 发表于 2017-7-11 14:44:40
假定有k个变量,主成分分析中选择主成分个数一般有两个标准:
一是单个主成分的贡献率大于1/k,也就是说变换后,单个主成分所含信息不小于变换之前的每个变量;
你刚好有10个变量,所有需要贡献率大于10%;
二是累积贡献率大于80%。

7
fortune9 发表于 2017-7-14 07:01:35
函数中文档中已经说明了,那个dashed line是贡献的平均值,高于这个线表示某个变量的贡献大于平均水平。至于重不重要,那是另一个问题。即使一个变量的贡献小于平均值,在一定意义上也是重要的。

8
johnmy 发表于 2017-9-15 15:57:22
谢谢大家了

9
318127803 发表于 2021-4-11 15:02:45
lww1993 发表于 2017-7-11 14:44
假定有k个变量,主成分分析中选择主成分个数一般有两个标准:
一是单个主成分的贡献率大于1/k,也就是说变 ...
你好,请问这种有可参考的专著或文献吗 求分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-16 12:35