楼主: 心晴923
6974 13

[问答] 求大神帮忙解答,sas做主成分分析!! [推广有奖]

  • 4关注
  • 0粉丝

本科生

13%

还不是VIP/贵宾

-

威望
0
论坛币
955 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2445 点
帖子
43
精华
0
在线时间
94 小时
注册时间
2015-1-7
最后登录
2020-2-25

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在进行主成分分析的时候,proc princomp data=w 这个数据集该用原始数据,标准化后的数据?
另外在求主成分得分的时候,也就是求综合得分过程中的一部分,该带入原始数据还是标准化数据,还是应该对应带入。鄙人几种情况都试过,结果都不一样!求赐教!!!感激不尽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:主成分分析 主成分 princomp 主成分得分 标准化数据

回帖推荐

letsgoaway 发表于10楼  查看完整内容

noprint参数我没怎么用过,不过推了一下,加上这个参数的话相关矩阵的计算应该就不一样了, 我们正常的相关系数是用这个公式计算的。 但是加noprint参数,主成分相关矩阵的计算是用下面这个公式算的,是未校正的相关矩阵。 加上noprint参数后,SAS过程结果会有“未校正的相关矩阵”、“未校正的相关矩阵的特征值” 我们一般用的都是正常的那个相关系数。
沙发
letsgoaway 发表于 2016-1-17 16:57:05 |只看作者 |坛友微信交流群
主成分经常会采用将变量标准化的方法,
因为在实际问题中,不同的变量往往有不同的量纲,而主成分的求解过程中总是优先考虑方差大的变量,量纲不一样影响可大可小,所以标准化之后效果会更好点。

使用道具

藤椅
心晴923 学生认证  发表于 2016-1-20 23:08:47 |只看作者 |坛友微信交流群
letsgoaway 发表于 2016-1-17 16:57
主成分经常会采用将变量标准化的方法,
因为在实际问题中,不同的变量往往有不同的量纲,而主成分的求解过 ...
主成分分析时,sas是不是会将数据自动标准化,求主成分得分?

使用道具

板凳
letsgoaway 发表于 2016-1-21 15:54:04 |只看作者 |坛友微信交流群
princomp过程后面有个参数可以选的,自己可以决定要不要标准化

使用道具

报纸
心晴923 学生认证  发表于 2016-1-21 20:11:54 |只看作者 |坛友微信交流群
letsgoaway 发表于 2016-1-21 15:54
princomp过程后面有个参数可以选的,自己可以决定要不要标准化
请问具体的选项语句?拜托~

使用道具

地板
letsgoaway 发表于 2016-1-21 21:28:34 |只看作者 |坛友微信交流群
心晴923 发表于 2016-1-21 20:11
请问具体的选项语句?拜托~
我试了一下,SAS的princomp过程会自己标准化的,你开始说的是对的。那个参数是对已生成的主成分进行标准化的。比如下面这个代码:参数std有与没有对主成分的构成没有影响,最后的公式都是一样的,不同的是有std参数的话,会对构成的主成分进行标准化一下。
proc princomp data=ex20_1 std out=data1;
run;

你找个数据试一下就可以了,
1、准备两份数据,一份没有标准化,一份标准化了,用proc princomp data=data;run结果是一样的,这就说明SAS做主成分会先标准化再做;
2、对同一份数据跑
proc princomp data=ex20_1 out=data1;run;
再加个参数std,再跑一次proc princomp data=ex20_1 std out=data2;run;
结果系数是一样的,但data2的主成份是经过标准化后的。

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Tigflanker + 2 + 3 + 4 观点有启发

总评分: 学术水平 + 2  热心指数 + 3  信用等级 + 4   查看全部评分

使用道具

7
心晴923 学生认证  发表于 2016-1-22 15:08:08 |只看作者 |坛友微信交流群
letsgoaway 发表于 2016-1-21 21:28
我试了一下,SAS的princomp过程会自己标准化的,你开始说的是对的。那个参数是对已生成的主成分进 ...
std是只对主成分进行标准化为方差为1;但是一份标准化后的数据,一份未经标准化后的数据,我跑的结果咋就不一样呢?

使用道具

8
letsgoaway 发表于 2016-1-23 23:52:16 |只看作者 |坛友微信交流群
心晴923 发表于 2016-1-22 15:08
std是只对主成分进行标准化为方差为1;但是一份标准化后的数据,一份未经标准化后的数据,我跑的结果咋就 ...
奇怪,我试了是可以的呀,
你拿一份数据试下面的代码,比较两次princomp的结果看看。应该是一样的
/*初始数据为mice1*/
proc princomp data=mice1 out=data1;run;

/*对mice1标准化后,输出数据mice2*/
proc standard data=mice1 mean=0 std=1 out=mice2;
var F1-F9;
run;
/*对标准化后的数据mice2进行主成分分析*/
proc princomp data=mice2 out=data2;run;

使用道具

9
心晴923 学生认证  发表于 2016-1-24 14:35:26 |只看作者 |坛友微信交流群
letsgoaway 发表于 2016-1-23 23:52
奇怪,我试了是可以的呀,
你拿一份数据试下面的代码,比较两次princomp的结果看看。应该是一样 ...
嗯是。按你的代码跑出来是一样的;我的里面加了一句noint,结果就不一样了这是为啥?

使用道具

10
letsgoaway 发表于 2016-1-24 17:26:58 |只看作者 |坛友微信交流群
noprint参数我没怎么用过,不过推了一下,加上这个参数的话相关矩阵的计算应该就不一样了,
我们正常的相关系数是用这个公式计算的。
相关系数.PNG
但是加noprint参数,主成分相关矩阵的计算是用下面这个公式算的,是未校正的相关矩阵。
相关系数2.PNG
加上noprint参数后,SAS过程结果会有“未校正的相关矩阵”、“未校正的相关矩阵的特征值”
我们一般用的都是正常的那个相关系数。

相关系数.PNG (4.51 KB)

相关系数.PNG

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 00:37