楼主: niuniuyiwan
2304 3

[SAS] 【SAS代码模板】聚类分析_cluster [推广有奖]

  • 7关注
  • 91粉丝

VIP

已卖:1980份资源

学科带头人

91%

还不是VIP/贵宾

-

威望
0
论坛币
14446 个
通用积分
1962.3850
学术水平
1119 点
热心指数
1167 点
信用等级
1061 点
经验
8523 点
帖子
1629
精华
1
在线时间
2492 小时
注册时间
2010-10-10
最后登录
2025-12-19

楼主
niuniuyiwan 在职认证  发表于 2015-7-14 22:22:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

sas代码模板】聚类分析_cluster

转自www.jiayounet.com

感谢数说工作室


1)聚类分析简易代码


——————————————模板————————————————

  1. proc cluster data=() method=聚类方法 std outtree=() pseudo simple;                                                                           
  2. id 识别变量;                                                                                                                          
  3. var 要聚类的变量;                                                                                                                                 
  4. run;
复制代码

——————————————模板————————————————

Method=指定聚类的方法,常用方法如下:

l  AVERAGE或AVE:类平均法,距离为平方距离,除非规定NOSQUARE。

l  CENTROD或CEN:距离为平方距离,除非规定NOSQUARE。

l  COMPLETE或COM:最长距离法

l  EML:最大似然谱系聚类

l  SINGLE或SIN:最短距离法。

l  WARD或WAR:WARD最小方差法。

l  MEDIAN|MED:中间距离法

l  FLEXIBLE|FLE:可变距离法

Std是将数据标准化。

outtree=生成记录聚类过程的输出数据集,此数据集将在画谱系图的时候用到,如果缺省,默认用Data1Data2Data3…..来命名。

Pseudo输出F统计量和伪T2统计量,当method=指定是avecenward时才有效。

Simple输出每个变量的描述性统计量

Id用于指定识别变量,缺省则用obn

Var指定要聚类的变量,缺省时,则默认为其他语句中没出现过的其他变量。


2)画出谱系图代码模板

————————————————模板———————————————————

  1. proc tree data=聚类过程的输出数据集 n=类的个数 out=() horizontal graphics;                                                                                 
  2. id province;                                                                                                                           
  3. run;
复制代码

————————————————模板———————————————————

Data=指定的输入数据集,是聚类cluster过程的输出数据集。

n=out=联合使用n=给出类的个数,每个观测值属于哪类就会储存在out中。有out=语句必须有n=语句,可以两者都不要。

Horizontal=指定绘制水平的聚类图,缺省则默认水平聚类图。

Graphics=指定一个高分辨率的图,如果缺省则默认低分辨率的图。


3)简例

如下数据进行聚类分析:

1.jpg


代码为:

  1. /*聚类分析*/                                                                                                                           
  2. proc cluster data=a method=ward std outtree=eco1 pseudo;                                                                                
  3. id province;                                                                                                                           
  4. run;                                         
复制代码
  1. /*谱系图*/                                                                                                                              
  2. proc tree data=eco1  n=4 out=out1 horizontal graphics;                                                                                 
  3. id province;                                                                                                                           
  4. run;
复制代码

                                                                                      


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Cluster sas代码 聚类分析 CLU horizontal simple method 工作室

已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
xddlovejiao1314 + 100 + 100 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 100  论坛币 + 100  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

沙发
xddlovejiao1314 学生认证  发表于 2015-7-15 10:52:03
好贴,谢谢分享,再接再厉。

藤椅
卿士维寒 发表于 2015-7-16 15:05:16
楼主,可以私聊不,最近想应用聚类方法写文章

板凳
fd_jinrong 发表于 2015-7-16 19:07:58
个人觉得这是一种很好的方法赞一个

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 03:06