楼主: chenfanwen
12670 10

[SAS EM] SAS聚类分析 [推广有奖]

  • 0关注
  • 0粉丝

本科生

15%

还不是VIP/贵宾

-

威望
0
论坛币
228 个
通用积分
1.1249
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
467 点
帖子
44
精华
0
在线时间
83 小时
注册时间
2005-10-24
最后登录
2014-5-5

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
http://bi-chen.spaces.live.com SAS  聚类分析Proc Cluster
聚类分析是用来寻找观测值中潜在的、未知的知识。它可以通过各种各样的方法计算得到,最常用的就是运用距离度量方式计算数据点之间的关系,从而创建聚簇。

SAS中执行聚类分析

PROC CLUSTER <选项>;
VAR 变量1 变量2 变量3 ... 变量 n;
选项主要是控制过程的打印、计算和输出

选项如下:

NOPRINT禁止打印输出

NOEIGEN禁止打印特征值

SIMPLE 产生每个变量的简单统计描述

METHOD=控制使用的聚类方法

STANDRAD 使用相关矩阵计算

OUTTREE
创建用于聚类图的输出数据集

VAR语句用来列举变量列表

例如:PROC CLUSTER METHOD = AVERAGE OUTTREE = TREE;
VAR PEAK_VISC TROUGH_VISC FINAL_VISC BREAKDOWN
TOTAL_SETBACK TIMEPEAK_VISC;


SAS中,可以通过Proc tree来创建树图,proc cluster的输出数据集作为proc tree的输入数据集。proc tree data=tree;

axis1 label=none;
proc tree data=tree1

dis horizontal


lines=(color=red dots)


vaxis=axis1;

SAS代码

%makegplot(type=pdf,pltfile='irisclus.pdf');

DATA IRISCLUS;

TITLE 'CLUSTER ANALYSIS OF 15 CASES FROM IRIS DATA SET';

TITLE2 'FIVE CASES FROM EACH IRIS TYPE';


INFILE 'irisclus.dat';

INPUT IRISGRP IRISID SEPALLEN SEPALWID PETALLEN PETALWID;

PROC CLUSTER OUTTREE=SINGLE SIMPLE STANDARD


METHOD=SINGLE PSEUDO;


VAR SEPALLEN SEPALWID PETALLEN PETALWID;


ID IRISID;

PROC TREE DATA=SINGLE DISSIMILAR;

TITLE3 'SINGLE LINKAGE METHOD';


ID IRISID;


%MACRO MAKEGPLOT(TYPE=PS,PLTFILE='PLOT.PS');

%PLOT:


FILENAME grafout &PLTFILE;


data _NULL_;


file grafout;

%* use device=ps for postscript file output;

%* use device=pdf for pdf file output;

%* use device=gif for gif file output;

%* use device=psepsf for encapsulated postscript file output;

%* use device=jpeg for jpeg file output;

%* use device=tiffp for tiff file output;

%* use device=bmp for bmp file output;

%* use device=WMF for Windows Metafile format file output;


goptions device=&type gsflen=80 gsfname=grafout gsfmode=append;


%goto exit;

Filename grafout clear;


%exit:


%blankln(0)

%endit:


%blankln(0)


%MEND MAKEGPLOT;


%MACRO BLANKLN(LINES);


%DO I=1 %TO &LINES;


%PUT %STR( );


%END;

%MEND BLANKLN;


SAS Kmeans聚类

data irisclus;
input IRISGRP IRISID SEPALLEN SEPALWID PETALLEN PETALWID;
cards;
1 101 5.1 3.5 1.4 0.2
1 102 4.9 3.0 1.4 0.2
1 103 4.7 3.2 1.3 0.2
1 104 4.6 3.1 1.5 0.2
1 105 5.0 3.6 1.4 0.2
2 201 7.0 3.2 4.7 1.4
2 202 6.4 3.2 4.5 1.5
2 203 6.9 3.1 4.9 1.5
2 204 5.5 2.3 4.0 1.3
2 205 6.5 2.8 4.6 1.5
3 301 6.3 3.3 6.0 2.5
3 302 5.8 2.7 5.1 1.9
3 303 7.1 3.0 5.9 2.1
3 304 6.3 2.9 5.6 1.8
3 305 6.5 3.0 5.8 2.2
;
* 数据标准化处理;
proc standard data=irisclus out=Stand mean=0 std=1;

var SEPALLEN SEPALWID PETALLEN PETALWID;

proc print data=stand;
* 执行Kmeans程序;
proc fastclus data=Stand out=Clust maxclusters=3 maxiter=100 drift;

var SEPALLEN SEPALWID PETALLEN PETALWID;

* 查看聚类结果;
proc print data=clust;
run;
* 运用 PROC DISCRIM寻找典型变量,并且绘制出来;
proc discrim data=clust out=discout canonical;
class cluster;
var SEPALLEN SEPALWID PETALLEN PETALWID;
proc plot data=discout;

plot can2*can1=cluster;

run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类分析 horizontal breakdown canonical filename 聚类分析 SAS

沙发
superty2005 发表于 2010-7-1 21:29:30 |只看作者 |坛友微信交流群
今天考SAS很悲剧了
公平与正义是社会的良心

使用道具

藤椅
yangponingsui 发表于 2010-7-30 16:31:31 |只看作者 |坛友微信交流群
proc cluster 只适合小样本数据,我几千万条记录的数据进行聚类时要7G多内存,哎

使用道具

板凳
sherrywill 发表于 2010-9-12 11:03:04 |只看作者 |坛友微信交流群
谢谢啦~ 正好现在做竞赛要用到聚类分析~

使用道具

报纸
天堂之路 发表于 2011-3-18 21:18:00 |只看作者 |坛友微信交流群
不错哎。。。。。。。。。。。

使用道具

地板
smilehelen 发表于 2011-4-2 09:44:29 |只看作者 |坛友微信交流群
谢谢提供参考了!!!

使用道具

7
wencycooll 发表于 2012-2-2 09:17:19 |只看作者 |坛友微信交流群
请问一下 kmeans算法 可以有很多变量?按道理说只有两个啊,比如 国家,国民生产总值 这两个变量,依据国民生产总值 将国家分类。但是sas 可以提供N个输入变量 如:国家,国民生产总值,国民人均收入,进口总额 等 这么多变量依据哪一个来聚类国家呢?

使用道具

8
土坑笨笨 发表于 2013-3-31 20:08:10 |只看作者 |坛友微信交流群
yangponingsui 发表于 2010-7-30 16:31
proc cluster 只适合小样本数据,我几千万条记录的数据进行聚类时要7G多内存,哎
大数据量不可以用吗?为什么呀

使用道具

9
laowangde 发表于 2013-5-7 18:05:19 |只看作者 |坛友微信交流群
挺不错的,参考下

使用道具

10
proc_zhu 发表于 2013-8-26 22:11:37 |只看作者 |坛友微信交流群
土坑笨笨 发表于 2013-3-31 20:08
大数据量不可以用吗?为什么呀
大数据量建议用 proc fastclus
挖矿是个技术活

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 17:59