SAS聚类分析-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 软件培训>>

SAS软件培训

>>

SAS聚类分析

SAS聚类分析

发布:chenfanwen | 分类:SAS软件培训

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

获取电子版《CDA一级教材》

完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。

完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。

http://bi-chen.spaces.live.comSAS聚类分析ProcCluster聚类分析是用来寻找观测值中潜在的、未知的知识。它可以通过各种各样的方法计算得到,最常用的就是运用距离度量方式计算数据点之间的关系,从而创建聚簇。SAS中 ...
免费学术公开课,扫码加入


http://bi-chen.spaces.live.com SAS聚类分析Proc Cluster
聚类分析是用来寻找观测值中潜在的、未知的知识。它可以通过各种各样的方法计算得到,最常用的就是运用距离度量方式计算数据点之间的关系,从而创建聚簇。
SAS中执行聚类分析
PROC CLUSTER <选项>;
VAR 变量1 变量2 变量3 ... 变量 n;
选项主要是控制过程的打印、计算和输出
选项如下:
NOPRINT禁止打印输出
NOEIGEN禁止打印特征值
SIMPLE 产生每个变量的简单统计描述
METHOD=控制使用的聚类方法
STANDRAD 使用相关矩阵计算
OUTTREE
创建用于聚类图的输出数据集
VAR语句用来列举变量列表
例如:PROC CLUSTER METHOD = AVERAGE OUTTREE = TREE;
VAR PEAK_VISC TROUGH_VISC FINAL_VISC BREAKDOWN
TOTAL_SETBACK TIMEPEAK_VISC;


在SAS中,可以通过Proc tree来创建树图,proc cluster的输出数据集作为proc tree的输入数据集。proc tree data=tree;
axis1 label=none;
proc tree data=tree1
dis horizontal
lines=(color=red dots)
vaxis=axis1;
SAS代码

%makegplot(type=pdf,pltfile='irisclus.pdf');

DATA IRISCLUS;

TITLE 'CLUSTER ANALYSIS OF 15 CASES FROM IRIS DATA SET';

TITLE2 'FIVE CASES FROM EACH IRIS TYPE';


INFILE 'irisclus.dat';

INPUT IRISGRP IRISID SEPALLEN SEPALWID PETALLEN PETALWID;

PROC CLUSTER OUTTREE=SINGLE SIMPLE STANDARD


METHOD=SINGLE PSEUDO;


VAR SEPALLEN SEPALWID PETALLEN PETALWID;


ID IRISID;

PROC TREE DATA=SINGLE DISSIMILAR;

TITLE3 'SINGLE LINKAGE METHOD';


ID IRISID;


%MACRO MAKEGPLOT(TYPE=PS,PLTFILE='PLOT.PS');

%PLOT:


FILENAME grafout &PLTFILE;


data _NULL_;


file grafout;

%* use device=ps for postscript file output;

%* use device=pdf for pdf file output;

%* use device=gif for gif file output;

%* use device=psepsf for encapsulated postscript file output;

%* use device=jpeg for jpeg file output;

%* use device=tiffp for tiff file output;

%* use device=bmp for bmp file output;

%* use device=WMF for Windows Metafile format file output;


goptions device=&type gsflen=80 gsfname=grafout gsfmode=append;


%goto exit;

Filename grafout clear;


%exit:


%blankln(0)

%endit:


%blankln(0)


%MEND MAKEGPLOT;


%MACRO BLANKLN(LINES);


%DO I=1 %TO &LINES;


%PUT %STR( );


%END;

%MEND BLANKLN;


SAS Kmeans聚类
data irisclus;
input IRISGRP IRISID SEPALLEN SEPALWID PETALLEN PETALWID;
cards;
1 101 5.1 3.5 1.4 0.2
1 102 4.9 3.0 1.4 0.2
1 103 4.7 3.2 1.3 0.2
1 104 4.6 3.1 1.5 0.2
1 105 5.0 3.6 1.4 0.2
2 201 7.0 3.2 4.7 1.4
2 202 6.4 3.2 4.5 1.5
2 203 6.9 3.1 4.9 1.5
2 204 5.5 2.3 4.0 1.3
2 205 6.5 2.8 4.6 1.5
3 301 6.3 3.3 6.0 2.5
3 302 5.8 2.7 5.1 1.9
3 303 7.1 3.0 5.9 2.1
3 304 6.3 2.9 5.6 1.8
3 305 6.5 3.0 5.8 2.2
;
* 数据标准化处理;
proc standard data=irisclus out=Stand mean=0 std=1;
var SEPALLEN SEPALWID PETALLEN PETALWID;
proc print data=stand;
* 执行Kmeans程序;
proc fastclus data=Stand out=Clust maxclusters=3 maxiter=100 drift;
var SEPALLEN SEPALWID PETALLEN PETALWID;
* 查看聚类结果;
proc print data=clust;
run;
* 运用 PROC DISCRIM寻找典型变量,并且绘制出来;
proc discrim data=clust out=discout canonical;
class cluster;
var SEPALLEN SEPALWID PETALLEN PETALWID;
proc plot data=discout;
plot can2*can1=cluster;
run;
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-844266-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
联系客服
值班时间:工作日(9:00--18:00)