请选择 进入手机版 | 继续访问电脑版
楼主: lovelybetty1208
2690 5

sas 中如何对大数据进行聚类 [推广有奖]

  • 0关注
  • 1粉丝

博士生

48%

还不是VIP/贵宾

-

威望
0
论坛币
97 个
通用积分
0
学术水平
1 点
热心指数
5 点
信用等级
1 点
经验
17473 点
帖子
294
精华
0
在线时间
147 小时
注册时间
2011-11-5
最后登录
2015-7-11

10论坛币
现在有一个数据集,其中有客户名称和客户规模,数据量非常大,近十万。
想对客户进行聚类,按照已经的客户规模,代码是:
proc cluster data= cl    method=average std outtree=cl01 simple noid print=7;
var  cys;
run;
proc tree data=cl01 n=7 horizontal graphics;
id  cys;
run;

但是sas的日志结果是:
WARNING: Ties for minimum distance between clusters have been detected at 15395 level(s) in
         the cluster history.
WARNING: DENDROGRAM 语句包含太多离散值。系统将不会绘制该点/线图。


第二条日志结果是:
NOTE: The GRAPHICS option is no longer required.  High resolution graphics is enabled by
      default.
WARNING: “左侧垂直轴”坐标轴(标签为“成员数”)不符合指定要求。坐标轴值将覆盖。
WARNING: “左侧垂直轴”坐标轴(标签为“成员数”)不符合指定要求。坐标轴值将覆盖。
WARNING: 请求的副刻度标记的个数 0 会导致所画的标记宽度少于一个像素。将忽略副刻度标记请求。


请问高手,该如何聚类才对。怎样知道应该聚出几类合适。非常感谢!

关键词:大数据 resolution horizontal Graphics Solution 数据 如何
耶和华是我的牧者,我必不致缺乏。
他使我躺卧在青草地上,
领我在可安歇的水边。
ding
耶和华是我的牧者,我必不致缺乏。
他使我躺卧在青草地上,
领我在可安歇的水边。

使用道具

credithe 发表于 2013-6-4 09:55:50 |显示全部楼层 |坛友微信交流群
正需要,看来看

使用道具

竹联剑客 发表于 2013-6-20 20:05:05 |显示全部楼层 |坛友微信交流群
你用的是哪种聚类分析法?

使用道具

hgswz 发表于 2013-6-21 09:55:09 |显示全部楼层 |坛友微信交流群
看来看

使用道具

竹联剑客 发表于 2013-6-20 20:05
你用的是哪种聚类分析法?
想用kmeans 但是不知道怎么做。
耶和华是我的牧者,我必不致缺乏。
他使我躺卧在青草地上,
领我在可安歇的水边。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 17:55