楼主: lovelybetty1208
3245 5

sas 中如何对大数据进行聚类 [推广有奖]

  • 0关注
  • 1粉丝

已卖:1份资源

博士生

47%

还不是VIP/贵宾

-

威望
0
论坛币
97 个
通用积分
0
学术水平
1 点
热心指数
5 点
信用等级
1 点
经验
17470 点
帖子
293
精华
0
在线时间
147 小时
注册时间
2011-11-5
最后登录
2015-7-11

楼主
lovelybetty1208 发表于 2013-4-22 17:40:52 |AI写论文
10论坛币
现在有一个数据集,其中有客户名称和客户规模,数据量非常大,近十万。
想对客户进行聚类,按照已经的客户规模,代码是:
proc cluster data= cl    method=average std outtree=cl01 simple noid print=7;
var  cys;
run;
proc tree data=cl01 n=7 horizontal graphics;
id  cys;
run;

但是sas的日志结果是:
WARNING: Ties for minimum distance between clusters have been detected at 15395 level(s) in
         the cluster history.
WARNING: DENDROGRAM 语句包含太多离散值。系统将不会绘制该点/线图。


第二条日志结果是:
NOTE: The GRAPHICS option is no longer required.  High resolution graphics is enabled by
      default.
WARNING: “左侧垂直轴”坐标轴(标签为“成员数”)不符合指定要求。坐标轴值将覆盖。
WARNING: “左侧垂直轴”坐标轴(标签为“成员数”)不符合指定要求。坐标轴值将覆盖。
WARNING: 请求的副刻度标记的个数 0 会导致所画的标记宽度少于一个像素。将忽略副刻度标记请求。


请问高手,该如何聚类才对。怎样知道应该聚出几类合适。非常感谢!

关键词:大数据 resolution horizontal Graphics Solution 数据 如何
耶和华是我的牧者,我必不致缺乏。
他使我躺卧在青草地上,
领我在可安歇的水边。

沙发
lovelybetty1208 发表于 2013-4-23 10:29:30
ding
耶和华是我的牧者,我必不致缺乏。
他使我躺卧在青草地上,
领我在可安歇的水边。

藤椅
credithe 发表于 2013-6-4 09:55:50
正需要,看来看

板凳
竹联剑客 发表于 2013-6-20 20:05:05
你用的是哪种聚类分析法?

报纸
hgswz 发表于 2013-6-21 09:55:09
看来看

地板
lovelybetty1208 发表于 2013-6-21 10:44:16
竹联剑客 发表于 2013-6-20 20:05
你用的是哪种聚类分析法?
想用kmeans 但是不知道怎么做。
耶和华是我的牧者,我必不致缺乏。
他使我躺卧在青草地上,
领我在可安歇的水边。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 20:14