现在有一个数据集,其中有客户名称和客户规模,数据量非常大,近十万。
想对客户进行聚类,按照已经的客户规模,代码是:
proc cluster data= cl method=average std outtree=cl01 simple noid print=7;
var cys;
run;
proc tree data=cl01 n=7 horizontal graphics;
id cys;
run;
但是sas的日志结果是:
WARNING: Ties for minimum distance between clusters have been detected at 15395 level(s) in
the cluster history.
WARNING: DENDROGRAM 语句包含太多离散值。系统将不会绘制该点/线图。
第二条日志结果是:
NOTE: The GRAPHICS option is no longer required. High resolution graphics is enabled by
default.
WARNING: “左侧垂直轴”坐标轴(标签为“成员数”)不符合指定要求。坐标轴值将覆盖。
WARNING: “左侧垂直轴”坐标轴(标签为“成员数”)不符合指定要求。坐标轴值将覆盖。
WARNING: 请求的副刻度标记的个数 0 会导致所画的标记宽度少于一个像素。将忽略副刻度标记请求。