楼主: tigy
6783 5

[clementine] Clementine 11又一个教训 以及一点感受,与10.0以及SAS EM的比较 [推广有奖]

  • 0关注
  • 0粉丝

本科生

96%

还不是VIP/贵宾

-

威望
0
论坛币
759 个
通用积分
0
学术水平
1 点
热心指数
0 点
信用等级
0 点
经验
4928 点
帖子
81
精华
0
在线时间
133 小时
注册时间
2007-8-6
最后登录
2020-11-6

楼主
tigy 发表于 2007-9-6 21:24:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

这个教训主要是关于clustering 的

CLEM 11中有3个cluster的工具,two stage(实际上是BIRCH算法), K-means, SOM
其中,只有two stage提供了选项可以对变量进行standardize,给人造成错觉k-means和som不提供这个功能
需要用户自己来standardize,实际上在查阅了CLEM 11附带的algorithm guide之后,我发现,K-means和SOM默认进行standardize。

但是接下来的问题是two-stage的standardize实际上是计算z-score就是方差为1,均知为零。而k-means和som的是range算法,就是最小值最大值那个。当然我们可以自己用derive node算z-score,可是由于k-means和som是默认standardize,而且似乎没有办法屏蔽掉这个过程(用CLEM 提供的script?我不知道,没试过),那么好像就算我辛辛苦苦算了z-score出来,最后也会被转变成range,,,

SPSS家的clementine感觉还是不如SAS EM严谨

不过CLEM 11比CLEM 10还是好了很多,如今data audit node提供了更强大的missing data imputation功能,终于有了C&RT imputation这一项。还有optimal binning,似乎也很有用。CLEM这版的特色似乎在于regression这边,增加了很多regression的工具,logit可以支持大于等于3个类的目标变量了,原来只有2个。Descriminant analysis以及general regression model的加入都很实用。

还有一个特色是decision list,这应该是一个给予association rules mining的应用,还没用太多,不过似乎不错

相比SAS EM, Clementine系列只能说还差一点,C&RT imputation这种功能在sas em 4.2版就有了。SAS EM在SAS Base的支持下,想要实现descriminant analysis以及其他regression方法也并不是难的事情。

以前Clementine比sas em强的地方在于有很多association rules mining的工具。而在sas em 4.2中,这方面很薄弱。不过似乎在SAM EM 5里面有了加强

就这些,斑竹是不是能发点钱啊,俺装的sas em 4.2过期了,想去sas版看破解的方法,,,,,,

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:clementine clementin Clement SAS EM 一点感受 SAS clementine 教训

已有 1 人评分论坛币 学术水平 收起 理由
xiaowenzi22 + 100 + 1 奖励

总评分: 论坛币 + 100  学术水平 + 1   查看全部评分

沙发
zxl19 发表于 2007-9-11 20:07:00
感谢原创!!

藤椅
ixianin 发表于 2009-3-27 14:06:00

楼猪是高人

板凳
chouxiangdaishu 发表于 2009-12-27 00:01:45
楼主是牛人

报纸
chouxiangdaishu 发表于 2009-12-27 00:02:21
不过EM用起来没有cle舒服

地板
hawkscry 发表于 2011-6-12 14:55:26
嗯,很受益。。。。。。。。。。
互联网金融,风控,模型开发

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-4 08:50