楼主: lishujuan1986
14842 24

[SAS EM] 求助:有哪位有sas EM 决策树方面的解释资料 [推广有奖]

  • 0关注
  • 1粉丝

初中生

85%

还不是VIP/贵宾

-

威望
0
论坛币
15 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
269 点
帖子
28
精华
0
在线时间
2 小时
注册时间
2009-3-4
最后登录
2010-10-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

本人属于数据挖掘初学者,想用决策树方法进行研究,但是用sas em 树是出来了,可是我不太懂怎么解释,所以希望有哪位大虾能够提供以下这方面的资料,万分感激,拜谢了!!!

我的邮箱:li_shujuan@yahoo.cn

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:SAS EM 决策树 数据挖掘初学者 YAHOO 我的邮箱 解释 资料 SAS 决策树

沙发
420948492 发表于 2009-4-27 08:34:00 |只看作者 |坛友微信交流群
决策树的方法比较常用的就那几种,c3.0,c4.5.c5.0,CART 等,解释的话就是一条条的分类规则,主要是原理,一般的数据挖掘教程上都有,可以在论坛上搜基本数据挖掘的书,呵呵
有人的地方就有江湖

使用道具

藤椅
lishujuan1986 发表于 2009-4-28 09:59:00 |只看作者 |坛友微信交流群
那请问如果用sas em 来改变决策树算法应该从哪进行设置呢?还有我不太懂运行tree节点后的那个树形结构的意思,能不能解释一下呢,万分感激啊!!!!!!

使用道具

板凳
420948492 发表于 2009-4-28 12:19:00 |只看作者 |坛友微信交流群

我没用过SAS EM决策树算法进行挖掘,以下是参考材料

树表示了通过使用简单的规则而形成的数据的分组。每个规则基于一个输入的值指定一个观测到某个组中,规则一个个的进行应用,形成了组中的层次。这种层级也叫做树,每个组都叫做节点。初始的分组包含了整个数据集,被叫做根节点。最后的节点叫做叶子节点。对于每个叶子节点,作出一个决策并被应用到所有在此叶子中的观测。决策的类型依赖于上下文。在本例所示的预测性建模中,决策只不过就是预测值。

判定树模型容易的容忍在输入变量和目标变量间的非线性关系。它提供了可解释性,并可以不经过单独的插补来处理缺失值。

1. Tree 节点添加到流程图工作区

2. 连接Transform Variables 节点和Tree节点

3. 打开Tree 节点。对于二元目标变量,节点使用卡方检验,默认对于二元目标变量分枝准则的显著性水平为0.200

简单说来,可以使用默认Basic项的设置来拟合模型

4. 选择Advanced 项。由于节点认识到一个启动的损失矩阵已经做过定义,它自动的是指模型评估度量为Average Loss。最佳树将在验证数据集中基于最小化期望损失被建立起来。

5. 使用应用工具箱中的保存图标保存模型。分别在条目中键入模型名称和描述并点击OK.默认,保存的模型名是"Untitled."

6. 使用应用工具箱中的RUN图示训练节点。

7. 当节点结束训练后,点击Message 窗口中的YES观察结果

结果浏览器中的所有项显示如下:

左上角的表总结了全部分类的过程。下面是另一个列出了随着树复杂性的增加在训练和验证集上的期望损失值表。右下角的图以图形化的方式表示了相同的信息。

只有2个叶子节点的树提供了验证数据集上最小的期望损失。验证数据集上的平均期望损失大约是-12(12分的收益)

环形树提供了一个对树复杂性,分枝平衡,判别能力的快速的浏览。环形的中心对应于树的根节点——离中心越远,树就越深。环上的一个分裂对应于树上的分枝。每个环上弧的长度对应于节点的样本大小。较深的颜色表示节点纯度高(这些节点有着最小期望损失值)。评估颜色窗口包含了对应于环形树上的期望损失值的组颜色。

8. 点击View 菜单选择Tree来观察更传统意义上的树图

树的流程图包含了以下的项:

o  根节点居于树中最高的节点,包含了所有的样本。

o  内部节点非末端节点(也包含了根节点),包含了分枝规则;

o  叶子节点 -- 末端节点,包含了对观测样本的最终分类。

可以使用下滑条显示额外的节点。期望损失值被用来递归的划分资料成相似的组。方法是递归的因为每个子组都是从先前分枝中对子分组分割而来的。

在每个节点上的数值标签表示出了树节点找到显著性分枝的点上。位于每个分枝中心的字符卷标是变量名。

当使用损失评估准则建立树时,当使用损失评估准则来建立树时,每行的节点包含了以下统计量:

o  第一行列出了在训练和验证数据集中的好客户的百分比。

o  第二行列出了在训练和验证数据集中的坏客户的百分比

o  第三行列出了在训练和验证数据集中的好客户的人数.

o  第四行列出了在训练和验证数据集中的坏客户的人数

o  第五行列出了在训练和验证数据集中的客户总数。

o  第六行列出了供选择的决策(接受或拒绝).

o  第七行列出了在训练和验证数据集中对于接收决策的期望损失。

o  第八行列出了在训练和验证数据集中对于拒绝决策的期望损失。

9. 关闭结果浏览器并关闭Tree 节点

有人的地方就有江湖

使用道具

报纸
lishujuan1986 发表于 2009-4-28 12:46:00 |只看作者 |坛友微信交流群
真是太感谢了,我会好好研读的!!!!

使用道具

地板
zhongwei1983062 发表于 2009-7-18 01:35:17 |只看作者 |坛友微信交流群
版主解释的非常好 受益

使用道具

7
mutangchun_yu 发表于 2009-8-11 22:43:46 |只看作者 |坛友微信交流群
在版上总能找到需要的方法,呵呵

使用道具

8
漂亮左手 发表于 2009-8-13 10:25:32 |只看作者 |坛友微信交流群
xuexileha

使用道具

9
zhongzihong 发表于 2009-8-13 10:41:17 |只看作者 |坛友微信交流群
那个有SAS enterprise miner  编程的书呀?急求
曾经错过

使用道具

10
88304485boy 发表于 2010-3-21 10:40:16 |只看作者 |坛友微信交流群
楼上 你想得挺美的
new year

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 14:26