楼主: blue_tw
2002 7

[Clementine数据挖掘] 选择节点 和测试流 [推广有奖]

  • 0关注
  • 0粉丝

VIP

已卖:1份资源

本科生

52%

还不是VIP/贵宾

-

威望
0
论坛币
1177 个
通用积分
30.0000
学术水平
-5 点
热心指数
-5 点
信用等级
-5 点
经验
105 点
帖子
50
精华
0
在线时间
20 小时
注册时间
2007-11-5
最后登录
2021-9-5

楼主
blue_tw 发表于 2010-2-25 17:34:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
老师
   您好!
   请问
  1、在Clementine中如何用选择节点将数据随机平分为二个部分,一部分作为训练集运用c5.0模型节点建模,一部分作为测试集呢?
  2、怎么建立测试模型?是将测试集连接训练得到的模型,再将此模型连接一个分析节点吗?

   谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:clementine clementin Clement 测试集 训练集 选择 节点

沙发
ruiqwy 发表于 2010-2-26 14:23:36
您好!
1.前期整理好数据后,选择partition节点 连接入数据流,在里面可以设置训练集、测试集及验证集,若要平分在测试集及训练集栏位内填上50%。
另外可以设置标签及数值;上面设置是对数据表中增加标志字段(区分测试集和训练集)的数值进行选择,第一个表示使用1、2、3这样的数值来表示,第二个是使用“1_training“等来表示,第三个是使用”training“等来表示,可以通过第二个图中的value来观察。此外下面还有设置随机种子的选项。
ps:在分割完不同集合后,可以右击partition节点,选择cache中enable,这样随机分割完的数据就可以暂时存在缓存中,这样不同时候进行不同建模的时候就不会因为样本不同而使结构受影响!(第一次执行后会在节点的右上方出现绿色的文件件的标签)
2.如果训练好模型后,把所得的模型节点从右上方拖到数据流的测试集后,建立连接后,再加个分析节点或一些结果的节点就可以了。
R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!

藤椅
blue_tw 发表于 2010-2-26 16:24:30
非常感谢老师!!!

板凳
blue_tw 发表于 2010-2-26 16:30:14
再问一下
选择partition节点,在测试集及训练集栏位内填上50%后
,是再用两个select节点,分别选择包含“分区 ="1_训练"”和丢弃“分区 ="1_训练"”,从而得到训练集和测试集,然后进连接模型节点的吗?

报纸
ruiqwy 发表于 2010-2-27 00:00:02
嗯!
R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!

地板
blue_tw 发表于 2010-2-27 10:57:45
谢谢老师!

7
秋日私语 发表于 2011-8-16 15:21:07
[Clementine数据挖掘]支持中文吗?
淡定,寻求心灵的宁静

8
ruiqwy 发表于 2011-8-20 04:26:28
最好是英文的
R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 23:17