楼主: yaoqsm321
3697 7

[问答] R语言做决策树,R软件会自动将数据离散化吗,还是需要手动去离散数据? [推广有奖]

  • 1关注
  • 0粉丝

本科生

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
873 点
帖子
81
精华
0
在线时间
70 小时
注册时间
2015-5-28
最后登录
2017-9-7

楼主
yaoqsm321 发表于 2016-11-10 14:17:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
做出来的决策树效果不好,预测的正确率只有50%,不知道是什么原因,求大神指教下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:离散数据 离散化 决策树 r软件 R语言 软件

沙发
tianjixuetu 在职认证  发表于 2016-11-10 15:21:58
方法不对吧。采用新方法训练下

藤椅
yaoqsm321 发表于 2016-11-10 16:00:19
tianjixuetu 发表于 2016-11-10 15:21
方法不对吧。采用新方法训练下
我用的rpart包,代码如下:
data <- read.csv("E://sha.csv",header=T)
ind <- sample(2, nrow(data), replace=TRUE, prob=c(0.9, 0.1))
traindata <- data[ind==1,]
testdata<- data[ind==2,]

library(rpart)
ct<-rpart.control(xval=5,minsplit=2,minbucket=1,cp=0.01)
model.CART <-rpart(f~七天+X1月+X3月+X6月+X12月+X18月+X24月+a+b+c+d,method="class",control=ct,data=traindata,parms=list(prior=c(0.6,0.4),split="information")
prune(model.CART,cp=0.01)

results.CART <-predict(model.CART,newdata=testdata, type="class")
不知道是不是代码写的有问题,还是那个参数没有设置对啊,总共11个变量,其中有9个都是连续的,是不是要把连续变量离散化?

板凳
jgchen1966 发表于 2016-11-10 18:26:09
一,决策树中很不稳定的,二,50%,说明,数据没啥子用信息含量,三,决策树,对变量没有要求离散化,它是最适合各类变量类型的ML,四,现在,单用决策树,已很少有价值了。。

报纸
yaoqsm321 发表于 2016-11-11 09:07:54
jgchen1966 发表于 2016-11-10 18:26
一,决策树中很不稳定的,二,50%,说明,数据没啥子用信息含量,三,决策树,对变量没有要求离散化,它是最 ...
你好,那除了用决策树,还有什么方法可以用来分类预测?用随机森林是不是可以提高稳定性和正确率呀?

地板
jgchen1966 发表于 2016-11-11 10:50:17
yaoqsm321 发表于 2016-11-11 09:07
你好,那除了用决策树,还有什么方法可以用来分类预测?用随机森林是不是可以提高稳定性和正确率呀?
如 果,有兴趣,有时间,可好好研习 R 包 caret  ,它包含了近百个分类ML 方法。。

7
yaoqsm321 发表于 2016-11-11 17:49:32
jgchen1966 发表于 2016-11-10 18:26
一,决策树中很不稳定的,二,50%,说明,数据没啥子用信息含量,三,决策树,对变量没有要求离散化,它是最 ...
谢谢,还有一个问题,R语言的好多函数看不懂,网上也搜不到语法,请问该怎么去学习呀?

8
jgchen1966 发表于 2016-11-11 20:13:09
yaoqsm321 发表于 2016-11-11 17:49
谢谢,还有一个问题,R语言的好多函数看不懂,网上也搜不到语法,请问该怎么去学习呀?
一、查阅  R 官网 http://mirrors.xmu.edu.cn/CRAN/
二,找本书, caret 作者就写了一本不错的ML 学习的书,也是学习caret 的书
Max Kuhn • Kjell Johnson,   Applied Predictive Modeling,  Springer Science+Business Media New York 2013

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 21:30