tianjixuetu 发表于 2016-11-10 15:21 
方法不对吧。采用新方法训练下
我用的rpart包,代码如下:
data <- read.csv("E://sha.csv",header=T)
ind <- sample(2, nrow(data), replace=TRUE, prob=c(0.9, 0.1))
traindata <- data[ind==1,]
testdata<- data[ind==2,]
library(rpart)
ct<-rpart.control(xval=5,minsplit=2,minbucket=1,cp=0.01)
model.CART <-rpart(f~七天+X1月+X3月+X6月+X12月+X18月+X24月+a+b+c+d,method="class",control=ct,data=traindata,parms=list(prior=c(0.6,0.4),split="information")
prune(model.CART,cp=0.01)
results.CART <-predict(model.CART,newdata=testdata, type="class")
不知道是不是代码写的有问题,还是那个参数没有设置对啊,总共11个变量,其中有9个都是连续的,是不是要把连续变量离散化?