附录1、五折交叉验证程序
1、构造五折下标集。
d=1:339;dd=list();z=5;nn=levels(tt$y);kl=length(nn)
for(i in 1:kl)dd[[i]]=d[tt$y==nn[i]]
kk=NULL;for(i in 1:kl)kk=c(kk,round(length(dd[[i]])/z))
set.seed(111);yy=list(NULL,NULL,NULL)
for(i in 1:kl)
{xx=list();uu=dd[[i]];for(j in 1:(z-1)){xx[[j]]=sample(uu,kk[i])
uu=setdiff(uu,xx[[j]])}
xx[[z]]=uu;for(k in 1:z)yy[[i]][[k]]=xx[[z]]}
mm=list(NULL,NULL,NULL,NULL,NULL)
for(i in 1:z)for(j in 1:kl)mm[[i]]=c(mm[[i]],yy[[j]][[i]])
mm[[i]] #是第i折的测试集下标集合。
2、随机森林的五折交叉验证的测试集和训练集分类的平均误差。
for(i in i:5){m=mm[[i]]
n0=359-length(m);n1=length(m)
RF=randomForest(y~.,data=tt[-m,])
E0[i]=sum(tt[-m,1]!=predict(RF,tt[-m,]))/n0
E1[i]=sum(tt[m,1]!=predict(RF,tt[m,]))/n1}
mean(E0)=0; mean(E1)=0.03333333。
|