这是rpart的一些选项
rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01,
maxcompete = 4, maxsurrogate = 5, usesurrogate = 2, xval = 10,
surrogatestyle = 0, maxdepth = 30, ...)
第一个minsplit的缺省值是20,如果一个node的个数小于20的话,就不会再继续分下去了。
你的总个数是21,分了一次之后一个是13,一个是8,所以不会再继续下去了。
> fit=rpart(y~x1+x3+x5,data=dat, cp = 0.001, minsplit = 5)
> fit
n= 21
node), split, n, deviance, yval
* denotes terminal node
1) root 21 4.92946800 0.5857907
2) x3< 4.621357e+07 17 0.43087720 0.4131688
4) x5< 1.477778 6 0.07079054 0.2864146
8) x5< 1.005 2 0.01760142 0.1982708 *
9) x5>=1.005 4 0.02988114 0.3304865 *
5) x5>=1.477778 11 0.21110520 0.4823075
10) x3< 3.049149e+07 9 0.13067690 0.4455678
20) x3>=2.615278e+07 3 0.02317325 0.3416831 *
21) x3< 2.615278e+07 6 0.05893949 0.4975102
42) x3< 2.472364e+07 4 0.02392114 0.4521742 *
43) x3>=2.472364e+07 2 0.01035413 0.5881822 *
11) x3>=3.049149e+07 2 0.01361306 0.6476360 *
3) x3>=4.621357e+07 4 1.83909100 1.3194340 *



雷达卡


京公网安备 11010802022788号







