randomForest(formula = keyunliang ~ ., data = bjdata, importance = TRUE)
Type of random forest: regression
Number of trees: 500
No. of variables tried at each split: 3
Mean of squared residuals: 14369293
% Var explained: 96.07
得到这个结果 我感觉好像是过拟合了
数据 23组数据 每组数据10个参数
对训练数据进行【-1,1】归一化后 结果 Call: randomForest(formula = keyunliang ~ ., data = bjdata, ntree = 500, mtry = 2, importance = TRUE) Type of random forest: regression Number of trees: 500 No. of variables tried at each split: 2 Mean of squared residuals: 1.420348e-13 % Var explained: 96.81 残差平方和大的原因是因为我的输入数据 都是好几万的那种 甚至有上亿的 所以残差平方和归一化前很大 不过归一化前后 varImpPlot(reg.rf)这个函数 的输出结果不同 不知道 该如何取舍 我感觉我这90%的解释率 有点太高了 可能是过拟合了~ |