楼主: 恙日
3887 4

[实际应用] 随机森林,R语言 [推广有奖]

  • 1关注
  • 1粉丝

初中生

66%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
106 点
帖子
16
精华
0
在线时间
10 小时
注册时间
2014-6-18
最后登录
2014-7-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Call:
randomForest(formula = keyunliang ~ ., data = bjdata, importance = TRUE)
               Type of random forest: regression
                     Number of trees: 500
No. of variables tried at each split: 3

          Mean of squared residuals: 14369293
                    % Var explained: 96.07
得到这个结果  我感觉好像是过拟合了
数据 23组数据 每组数据10个参数


对训练数据进行【-1,1】归一化后 结果
Call:
randomForest(formula = keyunliang ~ ., data = bjdata, ntree = 500,      mtry = 2, importance = TRUE)
               Type of random forest: regression
                     Number of trees: 500
No. of variables tried at each split: 2

          Mean of squared residuals: 1.420348e-13
                    % Var explained: 96.81

残差平方和大的原因是因为我的输入数据 都是好几万的那种 甚至有上亿的 所以残差平方和归一化前很大
不过归一化前后 varImpPlot(reg.rf)这个函数 的输出结果不同 不知道 该如何取舍  
我感觉我这90%的解释率 有点太高了 可能是过拟合了~

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:随机森林 R语言 randomForest regression importance explained forest 森林

沙发
wanlin000 发表于 2014-6-23 11:14:25 |只看作者 |坛友微信交流群
你用的是随机 回归啊,怎么才用分类的呢??求解释

随机森里 对归一不归一  没有太大的要求吧。

使用道具

藤椅
恙日 发表于 2014-6-24 08:50:31 |只看作者 |坛友微信交流群
wanlin000 发表于 2014-6-23 11:14
你用的是随机 回归啊,怎么才用分类的呢??求解释

随机森里 对归一不归一  没有太大的要求吧。
但是为什么归一化后 得到的结果不同呢?而且单位不同的话 貌似应该也会不同的~结果

使用道具

板凳
wanlin000 发表于 2014-6-25 09:26:05 |只看作者 |坛友微信交流群
恙日 发表于 2014-6-24 08:50
但是为什么归一化后 得到的结果不同呢?而且单位不同的话 貌似应该也会不同的~结果
我做的时候差距甚微啊

使用道具

报纸
恙日 发表于 2014-6-25 09:54:15 |只看作者 |坛友微信交流群
wanlin000 发表于 2014-6-25 09:26
我做的时候差距甚微啊
大神您加我qq吧~510741526~或者我加您qq也行~这样交流太慢的说~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-8 22:15