楼主: tzy3169
7555 3

[问答] R语言用caret包做特征选择如何规定得到的特征数 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

31%

还不是VIP/贵宾

-

威望
0
论坛币
992 个
通用积分
1.1000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1092 点
帖子
53
精华
0
在线时间
180 小时
注册时间
2015-2-13
最后登录
2022-8-2

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有5000个特征向量,我想通过特征选择获得其中的500个,我这样写对不对?
profile <- rfe(tt,tt[,"类型"], sizes = c(500), rfeControl = rfeControl(functions=rfFuncs ))
或者其他的包有什么函数可以做到的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Care 特征选择 RET ARE R语言 profile 如何

沙发
victorchan0633 发表于 2015-6-19 14:47:13 |只看作者 |坛友微信交流群
这样写有点问题,首先是tt,tt[,"类型"] 应该做一下区分,按照你的思路,tt代表的是训练集吧,那tt[,"类型"] 代表测试集应该跟训练集不同,还有就是选择500个, sizes = c(500)应该是 sizes = c(1:500)或者是别的长度为500的向量。特征选择用caret包里别的函数也可以做,比如rfeIter、safs等。

使用道具

藤椅
tzy3169 发表于 2015-6-23 18:29:06 |只看作者 |坛友微信交流群
victorchan0633 发表于 2015-6-19 14:47
这样写有点问题,首先是tt,tt[,"类型"] 应该做一下区分,按照你的思路,tt代表的是训练集吧,那tt[,"类型"] ...
谢谢你的回答,
我是看了这个链接才这样写的:http://blog.sina.com.cn/s/blog_7b75bd9e0101bybb.html
tt[,"类型"]代表的是因变量,
还有在rfe的介绍文档中给出的例子:
rfe(x, y,
    sizes = 2^(2:4),
    metric = ifelse(is.factor(y), "Accuracy", "RMSE"),
    maximize = ifelse(metric == "RMSE", FALSE, TRUE),
    rfeControl = rfeControl(),
    ...)
中对y的介绍:a vector of training set outcomes (either numeric or factor)也是因变量的意思

使用道具

板凳
路见不平3 发表于 2016-4-19 15:05:58 |只看作者 |坛友微信交流群
http://blog.sina.com.cn/s/blog_7b75bd9e0101bybb.html楼主,这个例子中的自变量和因变量是那个数据集划分成的两个么,分别代表x和y?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 08:40