楼主: zheguzai100
4877 1

[问答] 用caret包进行特征选择的疑问 [推广有奖]

  • 0关注
  • 0粉丝

本科生

17%

还不是VIP/贵宾

-

威望
0
论坛币
70 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1126 点
帖子
17
精华
0
在线时间
130 小时
注册时间
2010-7-13
最后登录
2023-8-29

楼主
zheguzai100 发表于 2015-10-13 09:48:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币


library(caret)
data(mdrr)
1. caret包中的rfe函数
x=mdrrDescr;y=mdrrClass
profile=rfe(x,trainy,sizes=c(21,25,28,30,33),
             rfeControl = rfeControl(functions=rfFuncs,method=’cv’))中sizes该如何设置?
我设置了三种形式
sizes=c(18:33)
sizes=c(18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33)
sizes=c(21,25,28,33)
三种sizes设置得出的结果依次如下图所示
问题1: size具体该怎么设置? 如果能得出最优变量集?
问题2: 是否还有其他好用的特征筛选报或者函数用?有没有使用案例分享? 谢谢

Variables Accuracy  Kappa AccuracySD KappaSD Selected
        18   0.7909 0.5693    0.06198 0.12545
        19   0.7934 0.5746    0.06212 0.12399
        20   0.7985 0.5843    0.05859 0.12037
        21   0.7935 0.5739    0.05700 0.11734
        22   0.8010 0.5889    0.05664 0.11624
        23   0.8085 0.6042    0.05666 0.11614
        24   0.7960 0.5781    0.05015 0.10407
        25   0.8008 0.5895    0.05744 0.11723
        26   0.8010 0.5894    0.04828 0.09891
        27   0.8059 0.5995    0.05695 0.11608
        28   0.8060 0.5989    0.06216 0.12671
        29   0.7985 0.5852    0.07074 0.14358
        30   0.8110 0.6084    0.05113 0.10568        *
        31   0.8085 0.6050    0.05776 0.11893
        32   0.8060 0.5989    0.06435 0.13150
        33   0.8035 0.5948    0.06083 0.12350
        64   0.8110 0.6095    0.05418 0.11089
——————————————————
Variables Accuracy  Kappa AccuracySD KappaSD Selected
        18   0.7810 0.5478    0.06127  0.1210
        19   0.7783 0.5425    0.06264  0.1249
        20   0.7883 0.5635    0.06863  0.1384
        21   0.7833 0.5525    0.05086  0.1031
        22   0.7860 0.5598    0.06262  0.1255
        23   0.7809 0.5482    0.06145  0.1229
        24   0.7910 0.5700    0.06230  0.1222
        25   0.7936 0.5756    0.05948  0.1161        *
        26   0.7910 0.5692    0.07010  0.1401
        27   0.7935 0.5743    0.04951  0.0961
        28   0.7810 0.5490    0.05877  0.1162
        29   0.7810 0.5497    0.06303  0.1229
        30   0.7835 0.5543    0.05246  0.1004
        31   0.7911 0.5700    0.06520  0.1269
        32   0.7935 0.5743    0.05483  0.1066
        33   0.7860 0.5599    0.06885  0.1351
        64   0.7911 0.5692    0.06441  0.1308
—————————————————–
Variables Accuracy  Kappa AccuracySD KappaSD Selected
        21   0.8010 0.5866    0.07637  0.1623
        25   0.8013 0.5874    0.07015  0.1492
        28   0.7986 0.5810    0.08060  0.1721
        30   0.7986 0.5813    0.06582  0.1419
        33   0.8034 0.5912    0.08454  0.1788        *
        64   0.7988 0.5850    0.07505  0.1575

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Care 特征选择 CAR ARE RET library profile method 如何

沙发
彼岸没有灯塔 发表于 2015-12-19 12:15:17
应该是选择最高的那个数量吧。rfe会把特征重要性依次排序,size是留在模型里的比较重要的特征数量。
按照我的观点,应该选择Accuracy和  Kappa比较高,而且SD低的那个size。这说明模型预测精度高,而且比较稳定。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 02:59