楼主: sunnyaimee
1605 5

[问题] 大家都怎么做Feature Selection? [推广有奖]

  • 0关注
  • 0粉丝

本科生

46%

还不是VIP/贵宾

-

威望
0
论坛币
107 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2507 点
帖子
41
精华
0
在线时间
152 小时
注册时间
2009-10-10
最后登录
2018-12-29

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求分享一些机器学习里feature selection的方法
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Selection Election feature Select Elect

沙发
飞天玄舞6 发表于 2017-9-21 08:56:29 |只看作者 |坛友微信交流群
http://blog.csdn.net/column/details/15615.html
可以看一下这个,特征选择大多出现在论文中,要更深入研究可以搜索其中的论文。

使用道具

藤椅
阿扁V5 学生认证  发表于 2017-9-21 13:48:04 |只看作者 |坛友微信交流群
简单的有计算一些统计方法、指标进行筛选,如单因素方差分析、卡方检验、特征与响应变量之间的相关系数、距离相关系数、信息增益、Gini系数等;复杂一点的用逐步回归、遗传算法、岭回归、lasso回归、弹性网络等,或者用一些模型计算变量重要性,如随机森林、决策树等等

使用道具

板凳
sunnyaimee 发表于 2017-9-23 22:41:29 |只看作者 |坛友微信交流群
阿扁V5 发表于 2017-9-21 13:48
简单的有计算一些统计方法、指标进行筛选,如单因素方差分析、卡方检验、特征与响应变量之间的相关系数、距 ...
不平衡数据有什么特别的方法吗?
我现在是先用信息增益, 随机森林什么的初选,然后模型用xgboost,调参,再之后想做一个更细致的特征选择,主要是因为production 的时候特征太多不方便。有什么建议吗?

谢啦

使用道具

报纸
阿扁V5 学生认证  发表于 2017-9-24 16:34:20 来自手机 |只看作者 |坛友微信交流群
不平衡数据用过采样或者欠采样,欠采样比较简单,就是从多类抽取和少类相同个数的样本,过采样可以用smote方法生成新样本,r有smote函数,特征的进一步选择建议用lasso或者弹性网络,筛选得到标准化系数稳定且显著的变量

使用道具

地板
jiawenqi111 发表于 2017-11-13 11:06:53 |只看作者 |坛友微信交流群
先占坑,回头再回答

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 04:46