滤式方法先对数据集进行特征选择,然后再训练学习器。特征选择过程与后续学习器无关,这相当于先对初始特征进行“过滤”,再用过滤后的特征训练模型。
过滤式选择的方法有:
1. 移除低方差的特征;
2. 相关系数排序,分别计算每个特征与输出值之间的相关系数,设定一个阈值,选择相关系数大于阈值的部分特征;
3. 利用假设检验得到特征与输出值之间的相关性,方法有比如卡方检验、t检验、F检验等。
4. 互信息,利用互信息从信息熵的角度分析相关性。
|
楼主: 我是小趴菜
|
531
0
[数据挖掘工具] 特征选择中什么是过滤式? |
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


