特征选择时,在下有两个问题想请教一下:
(1)做变量筛选时,数据使用训练集还是全集?
(2)我在选择用训练集进行变量筛选时,训练集的大小会影响到我变量筛选的个数,大家有遇到过这样的问题吗?是怎么解决的?那如果数据量会影响到变量筛选的结果,那筛选以后的变量还可信吗?要怎么样才能使变量筛选的结果可信度增加?
|
楼主: 露露的家园2012
|
1659
8
[问答] 特征选择的问题 |
|
博士生 78%
-
|
回帖推荐jameschin007 发表于2楼 查看完整内容 (1)做变量筛选时,数据使用训练集还是全集?
取决于你做什么模型。如果是supervised , 是训练集。 如果是unsupervised , 全集。
(2)我在选择用训练集进行变量筛选时,训练集的大小会影响到我变量筛选的个数,大家有遇到过这样的问题吗?是怎么解决的?那如果数据量会影响到变量筛选的结果,那筛选以后的变量还可信吗?要怎么样才能使变量筛选的结果可信度增加?
我猜测,你这是数据量比较小, 特征比较多。 导致统计上 ...
| ||
|
|
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


