建模时,如果有缺失值,就需要插值补全。如果用一个固定值(如均值,中位数等)替代缺失值,那么需先将数据集拆分成训练集和验证集后,用训练集计算补全的固定值并将其应用到验证数据集。如果使用proc mi插值,可否在数据集拆分前就插值?数据集拆分前就插值与拆分后训练集和验证集分别插值有什么不同?谢谢!
楼主: supersu35
|
1155
0
[问答] 缺失值补全的问题 |
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明