使用sklearn库的KNNImputer填充缺失值的几个问题:
1、在划分数据集为训练集和测试集前[size=13.0667px]进行缺失值填充,还是划分之后分别对训练集和测试集进行缺失值填充
[size=13.0667px]2、如果是划分数据集后进行缺失值填充,是先用fit_transform对训练集进行填充,然后使用transform对测试集填充吗?
3、[size=13.0667px]KNNImputer限制特征必须数值型,如果有类别型需要转换成数值型然后再使用,有没有比较方便的方式进行转换成数值型,然后填充完缺失值后再换回类别型


雷达卡




京公网安备 11010802022788号







