需要先进行训练集和测试集的拆分, 然后才能进行归一化
原因: 测试集是为了评估模型的在未知数据中的表现情况, 归一化的过程, 也是我们建模中的一步, 如果说将测试集也放到归一化模型的训练过程当中, 那么就等于说我们的模型接触到了测试集的信息。这种情况称为数据泄露, 在建模过程当中是不允许的。
|
楼主: 我是小趴菜
|
769
1
[数据挖掘新闻] 机器学习:先进性归一化处理还是先拆分数据集 |
|
教授 35%
-
|
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


