今天主要学习了数据预处理,数据去量纲化(标准化,归一化),分类型和连续性缺失值处理。
如果数据集里既有离散的变量,又有连续的变量,需要分而治之,离散的变量做编码的操作,如何使用的不是基于树模型的算法的话(KNN,逻辑回归,回归,感知机,SVM,神经网络)连续的特征需要做去量纲。
今天的内容不是很难,很好理解,操作也很好。
|
楼主: 丁胜杰
|
1324
0
[学习笔记] 【学习笔记】今天主要学习了数据预处理,数据去量纲化(标准化,归一化),分 ... |
|
硕士生 8%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


