1. 打卡SQL5题
2. 建模连续型X是否fen\'xian分箱:通常需要重点解释的X需要分箱,如果不是重点的X可分可不分。注意分箱后一定要是0、1、2…这样的数字,可以用LabelEncoder数字编码技术
3.OR值过大,考虑变量是否有共线性(cor系数),和数据异常值
4.正则化是解决共线性问题和数据稀疏问题,非常重要
5.有意积累好看的绘图
|
楼主: chuncha.lz
|
714
1
[学习笔记] 【学习笔记】1. 打卡SQL5题 2. 建模连续型X是否fen\'xian分箱:通常需要重点 ... |
|
硕士生 53%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


