对于一般模型影响不大,但对于回归模型而言,容易易导致回归系数标准误降低,使得对应p值减小。
重复值过多,样本随机误差降低,造成参数的贡献程度会被高估。
一般代码为:drop_duplicates(inplace=True)
|
楼主: 我是小趴菜
|
544
0
[数据挖掘新闻] 为什么要先去除重复值 |
|
教授 35%
-
|
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


