请选择 进入手机版 | 继续访问电脑版
楼主: 两仪织丶
1048 4

[问答] 请问如何处理掉自己不想要的缺失值? [推广有奖]

  • 0关注
  • 0粉丝

VIP4

高中生

10%

还不是VIP/贵宾

-

威望
0
论坛币
79699 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
320 点
帖子
8
精华
0
在线时间
17 小时
注册时间
2019-1-7
最后登录
2019-11-17

两仪织丶 发表于 2019-2-22 06:37:37 |显示全部楼层 |坛友微信交流群
100论坛币
最近分析的数据缺失值较多,而且分布在不同列。有些列的数据无关紧要所以我不想删除因此无法使用dropna(axis=0)。我只想删除或填补特定列的缺失值请问该如何实现?如果填补数据使用哪种方法比较好呢?

关键词:缺失值 drop 无关紧要 如何实现 数据缺失
soojinfan 发表于 2019-2-22 06:45:06 |显示全部楼层 |坛友微信交流群
简单的方法就是用平均值代替呗, 如何处理 missing data 本身就是一个很重要的研究方向

使用道具

gjinwei 发表于 2019-2-22 09:07:03 |显示全部楼层 |坛友微信交流群

使用道具

齐物论pi 学生认证  发表于 2019-2-23 18:38:02 |显示全部楼层 |坛友微信交流群
你这问的太广泛了,不过csdn上有很多方法,你完全可以去找适应你的方案

使用道具

phenix_022 发表于 2019-2-28 14:49:38 |显示全部楼层 |坛友微信交流群
data["columnName"].fillna(0) # 用0填充某一列的缺失值
data[data["columnName"].notnull()]  # 按照某一列的缺失值筛选
一般用上一个值、平均值、0、-99999  要根据实际情况判断

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 16:27