楼主: hml_morning
10734 9

[实际应用] r中怎么把缺失值较多的变量删除 [推广有奖]

  • 0关注
  • 0粉丝

初中生

80%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
139 点
帖子
8
精华
0
在线时间
18 小时
注册时间
2015-9-29
最后登录
2016-3-21

楼主
hml_morning 发表于 2015-9-29 17:48:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我有800个变量,有些变量缺失值达到80%,想把这些变量删除,怎么删除?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:缺失值

沙发
飞行员 发表于 2015-9-29 20:11:43
判断条件为
  1. sum(is.na(x)) / length(x) > 0.2
复制代码

藤椅
windblood 发表于 2015-9-29 20:18:35 来自手机
把所有变量名取出来,判断下缺失程度,缺失过多的把变量名存下,然后remove掉

板凳
oliyiyi 发表于 2015-9-29 21:40:42 来自手机
hml_morning 发表于 2015-9-29 17:48
我有800个变量,有些变量缺失值达到80%,想把这些变量删除,怎么删除?
不使用不就可以了

报纸
ryoeng 在职认证  发表于 2015-9-30 06:01:25

添加签名

提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽

地板
hml_morning 发表于 2015-9-30 09:26:42
飞行员 发表于 2015-9-29 20:11
判断条件为
我知道这个判断条件,但是800个变量,我不能一个一个判断啊?能不能写个循环或者不写循环直接就可以把所有变量筛选出来?

7
hml_morning 发表于 2015-9-30 09:27:18
ryoeng 发表于 2015-9-30 06:01
不过LZ缺失值高达 80% 的数据,分析出来的结果可信度高嚒?
我知道这个判断条件,但是800个变量,我不能一个一个判断啊?能不能写个循环或者不写循环直接就可以把所有变量筛选出来?

8
李会超 发表于 2015-9-30 09:38:59
  1. apply(b,2,function(x) sum(is.na(x)))
  2. apply(b,2,length)
复制代码

分别求出每列的缺失值个数,和列的个数,两者相除

9
愤怒的小鸟! 发表于 2015-10-1 09:51:00
请看我之前提过一个相似的问题,你可以参考一下 https://bbs.pinggu.org/thread-3906770-1-1.html

10
hml_morning 发表于 2015-10-8 13:49:15
愤怒的小鸟! 发表于 2015-10-1 09:51
请看我之前提过一个相似的问题,你可以参考一下 https://bbs.pinggu.org/thread-3906770-1-1.html
谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-8 20:45