签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › 求助，如何筛选含有特定缺失值的行？

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 显身卡| 道具中心

楼主: lanhong1993

7895 12

[程序分享] 求助，如何筛选含有特定缺失值的行？ [推广有奖]

1关注
1粉丝

博士生

54%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 2701 个
通用积分: 3.4261
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 12167 点
帖子: 214
精华: 0
在线时间: 141 小时
注册时间: 2016-11-1
最后登录: 2024-3-26

楼主

lanhong1993 发表于 2017-3-29 16:56:45 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

数据集如下：

id var1 var2 var3 var4 var5
1 5.4 6.7 5.8 4.9    NA
3 5.5 6.0 7.9 NA    8.8
5 2.9 9.9    8.9 5.9    NA
6 NA    NA    NA    8.7    6.8
7 4.9 2.0 8.9 3.8    5.8
10 4.4 3.8 6.8 NA    NA

......    ........
我想筛选出变量var5为缺失值，而其他变量均不是缺失值的行，比如第一行和第三行，这该怎么做呢？

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：缺失值 VaR 怎么做筛选出数据集如何

相关帖子

回复

使用道具举报

沙发

johnmy 发表于 2017-3-29 18:09:28 |只看作者 |坛友微信交流群

假设你的数据框是a

library(dplyr)
a%>%filter(!is.na(var1),!is.na(var2),!is.na(var3),!is.na(var4),is.na(var5))

已有 1 人评分	经验	收起理由
李会超	+ 20	精彩帖子

总评分: 经验 + 20 查看全部评分

回复

使用道具举报

藤椅

丘延君 发表于 2017-3-30 07:36:32 来自手机 |只看作者 |坛友微信交流群

lanhong1993 发表于 2017-3-29 16:56
数据集如下：

id var1 var2 var3 var4 var5

A<-A[which(is.na(A$var5)),]

已有 1 人评分	经验	收起理由
李会超	+ 20	精彩帖子

总评分: 经验 + 20 查看全部评分

回复

使用道具举报

板凳

jgchen1966 发表于 2017-3-30 12:08:40 |只看作者 |坛友微信交流群

johnmy 发表于 2017-3-29 18:09
假设你的数据框是a

library(dplyr)

条件设置，似有问题吧。该是：
a%>%filter(not(is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4)) & is.na(var5))
但是：
如果，有几百，甚至上千个变量，如何办？？推荐 purrr包中的相关函数！！

回复

使用道具举报

报纸

johnmy 发表于 2017-3-30 13:07:51 |只看作者 |坛友微信交流群

jgchen1966 发表于 2017-3-30 12:08
条件设置，似有问题吧。该是：
a%>%filter(not(is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4)) & i ...

两个得到的结果一样，
“not”应该是“！”

回复

使用道具举报

地板

johnmy 发表于 2017-3-30 13:09:50 |只看作者 |坛友微信交流群

!(x |y) is the same as !x & !y.

回复

使用道具举报

7楼

jgchen1966 发表于 2017-3-30 13:32:01 |只看作者 |坛友微信交流群

johnmy 发表于 2017-3-30 13:07
两个得到的结果一样，
“not”应该是“！”

"not",是magrittr包中提供的一个很好“ ！”代替！

回复

使用道具举报

8楼

jgchen1966 发表于 2017-3-30 13:40:52 |只看作者 |坛友微信交流群

johnmy 发表于 2017-3-30 13:09
!(x |y) is the same as !x & !y.

用not(x | y) ，在将一个数据集按 x | y 条件分成二部分等操作中，比 not(x) & not(y),不仅省代码，也更易用。尤其，在繁重的大数据集的清理工作中。。

回复

使用道具举报

9楼

jgchen1966 发表于 2017-3-30 13:52:56 |只看作者 |坛友微信交流群

jgchen1966 发表于 2017-3-30 13:40
用not(x | y) ，在将一个数据集按 x | y 条件分成二部分等操作中，比 not(x) & not(y),不仅省代码，也更 ...

比如，楼一的数据集，其实更好的操作，按条件(is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4)) 分成二部分：
a1<filter(a,is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4))

a2<-filter(a,not(is.na(var1)|is.na(var2)|is.na(var3)|is.na(var4)))
然后，使用a2，或取出var5为NA的，这真是楼主想要的，或用a2进行var5缺失的补值。

回复

使用道具举报

10楼

小朝 发表于 2017-3-30 21:58:25 |只看作者 |坛友微信交流群

library(dplyr)
a <- read.table('D:/a.txt',header = T)
a <- a %>% mutate(t=rowSums(is.na(a))) %>% filter(is.na(var5) & t==1)

复制代码

回复

使用道具举报

发帖

本版微信群

加好友,备注cda
拉您进交流群

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明