楼主: melody21
5425 5

[问答] 如何快速定位包含missing value的变量 [推广有奖]

  • 4关注
  • 6粉丝

已卖:5份资源

讲师

49%

还不是VIP/贵宾

-

威望
0
论坛币
3199 个
通用积分
462.0354
学术水平
36 点
热心指数
48 点
信用等级
36 点
经验
138 点
帖子
349
精华
0
在线时间
544 小时
注册时间
2007-7-14
最后登录
2023-2-4

楼主
melody21 发表于 2015-6-23 03:17:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一个600多个变量的数据集,有continuous, categorical variables
在R里,如何快速知道哪些变量包含missing value?
换言之,如何能将有missing value的变量作为输出结果?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:missing value SSIN Miss alue continuous 如何

沙发
ryoeng 在职认证  发表于 2015-6-23 03:27:47
提示: 作者被禁止或删除 内容自动屏蔽

藤椅
melody21 发表于 2015-6-23 03:33:27
ryoeng 发表于 2015-6-23 03:27
查了下,是个package。看看去。谢谢

板凳
云豹 发表于 2015-6-23 21:13:50
个人工作学习中常用的方法是,is.na(checking data frame),然后colSum.
如果colSum>0,那就是至少有一个missing value 了

或者直接每一个col用anyNA()

报纸
melody21 发表于 2015-6-24 04:38:48
云豹 发表于 2015-6-23 21:13
个人工作学习中常用的方法是,is.na(checking data frame),然后colSum.
如果colSum>0,那就是至少有一个mis ...
谢谢帮助。我的问题是,数据特别大,总共有800多个变量。
一般我都在数据整理部分将missing调整过了,但是还想在跑模型之前,快速确认一遍。
变量特别多,所以在想,有没有个函数,跑一下,就能把还含有missing的变量列出来。
类似于SAS中:
proc means data= sample n nmiss; run;
就可以查所有的数值型变量。

地板
云豹 发表于 2015-6-24 05:53:06
melody21 发表于 2015-6-24 04:38
谢谢帮助。我的问题是,数据特别大,总共有800多个变量。
一般我都在数据整理部分将missing调整过了,但 ...
which(colSums(is.na(df))!=0)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 01:03