请教大家,假如有10个变量,X1-X10,其中部分有缺失值。
如果某个观测有4个以上的变量存在缺失值,那么删除这个观测。
如果有3个以下的变量有缺失值,则用该变量的均数填补这些缺失值。
这个用R怎么写更简洁呢?
逐一识别每个变量的每个观测的缺失值情况(is.na),再计数缺失情况(用什么函数),然后怎么填补(用impute(data$X1,mean))?
|
楼主: pingguzh
|
1708
5
[问答] 请教缺失值识别及处理的方法 |
|
副教授 48%
-
|
| ||
|
统计爱好
|
|||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


