楼主: Jiayin2021
1578 2

[问答] 用两个数值的平均值来填充missing value [推广有奖]

  • 0关注
  • 0粉丝

VIP1

学前班

80%

还不是VIP/贵宾

-

威望
0
论坛币
980 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
40 点
帖子
2
精华
0
在线时间
2 小时
注册时间
2021-11-28
最后登录
2021-12-27

楼主
Jiayin2021 发表于 2021-11-28 20:15:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
你好,有一系列缺失值,想用缺失值最邻近的上面的那个数值和下面那个数值来填充这一系列缺失值,应该怎么处理?

如  数据类似
x  y
1  9
2  9
3  10
4  NA
5  NA
6  12
7  11
8  8
9  NA
10 NA
11 6

填充后想变成
  y
1  9
2  9
3  10
4  11
5  11
6  12
7  11
8  8
9  7
10 7
11 6

用了KNN插值处理,可能因为实际数据缺失值较大所以出现报错
类似,
data_new<-knnImputation(data, k =2,meth='mean', distData = NULL)
报错
Error in knnImputation(data_heartrate, k = 2, meth = "mean", distData = NULL) :
  Not sufficient complete cases for computing neighbors.
In addition: Warning message:
In knnImputation(data_heartrate, k = 2, meth = "mean", distData = NULL) :
  NAs introduced by coercion
这个代码在缺失值较少的时候试过没有问题。请各位大佬建议解决,感谢帮助!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:missing value SSIN Miss alue

沙发
s609078902 发表于 2021-11-29 09:04:09
  1. library(tidyverse)
复制代码


藤椅
s609078902 发表于 2021-11-29 09:04:57
  1. df <- tibble(x = c(9, 9, 10, NA, NA, 12, 12, 11, 8, NA, NA, 6),
  2.              y = x)

  3. df %>%
  4.   fill(x, .direction = "up") %>%
  5.   fill(y, .direction = "down") %>%
  6.   rowwise() %>%
  7.   mutate(z = mean(c(x, y)))
复制代码
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 6 + 6 + 6 热心帮助其他会员
万人往LVR + 5 + 4 + 4 + 4 精彩帖子

总评分: 论坛币 + 5  学术水平 + 10  热心指数 + 10  信用等级 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-4 01:42