楼主: 小鱿鱼啊
18724 9

[问答] r语言 多重插补法解决补缺失值的问题 [推广有奖]

  • 0关注
  • 1粉丝

初中生

28%

还不是VIP/贵宾

-

威望
0
论坛币
5 个
通用积分
3.0772
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
96 点
帖子
4
精华
0
在线时间
20 小时
注册时间
2013-7-20
最后登录
2024-8-18

楼主
小鱿鱼啊 发表于 2013-12-17 11:09:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
mydata<-read.csv("f:/Book1.csv")
mydata
mydata[complete.cases(mydata), ]
mydata[!complete.cases(mydata), ]
library(mice)
md.pattern(mydata)
x <- as.data.frame(abs(is.na(mydata)))#这一行是干嘛的?
head(mydata, n=111)

head(x, n=111)
imp<-mice(mydata,seed=22222)#这里运行老是显示1   1  热量摄入.千卡.  艾滋病人数.人.  艾滋病发病率.人.万人.  成年男性健康状况得分.分.  成年女性健康状况得分.分.错误于solve.default(xtx + diag(pen)) :
  系统计算上是奇异的: 倒条件数=1.90034e-16
fit=with(imp,lm(热量摄入.千卡= 艾滋病人数.人+艾滋病发病率.人.万人+成年男性健康状况得分.分+成年女性健康状况得分.分))#这里的lm后面不知道哪些设为自变量,因变量,我只是个补个缺失值,难道还要分自变量和因变量?
pooled<-pool(fit)
summary(pooled)                                             
dataset3 <- complete(imp, action=3)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多重插补 缺失值 R语言 Data

沙发
lishengyu 发表于 2013-12-23 21:55:47
x <- as.data.frame(abs(is.na(mydata)))###定义指示变量用的,即如果mydata数据缺失则对应元素1,否则为0。
imp<-mice(mydata,m) m应该是插补的次数,一般定义为5-10。
没模型的话直接运行就行了不用定义fit。
自我见解。
已有 1 人评分论坛币 收起 理由
admin_kefu + 30 热心帮助其他会员

总评分: 论坛币 + 30   查看全部评分

藤椅
张冬阳 发表于 2015-5-27 21:44:36
目前在做缺失数据有关的,多重插补法的论文,请问是否有较好的能够用于这类分析的不完全数据集

板凳
pengshizhe 发表于 2016-5-23 19:34:33
先保证变量都是数值型的,观测要多,变量要少(可减小变量数和增加观测数试试)。
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

报纸
yanling 发表于 2016-5-28 22:06:47
张冬阳 发表于 2015-5-27 21:44
目前在做缺失数据有关的,多重插补法的论文,请问是否有较好的能够用于这类分析的不完全数据集
R中有个Sleep数据
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

地板
1003133187 发表于 2019-8-25 01:34:38
您好前辈,我跟您有同样的疑问,我们进行缺失值的插补,为什么平白无故的要进行回归,如果研究主题与回归有关还好,那没有关系,为社么要用回归系数去评价插补的情况呢

7
小鱿鱼啊 发表于 2019-8-28 17:24:52
1003133187 发表于 2019-8-25 01:34
您好前辈,我跟您有同样的疑问,我们进行缺失值的插补,为什么平白无故的要进行回归,如果研究主题与回归有 ...
首先感谢lishengyu,这么多年了,才看到,顺便回答你的问题,这里从fit=with那一行开始,到summary(pooled),只是做线性回归,与多重插补法无关,只是填补缺失值的话,这三行删掉。

8
lemonade321 在职认证  发表于 2019-10-23 17:18:20
您好,关于mice插补法还想请教下,在同时生成m个完整数据集的情况下,如何去判断选择哪一个数据集呢?
百度上提到,with和pool是用来选择数据集的,但是还是没看明白如何去选择,有依据哪些参数去判断?

9
lemonade321 在职认证  发表于 2019-12-10 11:19:35
小鱿鱼啊 发表于 2019-8-28 17:24
首先感谢lishengyu,这么多年了,才看到,顺便回答你的问题,这里从fit=with那一行开始,到summary(poole ...
您好,关于mice插补法还想请教下,利用mice同时生成M个完整数据集的情况下,如何去判断哪一个数据集更好呢?百度时看到说,with和pool步骤是用啦选择数据集的,但不是很清楚要根据哪些参数去判断呢?

10
sjjjjjjjjj 发表于 2020-4-22 19:32:12
lemonade321 发表于 2019-12-10 11:19
您好,关于mice插补法还想请教下,利用mice同时生成M个完整数据集的情况下,如何去判断哪一个数据集更好呢 ...
你好,请问如何将生成的几套数据合并成一套呢?求回复,谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 07:02