楼主: pandaxiong2012
7886 4

[问答] 请问各位大神如何对一个excel中的数据集用R实现缺失值处理啊? [推广有奖]

  • 21关注
  • 4粉丝

讲师

30%

还不是VIP/贵宾

-

威望
0
论坛币
992 个
通用积分
5.9100
学术水平
11 点
热心指数
10 点
信用等级
9 点
经验
8118 点
帖子
422
精华
0
在线时间
489 小时
注册时间
2012-5-30
最后登录
2022-8-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大神,谁能给提点一下怎么在R语言中实现缺失值的处理,不是简单地删除,而是用其他的方法进行填补,数据集为一excel数据,大约1000条数据的样子。求问啊,再网上找了下,把网上的方法粘在这里吧,不过貌似不太对,用不了。求问各路大仙还有没有其他的方法?谢谢啦,急用!网上方法如下:
三、处理缺失数据

  • 删除缺失数据样本,其前提是缺失数据的比例较少,而且缺失数据是随机出现的,这样删除缺失数据后对分析结果影响不大。
  • 用变量均值或中位数来代替缺失值,其优点在于不会减少样本信息,处理简单。但是缺点在于当缺失数据不是随机出现时会产成偏误。
  • 多重插补法(Multiple imputation):多重插补是通过变量间关系来预测缺失数据,利用蒙特卡罗方法生成多个完整数据集,再对这些数据集分别进行分析,最后对这些分析结果进行汇总处理。在R语言中实现方法是使用mice包中的mice函数,生成多个完整数据集存在imp中,再对imp进行线性回归,最后用pool函数对回归结果进行汇总。汇总结果的前面部分和普通回归结果相似,nmis表示了变量中的缺失数据个数,fmi表示fraction of missing information,即由缺失数据贡献的变异。
----------------------
library(mice)
imp=mice(sleep,seed=1234)
fit=with(imp,lm(Dream~Span+Gest))
pooled=pool(fit)
summary(pooled)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:EXCEL 缺失值处理 exce xcel 缺失值 R语言 缺失值处理

最近一直在学R,累坏了,而且进展太慢!
沙发
水天一色DIY 在职认证  发表于 2013-5-18 10:43:51 |只看作者 |坛友微信交流群
mice,mi,Amelia & mvnmle packages also can deal with missing data,it will depend on your data.

使用道具

藤椅
pandaxiong2012 发表于 2013-5-21 15:23:11 |只看作者 |坛友微信交流群
水天一色DIY 发表于 2013-5-18 10:43
mice,mi,Amelia & mvnmle packages also can deal with missing data,it will depend on your data.
thank you!但是我想问问如何在R环境下对多变量缺失值进行填补呢?感觉不太会啊,因为R语言最近才学的。
最近一直在学R,累坏了,而且进展太慢!

使用道具

板凳
张冬阳 发表于 2015-5-28 16:23:29 |只看作者 |坛友微信交流群
楼主你好,我最近也在做多重插补法,毕业论文,用到MICE和VIM,过两天要交论文了,好急好急,楼主可否指点一二

使用道具

报纸
Say_┉ 学生认证  发表于 2018-1-28 02:50:54 |只看作者 |坛友微信交流群
楼主你好,利用mice进行缺失数据处理,是不是要多个变量才可以,而且要知道变量间的关系是什么才行对吧

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 20:20