楼主: polyphagia
1065 0

[学习分享] R语言教程:缺失值处理脚本 [推广有奖]

  • 2关注
  • 0粉丝

已卖:251份资源

博士生

10%

还不是VIP/贵宾

-

威望
0
论坛币
1413 个
通用积分
208.6144
学术水平
6 点
热心指数
6 点
信用等级
6 点
经验
14260 点
帖子
59
精华
0
在线时间
318 小时
注册时间
2020-12-12
最后登录
2025-2-23

楼主
polyphagia 学生认证  发表于 2024-10-20 15:35:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一、方法介绍

今天给大家带来脚本是缺失值处理的。为什么说这一块呢?因为我经常看到大家在用excel对缺失值进行插补,这种也是一个很好的方法,但是比较耗费时间,换句话来说性价比极低。有没有好办法呢,答案是肯定有!!

python的Numpy库中pd.fillna函数就可以搞定,语言非常简洁、方便!看到这里你是不是突然紧张一下,这一期不会是上python教程吧。哈哈哈,我个人不是特别喜欢python的语法,所以也只是在上机器学习中上python(因为python跑的更快一些),所以这一期咱们还是用R。说到缺失值,不得不提缺失值的类型,随机缺失(MAR,Missing at Random)、完全随机缺失(MCAR,Missing Completely at Random)、非随机缺失(MNAR,Missing not at Random),因为每一种缺失类型对应着不同的填补方法,一般情况下缺失数据属于随机缺失、完全随机缺失,也只有这两种类型的据能够填补,至于自己数据属于哪一类网上很多教程,本文不再阐述啦。因为我赶着打酱油去。

在R语言中,据我所知好像没有包可以快速帮我们去填补一些缺失数据(当然一些基于算法的插补除外),因此对我们来说十分的不便利。基于此,我写了几个小脚本可供大家使用。

二、操作代码1、删除法

删除法即个案的所有变量中只要存在缺失值,即将变量进行删除。这个比较简单,R里面有函数可以实现。代码如下


  1. data=read.xlsx("处理后.xlsx")#data为传入的数据new_data=na.omit(data) #删除存在存在缺失值的个案
复制代码




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


Free of the shackles

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-9 09:15