楼主: zwj1012
2893 4

[有偿编程] 关于数据质量的检测 [推广有奖]

  • 0关注
  • 0粉丝

本科生

46%

还不是VIP/贵宾

-

威望
0
论坛币
330 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
910 点
帖子
53
精华
0
在线时间
103 小时
注册时间
2008-11-9
最后登录
2021-9-8

50论坛币
向各位高手请教:

想要用R语言来检查大量数据的质量,具体想检查的项目为:
  • 每个文件数据的字段总数(因为有很多个数据文件,每个文件字段数会有不同);
  • 各字段的数据量(有多少条数据);
  • 数据的完整性:多少个字段有数据缺失(空值)、数据缺失的比例;

十分感谢!

关键词:数据质量 数据缺失 数据文件 完整性 R语言 检测
沙发
李会超 发表于 2014-12-24 16:48:50 |只看作者 |坛友微信交流群
如果要查看多少行数据,可以用nrows;查找缺失值可以用is.na,完整数据集是complete.cases

使用道具

藤椅
zwj1012 发表于 2014-12-25 09:21:34 |只看作者 |坛友微信交流群
李会超 发表于 2014-12-24 16:48
如果要查看多少行数据,可以用nrows;查找缺失值可以用is.na,完整数据集是complete.cases
能再说的详细点吗

使用道具

板凳
李会超 发表于 2014-12-25 09:30:31 |只看作者 |坛友微信交流群
zwj1012 发表于 2014-12-25 09:21
能再说的详细点吗
如果你一点R基础都没有的话,我觉得多说无益,如果有点R基础的话,上面那些话就够了
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
yywan0913 + 1 + 1 + 1 任性

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

报纸
zwj1012 发表于 2014-12-25 09:45:17 |只看作者 |坛友微信交流群
李会超 发表于 2014-12-25 09:30
如果你一点R基础都没有的话,我觉得多说无益,如果有点R基础的话,上面那些话就够了
谢谢。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 07:09