楼主: 不二不幸福
4017 13

[问答] 怎么删除重复项 [推广有奖]

11
不二不幸福 发表于 2018-5-5 11:12:09
cheetahfly 发表于 2018-5-4 21:55
不超过1G的数据应该妥妥的没问题,如果超过10个G,就用data.table包:
dt
超过10G了,还是用read.table()读取数据吗?感觉读取数据就很费时间

12
cheetahfly 在职认证  发表于 2018-5-5 13:00:16 来自手机
不二不幸福 发表于 2018-5-5 11:12
超过10G了,还是用read.table()读取数据吗?感觉读取数据就很费时间
data.table::fread()

13
alecwf 发表于 2019-11-14 07:17:35
不错。 好多方法

14
felixzhao123 发表于 2019-11-14 13:57:53
  1. library(dplyr)
  2. x <- data.frame(v1 = c("aaa","aaa","bbb","aaa","ccc","bbb"), v2 = c(111,222,111,111,222,111), v3 = c(222,111,333,222,222,444))
  3. x

  4. x <- x %>%
  5.   distinct(v1,v2,v3,.keep_all = TRUE)
复制代码
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
admin_kefu + 20 + 2 + 2 + 2 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 13:59