[问答] 怎么删除重复项 [推广有奖]

11楼

不二不幸福 发表于 2018-5-5 11:12:09

cheetahfly 发表于 2018-5-4 21:55
不超过1G的数据应该妥妥的没问题，如果超过10个G，就用data.table包：
dt

超过10G了，还是用read.table()读取数据吗？感觉读取数据就很费时间

12楼

cheetahfly

发表于 2018-5-5 13:00:16 来自手机

不二不幸福发表于 2018-5-5 11:12
超过10G了，还是用read.table()读取数据吗？感觉读取数据就很费时间

data.table::fread()

13楼

alecwf 发表于 2019-11-14 07:17:35

不错。好多方法

14楼

felixzhao123 发表于 2019-11-14 13:57:53

library(dplyr)
x <- data.frame(v1 = c("aaa","aaa","bbb","aaa","ccc","bbb"), v2 = c(111,222,111,111,222,111), v3 = c(222,111,333,222,222,444))
x
x <- x %>%
distinct(v1,v2,v3,.keep_all = TRUE)

复制代码

已有 1 人评分	论坛币	学术水平	热心指数	信用等级	收起理由
admin_kefu	+ 20	+ 2	+ 2	+ 2	热心帮助其他会员

总评分: 论坛币 + 20 学术水平 + 2 热心指数 + 2 信用等级 + 2 查看全部评分

加好友,备注cda
拉您进交流群