现有1.txt文件,格式如下:
aaa 111 222
aaa 222 111
bbb 111 333
aaa 111 222
ccc 222 222
bbb 111 444
希望去除重复项,最后得到:
aaa 111 222
aaa 222 111
bbb 111 333
ccc 222 222
bbb 111 444
数据很大,希望找到一种比较有效率的方式,试过unique,但是并没有达到目的
|
楼主: 不二不幸福
|
4016
13
[问答] 怎么删除重复项 |
|
硕士生 33%
-
|
回帖推荐cheetahfly 发表于9楼 查看完整内容 不超过1G的数据应该妥妥的没问题,如果超过10个G,就用data.table包:
dt
| ||
|
|
| ||||||||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


