楼主: zj_H
3831 7

[有偿编程] 删除两个数据框中的重叠部分 [推广有奖]

  • 0关注
  • 0粉丝

高中生

32%

还不是VIP/贵宾

-

威望
0
论坛币
39 个
通用积分
0.0027
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
388 点
帖子
9
精华
0
在线时间
40 小时
注册时间
2018-10-11
最后登录
2019-3-5

10论坛币
如何从一个数据框中删除一个已知的数据框?? 如图,怎样删除数据框unmature中数据框mature0 对应的数据,unmature中并不包含所有的mature0 数据,需从中筛选包含的那部分数据并删除,有什么方法可以实现??

1546601114(1).png

关键词:数据框 mature 什么方法 部分数据 Mat

回帖推荐

caimiao0714 发表于4楼  查看完整内容

感觉dplyr中有个函数anti_join()可以适用你的情况。 不过你这里面mature和unmature有什么可以对行进行唯一识别的key吗,如果有的话就是dplyr::anti_join(mature, unmature, by = "key")。 不然的话要比对65个变量是不是完全一样的话太没有效率了。
沙发
escaflowne1985 在职认证  发表于 2019-1-4 19:48:11 |只看作者 |坛友微信交流群
你这思路不对

使用道具

藤椅
zj_H 发表于 2019-1-4 19:51:55 |只看作者 |坛友微信交流群
escaflowne1985 发表于 2019-1-4 19:48
你这思路不对
???

使用道具

板凳
caimiao0714 学生认证  发表于 2019-1-5 21:19:03 |只看作者 |坛友微信交流群
感觉dplyr中有个函数anti_join()可以适用你的情况。

不过你这里面mature和unmature有什么可以对行进行唯一识别的key吗,如果有的话就是dplyr::anti_join(mature, unmature, by = "key")。

不然的话要比对65个变量是不是完全一样的话太没有效率了。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
admin_kefu + 20 + 2 + 2 + 2 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

报纸
67890 发表于 2019-1-6 08:37:36 |只看作者 |坛友微信交流群
楼上说的有道理。67个变量和65个变量不可能一样。要找到唯一的KEY. 可以是几个列数据的联合。

使用道具

地板
zj_H 发表于 2019-1-7 14:05:38 |只看作者 |坛友微信交流群
caimiao0714 发表于 2019-1-5 21:19
感觉dplyr中有个函数anti_join()可以适用你的情况。

不过你这里面mature和unmature有什么可以对行进行唯 ...
行名是对应的,unmature如果有包含在mature里面的话,行名是相同的,但还是需要每个行名进行比对,这样该怎么做??

使用道具

7
zj_H 发表于 2019-1-7 14:18:47 |只看作者 |坛友微信交流群
caimiao0714 发表于 2019-1-5 21:19
感觉dplyr中有个函数anti_join()可以适用你的情况。

不过你这里面mature和unmature有什么可以对行进行唯 ...
看了一下anti-join()似乎是可以的,不知能否把列名作为这个key,不然只能把所有的列作为key了......

使用道具

8
caimiao0714 学生认证  发表于 2019-1-7 23:36:29 |只看作者 |坛友微信交流群
zj_H 发表于 2019-1-7 14:18
看了一下anti-join()似乎是可以的,不知能否把列名作为这个key,不然只能把所有的列作为key了......
你最好能在mature和unmature之间生成一个可以唯一对应的key(或者选择之前的某个或者几个变量作为key),把全部65列作为key没有必要,算法上也非常低效率。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-12 14:50