请选择 进入手机版 | 继续访问电脑版
楼主: bala8lacrimosa
1162 5

[有偿编程] 一个关于利用R实现数据框中字段模糊匹配的问题 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

高中生

37%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
56 点
帖子
3
精华
0
在线时间
55 小时
注册时间
2020-1-28
最后登录
2023-11-26

10论坛币
HBZ 34 12
HBG1/HBG2 3 2
ALAS2 6 43
DCT 23 1
TDGF1/TDGFP3/TDGF2 44 89

PRX 23 4
IL1B 56 123
HBG2 56 89
PI16 45 75
ACOX1 234 56
如图,在表格1中有的数据有多个名字,而表格2中对应的数据只有一个名字,如表1中的HBG1/HBG2和表2中的HBG2,现在我想将两个表按行名相同的进行合并,然而这种多个名字对一个名字的我实在想不出怎样写代码才能避免数据删失
关键词:R实现 数据框 Cox DCT 行合并
sanjie27 发表于 2020-1-28 07:29:12 |显示全部楼层 |坛友微信交流群
  1. library(dplyr)
  2. library(tidyr)
  3. df_1 <- data.frame(name = c("HBZ", "HBG1/HBG2", "ALAS2", "DCT", "TDGF1/TDGFP3/TDGF2"),
  4.                    value_1 = c(34, 3, 6, 23, 44),
  5.                    value_2 = c(12, 2, 43, 1, 89))
  6. df_2 <- data.frame(name = c("PRX", "IL1B", "HBG2", "PI16", "ACOX1"),
  7.                    numeric_1 = c(23, 56, 56, 45, 234),
  8.                    numeric_2 = c(4, 123, 89, 75, 56))

  9. # 主要就是这个函数
  10. df_1 <- separate_rows(df_1, name)

  11. df_1 %>%
  12.   inner_join(df_2)
复制代码

使用道具

屋檐滴语 发表于 2020-1-29 12:36:36 |显示全部楼层 |坛友微信交流群
你得自定义一张表,把他们的关系一一对应起来,然后利用dplyr包的left_join函数就可以搞定了。

使用道具

屋檐滴语 发表于 2020-1-29 12:36
你得自定义一张表,把他们的关系一一对应起来,然后利用dplyr包的left_join函数就可以搞定了。
手动自定义的话工作量太大了 这个表有2万行 像这样重复的有几千个。。。

使用道具

湘江之水 发表于 2020-8-20 15:37:03 |显示全部楼层 |坛友微信交流群

使用道具

sanjie27 发表于 2020-8-21 14:32
谢谢您~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-16 22:33