楼主: 2286116865
2265 12

[问答] R小白,请教大家,R如何full_join多个CSV文件,感谢! [推广有奖]

  • 2关注
  • 4粉丝

已卖:207份资源

讲师

16%

还不是VIP/贵宾

-

威望
0
论坛币
373 个
通用积分
1.9084
学术水平
1 点
热心指数
6 点
信用等级
1 点
经验
7033 点
帖子
294
精华
0
在线时间
294 小时
注册时间
2015-5-3
最后登录
2026-1-8

楼主
2286116865 发表于 2021-11-17 15:08:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
大家好,我是R菜鸟,最近需要使用公共数据库的数据,因为数据集有很多个,都是CSV格式的,特别想用R实现多个CSV文件的合并,合并效果希望是dplyr包的full_join呈现的效果,百度尝试了很多方法,还是没有得到理想解决,希望大家能帮帮忙,谢谢啊!感谢!另外,还遇到一个问题,如果full_join数据集A有的,而数据集B无的单元格会赋值为NA,那是不是这个单元格对应的变量就变成了字符型变量呢,该怎么保持这个变量的性质不变呢?再次感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:FULL join 字符型变量 dplyr 数据集

沙发
nieqiang110 学生认证  发表于 2021-11-18 06:20:47
首先,用str命令挨个检查每个文件的结构,你可以看到不同变量的类型。如果要合并的文件类型不同,需要预先调整。
其次,full_join合并出现NA是正常的。合并后,你可以根据自己的需要,去除缺省值。
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

藤椅
s609078902 发表于 2021-11-18 10:10:06
1. 你都查到用 full_join() 了,那直接用不就行了;
2. NA 不一定是字符型。R会根据你该列的类型决定 NA 的类型,即如果你该列是数值型的,那么该列的 NA 也是数值型的。
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

板凳
2286116865 发表于 2021-11-18 16:17:17
s609078902 发表于 2021-11-18 10:10
1. 你都查到用 full_join() 了,那直接用不就行了;
2. NA 不一定是字符型。R会根据你该列的类型决定 NA  ...
感谢,因为我要合并的是多个CSV格式的数据集,我了解的是full_join只能一次合并两个,三个以上似乎就不行了,所以不知道怎么办了,苦恼中。

报纸
2286116865 发表于 2021-11-18 16:19:44
s609078902 发表于 2021-11-18 10:10
1. 你都查到用 full_join() 了,那直接用不就行了;
2. NA 不一定是字符型。R会根据你该列的类型决定 NA  ...
关于第二个问题,我也会用R尝试看下数据类型,因为我是合并的数据集用SPSS打开后发现有原来数值型有NA的变量变成了字符型变量,正在尝试解决办法。

地板
2286116865 发表于 2021-11-18 16:22:58
nieqiang110 发表于 2021-11-18 06:20
首先,用str命令挨个检查每个文件的结构,你可以看到不同变量的类型。如果要合并的文件类型不同,需要预先 ...
感谢,目前我的都是CSV格式的数据集,但是我不会三个及以上的数据集的合并呈现full_join效果,您能具体用代码教一下吗,感谢感谢!

7
nieqiang110 学生认证  发表于 2021-11-18 22:00:11
在确保你的每一个数据集变量格式正确的前提下:
data1%>%dplyr::full_join(data2)%>%full_join(data3)->data123

8
s609078902 发表于 2021-11-19 09:15:40
2286116865 发表于 2021-11-18 16:22
感谢,目前我的都是CSV格式的数据集,但是我不会三个及以上的数据集的合并呈现full_join效果,您能具体用 ...
写个 for 循环

9
2286116865 发表于 2021-11-19 09:30:32
nieqiang110 发表于 2021-11-18 22:00
在确保你的每一个数据集变量格式正确的前提下:
data1%>%dplyr::full_join(data2)%>%full_join(data3)->d ...
谢谢,这个跑出来了!太感谢了,另外,刚开始我以为您说的是文件格式都一样的前提,比如我的都是CSV格式,现在我不太能理解变量格式正确的前提是什么意思,变量格式已经是网上已经确定了的,Joining by的变量的类型都是一样的是否就是您说的变量格式正确呢?

10
nieqiang110 学生认证  发表于 2021-11-19 09:58:21
2286116865 发表于 2021-11-19 09:30
谢谢,这个跑出来了!太感谢了,另外,刚开始我以为您说的是文件格式都一样的前提,比如我的都是CSV格式, ...
所有的数据都是脏数据,我只是说您逐项检查变量格式是否是正确的

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-27 14:52