楼主: Ticous
4269 8

[问答] R语言 带逗号字段csv文件读取求助 [推广有奖]

  • 0关注
  • 0粉丝

初中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
132 点
帖子
5
精华
0
在线时间
28 小时
注册时间
2019-4-12
最后登录
2020-9-8

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
对于读取csv文件时,特别怕遇到内容含有“,”的据),分隔符就没有办法用了,目前我会的三种读取都不可行
read.csv 读取文件后,不知道有什么问题,比原数据量少了一半(千万行,9列的数据)
fread 读取文件,因为碰到内容含有“,”的,检测出列数不对就直接停止了,有没有办法让他跳过错误行,直接读取下面的数据?
read_csv 读取文件,编码出错读取文件是乱码,readr是否没有办法更改读取编码?我重新找了一份类似的文件上传了,求助 1556074498(1).png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据量 有没有 分隔符

1.txt

164 Bytes

类似文件

沙发
jalonso 发表于 2019-4-23 20:00:08 |只看作者 |坛友微信交流群
read.csv 里设置 sep=“,” 不好用么?
另外建议上传部分数据让大家看看,比较容易解决问题

使用道具

藤椅
Whig 在职认证  发表于 2019-4-23 21:05:24 |只看作者 |坛友微信交流群
啊?csv里的字段一般用逗号分隔,你是说字段内容也是逗号分隔的?比如英文中的数字100,000这种?

使用道具

板凳
Ticous 发表于 2019-4-24 10:40:32 |只看作者 |坛友微信交流群
Whig 发表于 2019-4-23 21:05
啊?csv里的字段一般用逗号分隔,你是说字段内容也是逗号分隔的?比如英文中的数字100,000这种?
对,就是这样

使用道具

报纸
Ticous 发表于 2019-4-24 11:00:40 |只看作者 |坛友微信交流群
jalonso 发表于 2019-4-23 20:00
read.csv 里设置 sep=“,” 不好用么?
另外建议上传部分数据让大家看看,比较容易解决问题
sep=","把内容中的逗号也进行分列了,我重新传了一份类似数据,麻烦您再看一下

使用道具

地板
Whig 在职认证  发表于 2019-4-24 12:00:47 |只看作者 |坛友微信交流群
Ticous 发表于 2019-4-24 10:40
对,就是这样
这样是读取不了的,你必须用空格或者双引号来分隔字段。就是人工来看,也没办法区分里面的逗号是字段分隔号还是英语里的千位分隔符呀

使用道具

7
Ticous 发表于 2019-4-24 12:18:56 |只看作者 |坛友微信交流群
Whig 发表于 2019-4-24 12:00
这样是读取不了的,你必须用空格或者双引号来分隔字段。就是人工来看,也没办法区分里面的逗号是字段分隔 ...
因为这类型的数据较少,可以在读入的时候作为异常值自动剔除吗

使用道具

8
Whig 在职认证  发表于 2019-4-24 13:17:59 |只看作者 |坛友微信交流群
Ticous 发表于 2019-4-24 12:18
因为这类型的数据较少,可以在读入的时候作为异常值自动剔除吗
用readLines按行读,每一行根据逗号去做split,长度大于你的列数的就跳过

使用道具

9
Ticous 发表于 2019-4-24 19:20:55 |只看作者 |坛友微信交流群
Whig 发表于 2019-4-24 13:17
用readLines按行读,每一行根据逗号去做split,长度大于你的列数的就跳过
虽然加了很多乱七八糟的代码,不过总算可以正常读入了,感谢~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 13:15