楼主: Silon.Jon
9615 10

[问答] <奇葩问题高手进>R读取引号中带逗号的csv文件 [推广有奖]

  • 7关注
  • 0粉丝

本科生

43%

还不是VIP/贵宾

-

威望
0
论坛币
1281 个
通用积分
0.0002
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2606 点
帖子
86
精华
0
在线时间
67 小时
注册时间
2012-9-12
最后登录
2015-5-1

楼主
Silon.Jon 发表于 2015-4-21 19:06:51 |AI写论文
10论坛币
读取命令如下:

a=read.csv("~/App_Annie_Intelligence_Top_Unified_Apps_Charts_google-play_South Korea_Games Role Playing_2015-02-01-2015-02-28.csv",
         header = TRUE, sep = ",", quote = "\"",
         dec = ",", fill = TRUE)

第九行就错了,如图:

a.png


原文件加上列名的第十行,如图:

b.png


关键词:Intelligence Unified Playing Google Charts

沙发
Silon.Jon 发表于 2015-4-21 22:48:09
怎么还没有人啊,我的问题就是为什么第9行圈出来的那个引号没有被当成字符串标示去掉,从而导致后面很多行数据都写在第9行APP.Name这列了

藤椅
Silon.Jon 发表于 2015-4-22 10:17:54
求解啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊!

板凳
Silon.Jon 发表于 2015-4-22 14:43:38
贴个原文件吧,就是将这个CSV导入,去掉首行和尾部注释,数据行应该是1476,其中有韩文字符。 App_Annie_Intelligence_Top_Unified_Apps_Charts_google-play_South Korea_Games Rol.rar (58.89 KB) 本附件包括:
  • App_Annie_Intelligence_Top_Unified_Apps_Charts_google-play_South Korea_Games Role Playing_2015-02-01-2015-02-28.csv

报纸
tucy 发表于 2015-7-15 17:01:39
你把原来的csv文件用excel打开重新保存下,再用read.csv读看看行不行

地板
peter4553 发表于 2015-7-16 04:39:12
(你贴上来的数据我下载不了... 因为需要论坛币...) 这个问题我清洗数据的时候也经常遇到,我觉得原因是R并不能区分你“文本中的逗号”跟“分隔符逗号”。两个方法供你参考。第一,这个文件你用Excel打开如果是正常的话,那你不妨把它存成.txt (Tab delimited txt),然后在R用read.table读入。第二种方法,如果你的文本中出现逗号的情况不多,或者你这个文件在excel也不能正常打开,那估计最好的方法是手动把这些文本中的逗号改成别的字符了。

7
meishanjia1900 发表于 2015-7-18 13:25:57
tucy 发表于 2015-7-15 17:01
你把原来的csv文件用excel打开重新保存下,再用read.csv读看看行不行
甚至都不用保存,直接read.csv一点问题都没有

8
meishanjia1900 发表于 2015-7-19 00:22:41
在read.csv中,将sep与dec参数均设定为","才是出现问题的原因。如果出现逗号,计算机到底将它当成小数点,还是将它当成分隔符?

9
tucy 发表于 2015-7-21 13:56:55
meishanjia1900 发表于 2015-7-19 00:22
在read.csv中,将sep与dec参数均设定为","才是出现问题的原因。如果出现逗号,计算机到底将它当成小数点,还 ...
对,这也是个问题。
但是直接read.csv应该也不行吧,因为楼主的文件里有带逗号的字符串,而read.csv会把它当成分隔符。

10
万人往LVR 在职认证  发表于 2015-7-21 14:12:42
我读数据都是用
read.csv(...,sep="")

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 10:56