楼主: huyiustc
41907 11

[问答] 文件读入出错,求坛友们指点 [推广有奖]

  • 9关注
  • 16粉丝

wizard

教授

34%

还不是VIP/贵宾

-

威望
0
论坛币
7669 个
通用积分
54.6497
学术水平
42 点
热心指数
47 点
信用等级
31 点
经验
9875 点
帖子
531
精华
0
在线时间
1965 小时
注册时间
2011-8-27
最后登录
2024-5-7

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
> read.csv(file="D:\\Data\\rd\\01.csv",header=TRUE)
错误于make.names(col.names, unique = TRUE) :
  '<ff><fe><53>'多字节字符串有错
此外: 警告信息:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 2 appears to contain embedded nulls
3: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 3 appears to contain embedded nulls
4: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 4 appears to contain embedded nulls
5: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 5 appears to contain embedded nulls
>
请问这是什么情况,求高手指点,我把csv表格header行删除后就能读入,但保留header就出错,why?
01.rar (12.82 MB) 本附件包括:
  • 01.csv
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Embedded Contain appears appear unique appears contain 字符串 file 信息

捕获.GIF (15.17 KB)

捕获.GIF

回帖推荐

jmpamao 发表于7楼  查看完整内容

因为你的文件是 假的CSV 格式文件 为了摆显下(或者说不迷信什么后缀名), 就按照你的“误判”格式,进行读取的。 readLines, 打开记事本等等 发现 是TAB 分开的,以及编码都有可能有问题。 就尝试了编码变化。 当然最实际的 做法是, 既然是 假的 CSV 格式文件, 可以变真的 CSV文件, 比如 EXCEL 另存为 csv格式就应该可以 读取了。

jmpamao 发表于4楼  查看完整内容

编码问题以及是TAB分隔的
我是御皇香案吏,谪居犹住在瀛洲
沙发
yywan0913 在职认证  发表于 2014-5-20 18:39:50 |只看作者 |坛友微信交流群
是/   而不是\   吧
是什么给了你自信

使用道具

藤椅
huyiustc 发表于 2014-5-20 18:43:39 |只看作者 |坛友微信交流群
yywan0913 发表于 2014-5-20 18:39
是/   而不是\   吧
我是windows系统,应该不是这个问题,因为file path不变只把header删除后能读进去
我是御皇香案吏,谪居犹住在瀛洲

使用道具

板凳
jmpamao 发表于 2014-5-20 20:16:02 |只看作者 |坛友微信交流群
编码问题以及是TAB分隔的
  1. data <- read.table("01.csv",sep="\t",header=T,fileEncoding="UCS-2LE")
复制代码
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
秋日私语 + 5 + 4 + 4 + 4 精彩帖子

总评分: 论坛币 + 5  学术水平 + 4  热心指数 + 4  信用等级 + 4   查看全部评分

使用道具

报纸
767217883 发表于 2014-5-20 22:50:13 |只看作者 |坛友微信交流群
http://blog.sina.com.cn/s/blog_6b36e6750100v8pd.html
ss

使用道具

地板
huyiustc 发表于 2014-5-21 08:19:14 |只看作者 |坛友微信交流群
jmpamao 发表于 2014-5-20 20:16
编码问题以及是TAB分隔的
真棒,问题解决了,但是不知道为什么要用参数sep="\t",csv是逗号分隔的啊,还有fileEncoding="UCS-2LE"是干嘛用得啊?还望指教啊!!!!
我是御皇香案吏,谪居犹住在瀛洲

使用道具

7
jmpamao 发表于 2014-5-21 09:17:19 |只看作者 |坛友微信交流群
huyiustc 发表于 2014-5-21 08:19
真棒,问题解决了,但是不知道为什么要用参数sep="\t",csv是逗号分隔的啊,还有fileEncoding="UCS-2LE"是 ...
因为你的文件是 假的CSV 格式文件

为了摆显下(或者说不迷信什么后缀名), 就按照你的“误判”格式,进行读取的。 readLines, 打开记事本等等 发现 是TAB 分开的,以及编码都有可能有问题。 就尝试了编码变化。

当然最实际的 做法是, 既然是 假的 CSV 格式文件, 可以变真的 CSV文件, 比如 EXCEL 另存为 csv格式就应该可以  读取了。

使用道具

8
huyiustc 发表于 2014-5-21 12:13:32 |只看作者 |坛友微信交流群
jmpamao 发表于 2014-5-21 09:17
因为你的文件是 假的CSV 格式文件

为了摆显下(或者说不迷信什么后缀名), 就按照你的“误判”格式, ...
受教了,谢谢啦
我是御皇香案吏,谪居犹住在瀛洲

使用道具

9
z在路上 发表于 2015-4-11 12:28:31 |只看作者 |坛友微信交流群
请教一下
本来数据是
“2015011639093227
2015011639093257
2015011639093321
2015011639093337

导入到R中
“ 2.015012e+15
  2.015012e+15
  2.015012e+15
  2.015012e+15

请问是什么问题?

使用道具

10
alecwf 发表于 2018-11-6 15:56:45 |只看作者 |坛友微信交流群
jmpamao 发表于 2014-5-20 20:16
编码问题以及是TAB分隔的
正解啊,学习了。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-14 03:27