楼主: yanyang729
4579 9

[问答] R读取中文时遇到的问题 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

71%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
65 点
帖子
7
精华
0
在线时间
7 小时
注册时间
2015-9-23
最后登录
2016-3-7

楼主
yanyang729 发表于 2015-12-29 11:26:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
小白求教
txt里一个中文词组 编码utf-8 在读取时出现下面的情况

> a <- scan("cn.txt",what = "")
Read 1 item
> a
[1] "\344\273\200\344\271\210\351\254\274"

有遇到过的吗?也不是乱码是什么意思

版本如下
platform       x86_64-apple-darwin13.4.0   
arch           x86_64                     
os             darwin13.4.0               
system         x86_64, darwin13.4.0        
status                                    
major          3                           
minor          2.2                        
year           2015                        
month          08                          
day            14                          
svn rev        69053                       
language       R                           
version.string R version 3.2.2 (2015-08-14)
nickname       Fire Safety

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Language Platform Version darwin string 中文

沙发
jiangbeilu 学生认证  发表于 2015-12-29 12:02:37
上传个文本文件看看?

藤椅
yanyang729 发表于 2015-12-29 14:06:38
这是测试的文本

cn.txt
下载链接: https://bbs.pinggu.org/a-1946327.html

9 Bytes

test

板凳
yanyang729 发表于 2015-12-29 14:07:23
jiangbeilu 发表于 2015-12-29 12:02
上传个文本文件看看?
已传 先谢过~

报纸
jiangbeilu 学生认证  发表于 2015-12-29 15:41:52
加个这个试试:
  1. a <- scan("cn.txt",what="",encoding="UTF-8")
复制代码

地板
yanyang729 发表于 2015-12-29 16:45:56
jiangbeilu 发表于 2015-12-29 15:41
加个这个试试:
看来还是编码问题
但新结果是
<U+4EC0><U+4E48><U+9B3C>
还是不对

7
jiangbeilu 学生认证  发表于 2015-12-29 18:14:47
我在windows下是没问题的。Mac对中文的支持并不是很好的。

8
yanyang729 发表于 2015-12-29 18:37:33
jiangbeilu 发表于 2015-12-29 18:14
我在windows下是没问题的。Mac对中文的支持并不是很好的。
恩 我也觉得是这个问题~ thx  anyway~

9
suimong 发表于 2015-12-29 22:54:54
楼主贴一下Sys.getlocale()的结果。Mac对UTF-8编码的支持是要比Windows好的,我在Mac虚拟机上试了一下,没有问题,不需要加encoding = "UTF-8",因为Mac默认的非ASCII编码就是UTF-8

10
king64 发表于 2016-1-2 08:01:46
顶一顶!遇到同类问题,求解!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 03:19