楼主: ansonzhou2001
24408 14

[问答] RStudio导入csv后中文乱码 [推广有奖]

  • 0关注
  • 0粉丝

高中生

60%

还不是VIP/贵宾

-

威望
0
论坛币
29459 个
通用积分
2.1304
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
265 点
帖子
27
精华
0
在线时间
36 小时
注册时间
2008-11-25
最后登录
2019-10-23

楼主
ansonzhou2001 发表于 2018-11-14 15:43:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
csv文件数据里面有中文,导入RStudio用的是
         data <- read.csv("data.csv", encoding="UTF-8")
而且Default text encoding已经改为UTF-8了,但是显示出来的依旧不是中文。

   X.U.FEFF..U.4EE3..U.7801.                X.U.540D..U.79F0.
1                  801770.SI                 <U+901A><U+4FE1>
2                  801750.SI         <U+8BA1><U+7B97><U+673A>
3                  801010.SI <U+519C><U+6797><U+7267><U+6E14>
4                  801080.SI                 <U+7535><U+5B50>
5                  801230.SI                 <U+7EFC><U+5408>
6                  801890.SI <U+673A><U+68B0><U+8BBE><U+5907>
7                  801720.SI <U+5EFA><U+7B51><U+88C5><U+9970>
8                  801730.SI <U+7535><U+6C14><U+8BBE><U+5907>
9                  801760.SI                 <U+4F20><U+5A92>


各位大神帮帮忙呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:RStudio Studio 中文乱码 dio stu Rstudio中文输入

1542181078(1).jpg (41.49 KB)

1542181078(1).jpg

沙发
Whig 在职认证  发表于 2018-11-14 16:28:05
你的csv文件不是以UTF-8存储的吧

藤椅
ansonzhou2001 发表于 2018-11-14 16:41:31
Whig 发表于 2018-11-14 16:28
你的csv文件不是以UTF-8存储的吧
是UTF-8,存的时候还特意看了一下

板凳
Whig 在职认证  发表于 2018-11-14 17:00:48
ansonzhou2001 发表于 2018-11-14 16:41
是UTF-8,存的时候还特意看了一下
那你在Excel里导入这个csv文件看看,看看Excel是不是把这文件识别为UTF-8格式的。用Excel里面的“数据-自文本”,Windows系统下的文件编码比较特殊。。。

报纸
ansonzhou2001 发表于 2018-11-15 10:16:10
Whig 发表于 2018-11-14 17:00
那你在Excel里导入这个csv文件看看,看看Excel是不是把这文件识别为UTF-8格式的。用Excel里面的“数据-自 ...
用MAC版的就没问题,到WINDOWS就还是不行。能改成UTF-8的地方都改了呀。死的心都有了

地板
Whig 在职认证  发表于 2018-11-15 11:32:29
ansonzhou2001 发表于 2018-11-15 10:16
用MAC版的就没问题,到WINDOWS就还是不行。能改成UTF-8的地方都改了呀。死的心都有了
这种情况如果不接触数据很难定位问题。我的建议就是先检查csv的编码格式,用我上面说的方法或者notepad++查看。等你肯定csv是UTF-8的,再执行R命令。

7
明建川 发表于 2018-11-15 11:40:44
read.csv("data.csv", encoding="gbk")

8
ansonzhou2001 发表于 2018-11-15 15:10:03
明建川 发表于 2018-11-15 11:40
read.csv("data.csv", encoding="gbk")
试过了呀,结果是那种无法显示的乱码呀。还是谢谢

9
屋檐滴语 发表于 2018-11-15 23:11:22
试试readr::read_csv()

10
ansonzhou2001 发表于 2018-11-16 09:19:59
感谢各位大神帮助,问题也解决。处理了两个地方,第一个是确保数据转CSV时不要带任何格式,存储的时候是csv utf-8. 而且在csv里面,选择所有数据后点了一下“自动换行(wrap text)”,这样解决了导入RSTUDIO后有时把两个数据合并当成一个的问题(具体是什么原理我不了解呀)。
第二点就是电脑的语言设置,这个估计是要看安装R和RSTUDIO的时候的设置情况。我的电脑是英文,所以在导入之前改了一下,整个code如下
    Sys.setlocale(category = "LC_ALL", locale = "Chinese")
    data <- read.csv ("data.csv", encoding = "UTF-8")
可以先用Sys.setlocale()检查一下当前设置。对locale设置只是暂时,不会永久改变电脑的locale设置的。
之前还看很多论坛,有人用了这个办法还是解决不了的,那就只能具体问题具体分析了。

感谢大家得帮忙
已有 1 人评分论坛币 收起 理由
小吭 + 2 精彩帖子

总评分: 论坛币 + 2   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-28 04:19