楼主: 老朽来也
7662 18

[问答] R语言抓数据时不显示中文? [推广有奖]

  • 1关注
  • 0粉丝

等待验证会员

本科生

27%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
220 点
帖子
11
精华
0
在线时间
163 小时
注册时间
2016-12-24
最后登录
2021-11-23

楼主
老朽来也 发表于 2018-12-28 20:41:40 |AI写论文
2论坛币
各位大神,我用R语言练习抓网页数据时,代码一样,本来应该出现中文的,结果出现一堆数字和字母,怎么才能让它显示中文呢?用的mac pro的r studio,这个有影响吗?

屏幕快照 2018-12-28 20.37.22.png (185.72 KB)

屏幕快照 2018-12-28 20.37.22.png

屏幕快照 2018-12-28 20.37.07.png (132.33 KB)

屏幕快照 2018-12-28 20.37.07.png

最佳答案

caimiao0714 查看完整内容

我的macbook pro全系统都是英文版的也能显示出来。把你的sessionInfo()放出来看看。

沙发
caimiao0714 学生认证  发表于 2018-12-28 20:41:41
我的macbook pro全系统都是英文版的也能显示出来。把你的sessionInfo()放出来看看。

  1. sessionInfo()
复制代码

WX20190111-183914@2x.png (256.36 KB)

WX20190111-183914@2x.png

藤椅
pippen303 发表于 2018-12-29 11:52:51
您好:
我想可能與文字編碼格式有關,建議您可以往這個方向修正。下列網址是關於R的網頁抓取部落格文章,供您一併參考,謝謝。

https://hy-chou.blogspot.com/2018/01/rxpathweb-crawler.html

板凳
老朽来也 发表于 2019-1-8 21:55:50
pippen303 发表于 2018-12-29 11:52
您好:
我想可能與文字編碼格式有關,建議您可以往這個方向修正。下列網址是關於R的網頁抓取部落格文章,供 ...
您好,这个网址打不开。。。

报纸
caimiao0714 学生认证  发表于 2019-1-9 14:42:36
跟你电脑的文件编码有关系,试试下面的代码:

  1. library(dplyr)
  2. parse_character(name_data, locale = locale(encoding = "UTF-8"))
复制代码


如果不行试试改变encoding里面的参数。
已有 1 人评分论坛币 收起 理由
jiangbeilu + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

地板
老朽来也 发表于 2019-1-10 20:13:39
caimiao0714 发表于 2019-1-9 14:42
跟你电脑的文件编码有关系,试试下面的代码:
说是没有parse_character这个函数?
> library(dplyr)
> parse_character(name_data, locale = locale(encoding = "UTF-8"))
Error in parse_character(name_data, locale = locale(encoding = "UTF-8")) :
  could not find function "parse_character"

7
caimiao0714 学生认证  发表于 2019-1-11 04:22:56
老朽来也 发表于 2019-1-10 20:13
说是没有parse_character这个函数?
> library(dplyr)
> parse_character(name_data, locale = locale( ...
抱歉,把前面的library(dplyr)换成library(readr).

8
老朽来也 发表于 2019-1-11 10:30:18
caimiao0714 发表于 2019-1-11 04:22
抱歉,把前面的library(dplyr)换成library(readr).
额,还是不行,而且写别的命令,也不出现中文
> d<-"您好"
> d
[1] "\346\202\250\345\245\275"

9
caimiao0714 学生认证  发表于 2019-1-11 11:35:05
老朽来也 发表于 2019-1-11 10:30
额,还是不行,而且写别的命令,也不出现中文
> d d
[1] "\346\202\250\345\245\275"
把encoding里面的"UTF-8"改成其他的常用中文编码试试 比如"GB2313".

10
老朽来也 发表于 2019-1-11 21:05:13
caimiao0714 发表于 2019-1-11 11:35
把encoding里面的"UTF-8"改成其他的常用中文编码试试 比如"GB2313".
我把所有的编码都试了一遍还是不行

1.png (258.12 KB)

1.png

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-16 13:05