楼主: dominee
5076 5

[问答] 求助R语言读取网页的乱码问题 [推广有奖]

  • 2关注
  • 2粉丝

硕士生

65%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
4.0016
学术水平
5 点
热心指数
5 点
信用等级
2 点
经验
1184 点
帖子
66
精华
0
在线时间
234 小时
注册时间
2006-5-18
最后登录
2022-4-2

楼主
dominee 发表于 2016-2-29 09:42:02 |AI写论文
1论坛币
碰到乱码了。。
> baseURL="http://data.eastmoney.com/center/stock.html";
> table=readHTMLTable(baseURL,header=TRUE,which=1)

关键词:求助R语言 R语言 eastmoney Center Table 网页

本帖被以下文库推荐

沙发
dominee 发表于 2016-2-29 09:45:08
1576.tm.png

藤椅
jiangbeilu 学生认证  发表于 2016-2-29 10:18:26
出现乱码,就转换编码:我试过了,用下面的代码是可以的。
其中,iconv是用来转换编码的。
  1. sapply(tb,function(x) iconv(x,"utf-8","gbk"))
复制代码
已有 1 人评分学术水平 收起 理由
fcfc2013 + 1 正解!

总评分: 学术水平 + 1   查看全部评分

板凳
dominee 发表于 2016-2-29 14:29:47
jiangbeilu 发表于 2016-2-29 10:18
出现乱码,就转换编码:我试过了,用下面的代码是可以的。
其中,iconv是用来转换编码的。
> baseURL="http://data.eastmoney.com/center/stock.html";
> table=readHTMLTable(baseURL,header=TRUE,which=1)
> iconv(table,"utf-8","gbk")
[1] "c(1, 3, 2)" "c(2, 1, 3)" "c(3, 2, 1)" "c(3, 2, 1)"
> table
                                 V1                                 V2
1  鍗庣數鑳芥簮[7.14%]璇︽儏 琛屾儏  鍗庢柊姘存偿[10.06%]璇︽儏 琛屾儏
2 瀹佹尝鐑數[-10.01%]璇︽儏 琛屾儏 鎬$悆璧勬簮[-10.02%]璇︽儏 琛屾儏
3  鍗庤锤鐗╂祦[10.03%]璇︽儏 琛屾儏  鎭掗

报纸
jiangbeilu 学生认证  发表于 2016-2-29 15:52:28
dominee 发表于 2016-2-29 14:29
> baseURL="http://data.eastmoney.com/center/stock.html";
> table=readHTMLTable(baseURL,header=TRU ...
iconv只能对向量进行操作,所以我用的是sapply进行的,你把语句中的tb改成table就可以了。

ps.由于table是R里的一个函数,所以不建议用table作为变量名。

地板
ryoeng 在职认证  发表于 2016-2-29 23:30:37
提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-21 20:56