人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › R语言获取新浪股票信息乱码问题？

发帖

楼主: expet

3088 9

[问答] R语言获取新浪股票信息乱码问题？ [推广有奖]

4关注
1粉丝

已卖：70份资源

本科生

95%

还不是VIP/贵宾

威望: 0 级
论坛币: 1286 个
通用积分: 0.0750
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 2138 点
帖子: 64
精华: 0
在线时间: 155 小时
注册时间: 2013-10-3
最后登录: 2025-10-28

楼主

expet 发表于 2015-12-22 14:14:36 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

各位，我在用RCurl获取新浪股票信息的时候出现乱码，
url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"
temp<-getURL(url=url,httpheader=myheader,.encoding="gb2312")
#该页面是<meta http-equiv="该页面是<meta http-equiv="[url=]Content-Type" content="[url=]text/html; charset=[/url][url=]utf-8[/url]" />的，
temp<-getURL(url=url,httpheader=myheader,.encoding="utf-8")
我现在想要获取url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"，怎么解决乱码的问题啊？请各位帮帮忙！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏2 回帖

关键词：新浪股票股票信息 R语言 Rcurl Curl 新浪股票信息

相关帖子

沙发

jiangbeilu

发表于 2015-12-22 14:26:25

你先把要提取的数据弄好，然后用iconv转换一下字体编码就可以实现了。

藤椅

expet 发表于 2015-12-22 15:53:17

jiangbeilu 发表于 2015-12-22 14:26
你先把要提取的数据弄好，然后用iconv转换一下字体编码就可以实现了。

为什么在原来的变量中不行，一定先要提取出来，这里有什么区别啊？

板凳

jiangbeilu

发表于 2015-12-22 16:17:53

expet 发表于 2015-12-22 15:53
为什么在原来的变量中不行，一定先要提取出来，这里有什么区别啊？

你可以两个都试一下，主要是减少工作量，少出错。

报纸

expet 发表于 2015-12-22 19:29:41

jiangbeilu 发表于 2015-12-22 16:17
你可以两个都试一下，主要是减少工作量，少出错。

两个我都试了，还是不行
> myheader=c("User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ","Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8","Accept-Language"="en-us","Connection"="keep-alive","Accept-Charset"="GB2312,utf-8;q=0.7,*;q=0.7")
> url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"
> temp<-getURL(url=url,httpheader=myheader,encoding="gb2312")
> k<-htmlParse(temp)
> title<-getNodeSet(k,'//title')
#返回的是<title>卤卤D<c2><bd>篓2<c4>(000786)1茅卤<be><bd>谩11_D<c2>脿<cb>2<c6><be>-_D<c2>脿<cb>铆<f8></f8></cb></c2></be></c6></cb></c2></bd></be></c4></bd></c2></title>

a <- sapply(title,xmlValue)
wp2=iconv(a,"gb2312","UTF-8")
wp2返回的还是乱码

地板

jiangbeilu

发表于 2015-12-22 20:50:06

expet 发表于 2015-12-22 19:29
两个我都试了，还是不行
> myheader=c("User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; ...

我用这个，可以实现非乱码显示

library(XML)
url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"
doc<-htmlTreeParse(url,useInternalNodes=T,encoding="gb2312")
doc

复制代码

7楼

expet 发表于 2015-12-22 22:49:19

jiangbeilu 发表于 2015-12-22 20:50
我用这个，可以实现非乱码显示

晕死，为什么我的还是乱码？受不了了

8楼

expet 发表于 2015-12-22 23:06:13

搞定了，和这个网页的页面设计有关，我去，受不了了

9楼

jiangbeilu

发表于 2015-12-23 10:51:09

expet 发表于 2015-12-22 23:06
搞定了，和这个网页的页面设计有关，我去，受不了了

我用上面的代码是可以实现非乱码显示的

10楼

路遥的遥 发表于 2016-12-5 17:23:40

expet 发表于 2015-12-22 23:06
搞定了，和这个网页的页面设计有关，我去，受不了了

兄弟，怎么解决的啊？遇到同样的问题i~

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[问答] R语言获取新浪股票信息乱码问题？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级热心勋章

中级热心勋章

初级信用勋章

初级学术勋章

中级信用勋章

高级热心勋章

本版微信群

[问答] R语言获取新浪股票信息乱码问题？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级热心勋章

中级热心勋章

初级信用勋章

初级学术勋章

中级信用勋章

高级热心勋章

本版微信群

扫码加我拉你入群