楼主: fenglx46801028
1448 2

[问答] R xpathApply数据获取不全 [推广有奖]

  • 0关注
  • 2粉丝

已卖:65份资源

硕士生

41%

还不是VIP/贵宾

-

威望
0
论坛币
219 个
通用积分
6.5976
学术水平
6 点
热心指数
6 点
信用等级
3 点
经验
1310 点
帖子
107
精华
0
在线时间
181 小时
注册时间
2013-2-22
最后登录
2021-11-23

楼主
fenglx46801028 发表于 2017-5-25 11:35:05 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请大神们帮帮忙,跪谢!

从东方财富网上获取股票代码list,R如下:
  1. library(RCurl)
  2. library(XML)

  3. # 从东方财富网获取股票list ------------------------------------------------------------------
  4. EMurl <- "http://quote.eastmoney.com/stocklist.html"
  5. EMhtml <- getURL(EMurl, .encoding = "gb2312")
  6. EMdoc <- htmlParse(EMhtml, encoding = "gb2312")
  7. EMStkSet <- xpathApply(EMdoc, "//div[@id='quotesearch']/ul/li/a", xmlGetAttr, "href")
复制代码


这个程序最终只能得到2914条数据,事实上应该有4361条数据。为什么数据会有缺失?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:apply XPath path appl Pat

沙发
ryoeng 在职认证  发表于 2017-5-25 19:56:40
提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽

藤椅
fenglx46801028 发表于 2017-5-25 23:17:47
ryoeng 发表于 2017-5-25 19:56
何不尝试 tidyquant程序包?
感谢回复!

看了一下tidyquant的Reference manual,觉得不能解决我的问题。

我想做的是对html页面进行解析,获取中国股票市场上的所有股票代码。而tidyquant看上去像是对股票的日数据的获取和处理,与我的需求不符。

还是谢谢你提供新的信息!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-20 13:28