楼主: 了空不了色
1412 7

[问答] 请问用R语言如何读取下列网页的数据?麻烦给出具体步骤,非常感谢。 [推广有奖]

  • 0关注
  • 0粉丝

已卖:324份资源

本科生

60%

还不是VIP/贵宾

-

威望
0
论坛币
3235 个
通用积分
8.4202
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1087 点
帖子
65
精华
0
在线时间
105 小时
注册时间
2017-1-13
最后登录
2023-9-13

楼主
了空不了色 发表于 2019-8-8 16:45:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
http://www.stats.gov.cn/tjsj/ndsj/2018/indexch.htm
我想读取三、国民经济核算下面,3.1国内生产总值这张表里面的数据。
用的是XML包里面的readHTMLTable函数,但不管怎么设置which都显示错误,请问应该如何操作。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:非常感谢 具体步骤 R语言 国内生产总值 国民经济核算

回帖推荐

surfw 发表于5楼  查看完整内容

框架网页 1 chrome打开数据网页,地址是没有变化的。右击此网页,点查看框架的源代码 地址栏就可看到实际网址 其它数据页面的地址类似,有规律的。 2 抓一个数据,都要的话可以循环。这儿用的是rvest包, Hadley写的,简单。

沙发
pippen303 发表于 2019-8-8 23:18:45
您好:
关于您的问题,日前用R爬蟲匯率資料,並將語法紀錄在我的博客中,网址如下,供參考。
https://hy-chou.blogspot.tw/2018/ 01/r.html
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

藤椅
surfw 发表于 2019-8-9 20:17:13
这张数据表是图片

板凳
了空不了色 发表于 2019-8-10 14:12:28
surfw 发表于 2019-8-9 20:17
这张数据表是图片
http://tjj.ah.gov.cn/tjjweb/web/tjnj_view.jsp?_index=1
请问如果是这里的二、国民经济核算-2.2安徽生产总值构成应如何做?

报纸
surfw 发表于 2019-8-10 15:31:45
框架网页
1 chrome打开数据网页,地址是没有变化的。右击此网页,点查看框架的源代码
地址栏就可看到实际网址
2.jpg

其它数据页面的地址类似,有规律的。

2 抓一个数据,都要的话可以循环。这儿用的是rvest包, Hadley写的,简单。
  1. library(rvest)
  2. web1 <- read_html("http://tjj.ah.gov.cn/tjjweb/tjnj/2018/2018/2/cn2-2.files/sheet001.htm")
  3. x <- web1 %>%
  4.         html_node("table") %>%
  5.         html_table(fill = TRUE)
复制代码


已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

地板
了空不了色 发表于 2019-8-10 16:55:24
surfw 发表于 2019-8-10 15:31
框架网页
1 chrome打开数据网页,地址是没有变化的。右击此网页,点查看框架的源代码
地址栏就可看到实际 ...
好的,非常感谢,我摸索一下

7
zhou1_20 发表于 2019-8-11 18:35:23
tesseract包识别图片中的数据

8
了空不了色 发表于 2019-8-14 16:49:37
zhou1_20 发表于 2019-8-11 18:35
tesseract包识别图片中的数据
谢谢告知

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-10 06:48