楼主: king64
1233 0

[问答] 读取网页中的表格? [推广有奖]

  • 1关注
  • 11粉丝

已卖:1336份资源

副教授

31%

还不是VIP/贵宾

-

威望
0
论坛币
1139 个
通用积分
119.2433
学术水平
48 点
热心指数
54 点
信用等级
42 点
经验
8328 点
帖子
318
精华
0
在线时间
1159 小时
注册时间
2008-2-7
最后登录
2023-7-17

楼主
king64 发表于 2016-2-14 14:25:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如何读取下面网页中的表格?
http://www.china-customs.com/customs-tax/04/

使用下面代码,无法读取,请教:如何修改代码?谢谢!

一开始检查,webpage的内容还没乱码,但是后面就乱码了!
而且最后,读取的不是表格!不知道问题在哪里!

link <- c( "http://www.china-customs.com/customs-tax/04/ )
require(XML)
require(RCurl)
webpage<-getURL(link,.encoding="gb2312")
webpage <- readLines(tc <- textConnection(webpage),encoding='gb2312'); close(tc)


tablehead <- xpathSApply(pagetree, "//table//th", xmlValue)
result<-xpathSApply(pagetree,"//table//td",xmlValue)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CUSTOMS custom China toms HTTP RCurl XML

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 12:36