楼主: weberxu
3268 4

[问答] 网页抓取数据后,列表导出的问题 [推广有奖]

  • 1关注
  • 2粉丝

硕士生

37%

还不是VIP/贵宾

-

威望
0
论坛币
118 个
通用积分
0
学术水平
8 点
热心指数
10 点
信用等级
8 点
经验
3247 点
帖子
187
精华
0
在线时间
121 小时
注册时间
2012-1-12
最后登录
2017-3-7

楼主
weberxu 发表于 2015-7-14 17:39:45 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大侠:
利用别人介绍的方法,抓取网页的数据后,导出总是提示如下问题:
> output <- write.table(TableData,file='output.txt',row.names = FALSE)
Error in data.frame(`NULL` = list(V1 = c(2L, 1L, 5L, 13L, 12L, 16L, 3L,  :
  arguments imply differing number of rows: 24, 14, 23, 11, 12, 6, 7, 8

请各位帮忙看看是什么问题?

代码如下:
library(XML);##解析网页用##

URL <- 'http://www.stats.gov.cn/tjsj/zxfb/201412/t20141216_653701.html'

if(url.exists(URL)){

  ##read the special table data##

  TableData <- readHTMLTable(URL)

  ##ok##

}
TableData
output <- write.table(TableData,file='output.csv',row.names = FALSE)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:网页抓取 抓取数据 output outpu 各位大侠 网页

未命名.png (5.88 KB)

未命名.png

沙发
万人往LVR 在职认证  发表于 2015-7-14 18:35:27
晕,你想把19张表打印在一张表里?写表的函数也不对。最后一句改成
write.csv(TableData[[1]],file='output1.csv',row.names = FALSE)
1代表第一个表,换成19就是第19个表
估计写成表了你还找不到表存到哪去了,R命令框左上角有个File -> Change dir ,选择你想存文件的位置,设置一次就好了。再运行你的程序就好了。

藤椅
weberxu 发表于 2015-7-14 20:42:47
万人往LVR 发表于 2015-7-14 18:35
晕,你想把19张表打印在一张表里?写表的函数也不对。最后一句改成
write.csv(TableData[[1]],file='outpu ...
非常感谢。你了解从网页上抓取数据吗?不同类型的网站,需要用到不同的方法和代码,有没有体系化的介绍?感谢。

板凳
万人往LVR 在职认证  发表于 2015-7-15 08:48:07
weberxu 发表于 2015-7-14 20:42
非常感谢。你了解从网页上抓取数据吗?不同类型的网站,需要用到不同的方法和代码,有没有体系化的介绍? ...
只是自己探索,参考
http://www.chuanke.com/3379957-137360.html

报纸
FullerHua 发表于 2015-8-23 20:20:27
8年来我一直在做网页抓取软件开发,而且一直在维护一个免费软件 集搜客GooSeeker ,目前有3万多用户,定义了超过40万个网站抓取模板,这个月我又升级了一版,把8年来积累的软件和技术都陆续免费开放出来,贡献微薄之力,协助大家玩转大数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 09:20