签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

经管百科

人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 悬赏大厅 › 网页数据自动爬取收集

楼主: 饭团团圆滚滚

2044 6

[找数据和资料] 网页数据自动爬取收集 [推广有奖]

1关注
0粉丝

已卖：741份资源

高中生

67%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 9239 个
通用积分: 5.0979
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 425 点
帖子: 14
精华: 0
在线时间: 31 小时
注册时间: 2016-11-16
最后登录: 2019-9-24

楼主

饭团团圆滚滚

学生认证

发表于 2018-8-10 20:36:03 |AI写论文

100论坛币

本人做课题收集数据过程中，需要爬取网站数据，具体为：

酒店数量众多，需要将网页上酒店当天价格数据自动爬取下来，手工记录较为复杂
有没有相应的程序和代码能自动爬取网页上的价格数据呢？
请诸位大神一起想想办法，小的定当重谢

分享0 收藏0 回帖

关键词：价格数据网站数据酒店数量数据过程过程中

相关帖子

回复

沙发

Christy201709 发表于 2018-8-10 20:43:33

可以用火车头采集器。。是使用源代码进行采集，软件有基础教学视频，稍微会难一点，但是采集速度和准确度还比较高，并且采集的内容也比较干净。你可以下载试试

回复

藤椅

Christy201709 发表于 2018-8-10 20:44:05

你是学酒店管理的吗

回复

板凳

在职认证

发表于 2018-8-11 17:17:51

python爬下来是挺好爬的，但是你的意思未来的每一天都自动爬一次？

回复

报纸

select- 发表于 2018-8-13 15:07:03

还需要爬吗

回复

地板

liuchao1013 发表于 2018-8-15 10:45:08

用stata软件编辑一段代码就可以爬虫

回复

7楼

2016310846 发表于 2018-8-15 11:47:28

r语言也可以爬虫
举个例子
library(rvest)
url <- 'http://sou.zhaopin.com/jobs/searchresult.ashx?jl=北京&kw=阿里巴巴'
web <- read_html(url)
job_title_nodes <- html_nodes(web, xpath = '//td[@class="zwmc"]/div/a')
job_title <- html_text(job_title_nodes)
job_title[1:2]
## [1] "阿里妈妈-java研发专家-北京" "大文娱-APP推广-PP助手&豌豆荚"

回复

发帖

本版微信群

扫码
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明