签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 悬赏大厅 › 网页数据自动爬取收集

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 显身卡| 道具中心

楼主: 饭团团圆滚滚

1585 6

[找数据和资料] 网页数据自动爬取收集 [推广有奖]

1关注
0粉丝

高中生

67%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 9183 个
通用积分: 4.6179
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 425 点
帖子: 14
精华: 0
在线时间: 31 小时
注册时间: 2016-11-16
最后登录: 2019-9-24

楼主

饭团团圆滚滚

学生认证

发表于 2018-8-10 20:36:03 |只看作者 |坛友微信交流群|倒序 |AI写论文

100论坛币

本人做课题收集数据过程中，需要爬取网站数据，具体为：

酒店数量众多，需要将网页上酒店当天价格数据自动爬取下来，手工记录较为复杂
有没有相应的程序和代码能自动爬取网页上的价格数据呢？
请诸位大神一起想想办法，小的定当重谢

分享0 收藏0 回帖

关键词：价格数据网站数据酒店数量数据过程过程中

回复

使用道具举报

沙发

Christy201709 发表于 2018-8-10 20:43:33 |只看作者 |坛友微信交流群

可以用火车头采集器。。是使用源代码进行采集，软件有基础教学视频，稍微会难一点，但是采集速度和准确度还比较高，并且采集的内容也比较干净。你可以下载试试

回复

使用道具举报

藤椅

Christy201709 发表于 2018-8-10 20:44:05 |只看作者 |坛友微信交流群

你是学酒店管理的吗

回复

使用道具举报

板凳

在职认证

发表于 2018-8-11 17:17:51 |只看作者 |坛友微信交流群

python爬下来是挺好爬的，但是你的意思未来的每一天都自动爬一次？

回复

使用道具举报

报纸

select- 发表于 2018-8-13 15:07:03 |只看作者 |坛友微信交流群

还需要爬吗

回复

使用道具举报

地板

liuchao1013 发表于 2018-8-15 10:45:08 |只看作者 |坛友微信交流群

用stata软件编辑一段代码就可以爬虫

回复

使用道具举报

7楼

2016310846 发表于 2018-8-15 11:47:28 |只看作者 |坛友微信交流群

r语言也可以爬虫
举个例子
library(rvest)
url <- 'http://sou.zhaopin.com/jobs/searchresult.ashx?jl=北京&kw=阿里巴巴'
web <- read_html(url)
job_title_nodes <- html_nodes(web, xpath = '//td[@class="zwmc"]/div/a')
job_title <- html_text(job_title_nodes)
job_title[1:2]
## [1] "阿里妈妈-java研发专家-北京" "大文娱-APP推广-PP助手&豌豆荚"

回复

使用道具举报

发帖

本版微信群

加JingGuanBbs
拉您进交流群

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明