楼主: yusb
952 0

[经管数据集] python爬虫程序源代码-链家房产去哪儿携程网机票豆瓣电影书籍小组相册小说下载分布式 [推广有奖]

已卖:21072份资源
好评率:99%
商家信誉:一般

巨擘

0%

还不是VIP/贵宾

-

威望
1
论坛币
40750 个
通用积分
2588.9809
学术水平
20 点
热心指数
31 点
信用等级
7 点
经验
5383 点
帖子
20183
精华
0
在线时间
11757 小时
注册时间
2020-12-8
最后登录
2026-1-9

楼主
yusb 在职认证  发表于 2023-11-22 21:41:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
python爬虫程序源代码-链家房产去哪儿携程网机票豆瓣电影书籍小组相册小说下载分布式爬虫
包含的爬虫程序源代码有:
distribute_crawler-master小说下载分布式爬虫.zip
DouBanSpider-master豆瓣爬虫.zip
doubanspiders-master豆瓣电影、书籍、小组、相册、东西等爬虫集.zip
findtrip-master机票爬虫(去哪儿和携程网).zip
LianJiaSpider-master链家网爬虫.zip


python爬虫程序源代码-链家房产去哪儿携程网机票豆瓣电影书籍小组相册小说下载分布式爬虫.zip (23.49 MB, 需要: RMB 19 元) 本附件包括:
  • distribute_crawler-master小说下载分布式爬虫.zip
  • DouBanSpider-master豆瓣爬虫.zip
  • doubanspiders-master豆瓣电影、书籍、小组、相册、东西等爬虫集.zip
  • findtrip-master机票爬虫(去哪儿和携程网).zip
  • LianJiaSpider-master链家网爬虫.zip



f7aabc2d83f730b749dbcb9f77d1b24.png


a958d0aac4197489add66cb43d07fdf.png


例如:豆瓣爬书说明:

## 豆瓣读书爬虫

Python所写,豆瓣读书的爬虫,方便大家搜罗各种美美书!

### 更新

最近爬下了豆瓣所有的图书信息(3088633本,2138386KB),并做了一个界面方面与数据库交互来搜罗好书。注:这里的代码不是爬下所有书籍所用的代码,仅供参考。有机会的时候再公开代码和爬下的所有数据。


### 更新

最近爬书发现豆瓣的页面规则发生了变化,导致不能爬到评价人数,由此对代码进行了相应的更新,并爬了一些新的数据(并不全)。



### 实现功能

1 可以爬下豆瓣读书标签下的所有图书

2 按评分排名依次存储

3 存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet

4 采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好的模仿浏览器行为,避免爬虫被封)

### 效果截图

试着小小运行了下,爬了七八万本书,结果在book_list.xlsx中


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python爬虫 python 携程网机票 链家房产 小说下载

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 15:19