楼主: shadowaver
6015 6

[程序分享] 基于Scrapy框架的python爬虫 [推广有奖]

随心所欲不逾矩

已卖:1243份资源

教授

56%

还不是VIP/贵宾

-

威望
0
论坛币
8309 个
通用积分
689.8825
学术水平
18 点
热心指数
22 点
信用等级
13 点
经验
29709 点
帖子
890
精华
0
在线时间
1382 小时
注册时间
2007-9-27
最后登录
2026-2-6

楼主
shadowaver 在职认证  发表于 2020-11-22 11:00:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
基于Scrapy框架的python爬虫
使用scrapy框架之前需要先安装
Cmd环境下有两种命令可以获取安装包并安装:1.conda install scrapy; 2.pip install scrapy;
Scrapy shell 测试
Scrapy shell也称"Scrapy终端",是一个交互终端,使我们可以在未启动spider爬虫的情况下尝试及调试代码。
在Scrapy中使用xpath或是CSS等,之所以不用再导入第三方包,是因为在Scrapy中已内置了相应的Selector选择器。
Selector有四个基本的方法。
最常用的Xpath方法。
(1)xpath( )
我们通过书写xpath表达式,可使程序返回该表达式所对应的所有节点的selector list选择器列表,从而筛选我们想要定位的元素。
(2)extract( )
序列化节点为Unicode字符串,并返回list列表。
(3)css( )
根据css表达式,返回该表达式所对应的所有节点的selector list选择器列表,语法和BeautifulSoup4相同。
(4)re( )
根据书写的正则表达式,对数据进行提取,返回Unicode字符串list列表。
2




基于Scrapy框架的python爬虫.pdf (1.49 MB, 需要: 10000 个论坛币)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python爬虫 scrapy python CRAP CRA python 爬虫 scrapy

shadowaver@163.com
QQ 540722048

沙发
三重虫(未真实交易用户) 发表于 2021-8-16 15:05:07

藤椅
shadowaver(未真实交易用户) 在职认证  发表于 2022-3-25 22:23:24
三重虫 发表于 2021-8-16 15:05
谢谢~~~~~~~~~~~~

板凳
kenidizl(未真实交易用户) 发表于 2022-4-8 11:24:53
有人买吗?好像贵了点儿

报纸
shadowaver(未真实交易用户) 在职认证  发表于 2022-4-8 17:01:00
kenidizl 发表于 2022-4-8 11:24
有人买吗?好像贵了点儿
有人买的,生活不易 赚点零花钱 ~

地板
dixiaoxa(未真实交易用户) 发表于 2022-4-12 14:59:26
谢谢~~~~~~~~~~

7
sunny.syf(未真实交易用户) 在职认证  发表于 2024-5-29 14:47:35
怎么都这么贵啊。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-10 15:55