楼主: qweaq123
761 1

[入门区公告] python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接 [推广有奖]

  • 0关注
  • 0粉丝

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
20 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2020-6-5
最后登录
2020-6-5

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

python自我学习 一 python语法,及变量类型

python自我学习 二 爬一个图片网站上

python学习 二 02 爬一个图片网站,获得主链接网址,并保存

python学习 二 03 爬一个图片网站-获得所有分页网址

本节目的:解析下载到本地的文件,获得图片链接

所有相关的网址,都下载到本地了,下面我们依次解析,获得图片链接,然后将图片链接保存起来。

由上图,可看到

是一组,保存着背景图片,那我们解析的时候,将这一组图片,单独的放在一个文件夹background中

是另一组,解析的时候,单独的放在一个文件夹中

第一步,我们遍历目录,获得所有的文件路径

为此,我写了个函数

调用:

获得目录下的所有txt文件路径,保存在txtFileList中。

第二步 解析文件,获得IMG路径

1、首先,针对不同分组,创建相应的子目录

是一组,保存着背景图片,那我们解析的时候,将这一组图片,单独的放在一个文件夹background中

我们将右侧的数字去掉,剩下的字符串作为这一组的类别

分析网页源码

图像链接保存在class=subcontents的div下,

<img 属性为 data-layer 下

为此我写了个函数

调用

获得文件中,所有图片的链接列表

这一过程的详细代码如下:

http://www.sina.com.cn/mid/search.shtml?q=%E5%A4%96%E9%93%BE%261%E7%BC%85%E7%94%B8%E7%9A%87%E5%AE%B61507l117116
http://www.sina.com.cn/mid/search.shtml?q=%E6%90%9C%E7%8B%90%261%E7%BC%85%E7%94%B8%E7%9A%87%E5%AE%B61507l117116
http://www.sina.com.cn/mid/search.shtml?q=%E6%96%B0%E6%B5%AA%261%E7%BC%85%E7%94%B8%E7%9A%87%E5%AE%B61507l117116
http://www.sina.com.cn/mid/search.shtml?q=%E7%BD%91%E6%98%93%261%E7%BC%85%E7%94%B8%E7%9A%87%E5%AE%B61507l117116
http://www.sina.com.cn/mid/search.shtml?q=%E8%85%BE%E8%AE%AF%261%E7%BC%85%E7%94%B8%E7%9A%87%E5%AE%B61507l117116
http://www.sina.com.cn/mid/search.shtml?q=%E5%85%B3%E6%B3%A8%261%E7%BC%85%E7%94%B8%E7%9A%87%E5%AE%B61507l117116






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python Background contents Content Ground

学习是人类进步的阶梯。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 08:16