楼主: Thanos123
510 3

[问答] 菜鸟爬虫问题 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

27%

还不是VIP/贵宾

-

威望
0
论坛币
917 个
通用积分
1.9500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1205 点
帖子
55
精华
0
在线时间
170 小时
注册时间
2016-4-26
最后登录
2024-4-22

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
初学爬虫,自己想爬个贴吧图片,结果出现以下问题:
源代码:
import urllib.request
url1 = 'https://tieba.baidu.com/p/5441684190'
response1 = urllib.request.urlopen(url1)
html1 = response1.read().decode('utf-8')

import re
reg=r'src="(.+?\.jpg)" size' #r'src=为正则表达式
imgre=re.compile(reg)
imaglist=re.findall(imgre,html1)
x=67
for imgurl1 in imaglist:
    print(x)
    urllib.request.urlretrieve(imgurl1,'C:\\Users\\thtf\\Desktop\\贴吧\\%s.jpg'%x)
    x+=1
print('抓取结束')

运行后出现:
QQ截图20171212005519.png
请问各位大神这怎么解决

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
fengxingliulizi 发表于 2017-12-12 09:41:03 |只看作者 |坛友微信交流群
1、我运行了,81,82都过了。
2、imaglist[27]错了,你看一下。

使用道具

藤椅
Thanos123 发表于 2017-12-12 19:08:42 |只看作者 |坛友微信交流群
fengxingliulizi 发表于 2017-12-12 09:41
1、我运行了,81,82都过了。
2、imaglist[27]错了,你看一下。
等于说是网页出错了?

使用道具

板凳
fengxingliulizi 发表于 2017-12-13 09:33:51 |只看作者 |坛友微信交流群
Thanos123 发表于 2017-12-12 19:08
等于说是网页出错了?
应该是

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 15:57