python 正则表达式爬虫程序卡死问题

0关注
0粉丝

已卖：333份资源

本科生

86%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 869 个
通用积分: 0.6629
学术水平: 0 点
热心指数: 2 点
信用等级: 0 点
经验: 795 点
帖子: 36
精华: 0
在线时间: 175 小时
注册时间: 2016-12-24
最后登录: 2022-11-26

楼主

老城别恋 发表于 2018-4-3 21:19:54 |AI写论文

22论坛币

用正则表达式爬取豆瓣读书网站链接书名作者年份，电脑一直卡着为啥？（附代码和截屏，Spyder和cmd都运行不出来），好几次了都是这样，难道正则表达式有问题还是电脑问题。
import requests
import re
content = requests.get('https://book.douban.com/').text
pattern = re.compile('<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>', re.S)
results = re.findall(pattern, content)
for result in results:
url, name, author, date = result
author = re.sub('\s', '', author)
date = re.sub('\s', '', date)
print(url, name, author, date)