我是通过B站的北理工mooc教程学python爬虫的,老师po出了一段抓取网页的通用代码
然后我就照着老师的代码依样画葫芦,还加了注释
# -*- coding: utf-8 -*-
import requests #导入requests库#
#抓取网页的通用代码框架#
#检测是否异常#
def getHTMLText(url):
try:
r=requests.get(url)
r.raise_for_status()#如果状态不是200,引发HTTPError异常#
r.encoding=r.apparent_encoding
return r.text
except:
return "产生异常"
if __name__=='__main__':
url="http://www.baidu.com"
print(getHTMLText(url))
但是不知道是不是因为python版本的不同,无法抓取网页内容。有用python3.7版本的同学,可以帮忙看下我的代码除了什么问题吗?谢谢了!


雷达卡




京公网安备 11010802022788号







