最近在学爬虫,准备从新闻类的网站开始,选择了新浪的国内新闻网页https://news.sina.com.cn/china/
但在爬取网页下的内容时,却爬取不到,返回为空,如图片所示。
所用的代码如:
import requests
from bs4 import BeautifulSoup #部析网页元素
rqrs=requests.get("https://news.sina.com.cn/china/")
rqrs.encoding="utf-8"
soup=BeautifulSoup(rqrs.text,'lxml')#解析HTML,指定使用普析器 lxml
print(type(soup))
print(soup.select('title'))#将含有 feed-card-item类的内容取出来
print(soup.select('.feed-card-item'))#将含有 feed-card-item类的内容取出来