楼主: 万木青
2665 7

[问答] python 爬虫 明明看到CSS样式的class,却爬不出结果来?采用什么了加密技术?求解! [推广有奖]

  • 4关注
  • 1粉丝

博士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
2876 个
通用积分
5.6096
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
2168 点
帖子
136
精华
0
在线时间
195 小时
注册时间
2014-10-20
最后登录
2021-4-12

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
import requests
from bs4 import BeautifulSoup #部析网页元素
rqrs=requests.get("https://news.sina.com.cn/china/")
rqrs.encoding="utf-8"
# print(rqrs.text)
soup=BeautifulSoup(rqrs.text,'lxml')#解析HTML,指定使用普析器 lxml
print(type(soup))
print(soup.select('title'))#将含有 feed-card-item类的内容取出来
print(soup.select('.feed-card-item'))#将含有 feed-card-item类的内容取出来,结果却返回空


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:网页元素

123.png (126.89 KB)

网页

网页

沙发
admin_kefu 在职认证  发表于 2018-11-29 11:41:34 |只看作者 |坛友微信交流群
您好,如果您的求助没有解决,请到项目交易发布需求,会有更快更专业的用户帮助您 https://bbs.pinggu.org/z_prj.php

使用道具

藤椅
瞎胡闹 学生认证  发表于 2018-11-29 15:33:45 |只看作者 |坛友微信交流群
你这样估计就没拿到原网页

使用道具

板凳
詹惠儿 发表于 2018-11-29 15:59:26 |只看作者 |坛友微信交流群
您好,可以试试 print(soup.find("div", {"class":"feed-card-item"}).text)
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

使用道具

报纸
万木青 发表于 2018-11-29 22:31:26 |只看作者 |坛友微信交流群
admin_kefu 发表于 2018-11-29 11:41
您好,如果您的求助没有解决,请到项目交易发布需求,会有更快更专业的用户帮助您 https://bbs.pinggu.org/z ...
好的,谢谢!

使用道具

地板
万木青 发表于 2018-11-29 22:31:44 |只看作者 |坛友微信交流群
詹惠儿 发表于 2018-11-29 15:59
您好,可以试试 print(soup.find("div", {"class":"feed-card-item"}).text)
好的,谢谢!

使用道具

7
万木青 发表于 2018-11-29 22:32:00 |只看作者 |坛友微信交流群
瞎胡闹 发表于 2018-11-29 15:33
你这样估计就没拿到原网页
应该是吧

使用道具

8
瞎胡闹 学生认证  发表于 2018-11-30 17:03:09 |只看作者 |坛友微信交流群
万木青 发表于 2018-11-29 22:32
应该是吧
加个headers 先看看有没有内容,然后在爬数据

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 23:31