楼主: feng_2long
1473 3

[问答] 问一个BeautifulSoup的基本问题 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

13%

还不是VIP/贵宾

-

威望
0
论坛币
1026 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5511 点
帖子
117
精华
0
在线时间
112 小时
注册时间
2010-1-7
最后登录
2020-8-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Python初学者,请帮帮忙,下面几行代码:

def get_links(url):
       resp = request.get(url)
       soup = bs.BeautifulSoup(resp.text, 'lxml')
       body = soup.body



在 soup = bs.BeautifulSoup(resp.text, 'lxml') 语句中,‘BeautifulSoup’ 是一个class并且可以在bs4的文件(__init__.py)中看到相应代码。


但是在 body = soup.body 语句中,这个‘.body’ 是函数吗? 我在bs4文件(__init__.py)中搜索不到对应的‘详细代码’



此外还有 '.find_all( )' , '.get( )' 等等这些,为何在bs4(__init__.py)文件中搜不到? 而且在Python的内置函数中我也没搜索到。



怎么回事?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:beautiful 基本问题 soup eau Aut python 爬虫 beautifulsoup python入门 网页爬虫

沙发
gjinwei 发表于 2017-4-7 14:43:01 |只看作者 |坛友微信交流群
你可以用调试模式步入函数内查看,但关键还在于它们是做什么用的。get(url)可以看成是你在服务器输入url,.body表示获取网页文件的body标签,findAll是用来定位网页标签或属性的,是Beautiful的函数
已有 1 人评分经验 收起 理由
我的素质低 + 10 精彩帖子

总评分: 经验 + 10   查看全部评分

使用道具

藤椅
benjobvatlonhoy 发表于 2017-4-21 15:00:37 |只看作者 |坛友微信交流群
有些可能是动态的,建议用ide之类的打开代码文件,然后使用ide的智能跳转过去看。
实在不行还可以进入debug模式,单步看代码

使用道具

板凳
w3746 发表于 2017-8-30 17:27:40 |只看作者 |坛友微信交流群
这个body应该不是函数吧,bs4里面没有这个函数,还有find_all是beautifulsoup里面的函数。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 17:37