楼主: joy0519
2271 2

[原创博文] python爬虫HTTP中header中User-Agent的运用 [推广有奖]

  • 3关注
  • 1粉丝

副教授

16%

还不是VIP/贵宾

-

威望
0
论坛币
1740 个
通用积分
98.4184
学术水平
4 点
热心指数
3 点
信用等级
0 点
经验
219 点
帖子
292
精华
0
在线时间
503 小时
注册时间
2015-9-26
最后登录
2024-3-29

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
   User-Agent :简称 UA ,它是一个特殊的字符串头,可以使服务器识别客户使用的操作系统及版本 浏览器及版本等信息 在做爬虫时加上此信息,可以伪装为浏览器;如果不加,很可能会被识别为爬虫。
1、查看某网页的Header,点击箭头指定的位置
tmp1.png
2、2、点击工具》开发人员工具
3、点击Network,然后点击F5
tmp2.png
4、查看到了User-Agent tmp3.png
5、python代码展现
import requestsfrom bs4 import BeautifulSouplink="https://movie.douban.com/top250"headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}r = requests.get(link, headers=headers)r.encoding = 'UTF-8'print(r.text)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python爬虫 python agent User Head

tmp2.png (41.11 KB)

tmp2.png

沙发
joy0519 发表于 2019-2-2 11:21:27 |只看作者 |坛友微信交流群
import requests
from bs4 import BeautifulSoup
link="https://movie.douban.com/top250"
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
r = requests.get(link, headers=headers)
r.encoding = 'UTF-8'
print(r.text)

使用道具

藤椅
luchange2000 发表于 2019-2-2 11:55:16 来自手机 |只看作者 |坛友微信交流群
joy0519 发表于 2019-2-2 11:18
User-Agent :简称 UA ,它是一个特殊的字符串头,可以使服务器识别客户使用的操作系统及版本 浏览器及版 ...
关注!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 15:11