1862 13

[其他] cookie的作用域以及跨域设置 [推广有奖]

11
数据洞见 发表于 2021-12-9 09:59:35
获取cookie保存到文件中
用到FileCookieJar对象的子类MozillaCookieJar来实现

filename='cookie.txt'#保存cookie的文件
cookie=cookielib.MozillaCookieJar(filename)#声明一个MozillaCookieJar对象实例(cookie)来保存cookie,后面写入文件
handler=urllib2.HTTPCookieProcessor(cookie)#还是创建处理器
opener=urllib2.build_opener(handler)#创建支持处理HTTP请求的opener对象
opener.open('http://www.douban.com')
cookie.save(ignore_discard=True,ignore_expires=True)#保存cookie到文件
#ignore_discard表示即使cookie将被丢弃也将保存下来,ignore_expires表示如果该文件中cookie已经存在,则覆盖原文件写入

12
数据洞见 发表于 2021-12-9 09:59:45
从文件中获取cookie,并访问
cookie保存在自己本地文件,可从文件中获取cookie并对网站进行访问

cookie=cookielib.MozillaCookieJar()#声明CookieJar对象实例来保存cookie
cookie.load('cookie.txt',ignore_discard=True,ignore_expires=True)#从文件中读取内容到cookie变量中
handler=urllib2.HTTPCookieProcessor(cookie)#处理器
opener=urllib2.build_opener(handler)
print opener.open('http://www.douban.com').read()

13
yunnandlg 在职认证  学生认证  发表于 2021-12-9 10:00:29
直接将Cookie写在header头部
# coding:utf-8
import requests
from bs4 import BeautifulSoup
cookie = '''cisession=19dfd70a27ec0eecf1fe3fc2e48b7f91c7c83c60;CNZZDATA1000201968=181584
6425-1478580135-https%253A%252F%252Fwww.baidu.com%252F%7C1483922031;Hm_lvt_f805f7762a9a2
37a0deac37015e9f6d9=1482722012,1483926313;Hm_lpvt_f805f7762a9a237a0deac37015e9f6d9=14839
26368'''
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Geck
o) Chrome/53.0.2785.143 Safari/537.36',
'Connection': 'keep-alive',
'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Cookie': cookie}
url = 'https://kankandou.com/book/view/22353.html'
wbdata = requests.get(url,headers=header).text
soup = BeautifulSoup(wbdata,'lxml')
print(soup)

14
yunnandlg 在职认证  学生认证  发表于 2021-12-9 10:00:40
使用requests插入Cookie
# coding:utf-8
import requests
from bs4 import BeautifulSoup
cookie = {
"cisession":"19dfd70a27ec0eecf1fe3fc2e48b7f91c7c83c60",
"CNZZDATA100020196":"1815846425-1478580135-https%253A%252F%252Fwww.baidu.com%252F%7C1483
922031",
"Hm_lvt_f805f7762a9a237a0deac37015e9f6d9":"1482722012,1483926313",
"Hm_lpvt_f805f7762a9a237a0deac37015e9f6d9":"1483926368"
}
url = 'https://kankandou.com/book/view/22353.html'
wbdata = requests.get(url,cookies=cookie).text
soup = BeautifulSoup(wbdata,'lxml')
print(soup)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-13 05:35