Cookie获取、保存与读取--688IT编程网

Cookie获取、保存与读取

为什么要使⽤Cookie呢？

Cookie，指某些⽹站为了辨别⽤户⾝份、进⾏session跟踪⽽储存在⽤户本地终端上的数据（通常经过加密）

⽐如说有些⽹站需要登录后才能访问某个页⾯，在登录之前，你想抓取某个页⾯内容是不允许的。那么我们可以利⽤Urllib库保存我们登录的Cookie，然后再抓取其他页⾯就达到⽬的了。

1|11.1 Opener

当你获取⼀个URL你使⽤⼀个opener(⼀个urllib.OpenerDirector的实例)。在前⾯，我们都是使⽤的默认的opener，也就是urlopen。它是⼀个特殊的opener，可以理解成opener的⼀个特殊实例，传⼊的参数仅仅是url，data，timeout。

如果我们需要⽤到Cookie，只⽤这个opener是不能达到⽬的的，所以我们需要创建更⼀般的opener来实现对Cookie的设置

1|21.2 Cookielib

cookielib模块的主要作⽤是提供可存储cookie的对象，以便于与urllib模块配合使⽤来访问Internet资源。Cookielib模块⾮常强⼤，我们可以利⽤本模块的CookieJar类的对象来捕获cookie并在后续连接请求时重新发送，⽐如可以实现模拟登录功能。该模块主要的对象有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar

我们使⽤以上⽅法将cookie保存到变量中，然后打印出了cookie中的值，运⾏结果如下

以上程序的原理如下

创建⼀个带有cookie的opener，在访问登录的URL时，将登录后的cookie保存下来，然后利⽤这个cookie来访问其他⽹址。

案例2：cookie保存⽂件的读取

quest import build_opener, Request

quest import HTTPCookieProcessor

kiejar import MozillaCookieJar

from urllib.parse import urlencode

def use_cookie():

# 请求头

headers = {

“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)

Chrome/65.0.3325.181 Safari/537.36”}

info_url = "www.sxt/index/user.html"

# 创建保存可以序列化cookie的⽂件对象

cookie = MozillaCookieJar()

# 加载cookie⽂件

cookie.load("", ignore_discard=True, ignore_expires=True)

# 构造可保存cookie的控制器

c_handler = HTTPCookieProcessor(cookie)

# 构造opener

opener = build_opener(c_handler)

# 构造访问个⼈页⾯请求

req1 = Request(info_url, headers=headers)

# 发送请求

resp2 = opener.open(req1)

# 打印信息

ad().decode())

if name == ‘main’:

# get_cookie()

session如何设置和读取

use_cookie()

688IT编程网

Cookie获取、保存与读取

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Cookie获取、保存与读取

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式