pythonrequesttimeout_Python:requests:详解超时和重试--688IT编程网

pythonrequesttimeout_Python：requests：详解超时和重试⽹络请求不可避免会遇上请求超时的情况，在 requests 中，如果不设置你的程序可能会永远失去响应。session如何设置和读取

超时⼜可分为连接超时和读取超时。

连接超时

连接超时指的是在你的客户端实现到远端机器端⼝的连接时（对应的是connect()），Request 等待的秒数。import time

import requests

url = 'le.hk'

print(time.strftime('%Y-%m-%d %H:%M:%S'))

try:

html = (url, timeout=5).text

print('success')

ptions.RequestException as e:

print(e)

print(time.strftime('%Y-%m-%d %H:%M:%S'))

因为 google 被墙了，所以⽆法连接，错误信息显⽰ connect timeout（连接超时）。2018-12-14 14:38:20

HTTPConnectionPool(host='le.hk', port=80): Max retries exceeded with url: / (Caused by ConnectTimeoutError(,

2018-12-14 14:38:25

就算不设置，也会有⼀个默认的连接超时时间（我测试了下，⼤概是21秒）。

读取超时

读取超时指的就是客户端等待服务器发送请求的时间。（特定地，它指的是客户端要等待服务器发送

字节之间的时间。在 99.9% 的情况下

这指的是服务器发送第⼀个字节之前的时间）。

简单的说，连接超时就是发起请求连接到连接建⽴之间的最⼤时长，读取超时就是连接成功开始到服务器返回响应之间等待的最⼤时长。

如果你设置了⼀个单⼀的值作为 timeout，如下所⽰：r = ('github', timeout=5)

这⼀ timeout 值将会⽤作 connect 和 read ⼆者的 timeout。如果要分别制定，就传⼊⼀个元组：

r = ('github', timeout=(3.05, 27))

⿊板课爬⾍闯关的第四关正好⽹站⼈为设置了⼀个15秒的响应等待时间，拿来做说明最好不过了。import time

import requests

url_login = 'www.heibanke/accounts/login/?next=/lesson/crawler_ex03/'

session = requests.Session()

<(url_login)

token = kies['csrftoken']

session.post(url_login, data={'csrfmiddlewaretoken': token, 'username': 'xx', 'password': 'xx'})

print(time.strftime('%Y-%m-%d %H:%M:%S'))

url_pw = 'www.heibanke/lesson/crawler_ex03/pw_list/'

try:

html = (url_pw, timeout=(5, 10)).text

print('success')

ptions.RequestException as e:

print(e)

print(time.strftime('%Y-%m-%d %H:%M:%S'))

错误信息中显⽰的是 read timeout（读取超时）。2018-12-14 15:20:47

HTTPConnectionPool(host='www.heibanke', port=80): Read timed out. (read timeout=10)

2018-12-14 15:20:57

读取超时是没有默认值的，如果不设置，程序将⼀直处于等待状态。我们的爬⾍经常卡死⼜没有任何的报错信息，原因就在这⾥了。超时重试

⼀般超时我们不会⽴即返回，⽽会设置⼀个三次重连的机制。def gethtml(url):

i = 0

while i < 3:

try:

html = (url, timeout=5).text

return html

ptions.RequestException:

i += 1

其实 requests 已经帮我们封装好了。（但是代码好像变多了...）import time

import requests

from requests.adapters import HTTPAdapter

s = requests.Session()

print(time.strftime('%Y-%m-%d %H:%M:%S'))

try:

r = s.get('le.hk', timeout=5)

ptions.RequestException as e:

print(e)

print(time.strftime('%Y-%m-%d %H:%M:%S'))

max_retries 为最⼤重试次数，重试3次，加上最初的⼀次请求，⼀共是4次，所以上述代码运⾏耗时是20秒⽽不是15秒2018-12-14 15:34:03

HTTPConnectionPool(host='le.hk', port=80): Max retries exceeded with url: / (Caused by ConnectTimeoutError(,

2018-12-14 15:34:23

688IT编程网

pythonrequesttimeout_Python:requests:详解超时和重试

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

pythonrequesttimeout_Python:requests:详解超时和重试

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法