如何修复请求中的 ReadTimeout 错误?

当收到请求的服务器未在预期时间内发送响应时,就会发生 Python 请求库中的 ReadTimeout 错误。发生这种情况的原因有很多,包括服务器过载、网络延迟或服务器处理时间缓慢。以下是处理和可能解决此错误的方法。

第 1 步:增加超时值

第一种也是最简单的尝试方法是增加请求中的超时值。这使得服务器有更多的时间响应。例如:

import requests

try:

response = requests.get('http://example.com', timeout=10) # Increase timeout from the default (~2 seconds) to 10 seconds

print(response.text)

except requests.exceptions.ReadTimeout:

print("The server did not respond within the time limit.")

第 2 步:重试机制

实施重试机制可以协助应对暂时的网络问题或服务器过载。您可以使用循环多次尝试请求:

import requests

from time import sleep

max_retries = 5

retry_count = 0

while retry_count < max_retries:

try:

response = requests.get('http://example.com', timeout=5)

print(response.text)

break # Exit loop if request is successful

except requests.exceptions.ReadTimeout:

print(f"Timeout occurred, retrying... ({retry_count+1})")

sleep(2) # Wait for 2 seconds before retrying

retry_count += 1

第 3 步:使用 Web 抓取工具(可选)

对于需求更多的网页抓取项目,可考虑使用网页抓取工具或服务。这些工具通常具有高级功能,例如自动重试机制、代理轮换等,因此您完全不必处理请求错误。

除了使用自动化网页抓取工具外,您还可以仅购买最终结果 – 自选即用型数据集,根据您的标准和要求进行定制。

Bright Data 的解决方案

Bright Data 提供先进的网页抓取工具,旨在应对各种网页抓取挑战。凭借其内置的代理管理和自动重试功能,可以确保您的数据收集过程尽可能高效无误。此外,Web Unlocker 解决方案可以动态解算验证码 并管理重试,从而进一步将抓取项目中遇到超时错误的可能性降低为零。

其他请求相关问题:

想要立即开始使用?