干货Python爬虫如何设置代理IP

690
2023/10/15 4:56:44
栏目: 编程语言
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

在Python爬虫中设置代理IP可以通过使用第三方库如requests或urllib库来实现。以下是一个使用requests库设置代理IP的示例代码:

import requests
# 设置代理IP
proxies = {
'http': 'http://IP:端口',
'https': 'https://IP:端口',
}
# 发送请求时使用代理IP
response = requests.get('https://www.example.com', proxies=proxies)
# 打印响应内容
print(response.text)

在上面的代码中,将IP端口替换为你的代理IP和端口号。注意,httphttps分别对应HTTP和HTTPS请求的代理设置。

如果你的代理IP需要身份验证,可以在代理IP的后面加上用户名和密码,如下所示:

import requests
# 设置代理IP
proxies = {
'http': 'http://用户名:密码@IP:端口',
'https': 'https://用户名:密码@IP:端口',
}
# 发送请求时使用代理IP
response = requests.get('https://www.example.com', proxies=proxies)
# 打印响应内容
print(response.text)

同样,将用户名密码IP端口替换为你的代理IP的相关信息。

另外,如果你需要使用多个代理IP,可以使用代理IP池来实现。代理IP池是一个存储多个代理IP的容器,你可以从中随机选择一个代理IP并设置为请求的代理。以下是一个简单的示例代码:

import random
import requests
# 代理IP池
proxies = [
'http://IP1:端口1',
'http://IP2:端口2',
'http://IP3:端口3',
]
# 随机选择一个代理IP
proxy = random.choice(proxies)
# 发送请求时使用代理IP
response = requests.get('https://www.example.com', proxies={'http': proxy})
# 打印响应内容
print(response.text)

在上面的代码中,proxies是一个代理IP池,你可以在其中添加多个代理IP。然后,使用random.choice函数从代理IP池中随机选择一个代理IP并设置为请求的代理。注意,这里只设置了HTTP请求的代理,如果你需要同时设置HTTPS请求的代理,需要在proxies中添加对应的代理信息。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: python目录名称无效如何处理