python如何爬取网页图片

1209
2023/8/4 23:45:04
栏目: 编程语言
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

要使用Python爬取网页图片,可以使用requests库来发送HTTP请求,然后使用beautifulsoup库或者正则表达式来解析网页内容,最后使用urllib库来下载图片。

下面是一个简单的示例代码,可以爬取指定网页的所有图片并保存到本地:

import requests
from bs4 import BeautifulSoup
import urllib
# 发送HTTP请求
response = requests.get('http://example.com')
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的图片标签
img_tags = soup.find_all('img')
# 下载图片
for img_tag in img_tags:
# 获取图片URL
img_url = img_tag['src']
# 下载图片并保存到本地
urllib.request.urlretrieve(img_url, 'image.jpg')

需要注意的是,上述代码只能下载网页中第一个图片,并且没有对错误进行处理。在实际应用中,可能需要处理多张图片和异常情况,例如使用循环来下载所有图片,添加异常处理等。

此外,还可以使用第三方库如Scrapy来更方便地实现图片爬取功能。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: Python列表与集合怎么并集