📜  下载图片 python google - Python (1)

📅  最后修改于: 2023-12-03 15:06:11.845000             🧑  作者: Mango

下载图片 Python Google

大家好,今天我们来一起学习如何使用 Python 从 Google 图像搜索中下载图片。

环境准备

首先,我们需要在本地搭建 Python 环境,包括安装 Python 和 pip。

接着,我们需要安装一些必要的 Python 库,以便于我们进行开发。其中,包括 requests, BeautifulSoup 和 urllib。您可以通过以下命令来安装它们:

pip install requests
pip install beautifulsoup4
pip install urllib3
实现步骤

接下来,我们来一步步实现从 Google 图像搜索中下载图片的过程。

1. 获取图片搜索结果的 URL

我们可以使用 Google 搜索引擎的图片搜索接口,通过构造 URL 来获取搜索结果中的图片。

例如,我们想要搜索关键词为“Python”的图片,那么就可以通过以下 URL 来获取搜索结果:

https://www.google.com/search?q=Python&tbm=isch

其中,q=Python 表示搜索关键词为“Python”,tbm=isch 表示搜索结果类型为图片。

2. 发送 HTTP 请求

接下来,我们使用 requests 库来发送 HTTP 请求,以获取搜索结果页面的 HTML 代码。代码如下:

import requests

url = 'https://www.google.com/search?q=Python&tbm=isch'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
response = requests.get(url, headers=headers)

其中,headers 参数表示我们使用的浏览器类型,用于模拟用户行为。

3. 解析 HTML

接下来,我们使用 BeautifulSoup 库来解析 HTML 代码,以找到图片的 URL。代码如下:

from bs4 import BeautifulSoup

soup = BeautifulSoup(response.text, 'html.parser')
img_links = soup.find_all('img')
for img_link in img_links:
    print(img_link['src'])

其中,find_all 函数用于查找 HTML 中的所有 img 标签,并返回一个包含所有 img 标签的 list。img_link['src'] 表示获取每个 img 标签的 src 属性,也就是图片的 URL。

4. 下载图片

最后,我们使用 urllib 库来下载图片。代码如下:

import urllib.request

img_url = 'https://www.google.com/images/branding/googlelogo/1x/googlelogo_color_272x92dp.png'
urllib.request.urlretrieve(img_url, 'python.png')

其中,img_url 表示图片的 URL,python.png 表示保存图片的文件名。urlretrieve 函数会自动从 URL 中下载图片,并保存到指定的文件中。

结论

上述就是使用 Python 从 Google 图像搜索中下载图片的完整过程。希望能对大家有帮助。