📜  如何在python中获取网站的代码(1)

📅  最后修改于: 2023-12-03 14:52:51.347000             🧑  作者: Mango

在 Python 中获取网站的源代码非常简单,只需要用到 urllib 或 requests 这些常用的库即可。下面分别介绍这两个库的使用方法。

1. 使用 urllib 库
import urllib.request

url = 'https://www.example.com/'
response = urllib.request.urlopen(url)
html = response.read()

print(html)

通过 urllib.request.urlopen() 可以打开一个网站,并返回该网站的源代码。通过 response.read() 可以将源代码读取出来,并赋值给 html 变量。最后打印出 html 可以查看网站的源代码。

2. 使用 requests 库
import requests

url = 'https://www.example.com/'
response = requests.get(url)
html = response.text

print(html)

通过 requests.get() 可以打开一个网站,并返回该网站的源代码。通过 response.text 可以将源代码读取出来,并赋值给 html 变量。最后打印出 html 可以查看网站的源代码。

两种方法都可以实现获取网站的源代码,但是在使用上还是有一些区别的。urllib 是 Python 自带的一个库,而 requests 是第三方库,需要安装才能使用。requests 相对于 urllib 而言使用更加简单,提供了更多的功能,例如设置 headers、请求超时时间等。因此在实际使用中建议使用 requests 库。