📜  Requests-html 绝对网址 - Python (1)

📅  最后修改于: 2023-12-03 14:47:04.143000             🧑  作者: Mango

Requests-html - 绝对网址探秘

简介

Requests-html 是一个基于 Python 的库,用于向 Web 服务器发出请求并解析响应。相比其他请求库,它能自动处理 JavaScript 渲染的页面,并模拟浏览器行为,支持绝对网址请求。本文将介绍 Requests-html 中关于绝对网址的使用方法。

安装
pip install requests-html
使用方法

在 Requests-html 库中,绝对网址是通过指定完整的 URL 地址来请求的。下面是一个例子:

from requests_html import HTMLSession

session = HTMLSession()
response = session.get('https://www.example.com')

以上代码将向 https://www.example.com 发出一个 GET 请求,并返回响应对象。

在实际使用中,我们有时会需要构建完整的 URL 地址。Requests-html 提供了一个很方便的方法,即使用 urljoin 函数来构建绝对路径的 URL。

from requests_html import urljoin

base_url = 'https://www.example.com'
page_url = '/about.html'

full_url = urljoin(base_url, page_url)
print(full_url)

以上代码将输出 https://www.example.com/about.html。即将 base_urlpage_url 结合起来构造出完整的 URL 地址。

总结

本文介绍了 Requests-html 中关于绝对网址的使用方法,包括请求绝对网址和构建绝对网址。在实际使用中,我们可以根据需要选择适合自己的方法来构造 URL 地址。