📜  将汤另存为 html (1)

📅  最后修改于: 2023-12-03 15:39:19.539000             🧑  作者: Mango

将汤另存为 HTML

有时候我们需要将 Python 中的汤(BeautifulSoup 对象)保存为 HTML 文件,以供后续的分析和处理。下面介绍两种将汤另存为 HTML 的方法。

方法一:使用 prettify() 方法

将汤保存为 HTML 最简单的方法是使用 prettify() 方法。prettify() 方法可以将汤按照标准的格式输出,便于阅读和分析。

from bs4 import BeautifulSoup

# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')

# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
    f.write(soup.prettify())

在上面的例子中,我们创建了一个简单的 HTML 文档,并使用 prettify() 方法将其保存为 output.html 文件。可以使用文本编辑器或浏览器打开此文件,查看保存的结果。

```python
from bs4 import BeautifulSoup

# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')

# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
    f.write(soup.prettify())

## 方法二:使用 encode() 方法

另一种将汤保存为 HTML 的方法是使用 `encode()` 方法。`encode()` 方法将汤编码为字符串,可以指定编码类型,然后将字符串保存为文件。

```python
from bs4 import BeautifulSoup

# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')

# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
    f.write(soup.encode('utf-8'))

在上面的例子中,我们使用 encode() 方法将汤编码为 UTF-8 字符串,并保存为 output.html 文件。可以使用文本编辑器或浏览器打开此文件,查看保存的结果。

```python
from bs4 import BeautifulSoup

# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')

# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
    f.write(soup.encode('utf-8'))