📜  Python – 将 HTML字符转换为字符串

📅  最后修改于: 2022-05-13 01:54:41.886000             🧑  作者: Mango

Python – 将 HTML字符转换为字符串

先决条件: html模块

给定一个包含 HTML字符的字符串,任务是将 HTML字符转换为字符串。这可以借助 html.escape() 方法(对于Python 3.4 + )来实现,我们可以通过使用 html.escape() 将 ASCII字符替换为特殊字符来将 ASCII字符串转换为 HTML 脚本 方法。

通过这种方法,我们可以将 HTML 实体解码为文本。

句法:

html.unescape(String)

我们也可以用美汤 处理实体转换。在 Beautiful Soup 4 中,实体会自动解码。

示例 1: Python 3.6+

Python3
# import html
import html
  
# Create Text
text = 'Γeeks for Γeeks'
  
# It Converts given text To String
print(html.unescape(text)) 
  
# It Converts given text to HTML Entities 
print(html.escape(text))


Python3
#import html
import html
  
try:
    # Python 2.6-2.7
    from HTMLParser import HTMLParser
except ImportError:
    # Python 3
    from html.parser import HTMLParser
  
# for python 3
h = html.parser
print(h.unescape('Γeeks for Γeeks'))


输出:

示例 2: Python 2.6-3.3

我们可以使用标准库中的 HTMLParser.unescape() :

  • 对于Python 2.6-2.7,它位于 HtmlParser 中。
  • 对于Python 3,它在 html.parser 中

蟒蛇3

#import html
import html
  
try:
    # Python 2.6-2.7
    from HTMLParser import HTMLParser
except ImportError:
    # Python 3
    from html.parser import HTMLParser
  
# for python 3
h = html.parser
print(h.unescape('Γeeks for Γeeks'))  

输出: