📜  HTML5-字符编码

📅  最后修改于: 2020-10-23 06:30:36             🧑  作者: Mango


字符编码是一种将字节转换为字符。要验证或显示HTML文档,程序必须选择字符编码。 HTML 5作者具有三种设置字符编码的方式-

HTTP内容类型标头

如果要编写cgi或类似程序,则可以使用HTTP Content-Type标头设置任何字符编码。

以下是简单的示例-

print "Content-Type: text/html; charset=utf-8\r\n";

元素

您可以将元素与charset属性一起使用,该属性指定HTML5文档的前512个字节内的编码。

以下是简化的示例-


上面的语法取代了对的需求,尽管该语法仍然被允许。

Unicode字节顺序标记(BOM)

字节顺序标记(BOM)由数据流开头的字符代码U + FEFF组成,在这里它可用作定义字节顺序和编码形式的签名,主要是未标记的纯文本文件。

许多Windows程序(包括Windows记事本)在保存为UTF-8的任何文档的开头都添加了字节0xEF,0xBB,0xBF。这是Unicode字节顺序标记(BOM)的UTF-8编码,即使与字节顺序无关,也通常称为UTF-8 BOM。

对于HTML5文档,可以在文件开头使用Unicode字节顺序标记(BOM)字符。该字符为使用的编码提供签名。