前端参考 -- HTML字符集之UTF-8货币符号
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集!
然而并非一直如此。早期 Web 的字符编码为 ASCII。
后来,从 HTML 2.0 到 HTML 4.01,ISO-8859-1 被视为标准字符集。
有了 XML 和 HTML5,UTF-8 终于出现并解决了许多字符编码问题。
字符集发展历程
-
最初:ASCII
计算机数据以二进制代码(01000101)存储在电子设备中。
为了使文本的存储标准化,创建了美国信息交换标准码(American Standard Code for Information Interchange,ASCII)。它为每个可存储字符定义了一个唯一的二 进制数字,以支持 0-9 之间的数字、大写和小写字母(a-z,A-Z)以及特殊字符(比 如 ! $ + - ( ) @ < > ,)。
由于 ASCII 使用 7 位字符,因此它只能表示 128 个不同的字符。
ASCII 的最大缺点是,它排除了非英文字母。
如今,ASCII 仍在使用,特别是在大型主机计算机系统中。 -
在 Windows 中:Windows-1252
Windows-1252 是 Windows(直到 Windows 95)中的默认字符集。
它是 ASCII 的扩展,增加了国际字符。
它使用一个完整的字节(8 位)表示 256 个不同的字符。
由于 Windows-1252 是 Windows 中的默认设置,因此所有浏览器都支持它。 -
在 HTML 4 中:ISO-8859-1
HTML 4 中最常用的字符集是 ISO-8859-1。
ISO-8859-1 是 ASCII 的扩展,增加了国际字符。
在 HTML 4 中,可以在 标签中指定与 ISO-8859-1 不同的字符集:所有 HTML 4 处理器也都支持 UTF-8:当浏览器检测到 ISO-8859-1 时,它通常默认为 Windows-1252,因为 Windows-1252 还有 32 个国际字符。 -
在 HTML5 中:Unicode UTF-8
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集。
Unicode 联盟开发了 UTF-8 和 UTF-16 标准,因为 ISO-8859 字符集是受限制的,并且不兼容多语言环境。
Unicode 标准(几乎)涵盖世界上所有的字符、标点和符号。
所有 HTML5 和 XML 处理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。
这里我们重点描述下 UTF-8 货币符号
范围:十进制 8352-8399,十六进制 20A0-20CF
如果您希望在 HTML 中显示特殊字符,可以使用下表中的 HTML 实体。
如果字符没有 HTML 实体,则可以使用十进制(dec)或十六进制(hex)引用。
字符 | 十进制 | 十六进制 | 实体 | 名称 |
---|---|---|---|---|
₠ | 8352 | 20A0 | 欧元货币符号(EURO-CURRENCY SIGN) | |
₡ | 8353 | 20A1 | 科朗符号(COLON SIGN) | |
₢ | 8354 | 20A2 | 克鲁塞罗符号(CRUZEIRO SIGN) | |
₣ | 8355 | 20A3 | 法国法郎符号(FRENCH FRANC SIGN) | |
₤ | 8356 | 20A4 | 里拉符号(LIRA SIGN) | |
₥ | 8357 | 20A5 | MILL SIGN | |
₦ | 8358 | 20A6 | 奈拉符号(NAIRA SIGN) | |
₧ | 8359 | 20A7 | 比塞塔符号(PESETA SIGN) | |
₨ | 8360 | 20A8 | 卢比符号(RUPEE SIGN) | |
₩ | 8361 | 20A9 | 朝鲜圆符号(WON SIGN) | |
₪ | 8362 | 20AA | 新的谢克尔符号(NEW SHEQEL SIGN) | |
₫ | 8363 | 20AB | 越南盾符号(DONG SIGN) | |
€ | 8364 | 20AC | € | 欧元符号(EURO SIGN) |
₭ | 8365 | 20AD | 基普符号(KIP SIGN) | |
₮ | 8366 | 20AE | 图格里克符号(TUGRIK SIGN) | |
₯ | 8367 | 20AF | 德拉克马符号(DRACHMA SIGN) | |
₰ | 8368 | 20B0 | 德国便士符号(GERMAN PENNY SYMBOL) | |
₱ | 8369 | 20B1 | 比索符号(PESO SIGN) | |
₲ | 8370 | 20B2 | 瓜拉尼符号(GUARANI SIGN) | |
₳ | 8371 | 20B3 | 澳大利亚元符号(AUSTRAL SIGN) | |
₴ | 8372 | 20B4 | 格里夫尼亚符号(HRYVNIA SIGN) | |
₵ | 8373 | 20B5 | 塞地符号(CEDI SIGN) | |
₶ | 8374 | 20B6 | 里弗弗尔符号(LIVRE TOURNOIS SIGN) | |
₷ | 8375 | 20B7 | SPESMILO SIGN | |
₸ | 8376 | 20B8 | 坚戈符号(TENGE SIGN) | |
₹ | 8377 | 20B9 | 印度卢比符号(INDIAN RUPEE SIGN) |