计算机编码

  • Unicode (万国码,统一码)

    Unicode是计算机科学领域的一项世界通用字符编码标准。是计算机中二进制数到真实世界中的实际符号的映射集。其发展由非营利机构统一码联盟进行推进。
    而我们常见的UTF-8,UTF-16,UTF-32都是Unicode标准的实现方式。

    code point(码位, 编码位置,code position)

    即编码中,某个字符在码空间中的的位置,就是这个字符的码位。例如:ASCII码包含128个码位,范围是0x0-0x7F(十六进制)。而unicode包含1,114,112个码位,范围是0x0-0x10FFFF。Unicode码空间划分为17个Unicode字符平