utf-8编码是什么意思

发布时间: 2022-03-03 17:55:45

精选答案

UTF-8是一种针对Unicode的可变长度字符编码，将Unicode字符集的抽象代码位映射为8位长整数(即代码位)进行数据存储或传输的序列。对于前0x7F的字符，UTF-8编码和ASCII码是一一对应的。如果一个字符在000800-00FFFF 之间，那转化到UTF-8 需要用三字节模板，使用16个码位，每个x 就是一个码位。

UTF-8编码可以通过屏蔽位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的返回结果相同，因此使排序变得更加容易。字节FF和FE在UTF-8编码中永远不会出现，因此他们可以用来表明UTF-16或UTF-32文本(见BOM)UTF-8是字节顺序无关的。它的字节顺序在所有系统中都是一样的，因此它实际上并不需要BOM。

“utf-8编码是什么意思”

其他答案

UTF-8(全称：8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码，由Ken Thompson于1992年创建。它可以用来表示Unicode标准中的任何字符，且其编码中的第一个字节仍与ASCII兼容，这使得原来处理ASCII字符的软件无须或只须做少部份修改，即可继续使用。

温馨提示：