文件的字节顺序记号

字节顺序记号 是编码为 U+FEFF统一码 字符("零宽度无断空白")。当以 UTF-16 或 UTF-32 来对UCS 或Unicode字符编码时,这个字符被用来标示其字节序。它常被用来当做标示文件是 UTF-8 、 UTF-16 或 UTF-32 编码格式的文件记号。


UTF-8 则没有字节顺序的概念。UTF-8编码过的字节顺序记号则被用来标示它是 UTF-8 的文件。它只用来标示一个 UTF-8 的文件,而不用来说明字节顺序。 许多应用程式(包含记事本 )会添加字节顺序记号到 UTF-8 文件中。然而,在有一些Unix系统 中,这种作法则不被建议采用。字节顺序记号在 UTF-8 中被表示为序列 EF BB BF ,对大部分未准备好处理 UTF-8 的 文本编辑器 及 网页浏览器 而言,在 ISO-8859-1 的环境中则会显示 


编码 表示 (十六进制 ) 表示 (十进制)
UTF-8 EF BB BF 239 187 191
UTF-16(大端序) FE FF 254 255
UTF-16(小端序) FF FE 255 254
UTF-32(大端序) 00 00 FE FF 0 0 254 255
UTF-32(小端序) FF FE 00 00 255 254 0 0

你可能感兴趣的:(unix,浏览器)