Unicode规范中的BOM

Unicode规范中的BOM的概念:

BOM——Byte Order Mark,就是字节序标记。

BOM的作用:

UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。
字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是"EF BB BF"。
所以如果接收者收到以"EF BB BF"开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。UTF-8编码的文件中,BOM占三个字节。

如图:


文本内容有BOM

如图:


文本内容无BOM

你可能感兴趣的:(Unicode规范中的BOM)