【学习笔记】BOM和UTF编码纪要

BOM——byte order mark,用来放在文本文件前端(例如unicode文件前端),用来表示当前文件的byte order(大端or小端)以及是用何种编码格式(utf8、utf16、urf32等)。

 

对于大端系统,utf16的BOM是0xFEFF;对于小端系统,如windows,utf16的BOM是0xFFFE。这样用UE打开文本文件,如果看到上面的标示,就可以判断是UTF16编码的文件了。类似的,UTF8的BOM是0xEFBBBF。

 

关于BOM,wiki上面介绍的很详细,地址如下:http://en.wikipedia.org/wiki/Byte_order_mark#UTF-8

 

你可能感兴趣的:(【学习笔记】BOM和UTF编码纪要)