大端、小端序和BOM(byte order mark)

在多字节数据存储中,

大端,高位存储在内存地址的低位
小端,低位存储在内存地址的低位
比如,0x11 24 33 44这个数,大端、小端分别如下



大端、小端序和BOM(byte order mark)_第1张图片



为什么会有大小端序?
大端小端序与硬件cpu相关,有的cpu将高位存储在低位内存,有的cupu将低位存储在低位内存。比如 0x 1d 2a,有两种存储方案1d在低位,2a在高位,那就是大端序。1d在高位,2a在低位,那就是小端序。


通常来说x86结构(windows、linux )的都是小端序,mac是大端序。


正因为有了大端序、小端序所以,才会有BOM

bom
bom全称byte order mark,字节顺序标记。bom用在文件的开头,标记编码方案、标记大小端序。


bom作用:
1、标志编码方案,比如,utf8的bom是 0x ef bb bf ,utf16的bom是FEFF,
2、标志大小端序,"多字节为编码单元"的编码方案都会存在大小端问题,比如utf16存在大小端序的问题,如果bom是FEFF,则表示大端序,如果bom是FFFE,则表示小端序。


unicode完整的BOM

UTF编码
Byte Order Mark (BOM)
UTF-8 without BOM
UTF-8 with BOM
EF BB BF
UTF-16LE
FF FE
UTF-16BE
FE FF
UTF-32LE
FF FE 00 00
UTF-32BE
00 00 FE FF

参考 unicode 字节序


你可能感兴趣的:(计算机基础知识)