Big-endian与Little-endian详尽说明

大端与小端存储详尽说明

大端与小端存储详尽说明

  • 大端与小端存储详尽说明
    • 一. 什么是字节序
    • 二. 什么是大端存储模式
    • 三. 什么是小端存储模式
    • 四. 大小端各自的特点
    • 五. 为什么会有大小端模式之分
    • 六. 为什么要注意大小端问题
    • 六. 大小端判定程序
    • 七. 大端小端的转换
      • 1)16位大小端转换
      • 2)32位大小端转换
    • 八. 大小端数据的存取
      • 1)存储时
      • 2)读取时

一. 什么是字节序

字节序,也就是字节的顺序,指的是多字节的数据在内存中的存放顺序。
在几乎所有的机器上,多字节对象都被存储为连续的字节序列。
不同的CPU有不同的字节序类型,最常见的有两种:
Little-Endian:将低序字节存储在起始地址(低位编址),也就是小端存储模式。
Big-Endian:将高序字节存储在起始地址(高位编址),也就是下面说的大端存储模式。

二. 什么是大端存储模式

数据的低位保存在内存中的高地址中,数据的高位保存在内存中的低地址中;这样的存储模式有点儿类似于把数据当作字符串顺序处理:地址由小向大增加,而数据从高位往低位放;
高字节数据存储在低地址。
16进制数据:0x12345678
存储方式:(低地址)12|34|56|78(高地址)
数组表示:
buf[3] (0x78) – 低位
buf[2] (0x56)
buf[1] (0x34)
buf[0] (0x12) – 高位
记忆方法: 地址的增长顺序与值的增长顺序相反。

三. 什么是小端存储模式

数据的低位保存在内存中的低地址中,数据的高位保存在内存中的高地址中;这种存储模式将地址的高低和数据位权有效地结合起来,高地址部分权值高,低地址部分权值低,和我们的逻辑方法一致。
16进制数据:0x12345678
存储方式:(低地址)78|56|34|12(高地址)
数组表示:
buf[3] (0x12) – 高位
buf[2] (0x34)
buf[1] (0x56)
buf[0] (0x78) – 低位
记忆方法: 地址的增长顺序与值的增长顺序相同

四. 大小端各自的特点

小端模式 :强制转换数据不需要调整字节内容,1、2、4字节的存储方式一样。
大端模式 :符号位的判定固定为第一个字节,容易判断正负。网络传输一般使用的就是Big Endian,也被称之为网络字节序,或网络序。
Big-endian与Little-endian详尽说明_第1张图片

五. 为什么会有大小端模式之分

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
我们常用的x86结构是小端模式,而KEIL C51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
因此可以说大端存储或小端存储都是由系统设定的,两者区别在于低地址存储的数据,因此可以写程序进行判断。

六. 为什么要注意大小端问题

C/C++语言编写的程序里数据存储顺序是跟编译平台所在的CPU相关的,而JAVA编写的程序则唯一采用big endian方式来存储数据。试想,如果你用C/C++语言在x86平台下编写的程序跟别人的JAVA程序互通时会产生什么结果?就拿上面的 0x12345678来说,你的程序传递给别人的一个数据,将指向0x12345678的指针传给了JAVA程序,由于JAVA采取big endian方式存储数据,很自然的它会将你的数据翻译为0x78563412。
因此,在你的C程序传给JAVA程序之前有必要进行字节序的转换工作。

六. 大小端判定程序

请写一个C函数,若处理器是Big_endian的,则返回0;如果Little_endian的,则返回1。

int checkLittleEndian()
{
 {
  union w
  {
   int a;
   char b;
  } c;
  c.a = 1;
  return (c.b == 1);
 }
}

联合体union的存放顺序是全部成员都从低地址开始存放,解答利用该特性,轻松地得到了CPU对内存采用Little-endian仍是Big-endian模式读写。

void Endianness()
{
	int a = 0x12345678;
	if( *((char*)&a) == 0x78)
		cout << "Little Endian" << endl;
	else
		cout << "Big Endian" << endl;
}

这一种是通过强制类型转换的方式来判断大小端的。如果是小端的话,低位字节0x78的内容应该是存放在低地址中。

七. 大端小端的转换

1)16位大小端转换

#define BSWAP_16(x) \   
    (uint_16)((((uint_16)(x) & 0x00ff) << 8) | \  
              (((uint_16)(x) & 0xff00) >> 8) \  
             )  

或者是函数的形式

uint_16 bswap_16(uint_16 x)
{
    return (((uint_16)(x) & 0x00ff) << 8) | \
           (((uint_16)(x) & 0xff00) >> 8) ;
}

2)32位大小端转换

#define BSWAP_32(x) \   
    (uint_32)((((uint_32)(x) & 0xff000000) >> 24) | \  
              (((uint_32)(x) & 0x00ff0000) >> 8) | \  
              (((uint_32)(x) & 0x0000ff00) << 8) | \  
              (((uint_32)(x) & 0x000000ff) << 24) \  
             )  

或者是函数的形式

uint_32 bswap_32(uint_32 x)  
{  
    return (((uint_32)(x) & 0xff000000) >> 24) | \  
           (((uint_32)(x) & 0x00ff0000) >> 8) | \  
           (((uint_32)(x) & 0x0000ff00) << 8) | \  
           (((uint_32)(x) & 0x000000ff) << 24) ;  
}  

八. 大小端数据的存取

1)存储时

1)先按照数据类型开辟一个空间。
int a;4字节|——|——|——|——|
2)数据定义。a=0x123456;
3)数据分割成存储单元(字节)。
0x12——0x34——0x56
4)不用考虑谁先放谁后放,我们要按顺序放,先放0x12,再放0x34……
5)大端存储方式,先往低地址放
|0x12|0x34|0x56|——|
小段存储方式,先往高地址放
|——|0x56|0x34|0x12|

2)读取时

读取时:
1)大端依次读出,小端倒叙读出。读取时,字节内部是一个整体不受倒叙影响
2)读取后,就和之前未存储时顺序一致了,也就是数没发生变化。
char只占有一个字节,因此字符不需要考虑大小端,而字符串又是单个字符的组合,因此也不需要考虑大小端。因此,在网络通信中,通信信息为字符串,不需要考虑大小端问题。

你可能感兴趣的:(C语言,网络,开发语言,c语言)