字节顺序
不同的 CPU 有不同的字节序类型 这些字节序是指整数在内存中保存的顺序 这个叫做主机序
最常见的有两种
1 . Little endian :将低序字节存储在起始地址
2 . Big endian :将高序字节存储在起始地址
LE little-endian
最符合人的思维的字节序
地址低位存储值的低位
地址高位存储值的高位
怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说
低位值小,就应该放在内存地址小的地方,也即内存地址低位
反之,高位值就应该放在内存地址大的地方,也即内存地址高位
BE big-endian
最直观的字节序
地址低位存储值的高位
地址高位存储值的低位
为什么说直观,不要考虑对应关系
只需要把内存地址从左到右按照由低到高的顺序写出
把值按照通常的高位到低位的顺序写出
两者对照,一个字节一个字节的填充进去
图示如下:
大端字节(Big-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
0x1000 0x1001
_____________________________
| |
| 0x31 | 0x32
|________________ | ________________
高位字节在低位字节的前面,也就是高位在内存地址低的一端.可以这样记住(大端->高位->在前->正常的逻辑顺序)
小端字节(little-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
0x1000 0x1001
_____________________________
| |
| 0x32 | 0x31
|________________ | ________________
低位字节在高位字节的前面,也就是低位在内存地址低的一端.可以这样记住(小端->低位->在前->与正常逻辑顺序相反)
下面给出一个程序检测系统采用的是什么字节顺序。
#include <sys/utsname.h> #include <unistd.h> #include <stdio.h> int main() { union { short inum; char c[sizeof(short)]; } un; struct utsname uts; un.inum=0x0102; if(uname(&uts)<0) { printf("Could not get host information .\n"); return -1; } printf("%s -%s-%s:\n",uts.machine, uts.sysname, uts.release); if(sizeof(short)!=2) { printf("sizeof short =%d\n", sizeof(short)); return 0; } if(un.c[0]==1 && un.c[1]==2) printf("big_endian.\n"); else if(un.c[0]==2 && un.c[1]==1) printf("little_endian.\n"); else printf("unknown .\n"); return 0; }
Linux采用了4个库函数来进行字节的转换:
主机字节顺序转换为网络字节顺序(对无符号长整型进行操作,4bytes)
主机字节顺序转换为网络字节顺序(对无符号短整型进行操作,2bytes)
网络字节顺序转换为主机字节顺序
网络字节顺序转换为主机字节顺序
注:n代表net, h代表host, s代表short,l代表long
在编程中,需要使用网络字节顺序时,应该使用这几个函数来进行转换,绝对不要依赖于具体的机器表示的方式。
字节处理函数
套接字地址是多字节数据,不是以空字符结尾的,这和C语言中的字符串是不同的。Linux提供两组函数来处理多字节数据,一组函数以b(byte)开头,是和BSD系统兼容的函数;另一组函数以mem开头,是ANSIC提供的函数。
以b开头的函数如下:
bzero
原型:extern void bzero(void *s, int n);
用法:#include <string.h>
功能:将以地址s开头的的前n个字节为零。
说明:bzero无返回值。bzero只能在linux下调用
bcopy
原型:extern void bcopy(const void *src, void *dest, int n);
用法:#include <string.h>
功能:将字符串src的前n个字节复制到dest中
说 明:bcopy不检查字符串中的空字节NULL,函数没有返回值。目标和源的位置与memcpy和strcpy不 同。
bcmp
原 型:extern int bcmp(const void *s1, const void *s2, int n);
用 法:#include <string.h>
功 能:比较字符 串s1和s2的前n个字节是否相等
说明:如果s1=s2或n=0则返回零,否则返回非零值。bcmp不检查NULL。
以m开头的函数如下:
memset
memset直接对字节操作
功 能:将s所指向的 某一块内存中的每个字节的内容全部设置为ch指 定的ASCII值。即将指定的内存,以 字节为单位,置为ch所 代表的内存形式。块的大小由第三个参数指定,这个函 数通常为新申请的内存做初始化工作。
用 法: void *memset(void *s, char ch, unsigned n);
原 理:以 字节为单位复制内存的二进制形式,到指定的内存区域。
(注:第二个数字也可以是int型, 然后截取该int变 量的最低字节。作为复制的二进制模板。所以第二个字节最常见的是0全 部置零 或 -1全部 置1。)
用 途:memset最 常见的用途是对struct做初始化工作
memset(结 构体的地址,0,sizeof(结构体));
memcpy用来做内存拷贝,你可以拿它拷贝任何数据类型的对象,可以指定拷贝的数据长度。
原型:extern void *memcpy(void *dest, void *src, unsigned int count);
功能:由src所指内存区域复制count个字节到dest所指内存区域。
说明:src和dest所指内存区域不能重叠,函数返回指向dest的指针
memcmp
原型:extern int memcmp(void *buf1, void *buf2, unsigned int count);
用法:#include <string.h>
功能:比较内存区域buf1和buf2的前count个字节。
说明:当buf1<buf2时,返回值<0
当buf1=buf2时,返回值=0
当buf1>buf2时,返回值>0