Linux C编程--网络编程1--字节顺序和字节处理函数

字节顺序

不同的CPU有不同的字节序类型这些字节序是指整数在内存中保存的顺序这个叫做主机序
最常见的有两种

1
Little endian:将低序字节存储在起始地址
2
Big endian:将高序字节存储在起始地址

LE little-endian
最符合人的思维的字节序
地址低位存储值的低位

地址高位存储值的高位

怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说

低位值小,就应该放在内存地址小的地方,也即内存地址低位

反之,高位值就应该放在内存地址大的地方,也即内存地址高位


BE big-endian
最直观的字节序

地址低位存储值的高位

地址高位存储值的低位

为什么说直观,不要考虑对应关系

只需要把内存地址从左到右按照由低到高的顺序写出

把值按照通常的高位到低位的顺序写出

两者对照,一个字节一个字节的填充进去


图示如下:

大端字节(Big-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
0x1000 0x1001
_____________________________
| |
| 0x31 | 0x32
|________________ | ________________
高位字节在低位字节的前面,也就是高位在内存地址低的一端.可以这样记住(大端->高位->在前->正常的逻辑顺序)

小端字节(little-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
0x1000 0x1001
_____________________________
| |
| 0x32 | 0x31
|________________ | ________________
低位字节在高位字节的前面,也就是低位在内存地址低的一端.可以这样记住(小端->低位->在前->与正常逻辑顺序相反)



下面给出一个程序检测系统采用的是什么字节顺序。

#include 
#include 
#include 

int main()
{
	union
	{
		short	inum;
		char c[sizeof(short)];
	} un;
	struct utsname	uts;
	un.inum=0x0102;
	if(uname(&uts)<0)
	{
		printf("Could not get host information .\n");
		return -1;
	}
	printf("%s -%s-%s:\n",uts.machine, uts.sysname, uts.release);
	if(sizeof(short)!=2)
	{
		printf("sizeof short =%d\n", sizeof(short));
		return 0;
	}
	if(un.c[0]==1 && un.c[1]==2)
		printf("big_endian.\n");
	else if(un.c[0]==2 && un.c[1]==1)
		printf("little_endian.\n");
	else
		printf("unknown .\n");
	return 0;
}

网络协议中的数据采用统一的网络字节顺序,因为只有采用统一的字节顺序,才能在不同的机器之间正确的发送和接收数据。Internet规定的网络字节顺序采用big-endian方式。

Linux采用了4个库函数来进行字节的转换:

Ø.unsigned long int htonl(unsignedlong int hostlong);

主机字节顺序转换为网络字节顺序(对无符号长整型进行操作,4bytes)

Ø. unsigned short int htons(unsignedshort int hostshort);

主机字节顺序转换为网络字节顺序(对无符号短整型进行操作,2bytes)

Ø .unsigned long int ntohl(unsignedlong int netlong);

网络字节顺序转换为主机字节顺序

Ø .unsigned short int ntohs(unsignedshort int netshort);

网络字节顺序转换为主机字节顺序

注:n代表net, h代表host, s代表short,l代表long

在编程中,需要使用网络字节顺序时,应该使用这几个函数来进行转换,绝对不要依赖于具体的机器表示的方式。


字节处理函数

套接字地址是多字节数据,不是以空字符结尾的,这和C语言中的字符串是不同的。Linux提供两组函数来处理多字节数据,一组函数以b(byte)开头,是和BSD系统兼容的函数;另一组函数以mem开头,是ANSIC提供的函数。

以b开头的函数如下:

bzero

原型:externvoidbzero(void*s,intn);

用法:#include

功能:将以地址s开头的的前n个字节为零。

说明:bzero无返回值。bzero只能在linux下调用


bcopy

原型:externvoidbcopy(constvoid*src,void*dest,intn);

用法:#include

功能:将字符串src的前n个字节复制到dest中

说明:bcopy不检查字符串中的空字节NULL,函数没有返回值。目标和源的位置与memcpy和strcpy不同。

bcmp

  原型:externintbcmp(constvoid*s1,constvoid*s2,intn);

  用法:#include

  功能:比较字符串s1和s2的前n个字节是否相等

说明:如果s1=s2或n=0则返回零,否则返回非零值。bcmp不检查NULL。


以m开头的函数如下:

memset

memset直接对字节操作

功能:将s所指向的某一块内存中的每个字节的内容全部设置为ch指定的ASCII值。即将指定的内存,以 字节为单位,置为ch所代表的内存形式。块的大小由第三个参数指定,这个函数通常为新申请的内存做初始化工作。

用法:void*memset(void*s,charch,unsignedn);

原理:以字节为单位复制内存的二进制形式,到指定的内存区域。

(注:第二个数字也可以是int型,然后截取该int变量的最低字节。作为复制的二进制模板。所以第二个字节最常见的是0全部置零或-1全部置1。)

用途:memset最常见的用途是对struct做初始化工作

memset(结构体的地址,0,sizeof(结构体));


memcpy

memcpy用来做内存拷贝,你可以拿它拷贝任何数据类型的对象,可以指定拷贝的数据长度。

原型:externvoid*memcpy(void*dest,void*src,unsignedintcount);

功能:由src所指内存区域复制count个字节到dest所指内存区域。

说明:src和dest所指内存区域不能重叠,函数返回指向dest的指针


memcmp

原型:externintmemcmp(void*buf1,void*buf2,unsignedintcount);

用法:#include

功能:比较内存区域buf1和buf2的前count个字节。

说明:当buf1

   当buf1=buf2时,返回值=0

   当buf1>buf2时,返回值>0


你可能感兴趣的:(Linux C编程--网络编程1--字节顺序和字节处理函数)