socket大小端转换

不同机器内部对变量的字节存储顺序不同,有的采用大端模式(big-endian),有的采用小端模式(little-endian)。
大端模式是指高字节数据存放在低地址处,低字节数据放在高地址处。
小端模式是指低字节数据存放在低地址处,高字节数据放在高地址处。

在网络上传输数据时,由于数据传输的两端可能对应不同的硬件平台,采用的存储字节顺序也可能不一致,因此 TCP/IP协议规定了在网络上必须采用网络字节顺序(也就是大端模式,UDP/TCP/IP协议规定:把接收到的第一个字节当作高位字节看待)
通过对大小端的存储原理分析可发现,对于 char 型数据,由于其只占一个字节,所以不存在这个问题,这也是一般情况下把数据缓冲区定义成 char 类型 的原因之一。对于IP 地址、端口号等非 char型数据,必须在数据发送到网络上之前将其转换成大端模式,在接收到数据之后再将其转换成符合接收端主机的存储模式。

Linux 系统为大小端模式的转换提供了 4 个函数,输入 man byteorder 命令可得函数原型:

点击(此处)折叠或打开

  1. <EM><STRONG><SPAN>#include<arpa/inet.h>

  2. uint32_t htonl(uint32_thostlong);

  3. uint16_t htons(uint16_thostshort);

  4. uint32_t ntohl(uint32_tnetlong);

  5. uint16_t ntohs(uint16_tnetshort);</SPAN>
  6. </STRONG>
  7. </EM>
htonl 表示 host to network long ,用于将主机 unsigned int型数据转换成网络字节顺序;
htons 表示 host to network short ,用于将主机 unsigned short型数据转换成网络字节顺序;
ntohl、ntohs 的功能分别与 htonl、htons 相反。
 
通常使用的有两种数据类型:短型(两个字节)和长型(四个字节)。

   下面介绍的这些转换函数对于这两类的无符号整型变量都可以正确的转换。 

   如果你想将一个短型数据从主机字节顺序转换到网络字节顺序的话,有这样一个函数htons:

   它是以"h”开头的,代表“主机”;

   紧跟着它的是"to",代表“转换到”;

   然后是"n",代表“网络”;

   最后是"s",代表“短型数据”。

 

    你可以使用"n","h", "to", "s", "l"的任意组合。当然,你要在可能的情况下进行组合。比如,系统是没有stolh()函数的(Shortto Long Host ?)。

   下面给出套接字字节转换程序的列表:

   hotns()——"Host to NetWork Short",主机字节顺序转换为网络字节顺序(对无符号短型进行操作 4bytes)

   htonl()——"Host to NetWorkLong",主机字节顺序转换为网络字节顺序(对无符号长型进行操作 8bytes)

   ntohs()——"NetWork to Host short",网络字节序转换为主机字节顺序(对无符号短型进行操作 4bytes)

   ntohl()——"NetWork to Host Long",网络字节顺序转换为主机字节顺序(对无符号长型进行操作 8bytes)

 

   例如:*.sin_addr.s_addr = htonl(inaddr_any)是什么意思?

   *.sin_addr.s_addr = htonl(inaddr_any)是Socket编程中用到的。

   *是任意定义的一个sockaddr_in型的结构体对象sin_addr是他的一个属性,用于定义IP地址,是strcutin_addr型的,s_addr为结构体in_addr的对象,简单说就是三个结构体嵌套包装的一个包。

   inaddr_any一般为内核指定的,大多数系统取0,表示任意的IP地址。

   htonl()简单说是把一个本机IP转化为网络协议中规定的格式的函数,也就是所谓的大端模式或小端模式。

   htons函数是将一个u_short类型的值从主机字节顺序转换为TCP/IP的网络字节顺序,原型声明如下:

   u_short htons(u_short  hostshort);

   htonl函数是将一个u_long的值从主机字节顺序转换为TCP/IP的网络字节顺序,原型声明如下:

   u_long  htonl(u_long hostlong);

   字节序和网络平台有关,不同的平台,字节序不同。(字节序顾名思义——字节的排列顺序)只有多于一个字节的数据类型,才有字节序的问题,比如short或者int类型。char是没有这个问题的字节序就是在硬件里面,一般实在内存里,如何表示存储和表示这些数据类型。如果高字节放到高地址上,就是大端(bigendian),如果高字节放到低地址上,就是小端模式(little endian)。

   网络通讯中,定义网络协议时,都指定用大端模式。所以,通用的办法就是不管主机字节序是什么,往网络上发送前,都转换成网络字节序,也就是用htons或htonl;而从网络收到的数据,不管主机是什么字节序,都转换成主机字节序,也就是ntohs或者额ntohl。按照这个规则,一般来说,不会出什么问题了

   举个例子,一个int型的整数在计算机中占4个字节,那么就有两种排列方法:

   整数0x01020304的两种表示方法

   低地址----------------高地址

    04     03     02     01---------------->方法1:小端模式(高字节放到低地址上)

    01     02     03     04---------------->方法2:大端模式(高字节放到高地址上) 网络字节序

   其中,方法1和方法2的区别就是高位放到高低之还是低地址。

   为了使得不同的主机格式能够无歧义的和网络格式相互赋值,一般牵涉到网络的开发库都会定义一套两种格式之间的转换函数,这样直接使用转换函数就可以完成两者之间的转换。

 

   在进行TCP通讯时,需要进行主机字节序和网络字节的转换。可如果我要发送的数据是调用ReadFile()函数从文件里读出来的,也就是读出来的数据都是保存到char[]数组里的,那我用send函数发送时还需要转换字节序吗?(http://topic.csdn.net/u/20091208/15/14925202-ce0d-4651-abfb-9e2f3cb73f1f.html)

   ——如果只是字节流,不需要转换。一般是ip地址,端口号码,传输一些整型数的参数,才需要做转换,字节流不需要。如果头部记录了大小的,那么这个记录了大小的整型数需要转换;

   ——协议解析方面的数字类型需要转换,负载字节流的不需要关心;

   ——需要让网络认识的数据,才需要转换,比如ip,端口号。而实际发送的数据,是没有转换要求的。从文件里读取出来的数据是你自己的数据吧,这些数据转不转换看你自己,反正发出去是什么样子,接收到就还是什么样子。


BTW:可以查看Linux源码的网站:http://lxr.free-electrons.com/ident?v=3.10&i=htonl

你可能感兴趣的:(【编程技术】)