3.1 概述
本章先从套接字地址结构开始讲解套接字API,这些结构可以在两个方向上传递:从进程到内核和从内核到进程。
地址转换函数:inet_addr和inet_ntoa
inet_ntop和inet_pton
3.2 套接字地址结构
3.2.1 IPv4套接字地址结构
图3.1是它的POSIX定义。定义在<netinet/in.h>头文件中。
struct in_addr{
in_addr_t s_addr; /* 32-bit IPv4 address */
/* network byte ordered*/
}
struct sockaddr_in{
uint8_t sin_len; /* length of structrure(16) */
sa_family_t sin_family; /* AF_INET */
in_port_t sin_port; /* 16-bit TCP or UDP port number */
/* network byte ordered*/
struct in_addr sin_addr; /* 32-bit IPv4 address*/
/* network byte ordered*/
char sin_zero[8]; /* unused*/
};
图3.1 网际(IPv4)套接字地址结构:sockaddr_in
图3.2列出了POSIX定义的这些数据类型以及后面将会遇到的其他数据类型。
图3.2 POSIX规范要求的数据类型
3.2.2 通用套接字地址结构
定义在<sys/socket.h>头文件中。结构如图3.3所示。
struct sockaddr {
uint8_t sa_len;
sa_family_t sa_family; /* address family: AF_xxx value */
char sa_data[14]; /* protocol-specific address */
};
图3.3 通用套接字地址结构:sockaddr
其他指向特定于协议的套接字地址结构的指针进行类型强制转换,变成指向某个通用套接字地址结构的指针,例如:
struct sockaddr_in serv; /* IPv4 socket address structure */
/* fill in serv{} */
bind(sockfd, (struct sockaddr *) &serv, sizeof(serv));
3.2.3 IPv6套接字地址结构
IPv6套接字地址结构在<netinet/in.h>中定义,如图3.4所示
struct in6_addr{
uint8_t s6_addr[16]; /* 128-bit IPv6 address*/
/* network byte ordered*/
};
#define SIN6_LEN
struct sockaddr_in6{
uint8_t sin6_len; /* length of this struct (28) */
sa_family_t sin6_family; /* AF_INET6 */
in_port_t sin6_port; /* transport layer port# */
/* network byte ordered */
uint32_t sin6_flowinfo; /*flow information,undefined */
struct in6_addr sin6_addr; /*IPv6 address */
/* network byte ordered */
uint32_t sin6_scope_id; /* set of inetfaces for a scope */
};
图3.4 IPv6套接字地址结构:sockaddr_in6
3.2.4 新的通用套接字地址结构
不像struct sockaddr,新的struct sockaddr_storage足以容纳系统所支持的任何套接字地址结构,sockaddr_storage结构在<netinet/in.h>头文件中定义。
struct sockaddr_storage {
uint8_t ss_len; /* length of this struct (implementation dependent) */
sa_family_t ss_family; /* address family: AF_xxx value */
/* implementation-dependent elements to provide:
* a) alignment sufficient to fulfill the alignment requirements of
* all socket address types that the system supports.
* b) enough storage to hold any type of socket address that the
* system supports.
*/
};
图3.5 存储套接字地址结构:sockaddr_storage
sockaddr_storage和sockaddr的主要差别
(1) sockaddr_storage通用套接字地址结构满足对齐要求。
(2) sockaddr_storage通用套接字地址结构足够大,能够容纳系统支持的任何套接字地址结构。
3.2.5 套接字地址结构的比较
图3.6 不同套接字地址结构的比较
3.3 值-结果参数
当往一个套接字函数传递一个套接字地址结构时,该结构总是以引用形式来传递,也就是传递的是指向该结构的一个指针。该结构的长度也作为一个参数来传递,不过其传递方式取决于该结构的传递方向:是从进程到内核,还是从内核到进程。
(1)进程-->内核:bind、connect和sendto。例如:
struct sockadd_in serv;
/* fill in serv() */
Connect(sockfd, (SA *)&serv, sizeof(serv));
指针和指针所指内容的大小都传递给了内核,于是内核知道到底需从进程复制多少数据进来。图3-7展示了这个情形。
图3-7 从进程到内核传递套接字地址结构
(2)内核-->进程:accept、recvfrom、getsockname和getpeername。例如:
struct sockaddr_un cli; /* Unix domain */
socklen_t len;
len = sizeof(cli); /* len is a value */
getpeername(unixfd, (SA *)&cli, &len);
/* len may have changed */
通过比较进程到内核、内核到进程的例子,可以发现,传递的结构大小由一个整数改为指向某个整数变量的指针。
其原因:当函数被调用时,结构大小是一个值,它告诉内核该结构的大小,这样内核在写该结构时不至于越界;当函数返回时,结构大小又是一个结果,它告诉内核在该结构中究竟存储了多少信息。图3-8展示了这个情形。
图3-8 从内核到进程传递套接字地址结构
当使用这种值-结果参数作为套接字地址结构的长度时,如果套接字地址结构时固定长度的,那么从内核返回的值总是那个固定长度,例如IPv4的sockaddr_in长度是16。然而对于可变长度的套接字地址结构(例如Unix域的sockaddr_un),返回值可能小于该结构的最大长度。
3.4 字节排序函数
(1)小端字节序:低序字节存储在起始地址
(2)大端字节序:高序字节存储在起始地址
图3-9展示了这两种格式。
图3-9 16位整数的小端字节序和大端字节序
(1)主机字节序:系统所使用的字节序,根据系统不用,可能为大端或小端
(2)网络字节序:采用大端字节序
其中主机字节序与网络字节序之间转换可以使用以下4个函数:
#include <netinet/in.h>
uint16_t htons(uint16_t host16bitvalue) ;
uint32_t htonl(uint32_t host32bitvalue) ;
Both return: value in network byte order
uint16_t ntohs(uint16_t net16bitvalue) ;
uint32_t ntohl(uint32_t net32bitvalue) ;
Both return: value in host byte order
3.5 字节操纵函数
(1)以b(表示字节)开头的第一组函数
#include <strings.h>
void bzero(void *dest, size_t nbytes);
void bcopy(const void *src, void *dest, size_t nbytes);
int bcmp(const void *ptr1, const void *ptr2, size_t nbytes);
Returns: 0 if equal, nonzero if unequal
(2)以mem(表示内存)开头的第二组函数
#include <string.h>
void *memset(void *dest, int c, size_t len);
void *memcpy(void *dest, const void *src, size_t nbytes);
int memcmp(const void *ptr1, const void *ptr2, size_t nbytes);
Returns: 0 if equal, <0 or >0 if unequal (see text)
注意项:
当原字节串与目标字节串重叠时,bcopy能够正确处理,但是memcpy的操作结果却不可知。
3.6 inet_aton、inet_addr和inet_ntoa函数
该节与下一节分别介绍两组地址转换函数。本节介绍的三个函数是在点分十进制数串(例如“206.168.112.96”)与它长度为32为的网络字节序二进制值间转换IPv4地址。
#include <arpa/inet.h>
int inet_aton(const char *strptr, struct in_addr *addrptr);
Returns: 1 if string was valid, 0 on error
in_addr_t inet_addr(const char *strptr);
Returns: 32-bit binary network byte ordered IPv4 address; INADDR_NONE if error
char *inet_ntoa(struct in_addr inaddr);
Returns: pointer to dotted-decimal string
注意项:
(1)inet_addr与inet_aton进行相同的转换,返回值为32位的网络字节序二进制值。该函数存在一个问题:所有的2的32次方个可能的二进制值都是有效的IP地址(从0.0.0.0到255.255.255.255),但是当出错时该函数返回INADDR_NONE常值(通常是一个32位均为1的值)。这意味着点分十进制数串255.255.255.255不能由该函数来处理。
(2)inet_ntoa返回值所指向的字符串驻留在静态内存中。这意味着该函数是不可重入的。
3.7 inet_pton和inet_ntop函数
这两个地址转换函数对于IPv4和IPv6地址都适用。
#include <arpa/inet.h>
int inet_pton(int family, const char *strptr, void *addrptr);
Returns: 1 if OK, 0 if input not a valid presentation format, -1 on error
const char *inet_ntop(int family, const void *addrptr, char *strptr, size_t len);
Returns: pointer to result if OK, NULL on error
注意项:
(1)如果以不被支持的地址族作为family参数,这两个函数都返回一个错误,并将errno置为EAFNOSUPPORT。
(2)inet_ntop函数中的len如果太小,不足以容纳表达格式的结果(包括结尾的空字符),返回一个错误,并将errno置为ENOSPC。
len长度大小在<netinet/in.h>头文件中有如下定义:
#define INET_ADDRSTRLEN 16 /* for IPv4 dotted-decimal */
#define INET6_ADDRSTRLEN 46 /* for IPv6 dotted-decimal */
(3)inet_ntop函数的strptr参数不可以是一个空指针。