学习VC++编制的Socket域名查询、解析程序,主要练习网络Winsock的应用。
一、 主要内容:
1. 根据IP地址查询主机信息;
2. 根据网址查询主机信息、DNS解析地址;
二、 设计实现:
1. 根据IP地址查询主机信息;
根据IP地址调用gethostbyaddr函数,分析hostent结构体获取主机信息。
2. 根据网址查询主机信息、DNS解析地址;
根据网址调用getaddinfo函数查询DNS服务器,查询链表依次获取该网址的主机信息,分析SOCKADDR_IN结构体,解析出IP地址。
三、 基础知识:
(一) 域名解析DNSR(domain name system resolution)
1. 域名解析
域名解析是把域名指向网站空间IP,让人们通过注册的域名可以方便地访问到网站一种服务。域名解析也叫域名指向、服务器设置、域名配置以及反向IP登记等等。说得简单点就是将好记的域名解析成IP,服务由DNS服务器完成,是把域名解析到一个IP地址,然后在此IP地址的主机上将一个子目录与域名绑定。
IP地址是网路上标识您站点的数字地址,为了方便记忆,采用域名来代替IP地址标识站点地址。域名解析就是域名到IP地址的转换过程。域名的解析工作由DNS服务器完成。
我们知道域名是为了方便记忆而专门建立的一套地址转换系统,要访问一台互联网上的服务器,最终还必须通过IP地址来实现,域名解析就是将域名重新转换为IP地址的过程。一个域名对应一个IP地址,一个IP地址可以对应多个域名;所以多个域名可以同时被解析到一个IP地址。域名解析需要由专门的域名解析服务器(DNS)来完成。
解析过程,比如,一个域名为:***.com,是想看到这个现HTTP服务,如果要访问网站,就要进行解析,首先在域名注册商那里通过专门的DNS服务器解析到一个WEB服务器的一个固定IP上:211.214.1.***,然后,通过WEB服务器来接收这个域名,把***.com这个域名映射到这台服务器上。那么,输入***.com这个域名就可以实现访问网站内容了.即实现了域名解析的全过程;
人们习惯记忆域名,但机器间互相只认IP地址,域名与IP地址之间是对应的,它们之间的转换工作称为域名解析,域名解析需要由专门的域名解析服务器来完成,整个过程是自动进行的。
域名解析协议(DNS)用来把便于人们记忆的主机域名和电子邮件地址映射为计算机易于识别的IP地址。DNS是一种c/s的结构,客户机就是用户用于查找一个名字对应的地址,而服务器通常用于为别人提供查询服务。
2. TTL值
全称是“生存时间(Time ToLive)”,简单的说它表示DNS记录在DNS服务器上缓存时间。
3. A记录
WEB服务器的IP指向A (Address) 记录是用来指定主机名(或域名)对应的IP地址记录。
(二) Socket
1. socket定义
socket接口是TCP/IP网络的API,socket接口定义了许多函数或例程,程序员可以用它们来开发TCP/IP网络上的应用程序。
每一个socket都用一个半相关描述{协议、本地地址、本地端口}来表示;一个完整的套接字则用一个相关描述{协议、本地地址、本地端口、远程地址、远程端口}来表示。
socket也有一个类似于打开文件的函数调用,该函数返回一个整型的socket描述符,随后的连接建立、数据传输等操作都是通过socket来实现的。
2. Socket类型
l 流式socket(SOCK_STREAM)
流式套接字提供可靠的、面向连接的通信流;它使用TCP协议,从而保证了数据传输的正确性和顺序性。
l 数据报socket(SOCK_DGRAM)
数据报套接字定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证是可靠、无差错的。它使用数据报协议UDP。
l 原始socket
原始套接字允许对底层协议如IP或ICMP进行直接访问,它功能强大但使用较为不便,主要用于一些协议的开发。
3. 地址数据结构
l 使用C/C++开发socket程序时,使用sockaddr和sockaddr_in这两个结构类型来保存socket信息。
l 这两个数据类型是等效的,可以相互转化,通常sockaddr_in数据类型使用更为方便。
structsockaddr
{
unsigned short sa_family; /*协议族*/
char sa_data[14]; /*14字节的协议地址,包含该socket的IP地址和端口号。*/
};
structsockaddr_in
{
short int sa_family; /*协议族*/
unsigned short int sin_port; /*端口号*/
struct in_addr sin_addr; /*IP地址*/
unsigned char sin_zero[8]; /*填充0 以保持与struct sockaddr同样大小*/
};
4. 协议族
l 上述结构中的sa_family字段用于描述socket中的协议族,其定义于netinet/in.h
sa_family |
AF_INET: IPv4协议 |
AF_INET6:IPv6协议 |
|
AF_LOCAL:UNIX域协议 |
|
AF_LINK:链路地址协议 |
|
AF_KEY: 密钥套接字(socket) |
5. 数据存储优先顺序
l 计算机数据存储有两种字节优先顺序:高位字节优先(称为大端模式)和低位字节优先(称为小端模式,PC机通常采用)。
l Internet 上数据以高位字节优先顺序在网络上传输,因此在有些情况下,需要对这两个字节存储优先顺序进行相互转化。
l 对字节存储优先顺序转化可能用到4个函数:htons()、 ntohs()、htonl()和ntohl()。这4个函数分别实现网络字节序和主机字节序的转化,其中h表示host,n表示network,s表示short,l表示long。通常16位的IP端口号用s,而IP地址用l。
l 调用该函数只是使其得到相应的字节序,用户不需清楚该系统的主机字节序和网络字节序是否真正相等。如果是相同不需要转换的话,该系统的这些函数会定义成空宏。
6. 字节优先顺序转换函数
所需头文件 |
#include |
函数原型 |
uint16_t htons(unit16_t host16bit) uint32_t htonl(unit32_t host32bit) uint16_t ntohs(unit16_t net16bit) uint32_t ntohs(unit32_t net32bit) |
函数传入值 |
host16bit:主机字节序的16位数据 host32bit:主机字节序的32位数据 net16bit: 网络字节序的16位数据 net32bit: 网络字节序的32位数据 |
函数返回值 |
成功:返回要转换的字节序 出错:-1 |
7. 地址格式转化
l 通常用户在表达地址时采用的是点分十进制表示的数值(或者是以冒号分开的十进制IPv6地址),而在通常使用的socket编程中所使用的则是二进制值,这就需要将这两个数值进行转换。
l 在IPv4中用到的函数有inet_aton()、inet_addr()和inet_ntoa(),而 IPv4和IPv6兼容的函数有inet_pton()和inet_ntop()。由于IPv6是下一代互联网的标准协议,后面涉及的函数都能够同时兼容IPv4和IPv6,但在具体举例时仍以IPv4为例。
l 这里inet_pton()函数是将点分十进制地址映射为二进制地址,而inet_ntop()是将二进制地址映射为点分十进制地址。
8. inet_pton函数
所需头文件 |
#include |
|
函数原型 |
int inet_pton(int family, const char *strptr , void *addrptr) |
|
函数传入值 |
family |
AF_INET:IPv4协议 |
AF_INET6:IPv6协议 |
||
strptr:要转化的值 |
||
addrptr:转化后的地址 |
||
函数返回值 |
成功:0 出错:-1 |
9. inet_ntop函数
所需头文件 |
#include |
|
函数原型 |
int inet_ntop(int family, void *addrptr , char *strptr, size_t len) |
|
函数传入值 |
family |
AF_INET:IPv4协议 |
AF_INET6:IPv6协议 |
||
addrptr:转化后的地址 |
||
strptr:要转化的值 |
||
len:转化后值的大小 |
||
函数返回值 |
成功:0 出错:-1 |
10. 主机名
l 通常,人们在使用过程中都不愿意记忆冗长的IP地址,尤其到IPv6时,地址长度多达128位。因此,使用主机名将会是很好的选择。
l 在Linux中,同样有一些函数可以实现主机名和地址的转化,最为常见的有gethostbyname()、gethostbyaddr()和getaddrinfo()等,它们都可以实现IPv4和IPv6的地址和主机名之间的转化。其中gethostbyname()将主机名转化为IP地址,gethostbyaddr()则是逆操作,将IP地址转化为主机名,另外getaddrinfo()还能实现自动识别IPv4地址和IPv6地址。
l gethostbyname()和gethostbyaddr()都涉及一个hostent的结构体。
11. hostent结构体
structhostent
{
char *h_name; /*正式主机名*/
char **h_aliases; /*主机别名*/
int h_addrtype; /*地址类型*/
int h_length; /*地址字节长度*/
char **h_addr_list; /*指向IPv4或IPv6的地址指针数组*/
};
l 调用gethostbyname()函数或gethostbyaddr()函数后就能返回hostent结构体的相关信息。
12. gethostbyname函数
所需头文件 |
#include |
函数原型 |
struct hostent *gethostbyname(const char *hostname) |
函数传入值 |
hostname:主机名 |
函数返回值 |
成功:hostent类型指针 出错:-1 |
• 调用该函数时可以首先对hostent结构体中的h_addrtype和h_length进行设置,若为IPv4可设置为AF_INET和4;若为IPv6可设置为AF_INET6和16;若不设置则默认为IPv4地址类型。
13. getaddrinfo函数
所需头文件 |
#include |
函数原型 |
int getaddrinfo(const char *node, const char *service , const struct addrinfo *hints , struct addrinfo **result) |
函数传入值 |
node: 网络地址或者网络主机名 |
service:服务名或十进制的端口号字符串 |
|
hints: 服务线索 |
|
result: 返回结果 |
|
函数返回值 |
成功:0 出错:-1 |
14. addrinfo结构体
getaddrinfo()函数涉及一个addrinfo的结构体:
structaddrinfo
{
int ai_flags; /*AI_PASSIVE, AI_CANONNAME;*/
int ai_family; /*地址族*/
int ai_socktype; /*socket类型*/
int ai_protocol; /*协议类型*/
size_t ai_addrlen; /*地址字节长度*/
char *ai_canonname; /*主机名*/
struct sockaddr *ai_addr; /*socket结构体*/
struct addrinfo *ai_next; /*下一个指针链表*/
};
15. addrinfo常见选项值
结构体头文件 |
#include |
ai_flags |
AI_PASSIVE:该套接口是用作被动地打开 |
AI_CANONNAME:通知getaddrinfo函数返回主机的名字 |
|
ai_family |
AF_INET:IPv4协议 |
AF_INET6:IPv6协议 |
|
AF_UNSPEC:IPv4或IPv6均可 |
|
ai_socktype |
SOCK_STREAM:字节流套接字socket(TCP) |
SOCK_DGRAM:数据报套接字socket(UDP) |
|
ai_protocol |
IPPROTO_IP:IP协议 |
IPPROTO_IPV4:IPv4协议 |
|
IPPROTO_IPV6:IPv6协议 |
|
IPPROTO_UDP:UDP |
|
IPPROTO_TCP:TCP |
• 通常服务器端在调用getaddrinfo()之前,ai_flags设置AI_PASSIVE,用于 bind()函数(用于端口和地址的绑定,后面会讲到),主机名nodename通常会设置为NULL。
• 客户端调用getaddrinfo()时,ai_flags一般不设置AI_PASSIVE,但是主机名 nodename和服务名servname(端口)则应该不为空。
• 即使不设置ai_flags为AI_PASSIVE,取出的地址也可以被绑定,很多程序中ai_flags直接设置为0,即3个标志位都不设置,这种情况下只要hostname和servname设置的没有问题就可以正确绑定。
/*#includefiles… */
int main()
{
struct addrinfo hints, *res = NULL;
int rc;
memset(&hints, 0, sizeof(hints));
/*设置addrinfo结构体中各参数 */
hints.ai_flags = AI_CANONNAME;
hints.ai_family = AF_UNSPEC;
hints.ai_socktype = SOCK_DGRAM;
hints.ai_protocol = IPPROTO_UDP;
/*调用getaddinfo函数*/
rc = getaddrinfo("localhost",NULL, &hints, &res);
if (rc != 0)
{
perror("getaddrinfo");
exit(1);
}
else
{
printf("Host name is %s\n",res->ai_canonname);
}
exit(0);
}
(三) 编程注意
l WS2_32.lib是网络套接字的库。两种方法加入
1、 菜单的项目 - 属性 - Linker -Input - Additional Dependencies 加上
2、 直接在代码里面 #pragma comment(lib,"ws2_32.lib")
l WSAStartup
使用Winsock库函数之前,必须先调用函数WSAStartup,该函数负责初始化动态连接库Ws2_32.dll.
函数定义:
intWSAStartup ( WORD wVersionRequested, LPWSADATA lpWSAData );
l wVersionRequested
wVersionRequested:[IN],是一个WORD(双字节数值,它指定了应用程序需要使用的Winsock版本.主版本号在低字节,次版本号在高字节。
不关心版本问题:使用常量WINSOCK_VERSION 赋值给wVersionRequested , 常量在Winsock2.h中定义。
MAKEWORD是一个宏定义主要由两个字节组成的WORD。
lpWSAData:[OUT],指向WSADATA数据结构的指针,该结构用于返回本机的Winsock系统实现的信息.
该结构WhighVersion和wVersion两个域系统支持的最高版本,后者是系统希望调用者使用的版本.
函数成功返回0; 否则返回错误码. 需要注意ws2_32.dll尚未初始化,是无法调用WSAGetLastError().int WSAGetLastError(void);
WSAStartup是任何使用Winsock的应用程序或者DLL首先必须调用Winsock库函数.
一方面它初始化ws2_32.dll,另一方面他用于在应该程序DLL与系统Winsock库版本协商.
当要求的版本(Winsock的最高版本)等与或高于系统支持的最底版本(下限),那么该函数操作成功并且在WSADATA.WhighVersion中返回系统支持的最高版本,在WSADATA.wVersion中返回系统支持的最高版(上限)和 wVersionRequested 之间的较小值。
l 属性 -à配置属性--à 常规 --à字符集:使用多字节字符集
保证memcpy等 CString 转换 char* 的正确性。