工作以来,写了很多socket相关的代码。磕磕碰碰,走了很多弯路,也积累了一些东西,今天正好整理一下。为了证明不是从书上抄来的,逻辑会有点乱(借口,呵呵)!知识点的介绍也不会像书上说的那么详细和精准,毕竟个人水平也就这样了。当然,主要还是以上手为主,不过分剖析原理性内容。一些陌生的函数要用到的头文件,使用man查看一下就能解决了。既然该文的名称为“快速上手”,那个人认为下述内容都不存在水分,都是必须要掌握的,一点都不能急躁!
对于程序员来说,开始的时候只会把socket编程当成一个工具,尽快上手,尽快解决战斗。于是乎最关心的就是socket那些函数的调用顺序,那就先给出UDP/TCP的流程图(从《UNIX网络编程》)吧:
有了流程图,再找一些资料,就很容易写出下面这样的代码(以TCP为例):
服务器程序:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#define PORT 1234
#define BACKLOG 5
#define MAXDATASIZE 1000
int main()
{
int listenfd, connectfd;
struct sockaddr_in server;
struct sockaddr_in client;
socklen_t addrlen;
char szbuf[MAXDATASIZE] = {0};
if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
{
perror("Creating socket failed.");
exit(1);
}
bzero(&server, sizeof(server));
server.sin_family = AF_INET;
server.sin_port = htons(PORT);
server.sin_addr.s_addr = htonl(INADDR_ANY);
if (bind(listenfd, (struct sockaddr *)&server, \
sizeof (server)) == -1)
{
perror("Bind()error.");
exit(1);
}
if (listen(listenfd, BACKLOG) == -1)
{
perror("listen()error\n");
exit(1);
}
addrlen = sizeof(client);
if ((connectfd = accept(listenfd, \
(struct sockaddr*)&client, &addrlen)) == -1)
{
perror("accept()error\n");
exit(1);
}
printf("You got a connection from cient's ip is %s, \
prot is %d\n", inet_ntoa(client.sin_addr), \
htons(client.sin_port));
memset(szbuf, 'a', sizeof(szbuf));
while (1)
{
send(connectfd, szbuf, sizeof(szbuf), 0);
}
close(connectfd);
close(listenfd);
return 0;
}
TCP服务器代码
客户端程序:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <netdb.h>
#define PORT 1234
#define MAXDATASIZE 1000
int main(int argc, char *argv[])
{
int sockfd, num;
char buf[MAXDATASIZE + 1] = {0};
struct sockaddr_in server;
if (argc != 2)
{
printf("Usage:%s <IP Address>\n", argv[0]);
exit(1);
}
if ((sockfd=socket(AF_INET, SOCK_STREAM, 0)) == -1)
{
printf("socket()error\n");
exit(1);
}
bzero(&server, sizeof(server));
server.sin_family = AF_INET;
server.sin_port = htons(PORT);
server.sin_addr.s_addr = inet_addr(argv[1]);
if (connect(sockfd, (struct sockaddr *)&server, \
sizeof(server)) == -1)
{
printf("connect()error\n");
exit(1);
}
while (1)
{
memset(buf, 0, sizeof(buf));
if ((num = recv(sockfd, buf, \ MAXDATASIZE,0)) == -1)
{
printf("recv() error\n");
exit(1);
}
buf[num - 1]='\0';
printf("Server Message: %s\n",buf);
}
close(sockfd);
return 0;
}
TCP客户端代码
有了这些代码,顺利地话一次性就能编过,也都正常跑起来。有些人就认为已经学会了socket,哈哈,当时我就是这样!更多的情况是,我们参考资料所用的运行环境往往和我们自己电脑不一致,就需要自己来修改代码。然后就会发现代码里出现AF_INET、htons、inet_addr、struct sockaddr……这些完全不知道干什么的东西。更有甚者,那人还不知道使用man,不喜欢看书,那就只能剩下猜谜了。运气好一点,最后能瞎猫碰见死老鼠,要是运气差一点,估计头就大了。
Socket编程的关键函数自然不能不懂,但基础知识同样重要,不理解基础知识到最后只会一团乱。书上写了好几页,其实内容也并不是太多。耐住性子弄明白,后面就会没那么添堵了。下面整理了三点:
一般编程而言,socket(特指socket这个系统调用)函数的第一个参数都使用AF_INET,表示是在IPv4因特网域。也可以改变为其它的值,用于IPv6网络等。
第二个参数为套接字类型,TCP链接使用SOCK_STREAM,UDP链接使用SOCK_DGRAM,基本就这两个。如果想写一个类似于ping这样直接访问网络层的一个程序,那就要使用其他类型了。
和1不同,1设置不对你就别想正确建立链接,但是字节序问题跳过去,可能开始并不会造成太大的影响。所以字节序转换往往就被人忽略了。
字节序问题是由“大端系统”和“小端系统”这两者的差异造成的。网络通信时,我们并不知道对端系统采用什么样的存储方式,这个时候,就引入了一个网络字节序的概念。网络协议统一使用大端字节序,不管什么类型的主机,在通过协议栈发送和接收时就知道数据需不需要转换了。
另外,并不是所有数据都需要转换的。如果采用字节流(没有类似int,short这种多字节格式化数据类型)方式进行通信,无需字节序转换,因为数据都是有序的,不管在什么系统中顺序都是一致的。
对于字节序的转换关系,建议还是自己画图理解一下,光动脑子想不是太容易理解。
字节序转换函数不多,只有四个,并且很容易记忆,它们分别是:
htonl、htons、ntohl、ntohs
其中h表示“主机(host)字节序”,n表示“网络(network)字节序”,l表示“长(long)整数(4个字节)”,s表示“短(short)整数(2个字节)”,to表示“从谁向谁转换”……比Stevens的原著都详细,这样再无法记住,还真是没什么办法了。
有时也会涉及到更多字节的字节序转换,比如long long类型(8个字节),其实,用上述函数也是有办法能够完成的。
实际使用时,IPv4和IPv6使用的地址结构是不同的。IPv4使用struct sockaddr_in,而后者使用struct sockaddr_in。但不同网络(比如IPv4、IPv6)编程使用的socket接口函数都是一样的,这是怎么做到的呢?答案是接口函数都使用了统一的地址结构struct sockaddr。这些地址结构的具体定义可以使用man查看,可以发现,这些结构的框架是相同的,在正确地使用方法下地址结构间可以相互强制转换。它们都符合
struct sockaddr {
unsigned short sa_family; /* address family, AF_xxx */
char sa_data[14]; /* 14 bytes of protocol address */
};
这种形式。因此,不管是在哪个网域下调用socket函数,只要将有差异的地址结构使用struct sockaddr进行强制类型转换就能实现接口的统一了。
接着,针对具体的IPv4编程中地址的赋值详细说明一下。上面提到,IPv4使用的地址结构及其定义为
struct sockaddr_in {
short sin_family; /* Address family */
unsigned short sin_port; /* Port number */
struct in_addr sin_addr; /* Internet address */
unsigned char sin_zero[8]; /* Same size as struct sockaddr */
};
在linux下:
in_addr结构
typedef struct in_addr{
unsigned long s_addr;
};
上面说到协议栈都需要使用网络字节序,sin_family自然是等于AF_INET(协议栈提供的值,不需要考虑字节序了)。sin_port(端口)是双字节变量,需要使用htons转字节序。sin_addr.s_addr(网络地址),它不是使用192.168.1.2这种点分十进制形式,而是需要将点分十进制地址转换成网络字节序的一个整数。这时就需要对192.168.1.2这种地址进行转换,系统提供了inet_addr函数(只能用于IPv4地址转换)。sin_addr.s_addr赋值为inet_addr(192.168.1.2)。能转过去就一定能变回来,系统提供了inet_ntoa函数进行逆变换。inet_addr和inet_ntoa只能适用于IPv4地址转换,系统还提供了inet_ntop和inet_pton函数,后两个函数兼容IPv4和IPv6,使用起来更加方便。
掌握这些基础知识之后写起代码来就不一定再需要拿着参考书来看了,这也是为一个健壮、稳定的网络程序做了热身运动,这可是必不可少的。
本来想一篇就写完的,写到这发现内容还真没想得那么少,在下一章会讲述网络程序的一些细节问题,也都是必不可少的。