一、Linux网络模型
Linux中网络栈的介绍一般分为四层的Internet模型:
TCP/IP协议族体系结构及主要协议:
1、TCP/IP协议族
TCP/IP实际上是一个协同工作的通信家族,为网络通信提供通路。为方便讨论TCP/IP协议族,大体上分为三部分:
Internet协议(IP)。
传输控制协议(TCP)和用户数据报协议(UDP)。
处于TCP和UDP之上的一组应用协议。它们包括:Telnet,文件传送协议(FTP),域名服务协议(DNS)和简单的邮件传送程序(SMTP)等。
2、数据链路层
数据链路层实现了网卡接口的网络驱动程序,以处理数据在网络媒介上(比如以太网)上的传输。不同的物理网络层具有不同的电器特性,网络驱动程序隐藏了这些细节,为上层协议提供了统一的接口。
3、网络层
网络层实现数据包的选路和转发。WAN通常使用众多分级的路由器来连接分散的主机或LAN,因此,通信的两台主机一般不是直接连接的,而是通过多个中间节点连接的。网络层的任务就是选择这些节点,以确定两台主机间的通信路径。同时,网络层对上层协议隐藏了网络拓扑连接的细节,使得在传输层和网络应用程序看来,通信的双方是直接相连的。
4、传输层
传输层为两台主机上的应用程序提供端到端(end to end)的通信。与网络层使用的逐跳的通信方式不同,传输层只关心通信的起始端和目的端,而不关心数据包的中转过程。
5、应用层
应用层负责处理应用程序的逻辑。
应用层协议很多:ping:应用程序,不是协议,调试网络环境;
telnet:远程登录协议。
DNS:机器域名到ip的转换。
HTTP:超文本传输协议,是一种详细规定了浏览器和万维网服务器之间互相通信的规则,通过因特网传送文档 的数据传送协议。
DHCP:动态主机配置协议。
6、数据封装
应用层程序在发送到物理网络之前,将沿着协议栈从上往下依次传递。每层协议都将在上层协议的基础上加上自己的头部信息(有时还包括尾部信息),以实现该层的功能,这个过程称为封装。
7、IP协议:
IP的主要目的是为数据输入/输出网络提供基本算法,为高层协议提供无连接的传送服务。这意味着在IP将数据交给接收站以前不在传输站点和接收站点之间建立对话。它只是封装和传递数据,但不向发送者或接收者报告包的状态,不处理所遇到的故障。
IP包由IP协议头与协议数据两部分构成。
8、TCP协议
TCP协议(传输控制协议)为应用层提供可靠的、面向连接的、基于流(stream)的服务。TCP协议使用超时重传、数据确认等方式来确保数据包被正确发送到目的地,因此TCP服务是可靠的。使用TCP协议通信的双方必须先建立TCP连接,并且在内核中为该连接的双方必须先建立TCP连接,并且在内核中为该连接维持一些必须的数据结构。当通信结束时,双方必须关闭连接以释放这些内核数据。
(1)TCP协议头部结构
(2)TCP三次握手
所谓三次握手(Three—way Handshake),是指建立一个TCP连接时,需要客户端和服务器总共发送三个包。
这个东西还是挺有搞头的,把这一大块整理完后,再把三次握手具体过程理一理。
(3)TCP四次挥手
TCP连接的删除需要发送四个包,因此称为四次挥手(four—way handshake)。客户端或服务器均可主动发起挥手动作,在socket编程中,任何一方执行close()操作即可产生挥手操作。
9、UDP协议
UDP协议(用户数据报协议),它与应用层TCP协议完全相反。提供不可靠、无连接和基于数据报的服务。不可靠意味着UDP协议无法保证数据从发送端正确的发送到接收端。如果数据在中途丢失,或者目的端通过数据校验发现数据错误而将其丢弃,则UDP协议的应用程序通常要自己处理数据确认、超时重传等逻辑性。
二、Linux网络编程基础
1、网络套接字socket
Linux中的网络编程通过Socket(套接字)实现,Socket是一种文件描述符。
(1)socket的三种类型
流式套接字(SOCK_STREAM):流式套接字可以提供可靠的、面向连接的通讯流,它使用TCP协议。TCP保证了数据传输的正确性和顺序性。
数据报套接字(SOCK_DGRAM):数据报套接字定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证可靠,无差错,它使用数据报协议UDP
原始套接字(SOCK_RAW):原始套接字允许使用IP协议,主要用于新的网络协议的测试等。 一般用于网络测试。
2、地址结构
在socket程序设计宏,struct sockaddr用于保存socket地址信息:
struct sockaddr
{
unsigned short sa_family; /*地址族*/
char sa_data[14]; /*14字节的协议地址,包含该socket的IP地址和端口号*/
}
sa_family:协议族,采用“AF_XXX”的形式,如AF_INET(IPV4协议)
sa_data:14字节的特定协议地址。
在socket程序设计中,struct sockaddr_in 同样用于保存socket地址信息:
struct sockaddr_in
{
short int sin_family; /*Internet地址族*/
unsigned short int sin_port; /*端口号*/
struct in_addr sin_addr; /*IP地址*/
unsinged char sin_zero[8]; /*填0以保持和strruct sockaddr同样大小*/
};
IP地址结构:
struct in_addr //网络IP的类型
{
unsigned long s_addr; /*32位的地址*/
}
在实际编程中,一般不针对sockaddr数据结构进行操作,而是使用与sockaddr_in数据结构。
3、字节序转换
(1)字节序概念
不同类型的CPU对变量的字节存储顺序可能不同;有的系统是高位在前,低位在后,而有的系统是低位在前,高位在后。在网络的数据顺序一定是要统一的。所以当内部字节存储顺序和网络字节顺序不同时,就一定要进行转换。
如32bit的整数(0x01234567)从地址0x100开始:
V小端字节序:(高位放在低地址)
V大端字节序:(高位放在高地址)
(2)网络字节序:
网络字节序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型,操作系统等无关。从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。
(3)字节序转换函数:
#include
uint16_t htons(unit16_t host16bit); //把unsigned int 类型从主机序到网络序
uint32_t htonl(unit32_t host32bit); //把unsigned long 类型从主机序到网络序
uint16_t ntohs(unit16_t net16bit); //把unsigned short 类型从网络序到主机序
unit32_t ntohl(unit32_t net32bit); //把unsigned long 类型从网络序到主机序
h--host n--network s--short l--long 通常16位的IP端口号用s代表。而IP地址用I代表。
4、IP与主机名
在网络上标识一台机器可以用IP,也可以使用主机名。
#include
struct hostent * getnostbyname(const char * hostname); // 实现主机名到IP地址的转换
函数返回值:
struct hostent
{
char * h_name; //主机的正式名
char **h_aliases; //主机的别名组
int h_addrtype; //主机的地址类型
int h_length; //主机的地址列表长度
char **h_addr_list; //主机的IP地址列表(32位网络地址)
}
#define h_addr h_addr_list[0] //主机的首个IP地址
5、IP地址转换
IP地址通常由数字加点的形式表示,而struct in_addr中使用的IP地址是32位整数表示的,为了转换可以使用如下两个函数。
#include
int iner_aton(const char * cp, struct in_addr *inp); //将a.b.c.d形式的IP转换为32位的IP
char * inet_ntoa(struct in_addr in); //将32位的IP转化为a.b.c.d的形式
三、socket网络编程
1、socket核心函数
(1)socket
#include
#include
int socket(int domain, int type, int protocol);
sockt函数对应于文件的打开操作(Linux一切皆文件),函数用于创建一个socket描述符。把它作为参数可以进行读,写等操作。
参数含义:sdomain:协议域,又称协议族。常用协议:AF_INET(IPV4协议)、AD_INET6(IPV6协议)、AF_LOCAL、 AF_ROUTE等。
type:指定socket的类型。上文有介绍,常用的有三种,SOCK_STREAM,SOCK_DGRAM。
prorocol:指定协议。当protocol为0时,会自动选择type类型对应的默认协议。
上面的type和protocol不可以随意组合的,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当我们调用socket创建一个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址。如果想要给它赋值一个地址,就必须调用bind()函数,否则就当调用connect()、listen()时系统会自动随机分配一个端口。
(2)bind
bind()函数将一个地址族中的特定地址赋给socket。
#include
#include
int bind(int sockfd, const struct sockaddr * addr, socklen_t addrlen);
sockfd: socket描述字,通过socket()函数创建,唯一标识一个socket。bind()函数就是给这个描述字绑定一个名字。
addr:这个结构体指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket的地址协议族的不同而不同,IPV4对应的IP地址是sockaddr_in上文有具体说明这个结构体。
为什么服务器需要绑定,而客户端不需要?
通常服务器在启动时需要绑定一个地址(地址加端口号)用于提供服务,客户端可以通过这个地址对服务器进行连接。而客户端则不需要,由系统自动分配端口号和自身IP地址组合即可。所以服务器在监听前需要进行绑定,而客户端不需要,在connect()时会由系统自动生成。
为什么有时候会出现bind()出错的情况,如何解决?
当clinet终止时自动关闭socket描述符,server的TCP连接收到的client发的FIN段后处于TIME_WAIT状态。TCP协议规定,主动关闭连接的一方要处于TIME_WAIT状态,等待两个MSL(maximum segment lifetime)的时间才能回到CLOSE的状态,当ctrl-C结束server时,server是主动关闭的一方,TIME_WAIT期间不能再次监听同样的server端口。
在server的TCP连接没有完全断开之前不允许重新监听是不合理的,因为,TCP连接没有完全断开指的是fd(127.0.0.1:8000)没有完全断开,而我们重新监听的是sockfd(0.0.0.0:8000),虽然是占用同一个端口,但IP地址不同,fd对应的是不某个客户端通讯的一个具体的IP地址,而sockfd对应的是wildcard address。解决这个问题的方法是使用setsockopt()设置socket描述符的选项SO_REUSEADDR为1,表示允许创建端口号相同但IP地址不同的多个socket描述符。
在socket和bind之间插入如下代码。
int opt = 1;
setsockopt(sockfd,SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));
(3)listen和connect
服务器在调用socket()、bind()之后调用listen()来监听这个socket,如果客户端这时调用connect发出连接,服务器将会收到这个请求。
#include
#include
int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr * addr, socklen_t addrlen);
listen的第一次参数为监听的socket描述字,第二个参数为相应socket可以排队的最大连接个数。socket函数创建的socket默认是一个主动类型的,listen函数将socket变为被动类型,等待客户的连接请求。
connect函数的第一个参数即为客户端的socket描述字,第二参数为服务器的socket地址,第三个参数为socket地址的长度。客户端通过调用connect函数与TCP服务器建立连接。
(4)accept
服务器监听到客户端通过connect发出的连接请求后,就将调用accept()函数来接受这个请求,这样连接就建立好了。之后就可以进行网络I/O操作,类同于普通文件的读写I/O操作。
#include
#include
int accept(int sockfd, struct sockaddr * addr, socklen_t *addrlen);
函数参数结构与connect,第一个参数是服务器socket()产生的sockfd,称为监听套接字,用于监听新的连接。第二个参数用于返回客户端的IP地址信息。
返回值是一个全新的文件描述符,这个文件描述符用于新建立的该连接的信息传输。
(5)read()/write()
至此,服务器与客户端已建立起连接。可以使用网络I/O进行读写操作,实现网络中不同进程之间的通信。
#include
ssize_t read(int sockfd, void *buf, size_t count);
ssize_t write(int sockfd, const void *buf, size_t count);
read用于从sockfd中读取内容,读成功时,read返回实际所读字节数, 小于0表示出错。
write函数将buf中的count自己内容写入sockfd中。失败返回-1。
(6)sendto()/recvfrom()
这两个函数用于基于无连接的网络传输协议,每次进行信息传输,需要注明接收方或者发送方的IP地址信息。
ssize_t sendto(int sockfd, const vod *buf, size_t len, int flags, const struct sockaddr * dest_addr, socklen_t addrlen);
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr * src_addr, socklen_t * addrlen);
(7)close()
在完成了读写操作后,关闭相应的socket描述符,与文件操作的fclose()类似。
#include
int close(int fd);
注意:close操作只是使相应socket描述字的引用计数-1,只有当引用计数为0的时候,才会触发TCP客户端向服务器发送终止连接请求。
2、基于TCP的网络编程
(1)基于TCP—服务器
(a)创建一个socket,用函数socket()
(b)绑定IP地址、端口等信息到socket上,用函数bind()
(c)监听套接字,设置允许的最大连接数,用函数listen()
(d)接收客户端发来的连接请求,用函数accept()
(e)收发数据,用函数send()和recv(),或者read()和write()
(f)关闭网络连接
(2)基于TCP—客户端
(a)创建一个socket,用函数socket()
(b)设置要连接的对方IP地址和端口等属性。
(c)连接服务器,用函数connect()
(e)收发数据,用函数send()和recv(),或者read()和write()
(f)关闭网络连接
3、基于UDP的网络编程
(1)基于UDP—服务器
(a)创建一个socket,用函数socket()
(b)绑定IP地址,端口等信息到socket上,用函数bind()
(c)循环接收数据,用函数recvfrom()
(d)关闭网络连接
(2)基于UDP—客户端
(a)创建一个socket,用函数socket()
(b)绑定IP地址,端口等信息到socket上,用函数bind()
(c)设置连接方的IP地址和端口等信息
(d)发送数据,用函数sendto()
(e)关闭网络连接
4、服务器模型
在网络程序里,一般来说都是许多客户对应一个服务器,为了处理客户的请求,对服务端的程序就提出特殊的要求。目前最常用的服务器模型有:
循环服务器:服务器在同一个时刻只可以相应一个客户端的请求。
并发服务器:服务器在同一个时刻可以相应多个客户端的请求。
(1)UDP循环服务器
UDP循环服务器实现的方法:UDP服务器每次从套接字上读取一个客户端的请求->处理->将结果返回给客户端
socket(....);
bind(...);
while(1)
{
recvfrom(...);
process(....);
sendo(....);
}
因为UDP是非面向连接的,没有一个客户端可以总是占用服务器,所有服务器对每一个客户的要求总能满足。
(2)TCP并发服务器
并发服务器的思想是每一个客户机的请求并不由服务器直接处理,而是由服务器创建一个子进程(线程)来处理。算法如下:
socket(.....);
bind(.....);
listen(.....);
while(1)
{
accept(....);
if(fork(...) == 0) {
process(.....);
exit();
}
close(.....);
}
缺点:创建子进程处理客户端请求对资源内存消耗很大。
5、多路复用I/O
阻塞函数在完成其他指定的任务以前不允许程序继续向下执行。例如:当服务器运行到accept语句时,而没有客户请求连接,服务器就会停在accept语句上等待连接请求的到来。这种情况称为阻塞。例如,如果你希望服务器仅仅检查是否有客户在等待连接,有就接受连接,否则就继续做其他事情,则可以通过select系统调用来实现。除此之外,select还可以同时监视多个套接字。
SELECT:
int select(int maxfd, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, const struct timeval * timeout);
参数:
Maxfd :文件描述符的范围,比待检的最大描述符大一即可。
Readfds:被读监控的文件描述集
Writefds:被写监控的文件描述符集
Exceptfds:被异常监控的文件描述符集
Timeout:定时器,0:非阻塞 , NULL:阻塞, 正整数:等待的最大时间,即函数在timeout时间是阻塞的、
返回值:
正常情况返回满足要求的文件描述符个数;
经过了timeout等待时间仍无文件满足,返回值为0;
如果select 被某个信号中断,它将返回-1并设置error为EINTR;
出错,返回-1并设置相应的error。
使用步骤:
(1)设置要监控的文件
(2)调用select开始监控
(3)判断文件是否发送变化
系统提供了4个宏对描述符集进行操作:
#include
void FD_SET(int fd, fd_set *fdset) //将文件描述符fd添加到文件描述符集fdset中
void FD_CLR(int fd, fd_set *fdset) //从文件描述符集fdset中清除文件描述符fd
void FD_ZERO(fd_set *fdset) //清空文件描述符集fdset
void FD_ISSET(int fd, fd_set *fdset) //在调用select后使用FD_ISSET来检测文件描述符集fdset中的文件fd发生了变化