TCP/IP网络编程读书笔记

1.linux文件描述符

描述符从3开始以由小到大的顺序编号，0,1,2,分配给标准I/O用作标准输入、标准输出和标准错误。Windows下叫句柄

2.协议族与套接字类型（socket函数第一、二个参数）

#include 
int socket(int domain,int type,int type, int protocol);

domain常用： IPv4协议族 PF_INET；
type: SOCK_STREAM（面向连接，TCP）， SOCK_DRGAM（面向消息， UDP）
第三个参数：决定最终采用的协议，选用TCP时，第三个参数可以为0。

3.地址族与数据序列

IP地址分类.jpg

端口号：操作系统参考端口号把数据传输给相应端口的套接字。端口号范围0 _{65535，其中0}1023位知名端口。TCP套接字和UDP套接字可以重复使用同一端口号。

4.IPv4地址结构体

struct sockaddr_in
{
    sa_family_t     sin_family;     //
    uint16_t        sin_port;       //16位TCP/UDP端口号
    struct in_addr  sin_addr;       //32位IP地址
    char            sin_zero[8];    //不使用
}；

其中in_addr定义如下：

struct in_addr
{
    In_addr_t               s_addr;         //32位IPv4地址
}

sin_zero为了让sockaddr_in的大小与sockaddr结构体保持一致，便于传参的时候进行强制类型转换。
为什么不直接填写sockaddr而要填写sockaddr_in再强转是因为sockaddr定义中一个sa_data[14]表示地址信息，不好填入。bind函数里传的是(struct sockaddr*)
sockaddr_in是专为IPv4设计，但其仍然要传入地址族信息是由于sockaddr的要求，sockaddr中需要地址族信息（其不是为IPv4单独设计）。

5.网络字节序

大端序：先保存高位字节，再保存低位字节（高字节在低地址）；

内存号	0x20号	0x21号	0x22号	0x23号
存储内容	0x12	0x34	0x56	0x78

小端序：先保存低位字节，再保存高位字节（高字节在高地址）。

内存号	0x20号	0x21号	0x22号	0x23号
存储内容	0x78	0x56	0x34	0x12

CPU存储时多用小端序（Intel和AMD均是），网络字节序为大端序。
字节序转换函数：htons,htonl,ntohs,ntohl （h代表主机，n代表网络，l代表long，s代表short）。
注：除了向sockaddr_in结构体填充数据外，其余情况无需考虑字节序问题。

6.网络地址初始化与分配

字符串形式的IP地址与32位整数型数据的转换：

#include  
in_addr_t inet_addr(const char* s); 　　　　　　　　 //成功返回32位大端序整数，失败返回INADDR_NONE 
int inet_aton(const char* s, struct in_addr* add)   //成功返回1，失败返回0

二者功能相同，inet_addr需要将转换后的IP地址待遇sockaddr_in结构体声明的in_addr结构体变量中。
inet_aton则通过参数自动把结果填入该结构体遍历。

INADDR_ANY可以自动获取IP地址，而不必手动输入。

7.TCP服务器端函数（listen与等待连接请求；accpet与受理连接请求）

#include 
int listen(int sock, int backlog); //backlog表示连接请求等待队列的长度

客户端请求连接时，受理之前一直使请求处于等待状态。

#include 
int accept(int sock, struct sockaddr* addr, socklen_t* addrlen);

addr保存发起连接请求的客户端地址信息的变量地址值
accept函数受理连接请求队列中待处理的客户端连接请求
函数调用成功后，accept函数内部产生用于数据I/O的套接字，并返回其文件描述符，这个套接字创建时自动的，并自动与发起连接请求的客户端建立连接。

8.TCP客户端函数（connect与请求连接）

#include 
int connect(int sock, struct sockaddr* servaddr, socklen_t addrlen);

servaddr保存目标服务器端地址信息
connect在服务器端接收连接请求后返回，但注意这里的接收连接是服务器端把连接请求信息记录到等待队列，所以connect函数返回后并不立即进行数据交换（等待accept）

9.TCP的服务器端/客户端函数调用关系

TCP的服务器端客户端函数调用关系.png

注：客户端只能等到服务器调用listen之后才能调用connect。但是在客户端调用connect之前，服务端可能率先调用accept,这时服务端进入阻塞状态，只到客户端调用connect函数为止。

10.TCP套接字中的I/O缓冲

调用write函数，数据将移到输出缓冲，在适当的时候（不管是分别传送还是一次性传送）传向对方的输入缓冲
调用read函数从输入缓冲读取数据，特性如下：

I/O缓冲在每个TCP套接字中单独存在
I/O缓冲在创建套接字时自动生成
即使关闭套接字也会继续传递输出缓冲中遗留的数据
关闭套接字将丢失输入缓冲中的数据

11.TCP三次握手

在谢希仁著《计算机网络》第四版中讲“三次握手”的目的是“为了防止已失效的连接请求报文段突然又传送到了服务端，因而产生错误”。

在谢希仁著《计算机网络》第四版中讲“三次握手”的目的是“为了防止已失效的连接请求报文段突然又传送到了服务端，因而产生错误”。
三次握手实际上是对通信双方数据原点的序列号达成共识（TCP连接的一方A，由操作系统动态随机选取一个32位长的序列号（Initial Sequence Number）），所以是双向的通道连接确立。

如果仅两次连接可能出现一种情况：客户端发送完连接报文（第一次握手）后由于网络不好，延时很久后报文到达服务端，服务端接收到报文后向客户端发起连接（第二次握手）。此时客户端会认定此报文为失效报文，但在两次握手情况下服务端会认为已经建立起了连接，服务端会一直等待客户端发送数据，但因为客户端会认为服务端第二次握手的回复是对失效请求的回复，不会去处理。这就造成了服务端一直等待客户端数据的情况，浪费资源。

12.TCP数据交换过程

主机A：SEQ 1200 ， 100 byte data
主机B：ACK 1301
主机A：SEQ 1301 ， 100 byte data
主机B：ACK 1402

ACK = SEQ号 + 传递的字节数 + 1，相当于告诉对方，下次要传递的SEQ号

13.TCP的四次挥手

四次挥手.jpg

TCP连接是双向的，因此在四次挥手中，前两次挥手用于断开一个方向的连接，后两次挥手用于断开另一方向的连接。

第一次挥手
若A认为数据发送完成，则它需要向B发送连接释放请求。该请求只有报文头，头中携带的主要参数为：
FIN=1，seq=u。此时，A将进入FIN-WAIT-1状态。

PS1：FIN=1表示该报文段是一个连接释放请求。
PS2：seq=u，u-1是A向B发送的最后一个字节的序号。

第二次挥手
B收到连接释放请求后，会通知相应的应用程序，告诉它A向B这个方向的连接已经释放。此时B进入CLOSE-WAIT状态，并向A发送连接释放的应答，其报文头包含：
ACK=1，seq=v，ack=u+1。

PS1：ACK=1：除TCP连接请求报文段以外，TCP通信过程中所有数据报的ACK都为1，表示应答。
PS2：seq=v，v-1是B向A发送的最后一个字节的序号。
PS3：ack=u+1表示希望收到从第u+1个字节开始的报文段，并且已经成功接收了前u个字节。

A收到该应答，进入FIN-WAIT-2状态，等待B发送连接释放请求。

第二次挥手完成后，A到B方向的连接已经释放，B不会再接收数据，A也不会再发送数据。但B到A方向的连接仍然存在，B可以继续向A发送数据。

第三次挥手
当B向A发完所有数据后，向A发送连接释放请求，请求头：FIN=1，ACK=1，seq=w，ack=u+1。B便进入LAST-ACK状态。

第四次挥手
A收到释放请求后，向B发送确认应答，此时A进入TIME-WAIT状态。该状态会持续2MSL时间，若该时间段内没有B的重发请求的话，就进入CLOSED状态，撤销TCB。当B收到确认应答后，也便进入CLOSED状态，撤销TCB。

为什么A要先进入TIME-WAIT状态，等待2MSL时间后才进入CLOSED状态？
为了保证B能收到A的确认应答。
若A发完确认应答后直接进入CLOSED状态，那么如果该应答丢失，B等待超时后就会重新发送连接释放请求，但此时A已经关闭了，不会作出任何响应，因此B永远无法正常关闭。

之所以不是三次而是四次主要是因为被动关闭方将"对主动关闭报文的确认"和"关闭连接"两个操作分两次进行。因为客户端有可能还要向服务端发送数据呢。

14.TCP的半关闭

单方面断开可能带来的问题：
主机A调用close后，主机B传输给主机A的数据也无法接受
include
int shutdown(int sock, int howto);
howto取 SHUT_RD 断开输入流；SHUT_WR断开输出流； SHUT_RDWR同时断开I/O流
断开输出流时向对方主机传递EOF。close也会向对方发送EOF，但是无法再接收了

15.IP地址与域名的转换

IP地址比域名发生变更的频率高，利用IP域名编写程序是更好的选择，所以说，程序需要IP地址和域名之间的转换函数。
#include
struct hostent* gethostbyname(const char* hostname);// 成果返回hostent结构体地址，失败返回NULL指针
关于hostent结构体

struct hostent {
    char* h_name;         // official name
    char** h_aliases;     //alias list
    int h_addrtype;        //host address type
    int h_length;        //address length
    char** h_addr_list;    //address list
};

最重要的成员是 h_addr_list，可以通过此变量与整数形式保存域名对应的IP地址。用户较多的网站有可能分配多个IP给同一个域名。
h_addr_list指向字符串指针数组，字符串指针数组中的元素实际是in_addr结构体变量的地址值（声明为char而不是in_addr因为hostent不仅仅为IPv4准备）。

h_addr_list.png

16.套接字可选项

获取和更改套接字选项

#include 
int getsockopt(int sock, int level, int optname, const void* optval, socklen_t* optlen); 
int setsockopt(int sock, int level, int optname, const void* optval, socklen_t* optlen);

sock：用于查看选项套接字的文件描述符；
level:要查看的可选项的协议层。有SOL_SOCKET（套接字相关）， IPPROTO_IP（IP相关）， IPPROTO_TCP（TCP协议相关）
optname：要查看的可选项名；
optval: 保持查看结果的缓冲地址值；
optlen：optval的缓冲大小。getsockopt调用函数后，保存可选项信息的字节数。
举例：（通过SO_TYPE查看套接字类型）

int sock_type;
int tcp_sock = socket(PF_INET, SOCK_STREAM, 0);
int state = getsockopt(tcp_sock, SOL_SOCKET, SO_TYPE, (void*)&sock_type, &optlen);
if (state) {
    error_handling("getsocket() error");
} 
else {
    printf("SOCKET_STREAM: %d \n", sock_type);
}

SO_SNDBUF & SO_RCVBUF

SO_SNDBUF 是输入缓冲大小相关可选项；SO_REVBUF是输出缓冲大小相关可选项。
用这两个可选项既可以读取当前I/O缓冲大小，也可以进行修改。（注：修改时不会完全按照请求更改大小）

SO_REUSEADDR 和 Time_wait

在TCP断开连接四次挥手过程中，先断开连接（先发送FIN消息的）主机需要经过Time_wait状态，因此若服务器端先断开连接，则无法立即重新运行，套接字处在Time_wait过程时，相应端口是正在使用的状态，因此，bind函数调用过程会发生错误。

客户端套接字也会经过Time_wait过程，先断开连接的套接字必然经过Time_wait，但是由于客户端套接字的端口号是任意指定的，所以无需考虑。

SO_REUSEADDR可以将Time_wait状态下的套接字端口号重新分配给新的套接字：

int optlen = sizeof(option);
int option = 1; 
setcsockopt(serv_sock, SOL_SOCKET, SO_REUSEADDR, (void*)&option, optlen);

Nagle算法与TCP_NODELAY

Nagle算法会最大限度进行缓冲，直到收到ACK，从而保证网络中任意时刻，最多只能有一个未被确认的小段。所谓“小段”，指的是小于MSS尺寸的数据块，所谓“未被确认”，是指一个数据块发送出去后，没有收到对方发送的ACK确认该数据已收到。
否则都是小包的话，即使只传输一个字节的数据，其头信息几十个字节，效率低。

“传输大文件数据”，可以考虑金庸Nagle算法，无需等待ACK的前提下连输传输。

禁用方法：将套接字可选项TCP_NODELAY改为1（真）即可

int opt_val = 1;
setsockopt(sock, IPPROTO_TCP, TCP_NODELAY, (void *)&opt_val, sizeof(opt_val));

17.僵尸进程

产生原因：fork函数产生子进程，终止方式有exit或者return，都会传递给操作系统，而操作系统不会销毁子进程，需要父进程主动发起请求，操作系统才会传递返回值，也就是说父进程要负责回收子进程。

销毁僵尸进程：

wait：成功时返回终止的子进程ID，但是父进程会阻塞直到有子进程终止
waitpid:

    pid_t waitpid(pit_t pid, int * statloc, int options);
    options传递 WHOHANG，即使没有终止的子进程也不会进入阻塞状态，而是返回0并退出函数，所以一般需要while循环来检测

18.信号处理

父进程不能只调用waitpid函数以等待子进程终止，解决方案：信号！
#include
void (signal(int signo, void (func)(int)))(int);
函数名：signal
参数：int signo, void (*func)(int)
返回类型：参数为int，返回void型的函数指针

当发生第一个参数中的信号类型时，调用第二个参数所指的函数，也就是信号处理函数

19.fork会复制套接字吗？

调用fork函数时复制父进程的所有资源，但是套接字是属于操作系统的，进程只是拥有代表相应套接字的文件描述符
所以调用fork后，2个文件描述符指向同一套接字

借此可以实现分割TCP I/O程序

20.进程间通信

管道也是属于操作系统的，用来提供给两个进程进行通信。

#include 
int pipe(int filedes[2]);
// filedes[0] 通过管道接收数据时使用的文件描述符，即管道出口
// filedes[1] 通过管道发送数据时使用的文件描述符，即管道入口

通过一个管道可以进行双向通信，但是会产生问题！！
数据进入管道后成为无主数据，通过read先读取数据的进程将得到数据，所以有可能读自己发出的数据
解决办法：创建两个管道负责不同的流

21.I/O复用

比如read和write，通常IO操作都是阻塞I/O的，也就是说当你调用read时，如果没有数据收到，那么线程或者进程就会被挂起，直到收到数据。

select，poll，epoll都是IO多路复用的机制。I/O多路复用(又被称为“事件驱动”)就通过一种机制，可以监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程序进行相应的读写操作。但select，poll，epoll本质上都是同步I/O，因为他们都需要在读写事件就绪后自己负责进行读写，也就是说这个读写过程是阻塞的。

简单版：提供服务的进程只有一个！

select函数

int select( int maxfd, fd_set* readset, fd_set* writeset, fd_set* exceptset, const struct timeval * timeout);
//maxfd 监视对象文件描述符数量
//readset 监视“是否存在待读取数据”
//writeset 监视“是否可传输无阻塞数据”
//exceptset 监视“是否发生异常”
//timeout，调用select函数后，防止陷入无限阻塞状态，传递超时信息
//返回值：错误返回-1，超时返回0，因发生关注的事件返回时，返回文件描述符数

调用select函数后，第二到第四个参数传递的fd_set变量将发生变化，原来为1的所有位均变为0但发生变化的文件描述符对应位除外，因此，可以认为值仍为1的位置上的文件描述符发生了变化

几大缺点：

每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大，向操作系统传递监视对象信息开销大
每次调用select都需要在内核遍历传递进来的所有fd
select支持的文件描述符数量太少，默认1024

22.多种I/O函数

linux中的send&recv

#include 
ssize_t send(int sockfd, const void* buf, size_t nbytes, int flags);
//成功返回发送的字节数，失败-1，
ssize_t recv(int sockfd, const void* buf, size_t nbytes, int flags);
//flags 指定的可选项信息

MSG_OOB可选项：用于传输带外数据，比如紧急消息，并不会加快数据传输速度，而是通过单独的通信路径高速传输数据，利用TCP的紧急模式进行传输

readv & writev 函数

对数据进行整合传输及发送的函数，减少I/O函数的调用次数

23.多播与广播

多播是基于UDP的，加入特定组即可接收发往该多播组的数据，多播组地址是D类IP地址，前四位1110，224开头
多播需要借助路由器完成

广播也是一次性向多个主机发送数据，但是只能向同一网络中的主机传输数据
直接广播：192.12.34
本地广播：255.255.255.255

24.套接字与标准I/O

标准I/O函数具有良好的移植性，可以利用缓冲提高性能
fopen feof fgetc fputs
创建套接字返回文件描述符，为了使用标准I/O函数，需要将其转换为FILE结构体指针

#include
FILE * fdopen(int fildes, const char *mode);    
//fildes 需要转换的文件描述符    mode ： "r" "w"
int fileno(FILE* stream);
//成功时返回转换后的文件描述符

文件描述符的复制和半关闭

可以通过两个FILE指针（读和写）来实现流分离

FILE指针的关系.jpg

但是上图中针对任一FILE指针调用fclose函数都会关闭文件描述符，也就终止套接字
所以应该也复制文件描述符，如下图

半关闭模型1.jpg

但是还应调用shutdown函数发送EOF并进入半关闭状态，然后fclose对应的FILE指针

复制文件描述符：

include

int dup(nit fildes);
int dup2(int fildes, int fildes2);
//filedes2明确指定的文件描述符整数值

25.优于select的epoll

epoll的优点：

无需编写以监视状态变化为目的的针对所有文件描述符的循环语句
调用对应于select函数的epoll_wait函数时无需每次传递监视对象信息

epoll_create：创建保存epoll文件描述符的空间
epoll_ctl：注册监视对象文件描述符

#include 
int epoll_ctl(int epfd, int op, int fd, struct epol_event * event);
//成功时返回0，失败返回-1
//op用于指定监视对象的添加、删除或更改等操作
//fd 需要注册的监视对象文件描述符
//event 监视对象的事件类型

epoll_wait：最后调用，返回发生事件的文件描述符数，同时在第二个参数指向的缓冲中保存发生事件的文件描述符集合

#include 

int epoll_wait(int epfd, struct epoll_event* events, int maxevents, int timeout);
//events 保存发生事件的文件描述符集合的结构体地址
//maxevents 第二个参数中可以保存的最大时间数量
//等待时间

条件触发和边缘触发

条件触发方式中，只要输入缓冲有数据就会一直通知该事件，只要剩余缓冲中还有数据，就将以事件方式再次注册
边缘触发中，输入缓冲收到数据时仅注册一次该事件

select是以条件触发方式工作的，epoll默认也是条件触发

如果实现边缘触发，那么就不知道输入缓冲是否读完，需要通过errno变量验证错误原因
以阻塞方式工作的read&write函数有可能引起服务器端的长时间停顿，因此需要采用非阻塞read&write

潜台词：read&write默认是阻塞方式工作的

将套接字改为非阻塞方式：
int flag = fcntl(fd, F_GETFL, 0);
fcntl(fd, F_SETFL, flag|O_NONBLOCK);
综上，read函数返回-1，变量errno中的值为EAGAIN时，说明没有数据可读

孰优孰劣？
边缘触发可以分离接收数据和处理数据的时间点，条件触发如果延迟处理数据，则会累积事件

26.线程

多进程模型缺点：

创建开销
进程间通信开销
上下文切换开销

线程为了保持多条代码执行流隔开了栈区域，共享数据区和堆

线程的创建和执行流程：

#include

int pthread_create(pthread_t* restrict thread, const pthread_attr_t* resctrict attr, void*(*start_routine)(void*), void* restrict arg);
//thread    保存新创建线程ID的变量地址值
//attr      传递线程属性的参数
//start_routine 相当于线程main函数，在单独执行流中执行的函数地址值（函数指针）
//arg       通过第三个参数传递调用函数时包含传递参数信息的变量地址值

注意：主函数返回后整个进程将被销毁，可以通过sleep函数向线程提供充足的执行时间，但这会干扰正常执行流

#include 
int pthread_join(pthread_t thread, void ** status);    
//thread 该参数值ID的线程终止后才会从该函数返回
//status 保存线程的main函数返回值的指针变量地址值

简而言之，调用该函数的进程或线程进入等待状态，直到特定线程终止，而且可以得到返回值

临界区

多个线程访问同一变量，由于不是原子操作，会导致同步问题
临界区即为访问变量的代码语句

互斥量

用来实现线程同步，保护临界区

#include

int pthread_mutex_init(pthread_mutex_t* mutex, const pthread_mutexattr_t* attr);
int pthread_mutex_destroy(pthread_mutex_t * mutex);
//成功返回0，失败返回其他
//mutex 创建互斥量时传递保存互斥量的变量地址
//attr  即将创建的互斥量属性

int pthread_mutex_lock(pthread_mutex_t* mutex);
int pthread_mutex_unlock(pthread_mutex_t* mutex);

信号量

信号量两个操作，P+1，V-1

#include 

int sem_post(sem_t* sem);
int sem_wait(sem_t* sem);
//post信号量增1，wait信号量减一

当信号量为0时，调用sem_wait函数，调用函数的线程将进入阻塞状态，此时如果其他线程调用sem_post，信号量的值变为1，而原本阻塞的线程可以将该信号量重新减为0并跳出阻塞状态

一般使用两个信号量，可以使得线程交替按序运行

销毁线程

pthread_join：等待线程终止，销毁线程，但是线程终止前，调用该函数的进程将会进入阻塞状态
pthread_detach：不会引起线程终止或进入阻塞状态

TCP/IP网络编程 读书笔记