Linux学习之路-http通信原理


http通信原理


 

应用通讯的基本模型分析

基本通讯流程:


        客户端http应用使用本机IP+随机注册生成的TCP端口,形成套接字socket,调用系统socket api 再经过网络层、数据链路层、物理层层层封装,把数据送达请求的服务器,经过层层解封,送达对应的http服务监听的套接字socket监听的相应的端口上。

 

期间涉及到的N种技术:


(1)TCP和UDP协议

    TCP特点:

        a.面向连接:收发数居前必须和对方建立可靠连接,一个连接必须经过3次握手

        简单过程

        主机A向主机B发出连接请求数据包:“我想给你发数据,可以吗?”,这是第一次对话;主机B向主机A发送同意连接和要求同步(同步就是两台主机一个在发送,一个在接收,协调工作)的数据包:“可以,你什么时候发?”,这是第二次对话;主机A再发出一个数据包确认主机B的要求同步:“我现在就发,你接着吧!”,这是第三次对话。三次“对话”的目的是使数据包的发送和接收同步,经过三次“对话”之后,主机A才向主机B正式发送数据。            

        详细过程:

        TCP三次握手过程

            a主机A通过向主机B 发送一个含有同步序列号的标志位的数据段给主机B ,向主机B 请求建立连接,通过这个数据段,主机A告诉主机B 两件事:我想要和你通信;你可以用哪个序列号作为起始数据段来回应我.

            b主机B 收到主机A的请求后,用一个带有确认应答(ACK)和同步序列号(SYN)标志位的数据段响应主机A,也告诉主机A两件事:我已经收到你的请求了,你可以传输数据了;你要用哪佧序列号作为起始数据段来回应我

            c主机A收到这个数据段后,再发送一个确认应答,确认已收到主机B 的数据段:"我已收到回复,我现在要开始传输实际数据了

        这样3次握手就完成了,主机A和主机B 就可以传输数据了.

       

        3次握手的特点:

            没有应用层的数据

            SYN这个标志位只有在TCP建产连接时才会被置1

            握手完成后SYN标志位被置0

 

        TCP建立连接要进行3次握手,而断开连接要进行4次

            a当主机A完成数据传输后,将控制位FIN1,提出停止TCP连接的请求

            b 主机B收到FIN后对其作出响应,确认这一方向上的TCP连接将关闭,ACK1

            c B 端再提出反方向的关闭请求,FIN1

            d 主机A对主机B的请求进行确认,ACK1,双方向的关闭结束.

       

        TCP的三次握手和四次断开可以看出,TCP使用面向连接的通信方式,大大提高了数据通信的可靠性,使发送数据端和接收端在数据正式传输前就有了交互,为数据正式传输打下了可靠的基础

         b.流量控制、滑动窗口

    UDP特点:无连接、尽力传输、面向报文

 

        两者区别:

                1.基于连接与无连接

                2.对系统资源的要求(TCP较多,UDP少)

                3.UDP程序结构较简单

                4.流模式与数据报模式

                5.TCP保证数据正确性,UDP可能丢包,TCP保证数据顺序,UDP不保证。

 

        TCP,UDP端口号的分配:

                0-1023 系统固定使用

                1024-49151 系统使用,一般也可以申请使用

                41952-65535 用户使用

(2)套接字socket


        用途:同一主机或不同主机间,进程间通讯的一种实现,即IPC的一种实现

        类型有3种:TCP套接字、UDP套接字、RAW套接字

(3)html语言

    HTML是网络的通用语言,一种简单、通用的全置标记语言。

            其中包含:

                    CSS样式表、javascript

                    MIME:多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开

      

(4)http:超文本传输协议

    HTTPHyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议.默认端口为80

            协议版本:

                    HTTP/0.9:原型版本,功能简陋

                    HTTP/1.0:第一个广泛使用的版本,支持MIME

                    HTTP/1.1: 增强了缓存功能

                    HTTP/2.0

(5)URI:统一资源标识符Uniform Resource Identifier)是一个用于标识某一互联网资源名称的字符串

                        URL:URLURI命名机制的一个子集

    实例:一个网站访问的完整http请求、请求处理过程

   

        客户端请求:

            http应用注册一个随机端口,加上本机IP,调用socket api 向服务器发出请求

        服务器请求处理:

            (1) 建立或处理连接(tcp连接):接收请求或拒绝请求

            (2) 接收请求(请求报文中对某资源的一次请求的过程,服务器httpd服务对于请求的处理模式,根据实际设定来使用)

                并发访问响应模型(Web I/O):

                (*) 单进程I/O结构:启动一个进程处理用户请求,而且一次只处理一个;多个请求被串行响应;

                (*) 多进程I/O结构:并行启动多个进程,每个进程响应一个请求;

                (*) 复用I/O结构:一个进程响应n个请求;

                    -多线程模型:一个进程生成N个线程,每个线程响应一个用户请求;

                    -事件驱动:event-driven,一个进程直接相应多个请求

                (*) 复用的多进程I/O结构:启动多个(m)进程,每个进程响应n个请求;

                    也就是event生成多个进程,让这些进程每一个直接相应多个请求

            (3) 处理请求,对请求报文进行解析,获取请求的资源及请求的方法等信息(分析报文首部信息)

                报文首部简介:

                <method> <URL> <VERSION> 起始行,方法,url,版本

                Host: www.magedu.com   请求的主机名称

                ...

            (4) 访问资源,获取请求报文中请求的资源

                根据报文的信息,和web服务器资源路径映射方式:

                (a) docroot

                (b) alias

                (c) 虚拟主机docroot

                (d) 用户家目录docroot

                例如请求的是一个网页的图片,就根据实际路径进行系统调用读取图片

            (5) 构建响应报文

                资源准备好后,根据资源设定MIME类型,有几种设定方法:

                1.显式分类:

                2.魔法分类:自动测试该资源和设定

                3.协商分类:和客户协商决定

 

                如果客户端需要的资源不在本机,可做URL重定向:

                web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径;

 
            (6) 发送响应报文

            (7) 记录日志

    至此,一个基本的通信流程,会涉及到的技术有:TCPUDP、套接字sockethtml语言、http协议、http服务响应模型、http报文、URL

你可能感兴趣的:(linux,http,tcp,UDP)