应用通讯的基本模型分析

基本通讯流程:

  • 客户端http应用使用本机IP+随机注册生成的TCP端口,形成套接字socket,调用系统socket api 再经过网络层、数据链路层、物理层层层封装,把数据送达请求的服务器,经过层层解封,送达对应的http服务监听的套接字socket监听的相应的端口上。


期间涉及到的N种技术:

(1)TCP和UDP协议

  TCP特点:

  A.面向连接:收发数居前必须和对方建立可靠连接,一个连接必须经过3次握手

   简单过程:

   主机A向主机B发出连接请求数据包:“我想给你发数据,可以吗?”,这是第一次对话;主机B向主机A发送同意连接和要求同步(同步就是两台主机一个在发送,一个在接收,协调工作)的数据包:“可以,你什么时候发?”,这是第二次对话;主机A再发出一个数据包确认主机B的要求同步:“我现在就发,你接着吧!”,这是第三次对话。三次“对话”的目的是使数据包的发送和接收同步,经过三次“对话”之后,主机A才向主机B正式发送数据。            

   详细过程:

     TCP三次握手过程

      (a) 主机A通过向主机B 发送一个含有同步序列号的标志位的数据段给主机B ,向主机B 请求建立连接,通过这个数据段,主机A告
         诉主机B 两件事:我想要和你通信;你可以用哪个序列号作为起始数据段来回应我.

      (b) 主机B 收到主机A的请求后,用一个带有确认应答(ACK)和同步序列号(SYN)标志位的数据段响应主机A,也告诉主机A两件事:我
         已经收到你的请求了,你可以传输数据了;你要用哪个序列号作为起始数据段来回应我

      (c) 主机A收到这个数据段后,再发送一个确认应答,确认已收到主机B 的数据段:"我已收到回复,我现在要开始传输实际数据了

        这样3次握手就完成了,主机A和主机B 就可以传输数据了.

    http通信原理_第1张图片   

    http通信原理_第2张图片

      3次握手的特点:

       没有应用层的数据

         SYN这个标志位只有在TCP建产连接时才会被置1

       握手完成后SYN标志位被置0

     TCP建立连接要进行3次握手,而断开连接要进行4次

         (a) 当主机A完成数据传输后,将控制位FIN置1,提出停止TCP连接的请求

         (b) 主机B收到FIN后对其作出响应,确认这一方向上的TCP连接将关闭,将ACK置1

         (c) 由B 端再提出反方向的关闭请求,将FIN置1

         (d) 主机A对主机B的请求进行确认,将ACK置1,双方向的关闭结束.

        由TCP的三次握手和四次断开可以看出,TCP使用面向连接的通信方式,大大提高了数据通信的可靠性,使发送数据端和接收
           端在数据正式传输前就有了交互,为数据正式传输打下了可靠的基础

      http通信原理_第3张图片

  B.流量控制、滑动窗口

 UDP特点

   无连接、尽力传输、面向报文

   两者区别:

      1.基于连接与无连接

      2.对系统资源的要求(TCP较多,UDP少)

      3.UDP程序结构较简单

      4.流模式与数据报模式

      5.TCP保证数据正确性,UDP可能丢包,TCP保证数据顺序,UDP不保证。

  TCP,UDP端口号的分配:

    0-1023 系统固定使用

    1024-49151 系统使用,一般也可以申请使用

    41952-65535 用户使用


(2)套接字socket

    用途:同一主机或不同主机间,进程间通讯的一种实现,即IPC的一种实现

   类型有3种:TCP套接字、UDP套接字、RAW套接字


(3)html语言

  HTML是网络的通用语言,一种简单、通用的全置标记语言。

   其中包含:

     CSS样式表、javascript

     MIME:多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,
         浏览器会自动使用指定应用程序来打开

      

(4)http:超文本传输协议

  (HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议.默认端口为80

   协议版本:

      HTTP/0.9:原型版本,功能简陋

      HTTP/1.0:第一个广泛使用的版本,支持MIME

      HTTP/1.1: 增强了缓存功能

      HTTP/2.0:


(5)URI:统一资源标识符(Uniform Resource Identifier)是一个用于标识某一互联网资源名称的字符串

  URL:URL是URI命名机制的一个子集

  实例:一个网站访问的完整http请求、请求处理过程

    客户端请求:

     http应用注册一个随机端口,加上本机IP,调用socket api 向服务器发出请求

    服务器请求处理:

     (1) 建立或处理连接(tcp连接):接收请求或拒绝请求

     (2) 接收请求(请求报文中对某资源的一次请求的过程,服务器httpd服务对于请求的处理模式,根据实际设定来使用)

      并发访问响应模型(Web I/O):

        (*) 单进程I/O结构:启动一个进程处理用户请求,而且一次只处理一个;多个请求被串行响应;

        (*) 多进程I/O结构:并行启动多个进程,每个进程响应一个请求;

        (*) 复用I/O结构:一个进程响应n个请求;

             -多线程模型:一个进程生成N个线程,每个线程响应一个用户请求;

             -事件驱动:event-driven,一个进程直接相应多个请求

        (*) 复用的多进程I/O结构:启动多个(m)进程,每个进程响应n个请求;

        也就是event生成多个进程,让这些进程每一个直接相应多个请求

      (3) 处理请求,对请求报文进行解析,获取请求的资源及请求的方法等信息(分析报文首部信息)

          报文首部简介:

            起始行:方法,url,版本

           Host: www.magedu.com   请求的主机名称

                ...

      (4) 访问资源,获取请求报文中请求的资源

          根据报文的信息,和web服务器资源路径映射方式:

             (a) docroot

             (b) alias

             (c) 虚拟主机docroot

             (d) 用户家目录docroot

                例如请求的是一个网页的图片,就根据实际路径进行系统调用读取图片

      (5) 构建响应报文

        资源准备好后,根据资源设定MIME类型,有几种设定方法:

             1.显式分类:

             2.魔法分类:自动测试该资源和设定

             3.协商分类:和客户协商决定

                如果客户端需要的资源不在本机,可做URL重定向:

                 web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径;

 
      (6) 发送响应报文

      (7) 记录日志


      至此,一个基本的通信流程完成,会涉及到的技术有:TCP、UDP、套接字socket、html语言、http协议、http服务响应模
      型、http报文、URL