详解一次完整的HTTP请求处理

详解一次完整的HTTP请求处理

  • 一次完整的HTTP请求处理过程
  • HTTP 服务通信过程
    • 接收请求的模型
    • 处理请求
      • 请求报文
        • 1、请求行
        • 2、请求头部
        • 3、请求数据
    • 访问资源
    • 构建响应报文
      • 响应实体
      • URL重定向
      • MIME类型
      • 响应报文格式
    • 发送响应报文
    • 记录日志
  • 请求方法介绍
    • GET
    • HEAD
    • POST
    • PUT
    • DELETE
    • CONNECT
    • OPTIONS
    • TRACE

一次完整的HTTP请求处理过程

  1. 建立或处理连接:接收请求或拒绝请求
  2. 接收请求:接收来自于网络上的主机请求报文中对某特定资源的一次请求的过程
  3. 处理请求:对请求报文进行解析,获取客户端请求的资源及请求方法等相关信息
  4. 访问资源:获取请求报文中请求的资源
  5. 构建响应报文
  6. 发送响应报文
  7. 记录日志

一些不太重要的备注:

  • 端口复用,生成一个套接字文件,在内核的内存中,进行保存记录(CIP PORT:SIP PORT),记录未及时处理的连接
  • 每有一个用户进行访问连接时,都会进行记录保存
  • C/S模型中,多并发模式特别常见
  • 主进程会产生子进程,在子进程中响应用户请求,可处理多并发请求

HTTP 服务通信过程

详解一次完整的HTTP请求处理_第1张图片
详解一次完整的HTTP请求处理_第2张图片

详解一次完整的HTTP请求处理_第3张图片

接收请求的模型

并发访问响应模型(Web I/O):

  • 单进程I/O模型:启动一个进程处理用户请求;这意味着,一次只能处理一个请求,多个请求被串行响应
  • 多进程I/O结构:由父进程并行启动多个子进程,每个子进程响应一个请求
  • 复用的I/O结构:一个进程响应n个请求,两种实现方式:
    • 多线程模式:一个进程生成n个线程,一个线程处理一个请求
    • 事件驱动(event-driven):一个进程直接处理n个请求
  • 复用的多进程I/O结构:启动多个(m)个进程,每个进程生成(n)个线程(响应的请求的数量:m*n)

详解一次完整的HTTP请求处理_第4张图片

处理请求

服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理。

请求报文

一个HTTP请求报文由请求行(request line)、请求头部(header)、空行和请求数据4个部分组成,下图给出了请求报文的一般格式。
详解一次完整的HTTP请求处理_第5张图片

1、请求行

请求行分为三个部分:请求方法、请求地址和协议版本。

请求方法

HTTP 定义的请求方法:GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS。
最常的两种GET和POST,如果是RESTful接口的话一般会用到GET、POST、DELETE、PUT。

请求地址

URL:统一资源定位符,是一种自愿位置的抽象唯一识别方法。

协议版本
HTTP 使用版本。

2、请求头部

请求头部为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
请求头部的最后会有一个空行,表示请求头部结束,接下来为请求数据,这一行非常重要,必不可少。
详解一次完整的HTTP请求处理_第6张图片

3、请求数据

可选部分,比如GET请求就没有请求数据。

访问资源

服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源。

资源放置于本地文件系统特定的路径:DocRoot

DocRoot --> /var/www/html

HTTP在Linux中的文件根目录是:/var/www/html ,对应URL 中 服务器名称后面的 “/”
例如:

Linux中的文件位置:
/var/www/html/images/logo.jpg

完整的URL;
http://www.magedu.com/images/logo.jpg

web服务器资源路径映射方式:

(a) docroot
(b) alias
(c) 虚拟主机docroot
(d) 用户家目录docroot

构建响应报文

一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体。

响应实体

如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:

  • 描述了响应主体MIME类型的Content-Type首部
  • 描述了响应主体长度的Content-Length
  • 实际报文的主体内容

URL重定向

web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径。

MIME类型

Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型与资源管理起来:

  • 魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名时
  • 显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或内容,强制特定文件或目录内容拥有某个MIME类型
  • 类型协商: 有些Web服务器经过配置,可以以多种文档格式来存储资源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商来决定使用哪种格式(及相关的MIME类型)“最好”

响应报文格式

详解一次完整的HTTP请求处理_第7张图片

HTTP响应报文主要由状态行、响应头部、空行以及响应数据组成。

1、状态行:
由3部分组成,分别为:协议版本,状态码,状态码描述。
其中协议版本与请求报文一致,状态码描述是对状态码的简单描述,所以这里就只介绍状态码。

状态码:

状态代码为3位数字。
1xx:指示信息--表示请求已接收,继续处理。
2xx:成功--表示请求已被成功接收、理解、接受。
3xx:重定向--要完成请求必须进行更进一步的操作。
4xx:客户端错误--请求有语法错误或请求无法实现。
5xx:服务器端错误--服务器未能实现合法的请求。

下面列举几个常见的:
详解一次完整的HTTP请求处理_第8张图片

2、响应头部

与请求头部类似,为响应报文添加了一些附加信息
常见响应头部如下:
详解一次完整的HTTP请求处理_第9张图片
3、响应数据
用于存放需要返回给客户端的数据信息。

发送响应报文

Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束了。

记录日志

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务。

请求方法介绍

GET

  • 请求指定的页面信息,并返回实体主体。
  • GET请求请提交的数据放置在HTTP请求协议头中,GET方法通过URL请求来传递用户的输入,GET方式的提交你需要用Request.QueryString来取得变量的值。
  • GET方法提交数据,可能会带来安全性的问题,数据被浏览器缓存。
  • GET请求有长度限制。
// 发起请求
http://localhost/general/form/getpost.asp?Text=Hello+World
// 解析请求参数(asp语法)
<% If Request.QueryString(“Text”) <> ““ Then %> 
通过get方法传递来的字符串是: “<%= Request.QueryString(“Text”) %>
<% End If %>

HEAD

  • 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头。

POST

  • 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。
  • POST请求可能会导致新的资源的建立和/或已有资源的修改。
  • POST方式提交时,你必须通过Request.Form来访问提交的内容
// 发起请求
http://localhost/general/form/getpost.asp
// 解析请求参数(asp语法)
<% If Request.Form(“Text”) <> ““ Then %> 
通过Post方法传递来的字符串是: “<%= Request.Form(“Text”) %>
<% End If %>

PUT

  • 从客户端向服务器传送的数据取代指定的文档的内容。

DELETE

  • 请求服务器删除指定的页面。
  • DELETE请求一般返回3种码
    • 200(OK)——删除成功,同时返回已经删除的资源。
    • 202(Accepted)——删除请求已经接受,但没有被立即执行(资源也许已经被转移到了待删除区域)。
    • 204(No Content)——删除请求已经被执行,但是没有返回资源(也许是请求删除不存在的资源造成的)。

CONNECT

  • 协议中预留给能够将连接改为管道方式的代理服务器。

OPTIONS

  • 允许客户端查看服务器的性能。

TRACE

  • 回显服务器收到的请求,主要用于测试或诊断。

你可能感兴趣的:(Linux学习笔记)