《计算机网络——自顶向下方法》应用层——Web和HTTP

Web和HTTP

20世纪90年代初期,一个新型应用即万维网登上了舞台,Web是一个引起公众注意的因特网应用,它极大的改变了人们与工作环境内外交流的方式。

HTTP概况

Web 的应用层协议是超文本传输协议(HTTP),它是Web的核心 。HTTP由两个程序实现:一个客户程序和一个服务器程序,二者运行在不同的端系统中,通过交换HTTP报文进行会话。
web页面由对象组成,一个对象知识一个文件,多数web页面含有一个HTML基本文件,HTML基本统建通过对象的URL地址引用页面中的其他对象。Web服务器(如Apache)实现了HTTP服务端,用于存储web对象,每个对象由URL寻址。HTTP定义了web客户想web服务器请求web页面的方式,以及服务器向客户传送web页面的方式。
HTTP使用TCP作为它的支撑运输协议,HTTP使用TCP作为它的支撑晕乎协议。HTTP客户首先发起一个与服务器的TCP连接。一旦连接建立,gauge浏览器和服务器进程可以通过套接字接口访问TCP。客户端的套接字接口是客户进程与TCP连接之间的们,这服务器端的套接字接口则是服务器进程与TCP连接之间的们。类似地,服务器从他的套接字接口接收HTTP请求报文向它的套接字接口发送HTTP报文。
服务器向客户发送被请求的文件,而不存储任何关于该客户的状态信息,所以HTTP是一个无状态协议,web服务器总是打开的,具有一个固定的IP地址,服务于可能来自百万计的不同浏览器请求。

非持续连接和持续连接

根据每个请求/响应对是经过一个 单独 的TCP连接发送,还是所有的请求及其响应经相同 的TCP连接发送,我们可以称该应用程序为使用非持续连接持续连接.两种方式主要在往返时间(RTT)上存在区别。

HTTP报文格式

HTTP请求报文

HTTP请求报文的第一行叫做请求航,后继叫做首部行。请求行有3个字段:方法字段、URL字段和HTTP版本字段。方法字段可以取几种不同的值,包括GET、POST、HEAD、PUT和DELETEI(绝大部分使用GET方法)

HTTP响应报文

响应报文有三个部分:状态行、6个首部行,然后是实体体.状态行有三字段:协议版本字段、状态码和响应的状态信息.
首部行中:connection告诉客户,发送完报文后该TCP是否关闭;Date:服务器产生并发送该响应报文的时间;……;;Last-Modified:首部行对既可能在本地客户也可能在网络缓存服务器上的对象缓存来说非常重要;……
下面是一些常见的状态码和他们对应的短语:

  • 200 OK :请求成功,信息在返回的响应报文中;
  • 301 Moved Permanently : 请求的对象已经被永久转移了,新的URL定义在响应报文的Location:首部行中。客户软件将自动获取新的URL;
  • 400 Bad Request:通用差错代码,指示带请求不能被服务器理解;
  • 404 Not Found:被请求的文档不在服务器上;
  • 505 HTTP Version Not Supported:服务器不支持请求报文使用的HTTP协议版本。

用户与服务器的交互:cookie

我们知道HTTP服务器是无状态的,这简化了服务器的设计,然而web站点通常希望能够识别用户(可能是因为服务器希望限制用户的访问,或者因为它希望把内容和用户身份关联起来),为此,HTTP使用了cookie
cookie技术有四个组件:1. 在HTTP响应报文中的一个cookie首部行;2. 在HTTP请求报文中的一个cookie首部行;3. 用户的端系统中保留有一个cookie文件,并由用户的浏览器进行管理;4. 位于web站点的一个后端数据库。

Web缓存

Web缓存也叫代理服务器它是能够代表初始Web服务器来满足HTTP请求的网络实体,Web缓存器有自己的磁盘存储空间,并保存最近请求过的对象副本。
Web缓存器是服务器同时又是客户,通常由ISP购买安装。
在因特网上部署Web缓存器有两个原因:

  1. web缓存器可以大大减少对客户请求的响应时间;
  2. web缓存器可以大大减少一个机构的接入链路到因特网的通信量。

条件GET方法

尽管高速缓存器能减少用户感受到的响应时间,但是引入了一个新的问题,即存放在缓存器中的对象副本可能是陈旧的。辛运的是,HTTP协议有一种机制,允许缓存器证明它的对象是最新的,这种机制就是条件GET方法(由于缓存器存储对象时也存储了最后修改日期,该机制主要就是通过检查If-Modified-Since和Last-Modified是否相等来判断是否被修改过)。

你可能感兴趣的:(《计算机网络——自顶向下方法》应用层——Web和HTTP)