超文本传送协议(hypertext transfer protocol,HTTP)是万维网(world wide web,www,也简称为web)
的基础,本节主要对http协议进行介绍,并分别给出http多线程服务器和客户程序的实例,而不
介绍有关WEB和浏览器方面的知识。
HTTP是一个属于应用层的面向对象的协议,适用于分布式超媒体信息系统。它于1990年提出,
经过几年的使用与发展,得到不断地完善和扩展,目前在WWW中使用的是http1.1
1、http协议特点:
HTTP协议是网络中使用最为广泛的一种高级协议,WWW服务广泛应用,而WWW服务器使用的主要协议是
HTTP协议,经过十几年的使用与发展,HTTP协议得到了极大的扩展和完善,目前HTTP协议支持的不仅
限于WWW服务,还有FTP等其他服务。
HTTP协议最初开始的设计目标就是通过网络来支持Client和Server之间的事务处理,其最初原型在
1990年出现,为了适应WWW的需求,在功能和性能方面进行了大量的改进,最开始出现的HTTP原始
协议现在称为HTTP0.9,它是一个面向消息的简单协议,是现在使用的HTTP协议的子集。因此它同
HTTP1.0,HTTP1.1兼容。该协议描述了Client和Server之间请求和响应的过程:
Client在本地主机向运行于远程主机上的Server请求链接,连接成功之后通过GET来访问Server端
对象(可以是普通网页,也可以是通过CGI或ISAPI生成的动态页面),Server端在连接终止之前将
请求的对象或者是错误消息返回给Client,结束响应过程.HTTP0.9和现在使用的HTTP1.1在基本上
实现上没有大的区别,HTTP1.0是以HTTP0.9为基础发展起来的,增加了复杂网络连接下访问不同
对象类型的功能,基本的改进如下:
(1)增加了请求的类型,如HEAD、POST等。
(2)增加了请求和响应消息的协议版本,如响应消息第一行以“HTTP/1.0”开始,表示Server使用
的是HTTP协议的1.0版。
(3)使用Server响应码来表示请求响应消息的成功与否,如果响应消息第一行以200 OK结束,
说明操作成功。
(4)使用MIME(Multipurpose Internet Mail Externsion)的消息标题(Header)和消息体(Body)格式
来描述访问对象的数据类型和附加在后面的元信息,如MIME的Header为"Content-type:text/html"
表明响应的消息实体是HTML文件,增加了MIME支持之后,使HTTP协议可以处理的数据类型获得很
大的扩充,从而实现了对多媒体流信息(如声音,图像)的处理支持。
(5)用Challenge/Response实现认证,这样可以在用户访问某些页面时要求输入用户名和密码,进行
身份认证。
(6)增加了代理(proxy)支持功能,在HTTP0.9中,规定了Client和Server只能直接交互,而1.0版可以通过
代理等中间实体实现间接连接。
HTTP1.1是在HTTP1.0的基础上实现的一次飞跃,主要的改进集中在性能、安全、数据类型处理等方面:
(1)提出了Server端缓冲对象的概念,其目的是为了减少网络上相同类型内容的反复传送,提高访问
速度,节约带宽。
(2)使用永久连接(persistent Connect)作为基本的连接,提高性能。
(3)允许Client和Server之间对内容进行协商
(4)突破了HTTP1.0中Server和IP一一对应的限制,可能通过主机名来决定由哪一个Server提供服务
HTTPng是发展中的下一代协议,在效率和性能上有了更进一步的提高,HTTP协议的主要特点可概括
为如下几点:
(1)简单快速
客户向服务器请求服务时,只需要传送请求方法和路径,请求方法主要有GET,HEAD,POST等,
其中又以GET最为广泛。由于HTTP协议简单,使得HTTP服务器的程序规模小,通信速度很快。
(2)灵活
HTTP允许传输任意类型的数据对象(ASCII文本:二进制流如BMP,JPG,ZIP等),传输数据的具体类型
在Content-type域中加以标记
(3)无连接
无连接的含义是限制每次连接只处理一个请求,服务器处理完客户的请求,并收到客户的应答后
立即断开连接。采用这种方式可以节省传输时间
(4)无记忆状态能力
无记忆状态能力是指协议不保留当前事务处理的信息。虽然这样会带来一些副作用,可是服务 需要
重新利用先前信息,可以实现较快应答.
HTTP协议报文结构:
HGGP是一个面向事务的客户服务器协议。虽然HTTP使用了TCP协议,但HTTP协议是无状态的(Stateless)。
也就是说每一个事务都独立地进行处理。当一个事务开始时,就在WWW客户与WWW服务器之间产生一个
TCP连接,当事务结束时就释放这个TCP连接。
HTTP的无状态特性很适合它的典型应用。用户在使用WWW时,往往要读取一系列的网页,而
这些网页又可能分布在许多相距很远的服务器上,将HTTP协议做成无状态,可使读取网页信息完成得
较迅速,HTTP协议本身也是无连接的,虽然它使用了面向连接的TCP连接。
在许多情况下,用户的个人计算机并不是一起连在Internet上,而是通过拨号方式经过Internet服务
提供商再连接到Internet上的。在这种情况下,先要使用SLIP或PPP协议与ISP接通,待ISP分配给用户一个
临时的IP地址后,才能使用WWW浏览器。
从HTTP的观点来看,上述WWW浏览器就是一个HTTP客户,而在WWW服务器等待HTTP请求的进程常称为、
HTTPdaemon,HTTPdaemon在收到HTTP客户请求后,经过一些必要的处理,将所需的文件返回给HTTP客户。
下面让我们来研究一下HTTP的报文结构。HTTP有两类报文:从客户到服务器的请求报文和从服务器到
客户的响应报文。
两种报文都由5个成员组成,其中请求报文的结构如下:
1、第1成员:请求行(Request-Line)或状态行(Status-line)
2、第2成员:通用头(General-Header)
3、第2成员:请求头(Request-Header)
4、第4成员:实体头(Entity-Header)
5、第5成员:实体主体(Entiry-Body)
TCP/IP:
TCP(Transmission Control Protocol) 传输控制协议
TCP是主机对主机层的传输控制协议,提供可靠的连接服务,采用三次握手确认建立一个连接:
位码即tcp标志位,有6种标示:SYN(synchronous建立联机) ACK(acknowledgement 确认) PSH(push传送) FIN(finish结束) RST(reset重置) URG(urgent紧急)
Sequence number(顺序号码) Acknowledge number(确认号码)
第一次握手:主机A发送位码为syn=1,随机产生seq number=1234567的数据包到服务器,主机B由SYN=1知道,A要求建立联机;
第二次握手:主机B收到请求后要确认联机信息,向A发送ack number=(主机A的seq+1),syn=1,ack=1,随机产生seq=7654321的包
第三次握手:主机A收到后检查ack number是否正确,即第一次发送的seq number+1,以及位码ack是否为1,若正确,主机A会再发送ack number=(主机B的seq+1),ack=1,主机B收到后确认seq值与ack=1则连接建立成功。
完成三次握手,主机A与主机B开始传送数据。
在TCP/IP协议中,TCP协议提供可靠的连接服务,采用三次握手建立一个连接。
第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认;
第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态; 第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。 完成三次握手,客户端与服务器开始传送数据