初识HTTP(1)

HTTP基本概念

HTTP 是超⽂本传输协议,也就是HyperText Transfer Protocol

超文本传输协议:

初识HTTP(1)_第1张图片

HTTP是一个在计算机世界⾥专⻔在两点之间传输⽂字、图⽚、⾳频、视频等超⽂本数据的约定和规范

HTTP常见的状态码
具体含义 常见状态码
1xx 提示信息,表示目前是协议处理状态,还需后续操作
2xx 成功,报文已经收到并被正确处理 200/204/206
3xx 重定向,资源位置发生变动,需要客户端重新发送请求 301、302/304
4xx 客户端错误,请求报文有误,服务器无法处理 400、403、404
5xx 服务器错误,服务器在处理请求时内部发生了错误 500、501、502、503
1xx

1xx 类状态码属于提示信息,是协议处理中的⼀种中间状态,实际⽤到的⽐较少。

2xx

2xx 类状态码表示服务器成功处理了客户端的请求,也是我们最愿意看到的状态。

200 OK:最常⻅的成功状态码,表示⼀切正常。如果是⾮ HEAD 请求,服务器返回的响应头都会有 body 数据。

204 No Content:常⻅的成功状态码,与 200 OK 基本相同,但响应头没有 body 数据。

206 Partial Content:应⽤于 HTTP 分块下载或断点续传,表示响应返回的 body 数据并不是资源的全部,⽽ 是其中的⼀部分,也是服务器处理成功的状态。

3xx

3xx 类状态码表示客户端请求的资源发送了变动,需要客户端⽤新的 URL ᯿新发送请求获取资源,也就是重定 向。

301 Moved Permanently:表示永久᯿定向,说明请求的资源已经不存在了,需改⽤新的 URL 再次访问

302 Found:表示临时᯿定向,说明请求的资源还在,但暂时需要⽤另⼀个 URL 来访问

301 和 302 都会在响应头⾥使⽤字段 Location ,指明后续要跳转的 URL,浏览器会⾃动᯿定向新的 URL。

304 Not Modified:不具有跳转的含义,表示资源未修改,᯿定向已存在的缓冲⽂件,也称缓存᯿定向,⽤于缓 存控制。

4xx

4xx 类状态码表示客户端发送的报⽂有误,服务器⽆法处理,也就是错误码的含义

400 Bad Request

表示客户端请求的报⽂有错误,但只是个笼统的错误

403 Forbidden:表示服务器禁⽌访问资源,并不是客户端的请求出错

404 Not Found:表示请求的资源在服务器上不存在或未找到,所以⽆法提供给客户端

5xx

5xx 类状态码表示客户端请求报⽂正确,但是服务器处理时内部发⽣了错误,属于服务器端的错误码。

500 Internal Server Error:与 400 类型,是个笼统通⽤的错误码,服务器发⽣了什么错误,我们并不知道。

501 Not Implemented:表示客户端请求的功能还不⽀持,类似“即将开业,敬请期待”的意思。

502 Bad Gateway:通常是服务器作为⽹关或代理时返回的错误码,表示服务器⾃身⼯作正常,访问后端服务器 发⽣了错误。

503 Service Unavailable:表示服务器当前很忙,暂时⽆法响应服务器,类似“⽹络服务正忙,请稍后᯿试”的意 思。

HTTP常见字段
Host字段

客户端发送请求时,用来指定服务器的域名:www.baidu.com;有了Host字段,就可以将请求发往同一台服务器上的不同网站

Content-Length字段

服务器在返回数据时,会有 Content-Length 字段,表明本次回应的数据⻓度。

Connection 字段

Connection 字段最常⽤于客户端要求服务器使⽤ TCP 持久连接,以便其他请求复⽤。

HTTP/1.1 版本的默认连接都是持久连接,但为了兼容⽼版本的 HTTP,需要指定 Connection ⾸部字段的值为 Keep-Alive 。

Content-Type 字段

Content-Type 字段⽤于服务器回应时,告诉客户端,本次数据是什么格式。

客户端请求的时候,可以使⽤ Accept 字段声明⾃⼰可以接受哪些数据格式。

Content-Encoding 字段

Content-Encoding 字段说明数据的压缩⽅法。表示服务器返回的数据使⽤了什么压缩格式

GET、POST

GET

请求从服务器获取资源,这个资源可以是静态的⽂本、⻚⾯、图⽚视频等。

POST

向 URI 指定的资源提交数据,数据就放在报⽂的 body ⾥。

HTTP特性

优点(1.1):简单、灵活和易于扩展、应⽤⼴泛和跨平台

  1. 简单

    HTTP 基本的报⽂格式就是 header + body ,头部信息也是 key-value 简单⽂本的形式,易于理解,降低了学习 和使⽤的⻔槛。

  2. 灵活、易于扩展

    HTTP协议⾥的各类请求⽅法、URI/URL、状态码、头字段等每个组成要求都没有被固定死,都允许开发⼈员⾃定 义和扩充。 同时 HTTP 由于是⼯作在应⽤层( OSI 第七层),则它下层可以随意变化。 HTTPS 也就是在 HTTP 与 TCP 层之间增加了 SSL/TLS 安全传输层,HTTP/3 甚⾄把 TCP 层换成了基于 UDP 的 QUIC。

  3. 应用广泛、跨平台

缺点:无状态、明文传输、不安全

  1. 无状态

    ⽆状态的好处:因为服务器不会去记忆 HTTP 的状态,所以不需要额外的资源来记录状态信息,这能减轻服务器的 负担,能够把更多的 CPU 和内存⽤来对外提供服务。

    ⽆状态的坏处:既然服务器没有记忆能⼒,它在完成有关联性的操作时会⾮常麻烦。

  2. 明文传输

    明⽂意味着在传输过程中的信息,是可⽅便阅读的,通过浏览器的 F12 控制台或 Wireshark 抓包都可以直接⾁眼查 看,为我们调试⼯作带了极⼤的便利性。

    但是这正是这样,HTTP 的所有信息都暴露在了光天化⽇下,相当于信息裸奔。在传输的漫⻓的过程中,信息的内 容都毫⽆隐私可⾔,很容易就能被窃取。

  3. 不安全(严重)

    通信使⽤明⽂(不加密),内容可能会被窃听。

    不验证通信⽅的身份,因此有可能遭遇伪装。

    ⽆法证明报⽂的完整性,所以有可能已遭篡改。

性能

HTTP 协议是基于 TCP/IP,并且使⽤了「请求 - 应答」的通信模式,所以性能的关键就在这两点⾥

  1. 长链接

    早期 HTTP/1.0 性能上的⼀个很⼤的问题,那就是每发起⼀个请求,都要新建⼀次 TCP 连接(三次握⼿),⽽且是 串⾏请求,做了⽆谓的 TCP 连接建⽴和断开,增加了通信开销。

    为了解决上述 TCP 连接问题,HTTP/1.1 提出了⻓连接的通信⽅式,也叫持久连接。这种⽅式的好处在于减少了 TCP 连接的᯿复建⽴和断开所造成的额外开销,减轻了服务器端的负载。

    持久连接的特点是,只要任意⼀端没有明确提出断开连接,则保持 TCP 连接状态。

  2. 管道网络运输

    在同⼀个 TCP 连接⾥⾯,客户端可以发起多个请求,只要第⼀个请求发出去了,不必等其回来,就可以发第 ⼆个请求出去,可以减少整体的响应时间。

    但是服务器还是按照顺序,先回应 A 请求,完成后再回应 B 请求。要是前⾯的回应特别慢,后⾯就会有许多请求排队等着。这称为队头堵塞

  3. 队头阻塞

    当顺序发送的请求序列中的⼀个请求因为某种原因被阻塞时,在后⾯排队的所有请求也⼀同被阻塞了,会招致 客户端⼀直请求不到数据

你可能感兴趣的:(计算机网络学习笔记,http)