HTTP协议和Web服务器的简单讲解

HTTP协议

网址的组成

网址有4部分组成

  • 协议 HTTP,HTTPS(加密的HTTP协议),FTP
  • 域名或者IP地址 www.baidu.com, 127.0.0.1(localhost)
  • 端口号 HTTP协议的端口号是80,HTTPS端口号443
  • 路由(就是路径) /,/login

百度的网址——https://www.baidu.com/

域名又是什么?

我们通过IP地址进行通信,但是IP地址又很难被人们记住所以诞生了域名。
当我们访问一个网页时,先通过DNS(Domain Name Server,域名服务器)查询到该域名所绑定的IP地址然后再进行访问。

使用ping可以得到域名所绑定的IP地址

百度 https://www.baidu.com/ 对应的IP地址是[115.239.211.112]

端口号

端口号是用来区分不同的服务,当一个数据到达计算机,然而计算机有很多软件都在接收数据如QQ、邮箱、浏览器等等。
但是不知道到底是谁的数据,有了端口号就是可以区分不同的服务。端口号范围是从0 到65535。

重头戏HTTP超文本传输协议

为什么叫超文本传输协议呢,因为收发的是文本信息。

1,浏览器(客户端)按照规定的格式发送文本数据(请求)到服务器
2,服务器解析请求,按照规定的格式返回文本数据到浏览器
3,浏览器解析得到的数据,并做相应处理

HTTP协议也有4部分组成

  • 请求行或者响应行
  • heard头部信息
  • 两个空行\r\n\r\n主要来分割heard和body(一个\r\n等同于python中的一个\n)
  • body内容也就是HTML文本(可以为空)

下面是一个完整的HTTP请求

GET / HTTP/1.1
Host: localhost:8000
Connection: keep-alive
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) Chrome/64.0.3282.167 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Cookie: Pycharm-62160a8f=9b13cb50-3135-4837-8ef9-6ef21178fd2f


其中响应行(第一行):
1,GET请求方式还有POST请求
2,/ 是请求网页的路径
3,HTTP/1.1 是版本
heard里面是HOST(IP地址和端口号)Cookie等一些属性
body里面是POST请求的参数

下面是一个响应的HTTP

HTTP/1.1 200 OK
Date: Thu, 29 Mar 2018 12:03:27 GMT
Content-Type: text/html
Content-Length: 14615
Last-Modified: Wed, 28 Mar 2018 11:23:00 GMT
Connection: Keep-Alive
Vary: Accept-Encoding
Set-Cookie: PSTM=1522325007; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Server: BWS/1.1
X-UA-Compatible: IE=Edge,chrome=1
Pragma: no-cache
Cache-control: no-cache
Accept-Ranges: bytes


html文本...

其中响应行(第一行):
1,HTTP/1.1 是版本
2,200 是[状态码]跟 404 一样
3,OK 是状态码的描述(404就是NOT FOUND)
浏览器会自己解析Header部分,然后将Body(html)渲染成网页

web服务器是做什么的?

Web服务器就是处理HTTP请求的
完整的套路

  • 接收浏览器(客户端)发送的请求(符合HTTP协议的文本)
  • 后台处理数据
  • 将响应数据(一个网页)返回浏览器
  • 浏览器渲染网页

你可能感兴趣的:(HTTP协议和Web服务器的简单讲解)