从输入地址到页面展现过程背后的故事

当我们在浏览器中输入www.baidu.com并按下回车时,浏览器就会给我们打开百度的首页面。浏览器打开任何一个页面都需要一定的时间,那么从我们输入地址到页面展现这一段时间中,究竟发生了哪些事情呢?

一、识别URL

URL,全称统一资源定位符,用于定位用户所输入的网站资源。完整的URL是由协议(比如http,ftp)、域名(比如baidu.com)、文件路径(比如/1441477.html)和端口(比如:80)四个部分组成的。

二、域名解析

互联网上每一台计算机的唯一标识是它的IP地址,但是IP地址并不方便记忆。用户更喜欢用方便记忆的网址去寻找互联网上的其它计算机,也就是上面提到的百度的网址。因此浏览器必须要知道网站的IP地址才可以真正地向网站发出请求。而将域名转换为IP的,就是DNS
DNS查询的过程一般按下面次序进行

  1. 浏览器缓存
  2. 系统缓存(本地host文件)
  3. 路由器缓存
  4. ISP(互联网服务提供商)DNS缓存
  5. 根域名服务器
  6. 顶级域名服务器
  7. 主域名服务器  
    关于DNS解析详细内容可以参考这篇文章

三、建立TCP连接

HTTP协议是建立在TCP协议之上的一种应用,在获取到服务器的IP地址后,浏览器需要开始与服务器之间建立TCP连接,这其中要经过三次握手。这部分涉及到计算机网络的相关知识,可参考TCP三次握手简述

四、浏览器发起http请求

发送HTTP请求的过程就是构建HTTP请求报文并通过TCP协议中发送到服务器指定端口(HTTP协议80/8080, HTTPS协议443)。HTTP请求报文是由三部分组成:

  1. 请求方法URI协议/版本

请求方法有GET, POST, PUT, DELETE等等

  1. 请求头(Request Header)

请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等

  1. 请求正文
    请求正文中可以包含客户提交的查询字符串信息,或者想服务器提交的数据等

五、服务器响应返回数据

服务器拿到请求之后会根据请求的方法、访问的路径、提交的参数等进行处理,返回一个HTTP响应,HTTP响应报文也是由三部分组成:

  1. 响应行

响应行一般包含协议版本、状态码及其描述组成

  1. 响应头

响应报头与请求头类似,为响应报文添加了一些附加信息

  1. 响应体
    响应体就是响应的消息体,如果是纯数据就是返回纯数据,如果请求的是HTML页面,那么返回的就是HTML代码,如果是JS就是JS代码,如此之类

六、浏览器解析、渲染

这样浏览器就接收到了服务器返回的html文件后就开始逐行解析文件的内容。浏览器在解析过程中,如果遇到请求外部资源时,如图像,JS等。浏览器将重复四、五过程下载该资源。
浏览器是一个边解析边渲染的过程。首先浏览器解析HTML文件构建DOM树,然后解析CSS文件构建渲染树,等到渲染树构建完成后,浏览器开始布局渲染树并将其绘制到屏幕上。
浏览器渲染原理

七、页面展现

待浏览器将页面全部渲染完之后,一个完整的百度页面就成功的展现在我们面前啦!


你可能感兴趣的:(从输入地址到页面展现过程背后的故事)