从输入地址到页面展现过程背后的故事

当我们在浏览器中输入www.baidu.com并按下回车时，浏览器就会给我们打开百度的首页面。浏览器打开任何一个页面都需要一定的时间，那么从我们输入地址到页面展现这一段时间中，究竟发生了哪些事情呢？

一、识别URL

URL，全称统一资源定位符，用于定位用户所输入的网站资源。完整的URL是由协议（比如http，ftp）、域名（比如baidu.com）、文件路径（比如/1441477.html）和端口（比如:80）四个部分组成的。

二、域名解析

互联网上每一台计算机的唯一标识是它的IP地址，但是IP地址并不方便记忆。用户更喜欢用方便记忆的网址去寻找互联网上的其它计算机，也就是上面提到的百度的网址。因此浏览器必须要知道网站的IP地址才可以真正地向网站发出请求。而将域名转换为IP的，就是DNS
DNS查询的过程一般按下面次序进行

浏览器缓存
系统缓存（本地host文件）
路由器缓存
ISP（互联网服务提供商）DNS缓存
根域名服务器
顶级域名服务器
主域名服务器　　
关于DNS解析详细内容可以参考这篇文章

三、建立TCP连接

HTTP协议是建立在TCP协议之上的一种应用，在获取到服务器的IP地址后，浏览器需要开始与服务器之间建立TCP连接，这其中要经过三次握手。这部分涉及到计算机网络的相关知识，可参考TCP三次握手简述

四、浏览器发起http请求

发送HTTP请求的过程就是构建HTTP请求报文并通过TCP协议中发送到服务器指定端口(HTTP协议80/8080, HTTPS协议443)。HTTP请求报文是由三部分组成:

请求方法URI协议/版本

请求方法有GET, POST, PUT, DELETE等等

请求头(Request Header)

请求头包含许多有关的客户端环境和请求正文的有用信息。例如，请求头可以声明浏览器所用的语言，请求正文的长度等

请求正文
请求正文中可以包含客户提交的查询字符串信息，或者想服务器提交的数据等

五、服务器响应返回数据

服务器拿到请求之后会根据请求的方法、访问的路径、提交的参数等进行处理，返回一个HTTP响应，HTTP响应报文也是由三部分组成:

响应行

响应行一般包含协议版本、状态码及其描述组成

响应头

响应报头与请求头类似，为响应报文添加了一些附加信息

响应体
响应体就是响应的消息体，如果是纯数据就是返回纯数据，如果请求的是HTML页面，那么返回的就是HTML代码，如果是JS就是JS代码，如此之类

六、浏览器解析、渲染

这样浏览器就接收到了服务器返回的html文件后就开始逐行解析文件的内容。浏览器在解析过程中，如果遇到请求外部资源时，如图像,JS等。浏览器将重复四、五过程下载该资源。
浏览器是一个边解析边渲染的过程。首先浏览器解析HTML文件构建DOM树，然后解析CSS文件构建渲染树，等到渲染树构建完成后，浏览器开始布局渲染树并将其绘制到屏幕上。
浏览器渲染原理

七、页面展现

待浏览器将页面全部渲染完之后，一个完整的百度页面就成功的展现在我们面前啦！