进程 : 进程是操作系统资源分配的基本单位,进程中包含线程。简而言之,就是正在进行中的应用程序。
线程:线程是由进程所管理的。是进程内的一个独立执行的单位,是CPU调度的最小单位。
为了提升浏览器的稳定性和安全性,浏览器采取了多进程模型。
目前最新的Chrome进程架构图
浏览器设置的时候是一个多进程模型,这样能确保浏览的安全性和稳定性。如果一个页面有问题,不影响其他页面的运行。
HTML
、CSS
和JavaScript
转换为用户可以与之交互的网页,排版引擎Blink
和JavaScript
引擎V8都运行在该进程中,默认情况下,Chrome
为每一个Tab
标签页创建一个渲染进程。出于安全考虑,渲染进程都是运行在沙箱模式下的。所以我们开启一个页面,至少会启动4个进程。
HTTP
是一种允许浏览器向服务器获取资源的协议,是Web的基础。通常由浏览器发起请求,用来获取不同类型的文件,例如HTML
,CSS
,JavaScript
、图片、视频等。此外,HTTP
也是浏览器使用最广的协议。规定了客户端请求,和服务器端响应数据格式的协议。
接下来简单介绍一下 浏览器发送HTTP
请求的大致流程:
首先,浏览器构造请求行,构建好之后,浏览器准备发起网络请求
在正在发起网络请求之前,浏览器会现在浏览器缓存中查询是否有请求的文件,其实浏览器缓存是一种本地保存的资源副本,以供下次请求时直接使用的技术。
当浏览器发现请求的资源已经在浏览器缓存中存有副本,它会拦截请求,返回该资源的副本,并直接结束请求。而不会再去源服务器中重新下载。这样可以缓解服务的压力,提升性能。如果缓存查找失败,则进入网络请求。
HTTP和TCP的关系,因为浏览器使用HTTP协议作为应用层协议**,用来封装请求的文本信息**;并使用TCP/IP作传输层协议将它发到网络上,所以在HTTP工作开始之前,浏览器需要TCP与服务器建立连接。也就是说HTTP的内容是通过TCP的传输数据阶段来实现的。
数据包是通过IP地址传输给接收方的。由于IP地址是数字标识的,难以记忆,使用一个域名例如www.baidu.com就容易记忆了,所以基于这个需求又出现了一个服务,负责把域名和IP地址做–映射关系。这套域名映射为IP的系统叫做"域名系统",简称DNS
。
第一步浏览器会请求 DNS 返回域名对应的 IP。当然浏览器还提供了 DNS 数据缓存服务,如果某个域名已经解析过了,那么浏览器会缓存解析的结果,以供下次查询时直接使用,这样也会减少一次网络请求。
IP地址和端口已经准备好了,是不是可以马上建立TCP连接。
不行,因为Chrome有个机制,同一个域名同时最多只能建立6个TCP连接。如果请求书少于6个,直接进入下一步,建立TCP连接。
排队等待结束后,建立TCP连接
历经千辛万苦,HTTP 的请求信息终于被送达了服务器。接下来,服务器会根据浏览器的请求信息来准备相应的内容:
返回请求
断开连接
通常情况下,一旦服务器向客户端返回了请求数据,它就要关闭TCP连接。不过如果在浏览器或服务器在其头部信息加入Connection:Keep-Alive
那么TCP连接在发送后将仍然保持打开状态,这样浏览器可以继续通过同一个TCP连接发送请求。
保持TCP连接可以省去下次请求时需要建立连接的时间,提升资源加载速度。比如一个Web页面中内嵌图片来自于同一个web站点,如果初始化长连接,就不需要重复建立新的TCP连接。
因为第一次加载页面的过程中,缓存了一些耗时的数据。
那么,哪些数据会被缓存呢?DNS缓存和页面资源缓存这两块数据是会被浏览器缓存的。
通过上图第一次请求可以看出,当服务器返回HTTP
响应头给浏览器时,浏览器通过响应头的Cache-Control
字段来设置是否缓存该资源。
Cache-Control:Max-age=2000 //缓存过期时间是2000
这也就意味着,在该缓存资源还没有过期的情况下,如果再次发送请求该资源,会之间返回缓存中的资源给浏览器。
但如果缓存过期了,浏览器则会继续发送网络请求,并且在HTTP
请求头中带上:
If-None-Match:"4f80f-13c-3a1xb12a"
简要来说,很多网站第二次访问能够秒开,是因为这些网站把很多资源都缓存在了本地,浏览器缓存直接使用本地副本来回应请求,而不会产生真实的网络请求,从而节省了时间。同时,DNS
数据也被浏览器缓存了,这又省去了 DNS
查询环节。
接下来我们从进程角度讨论一下:从浏览器里,输入URL地址,到页面显示,这中间发生了什么?
从上图可以看到,整个过程需要各个进程之间的配合,我们结合上图我们从进程的角度,描述一下
1、浏览器进程接收到用户输入的URL请求,浏览器进程便将URL转发给网络进程。
2、网络进程中发起真正的URL请求。
3、网络进程接收到响应头数据,便解析响应头数据,并将数据转发给浏览器进程。
4、浏览器进程接收到网络进程的响应头数据之后,发送"提交文档"消息到渲染进程。
5、渲染进程接收到"提交文档"的消息之后,便开始准备接收HTML数据,接收数据的方式是直接和网络进程建立数据管道。
6、等文档数据传输完成之后,渲染进程会返回“确认提交”的消息给浏览器进程。
7、浏览器进程接收到渲染进程"确认提交"的消息之后,便开始移除之前旧的文档,然后更新浏览器进程中的页面状态。
所谓提交文档,就是浏览器主进程,将网络进程接收到的HTML数据提交给渲染进程。
接下来我们从一个简单的html页面来谈浏览器的渲染流程:
DOM解析的特点,是不会被阻塞的。因为浏览器无法直接理解和使用HTML,所以需要将HTML转化为浏览器能够理解的结构—DOM树。树结构很像我们现实生活中的"树",其中的每一个点我们称为**节点,**相连的节点称为父子节点。在浏览器渲染中,我们使用的就是树结构。
DOM树描述了文档的内容。元素是第一个标签也是文档树的根节点。树反映了不同标记之间的关系和层次结构。嵌套在其他标记中的标记是子节点。DOM节点的数量越多,构建DOM树所需的时间就越长。
HTML内容转换为浏览器DOM树结构的过程:字节 → 字符 → 令牌 → 节点 → 对象模型。
当解析器发现非阻塞资源,例如一张图片,浏览器会请求这些资源并且继续解析。当遇到一个CSS文件时,解析也可以继续进行,但是对于标签(特别是没有
async
或者 defer
属性)会阻塞渲染并停止HTML的解析。
浏览器构建DOM树时,这个过程占用了主线程。当这种情况发生时,预加载扫描仪将解析可用的内容并请求高优先级资源,如CSS、JavaScript和web字体。多亏了预加载扫描器,我们不必等到解析器找到对外部资源的引用来请求它。它将在后台检索资源,以便在主HTML解析器到达请求的资源时,它们可能已经在运行,或者已经被下载。预加载扫描仪提供的优化减少了阻塞。
先有内容,我们才能对内容就行修饰。
样式计算的目的是为了计算出DOM节点中每一个元素的具体样式,这个阶段大体分三步。
CSS
来源有:
link
引用的CSS
文件style
标签内的CSS
style
属性内嵌的CSS
和HTML文件一样,浏览器也是无法直接理解这些纯文本的CSS样式,所以当渲染引擎接收到CSS文本的时,会执行一个转换操作,将css文本转换为浏览器可以理解的结构—styleSheets。
渲染引擎会把获取到的 CSS
文本全部转换为 styleSheets
结构中的数据,并且该结构同时具备了查询和修改功能,这会为后面使用JS
的样式操作提供基础。
我们已经将CSS
转换为浏览器能理解的结构了,那么接下来就要对其进行属性值的标准化操作。
那么什么是属性值的标注啊呢?
body { font-size: 2em }
p {color:blue;}
span {display: none}
div {font-weight: bold}
div p {color:green;}
div {color:red; }
可以看到上面的 CSS
文本中有很多属性值,如 2em
、blue
、bold
,这些类型数值不容易被渲染引擎理解,所以需要将所有值转换为渲染引擎容易理解的、标准化的计算值,这个过程就是属性值标准化。
这里就涉及到CSS
的继承规则和层叠规则了。
首先是CSS
的继承,css继承是每个DOM节点都包含父节点的样式。结合以下例子,看下面这张表示如何应用到DOM节点上的。
body { font-size: 20px }
继承规则就是一般文本和字体相关样式都是可以继承的。层叠规则,嵌套的越深权重就越高。
总之,样式计算阶段的目的是为了计算出 DOM
节点中每个元素的具体样式,在计算过程中需要遵守 CSS
的继承和层叠两个规则。这个阶段最终输出的内容是每个 DOM
节点的样式,并被保存在 ComputedStyle
的结构内。
如果你想了解每个 DOM
元素最终的计算样式,可以打开 Chrome
的“开发者工具”,选择第一个“element”标签,然后再选择“Computed”子标签
现在,我们有DOM树和DOM树中元素的样式,但是还足以显示页面,因为我们还不知道DOM元素的几何位置,那么接下来就需要计算出DOM树中可见元素的几何位置,我们把这个计算过程叫做布局。
Chrome
在布局阶段需要完成两个任务:创建布局树和布局计算
DOM树有些元素不会在页面上显示,被用户看到,如head
标签和使用了display:none
的元素。所以在显示之前,我么还要额外地构建一棵只包含了可见元素的布局树。
从上图可以看出,DOM树中所有不可见的节点都没有有包含到布局树中。
我们已经有了一棵完整的布局树,那么接下来就要根据DOM节点对应的CSS
树中的样式,计算布局树节点的坐标位置。即计算元素在视口上确切的位置和大小。
有了布局树之后,每个元素的具体位置信息都计算出来了,那么接下来是不是就要开始着手绘制页面了?不是。因为页面中有很多复杂的效果,如一些复杂的3D转换,页面滚动,或者使用z-index
,为了更方便的实现这些效果,渲染引擎还需要为特定的节点生成专门的图层,并生成一棵对应的图层树(LayerTree)。这和PS的图层类似,正是这些图层叠加在一起才最终构成了页面图像。
想要直观的理解什么是图层,可以打开Chrome
的"开发工具",选择Layers
标签,就可以查看可视化页面的分层情况。
布局树和图层树的关系
通常情况下,并不是布局树中的每一个节点都包含一个图层,如果一个节点没有对应的图层,那么这个节点就从属于父节点的图层。那么什么情况满足,渲染引擎才会为特定的节点创建新的图层呢?满足一下两个条件中的任意一个,元素就可以被单独提升为一个图层。
页面是一个二维平面,但层叠上下文能够上HTML
元素拥有三维概念,这些HTML
元素按自身属性的优先级分布在垂直于这个二维平面的Z轴上,以下情况会作为单独的图层。
position:fixed
css 3d
例如:transform:rotateX(30deg)
video
canvas
CSS3
动画的节点will-change
那么什么是剪裁,结合以下代码
DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Documenttitle>
<style>
div {
width: 200px;
height: 200px;
overflow:auto;
background: gray;
}
style>
head>
<body>
<div >
<p>所以元素有了层叠上下文的属性或者需要被剪裁,那么就会被提升成为单独一层,你可以参看下图:p>
<p>从上图我们可以看到,document层上有A和B层,而B层之上又有两个图层。这些图层组织在一起也是一颗树状结构。p>
<p>图层树是基于布局树来创建的,为了找出哪些元素需要在哪些层中,渲染引擎会遍历布局树来创建层树(Update LayerTree)。p>
div>
body>
html>
这里我么把div的大小限定为200 * 200像素,而div里面的文字内容比较多,文字所显示的区域肯定会超过200 * 200的面积,这时候就产生了剪裁,渲染引擎会把裁剪文字内容的一部分用于显示在div区域,下面是运行时的执行结果:
出现这种裁剪情况时,渲染引擎会为文字单独为文字创建一层,如出现滚动条,滚动条也会被提升为单独的层。
在完成图层树的构建之后,渲染引擎会对图层树中的每个图层进行绘制,那么接下来我们看看渲染引擎是如何实现图层的绘制?
如果给你一张纸,让你先把背景涂成暗色,然后再中间中间位置花一个红色的圆,最后在圆上画一个绿色三角,你会怎么操作,通常你会按顺序操作。
渲染引擎实现图层的绘制与之类似,会把一个图层的绘制拆分为很多小的绘制指令,然后再把这些指令按照顺序组成一个待绘制列表,如下图所示:
从图中可以看出,绘制列表中的指令其实非常简单,就是让其执行一个简单的绘制操作,比如说绘制粉色矩形或者黑色的线等。而绘制一个元素通常需要好几条绘制指令,因为每个元素的背景、前景、边框都需要单独的指令去绘制。所以在图层绘制阶段,输出的内容就是这些待绘制列表。
绘制列表指令用来记录绘制顺序和绘制指令的列表,而实际上绘制操作是由渲染引擎中的合成线程来完成。结合下图看渲染主线程和合成线程之间的关系:
如上图所示,当图层的绘制列表准备好之后,主线程会把该绘制列表提交给合成线程,那么合成线程是如何工作的?
首先我们谈一个概念,视口。什么是视口?
通常一个页面可能很大,用户只能看到其中的一部分,我们把用户可以看到的这个区域叫视口(viewport)。
比如说,一个图层很大,页面需要滚动底部,才能全部显示。但是通过视口,用户只能看到页面很小的一部分,所以在此种情况下,要一次性绘制完图层所有的内容,会产生很大的开销,且没有必要。
基于这个原因,合成线程会将图层划分为图块,这些图块的大小通常是256 * 256或512 * 512。然后合成线程会按照视口附近的图块来优先生成位图,实际生成位图的操作就是有栅格化来执行的。所谓栅格化,**是指将图块转化为位图(所谓位图就是能够看的到的图层区域)。而图块是栅格化执行的最小单位。**渲染进程维护了一个栅格化的线程池,所有的图块栅格化都是在线程池内执行,运行方式如下图所示:
通常,栅格化过程都会使用GPU来加速生成,使用GPU生成位图过程叫快速栅格化,或者GPU栅格化,生成的位图被保存在GPU内存中。GPU操作是运行在GPU进程中的,那么栅格化,还涉及到了跨进程操作。
从图中可以看出,渲染进程把生成图块的指令发送给 GPU,然后在 GPU 中执行生成图块的位图,并保存在 GPU 的内存中。
一旦所有图块被栅格化,合成线程就会生成一个绘制图块的命令—“DrawQuad”,然后将该命令提交给浏览器进程。
浏览器进程里有一个叫viz的组件,用来接收合成线程发过来的DrawQuad命令,然后根据DrawQuad命令,将其页面内容绘制到内存中,最后显示在屏幕上。
到此,经过一系列的阶段,编写好的HTML
、CSS
、JavaScript
等文件,经过浏览器就会显示为页面。
我们已经完整分析了整个渲染流程,从HTML到DOM,样式计算,布局,图层,绘制,栅格化,合成和显示。
一个完整的渲染流程大致可总结如下:
有了渲染流水线的基础,我们来谈谈和渲染流水线关系的三个概念—重排,重绘和合成。理解这个三个概念对于后续Web的性能优化会有很大的帮助。
从上图可以看出,如果你通过JS或CSS修改元素的几何位置属性,如width
,height
等,那么会触发浏览器的重新布局,解析之后的一系列子阶段,这个过程就叫**重排也称回流。重排需要更新完整的渲染流水线,所以开销也最大的。
比如通过JS更改某些元素的背景颜色,渲染流水的调整参见下图:
修改元素的背景色,布局阶段不会执行,因为没有引起几何位置的变换,所以直接进入绘制,然后执行之后的一系列子阶段,这个过程就叫重绘。相较重排操作,重绘省去了布局和分层阶段,所以执行效率会比重排效率高。
那如果你更改一个既不要布局也不要绘制的属性,渲染引擎将跳过布局和绘制,只执行后续的合成操作,我们把这个过程叫做合成。
在上图,我们使用CSS
的transform
来实现动画效果,可以避开重排和重绘阶段,直接在非主线程上执行合成动画操作。这样的效率最高,因为是在非主线程上合成的,并没有占用主线程的资源。
如果我们要提升性能,需要做的就是减少浏览器的重绘和回流
display: none
,操作结束后再把它显示出来。因为在display
属性为none
的元素上进行的DOM操作不会引发回流和重绘。