JS运行机制最全面的一次梳理

原文:从浏览器多进程到JS单线程,JS运行机制最全面的一次梳理

由我进行二次编辑整理而成。

长文预警!需要有一定的编程基础与前端基础。

能解答你大部分的困惑,例如:浏览器如何处理页面与 JS 脚本和插件的?JS 是绝对的单线程?事件驱动是什么(Node.js 基础)?事件循环是什么?页面如何被渲染的?浏览器的硬件加速是什么意思?

从浏览器进程,再到浏览器内核运行,再到JS引擎单线程,再到JS事件循环机制,从头到尾系统的梳理一遍,摆脱碎片化,形成一个知识体系.

大纲

  • 进程和线程
  • 浏览器是多进程的
    • 浏览器都包含哪些进程?
    • 浏览器多进程的优势
    • 重点是浏览器内核(渲染进程)
    • Browser进程和浏览器内核(Renderer进程)的通信过程
  • 梳理浏览器内核中线程之间的关系
    • GUI渲染线程与JS引擎线程互斥
    • JS阻塞页面加载
    • WebWorker,JS的多线程?
    • WebWorker与SharedWorker
  • 简单梳理下浏览器渲染流程
    • load事件与DOMContentLoaded事件的先后
    • css加载是否会阻塞dom树渲染?
    • 普通图层和复合图层
  • 从Event Loop谈JS的运行机制
    • 事件循环机制进一步补充
    • 单独说说定时器
    • setTimeout而不是setInterval
  • 事件循环进阶:macrotask与microtask
  • 写在最后的话

区分进程和线程

编程基础知识,略过,详情见原文

核心点:

  • 进程是 cpu 资源分配的最小单位(是能拥有资源和独立运行的最小单位)

  • 线程是 cpu 调度的最小单位(线程是建立在进程的基础上的一次程序运行单位,一个进程中可以有多个线程)

  • 不同进程之间也可以通信,不过代价较大

浏览器是多进程的

理解了进程与线程了区别后,接下来对浏览器进行一定程度上的认识:(先看下简化理解)

  • 浏览器是多进程
  • 浏览器之所以能够运行,是因为系统给它的进程分配了资源(cpu、内存)
  • 简单点理解,每打开一个Tab页,就相当于创建了一个独立的浏览器进程

以 Chrome 为例,它的多个标签页,然后可以在Chrome的任务管理器中看到有多个进程(分别是每一个 Tab 页面有一个独立的进程,以及一个主进程),在 Windows 的任务管理器中也可以看出。

注意:在这里浏览器应该也有自己的优化机制,有时候打开多个tab页后,可以在Chrome任务管理器中看到,有些进程被合并了 (所以每一个Tab标签对应一个进程并不一定是绝对的)

浏览器都包含哪些进程?

知道了浏览器是多进程后,再来看看它到底包含哪些进程:(为了简化理解,仅列举主要进程)

  1. Browser 进程:浏览器的主进程(负责协调、主控),只有一个。作用:
    • 负责浏览器界面显示,与用户交互。如前进,后退等
    • 负责各个页面的管理,创建和销毁其他进程
    • 将 Renderer 进程得到的内存中的 Bitmap,绘制到用户界面上
    • 网络资源的管理,下载等
  2. 第三方插件进程:每种类型的插件对应一个进程,仅当使用该插件时才创建
  3. GPU 进程:最多一个,用于 3D 绘制等
  4. 浏览器渲染进程(浏览器内核,Renderer进程,内部是多线程的):默认每个 Tab 页面一个进程,互不影响。主要作用为:页面渲染,脚本执行,事件处理等

强化记忆:在浏览器中打开一个网页相当于新起了一个进程(进程内有自己的多线程)

当然,浏览器有时会将多个进程合并(譬如打开多个空白标签页后,会发现多个空白标签页被合并成了一个进程)

浏览器多进程的优势

相比于单进程浏览器,多进程有如下优点:

  • 避免单个 page crash 影响整个浏览器
  • 避免第三方插件 crash 影响整个浏览器
  • 多进程充分利用多核优势
  • 方便使用沙盒模型隔离插件等进程,提高浏览器稳定性

简单点理解:

如果浏览器是单进程,那么某个 Tab 页崩溃了,就影响了整个浏览器,体验有多差;同理如果是单进程,插件崩溃了也会影响整个浏览器;而且多进程还有其它的诸多优势。。。

当然,内存等资源消耗也会更大,有点空间换时间的意思

看过相关趣图吧,再大的内存也不够 Chrome 吃的,内存泄漏问题现在已经改善了一些了,也仅仅是改善,还有就是会导致耗电增加。。。。

浏览器内核(渲染进程)

重点来了,我们可以看到,上面提到了这么多的进程,那么,对于普通的前端操作来说,最终要的是什么呢?答案是渲染进程

可以这样理解,页面的渲染,JS 的执行,事件的循环,都在这个进程内进行。接下来重点分析这个进程

请牢记,浏览器的渲染进程是多线程的(JS 引擎是单线程的)

那么接下来看看它都包含了哪些线程(列举一些主要常驻线程):

  1. GUI 渲染线程
    • 负责渲染浏览器界面,解析 HTML,CSS,构建 DOM 树和 RenderObject 树(简单理解为 CSS 形成的样式树,Flutter 核心之一),布局和绘制等。
    • 当界面需要重绘(Repaint)或由于某种操作引发回流(reflow)时,该线程就会执行
    • 注意,GUI 渲染线程与 JS 引擎线程是互斥的,当 JS 引擎执行时 GUI 线程会被挂起(冻结),GUI 更新会被保存在一个队列中 等到 JS 引擎空闲时 立即被执行。
  2. JS 引擎线程
    • 也称为 JS 内核,负责处理 Javascript 脚本程序。(例如 V8 引擎)
    • JS 引擎线程负责解析 Javascript 脚本,运行代码。
    • JS 引擎一直等待着任务队列中任务的到来,然后加以处理,一个 Tab 页(renderer 进程)中无论什么时候都只有一个 JS 线程在运行 JS 程序
    • 同样注意,GUI 渲染线程与 JS 引擎线程是互斥的,所以如果 JS 执行的时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞。
  3. 事件触发线程
    • 归属于浏览器而不是 JS 引擎,用来控制事件循环(可以理解,JS 引擎自己都忙不过来,需要浏览器另开线程协助)
    • 当 JS 引擎要执行代码块如 setTimeOut 时(也可来自浏览器内核的其他线程,如鼠标点击、Ajax 异步请求等),会将对应任务添加到事件线程中。并且会负责排序
    • 当对应的事件符合触发条件被触发时,该线程会把事件添加到待处理队列的队尾,等待 JS 引擎的处理
    • 注意,由于 JS 的单线程关系,所以这些待处理队列中的事件都得排队等待 JS 引擎处理(当 JS 引擎空闲时才会去执行
    • 这里可以简单理解为,它负责管理一堆事件和一个“事件队列”,只有在事件队列的任务 JS 引擎才会在空闲的时候去执行,而它要做的,就是负责当某个事件被触发时,把它加入到事件队列。例如鼠标单击。
  4. 定时触发器线程
    • 传说中的 setInterval 与 setTimeout 所在的线程
    • 浏览器定时计数器并不是由 JavaScript 引擎计数的,(因为 JavaScript 引擎是单线程的,如果处于阻塞线程状态就会影响记计时的准确)
    • 因此通过单独线程来计时并触发定时,计时完毕后,添加到事件队列中(对应 事件触发线程 的“事件符合触发条件被触发时”),等待 JS 引擎空闲后执行。
    • 注意,W3C 在 HTML 标准中规定,规定要求 setTimeout 中低于 4ms 的时间间隔算为 4ms。
  5. 异步http请求线程
    • 在 XMLHttpRequest 在连接后是通过浏览器新开一个线程请求
    • 将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中。再由 JavaScript 引擎执行。

看到这里,如果觉得累了,可以先休息下,这些概念需要被消化,毕竟后续将提到的事件循环机制就是基于事件触发线程的,所以如果仅仅是看某个碎片化知识, 可能会有一种似懂非懂的感觉。要完成的梳理一遍才能快速沉淀,不易遗忘。放张图巩固下吧:

JS运行机制最全面的一次梳理_第1张图片

再说一点,为什么 JS 引擎是单线程的?额,这个问题其实应该没有标准答案,譬如,可能仅仅是因为由于多线程的复杂性,譬如多线程操作一般要加锁,因此最初设计时选择了单线程。。。

而就是因为这个原因,被 Node.js 的作者盯上,选中作为 Node 的语言。

补充关于 DOM 的重绘,在之前的 App跨平台方案的发展 一文也说过,这里会有一个虚拟 DOM 的概念,当浏览器将页面渲染完成,虚拟 DOM 也就出现了,这时候操作任何的元素,都会引起整个 DOM 的重绘,来刷新页面显示,这个过程是非常消耗资源的。

Vue、React 之类的框架会接管 DOM 操作,在一系列的操作中会与原始 DOM 结构进行比对,生成一组最小更改,然后执行操作,这样会大幅减少对 DOM 的频繁操作引起的不必要的性能损耗。

Browser进程和浏览器内核(Renderer进程)的通信过程

看到这里,首先,应该对浏览器内的进程和线程都有一定理解了,那么接下来,再谈谈浏览器的 Browser 进程(控制进程)是如何和内核通信的, 这点也理解后,就可以将这部分的知识串联起来,从头到尾有一个完整的概念。

如果自己打开任务管理器,然后打开一个浏览器,就可以看到:任务管理器中出现了两个进程(一个是主控进程,一个则是打开 Tab 页的渲染进程), 然后在这前提下,看下整个的过程:(简化了很多)

  • Browser 进程收到用户请求,首先需要获取页面内容(譬如通过网络下载资源),随后将该任务通过 RendererHost 接口传递给 Render (内核)进程
  • Renderer 进程的 Renderer 接口收到消息,简单解释后,交给渲染线程,然后开始渲染
    • 渲染线程接收请求,加载网页并渲染网页,这其中可能需要 Browser 进程获取资源和需要 GPU 进程来帮助渲染
    • 当然可能会有 JS 线程操作 DOM(这样可能会造成回流并重绘)
    • 最后 Render 进程将结果传递给 Browser 进程
  • Browser 进程接收到结果并将结果绘制出来

这里绘一张简单的图:(很简化)

JS运行机制最全面的一次梳理_第2张图片

看完这一整套流程,应该对浏览器的运作有了一定理解了,这样有了知识架构的基础后,后续就方便往上填充内容。

这块再往深处讲的话就涉及到浏览器内核源码解析了,不属于本文范围。

如果这一块要深挖,建议去读一些浏览器内核源码解析文章。

浏览器内核中线程之间的关系

到了这里,已经对浏览器的运行有了一个整体的概念,接下来,先简单梳理一些概念

GUI 渲染线程与 JS 引擎线程互斥

由于 JavaScript 是可操纵 DOM 的,如果在修改这些元素属性同时渲染界面(即 JS 线程和 UI 线程同时运行),那么渲染线程前后获得的元素数据就可能不一致了。

因此为了防止渲染出现不可预期的结果,浏览器设置 GUI 渲染线程与 JS 引擎为互斥的关系,当 JS 引擎执行时 GUI 线程会被挂起, GUI 更新则会被保存在一个队列中等到 JS 引擎线程空闲时立即被执行。

JS阻塞页面加载

从上述的互斥关系,可以推导出,JS 如果执行时间过长就会阻塞页面。

譬如,假设 JS 引擎正在进行巨量的计算,此时就算 GUI 有更新,也会被保存到队列中,等待 JS 引擎空闲后执行。 然后,由于巨量计算,所以 JS 引擎很可能很久很久后才能空闲,自然会感觉到巨卡无比。

所以,要尽量避免 JS 执行时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞的感觉。

解决这种问题,除了将运算放在后端,如果避不开,并且巨量计算还和 UI 有关系,那么我的思路就是使用 setTimeout 将任务分割,中间给出一点空闲时间让 JS 引擎去处理下 UI,不至于页面直接卡死。

如果直接决定最低要求 HTML5+ 的版本,那么可以看看下面的 WebWorker

WebWorker, JS的多线程?

前文中有提到 JS 引擎是单线程的,而且 JS 执行时间过长会阻塞页面,那么 JS 就真的对 cpu 密集型计算无能为力么?

所以,后来 HTML5 中支持了Web Worker

MDN 的官方解释是:

Web Worker 为 Web 内容在后台线程中运行脚本提供了一种简单的方法。

线程可以执行任务而不干扰用户界面,一个 worker 是使用一个构造函数创建的一个对象(Worker())运行一个命名的 JavaScript 文件(这个文件包含将在工作线程中运行的代码)。

workers 运行在另一个全局上下文中,不同于当前的 window。

因此,使用 window 快捷方式获取当前全局的范围(而不是 self)在一个 Worker 内将返回错误

这样理解下:

  • 创建 Worker 时,JS 引擎向浏览器申请开一个子线程(子线程是浏览器开的,完全受主线程控制,而且不能操作 DOM
  • JS 引擎线程与 worker 线程间通过特定的方式通信(postMessage API,需要通过序列化对象来与线程交互特定的数据)

所以,如果有非常耗时的工作,请单独开一个 Worker 线程,这样里面不管如何翻天覆地都不会影响 JS 引擎主线程, 只待计算出结果后,将结果通信给主线程即可,perfect!

而且注意下,JS 引擎是单线程的,这一点的本质仍然未改变,Worker 可以理解是浏览器给 JS 引擎开的外挂,专门用来解决那些大量计算问题。

其它,关于 Worker 的详解就不是本文的范畴了,因此不再赘述。

WebWorker与SharedWorker

既然都到了这里,就再提一下 SharedWorker(避免后续将这两个概念搞混)

  • WebWorker 只属于某个页面,不会和其他页面的 Render 进程(浏览器内核进程)共享
    • 所以 Chrome 在 Render 进程中(每一个 Tab 页就是一个 Render 进程)创建一个新的线程来运行 Worker 中的 JavaScript 程序。
  • SharedWorker 是浏览器所有页面共享的,不能采用与 Worker 同样的方式实现,因为它不隶属于某个 Render 进程,可以为多个 Render 进程共享使用
    • 所以 Chrome 浏览器为 SharedWorker 单独创建一个进程来运行 JavaScript 程序,在浏览器中每个相同的 JavaScript 只存在一个 SharedWorker 进程,不管它被创建多少次。

看到这里,应该就很容易明白了,本质上就是进程和线程的区别。SharedWorker 由独立的进程管理,WebWorker 只是属于 Render 进程下的一个线程。

浏览器渲染流程

本来是直接计划开始谈 JS 运行机制的,但想了想,既然上述都一直在谈浏览器,直接跳到 JS 可能再突兀,因此,中间再补充下浏览器的渲染流程(简单版本)

为了简化理解,前期工作直接省略成:

  • 浏览器输入 url,浏览器主进程接管,开一个下载线程,然后进行 http 请求(略去 DNS 查询,IP 寻址等等操作),然后等待响应,获取内容,随后将内容通过 RendererHost 接口转交给 Renderer 进程
  • 浏览器渲染流程开始

浏览器器内核拿到内容后,渲染大概可以划分成以下几个步骤:

  1. 解析 html 建立 dom 树
  2. 解析 css 构建 render 树(将 CSS 代码解析成树形的数据结构,然后结合 DOM 合并成 render 树)
  3. 布局 render 树(Layout/reflow),负责各元素尺寸、位置的计算
  4. 绘制 render 树(paint),绘制页面像素信息
  5. 浏览器会将各层的信息发送给 GPU,GPU 会将各层合成(composite),显示在屏幕上。

所有详细步骤都已经略去,渲染完毕后就是 load 事件了,之后就是自己的 JS 逻辑处理了。

既然略去了一些详细的步骤,那么就提一些可能需要注意的细节把。

这里重绘参考来源中的一张图:

JS运行机制最全面的一次梳理_第3张图片

load事件与DOMContentLoaded事件的先后

上面提到,渲染完毕后会触发 load 事件,那么你能分清楚 load 事件与 DOMContentLoaded 事件的先后么?

很简单,知道它们的定义就可以了:

  • 当 DOMContentLoaded 事件触发时,仅当 DOM 加载完成,不包括样式表,图片,async 脚本等。
  • 当 onload 事件触发时,页面上所有的 DOM,样式表,脚本,图片都已经加载完成了,也就是渲染完毕了

所以,顺序是:DOMContentLoaded -> load

css加载是否会阻塞dom树渲染?

这里说的是头部引入 css 的情况

首先,我们都知道:css 是由单独的下载线程异步下载的。

然后再说下几个现象:

  • css 加载不会阻塞 DOM 树解析(异步加载时 DOM 照常构建)
  • 但会阻塞 render 树渲染(渲染时需等 css 加载完毕,因为 render 树需要 css 信息)

这可能也是浏览器的一种优化机制。

因为你加载 css 的时候,可能会修改下面 DOM 节点的样式,如果 css 加载不阻塞 render 树渲染的话,那么当 css 加载完之后, render 树可能又得重新重绘或者回流了,这就造成了一些没有必要的损耗。

所以干脆就先把 DOM 树的结构先解析完,把可以做的工作做完,然后等你 css 加载完之后, 在根据最终的样式来渲染 render 树,这种做法性能方面确实会比较好一点。

普通图层和复合图层

渲染步骤中就提到了 composite 概念。

可以简单的这样理解,浏览器渲染的图层一般包含两大类:普通图层 以及 复合图层

首先,普通文档流内可以理解为一个复合图层(这里称为 默认复合层,里面不管添加多少元素,其实都是在同一个复合图层中)

其次,absolute 布局(fixed 也一样),虽然可以脱离普通文档流,但它仍然属于 默认复合层

然后,可以通过 硬件加速 的方式,声明一个 新的复合图层,它会单独分配资源 (当然也会脱离普通文档流,这样一来,不管这个复合图层中怎么变化,也不会影响 默认复合层 里的回流重绘)

可以简单理解下:GPU 中,各个复合图层是单独绘制的,所以互不影响,这也是为什么某些场景硬件加速效果一级棒

可以Chrome DevTools --> More Tools --> Rendering --> Layer borders中看到,黄色的就是复合图层信息

如何变成复合图层(硬件加速)

将该元素变成一个复合图层,就是传说中的硬件加速技术

  • 最常用的方式:translate3dtranslateZ
  • opacity 属性/过渡动画(需要动画执行的过程中才会创建合成层,动画没有开始或结束后元素还会回到之前的状态)
  • will-chang 属性(这个比较偏僻),一般配合 opacity 与 translate 使用, 作用是提前告诉浏览器要变化,这样浏览器会开始做一些优化工作(这个最好用完后就释放)
  • 、