前言
在说一个概念前,我们需要确定它的前提,此文以 ECMAScript5 为基础撰写
一句话解释
词法环境就是在 JavaScript 代码编译阶段记录变量声明、函数声明、函数声明的形参的合集
JavaScript 的编译过程
在介绍词法环境前,我们先看下在 V8 里 JavaScript 的编译执行过程,大致分为三个阶段
第一步:V8 引擎刚拿到
执行上下文
的时候,会把代码从上到下一行一行的先做分词/词法分析(Tokenizing/Lexing)。分词是指:比如var a = 2;
这段代码,会被分词为:var
a
2
和;
这样的原子符号(atomic token);词法分析是指:登记变量声明、函数声明、函数声明的形参第二步:在分词结束以后,会做代码解析,引擎将 token 解析翻译成一个 AST(抽象语法树), 在这一步的时候,如果发现语法错误,就会直接报错不会再往下执行
第三步:引擎生成 CPU 可以执行的机器码
在第一步里有个词法分析,它用来登记变量声明、函数声明、函数声明的形参,后续代码执行的时候就知道去哪里拿变量的值和函数了,这个登记的地方就是
Lexical Environment(词法环境)
总结一下:引擎会在解释 JavaScript 代码之前首先对其进行编译。编译器的一部分工作就是找到所有的声明,并用合适的作用域将它们关联起来
我们先升到一万米高空,看一下整个 JavaScript 的执行生命周期
JavaScript 的执行生命周期分成两个阶段,编译阶段和执行阶段
编译阶段由编译器完成,它将代码翻译成可执行代码,这个阶段能知道全部标识符在哪里、如何声明的以及作用域规则
- 编译阶段进行变量声明
- 编译阶段变量声明进行提升,但是指为 undefined
- 编译阶段所有非表达式的函数声明进行提升
代码执行阶段即执行可运行代码,生成执行上下文,这部分由引擎完成
- 负责
变量赋值
,函数引用
以及执行代码
- 负责
(PS:对 JavaScript 而言,大部分情况下编译发生在代码执行前的几微秒)
我们要说的 词法环境
就是在编译阶段负责收集的”容器“
注意:JavaScript 采用的是词法作用域(静态作用域),所以词法环境是与我们所写的代码结构相对应,换句话说,我们将代码写成什么样,词法环境就是怎么样子。词法环境是在代码定义的时候决定的,跟代码在哪里调用没有关系。
词法环境由什么组成
词法环境的内部有两部分组成:环境记录器(Environment Record)、对外部环境的引用(outer)
- 环境记录器记录存储变量、函数声明以及函数声明的形参
- 外部环境的引用意味着它可以访问其父级词法环境(作用域)
环境记录器又分为两种
- 声明式环境记录(Declarative Environment Record):用来记录直接有标识符定义的元素,比如变量、常量、let、class、module、import 以及函数声明。
- 对象式环境记录(Object Environment Record):主要用于 with 和 global 的词法环境。
其中 声明式环境记录(Declarative Environment Record),又分为两种类型:
- 函数环境记录(Function Environment Record):用于函数作用域。
- 模块环境记录(Module Environment Record):模块环境记录用于体现一个模块的外部作用域,即模块 export 所在环境。
我们做一个分类图,更加具象地认识词法环境所包含的东西
环境记录器很好理解,无非就是变量集合,那什么是 outer 呢
在之前介绍 作用域 的文章中我们曾经总结过:JavaScript 的作用域是词法作用域,它由函数在那里定义有关
而 outer 就是指向词法环境的父级词法环境(作用域)
我们举个例子来看一下词法环境的构成元素:
var a = 1;
function foo() {
console.log(a);
function bar() {
var b = 2;
console.log(a * b);
}
bar();
}
function baz() {
var a = 10;
foo();
}
baz();
它的词法作用域关系图如下:
更加具象的关系图如下:
我们也可以用伪代码来模拟上面代码的词法环境:
// 全局词法环境
GlobalEnvironment = {
outer: null, // 全局环境的外部环境引用为null
GlobalEnvironmentRecord: {
// 全局 this 绑定指向全局对象
[[GlobalThisValue]]: ObjectEnvironmentRecord[[BindingObject]],
// 声明式环境记录,除了全局函数和 var ,其他声明都绑定在这里
DeclarativeEnvironmentRecord: {},
// 对象式环境记录,绑定对象为全局对象
ObjectEnvironmentRecord: {
a: 1,
foo: << function >>,
baz: << function >>,
isNaN: << function >>,
isFinite: << function>>,
parseInt: << function>>,
parseFloat: << function>>,
Array: << construct function>>,
Object: << construct function>>,
...
}
}
}
//foo 函数的词法环境
fooFunctionEnvironment = {
outer: GlobalEnvironment, // 外部词法环境引用全局环境
FunctionEnvironmentRecord: {
[[ThisValue]]: GlobalEnviroment, // this绑定指向全局环境
bar: << function >>
}
}
// bar 函数的词法环境
barFunctionEnvironment = {
outer: fooFunctionEnviroment, // 外部词法环境引用foo函数词法环境
FunctionEnvironmentRecord: {
[[ThisValue]]: GlobalEnviroment, // this绑定指向全局环境
b: 2
}
}
// baz 函数的词法环境
bazFunctionEnvironment = {
outer: GlobalEviroment, // 外部词法环境引用指向全局环境
FuntionEnvironmentRecord: {
[[ThisValue]]: GlobalEnviroment, // this绑定指向全局环境
a: 10
}
}
我们可以看出词法环境的两个重要组成部分,其中 outer 由作用域决定,环境记录器记录所有的变量,当在本词法环境中找不到变量时,就会引着 outer 往父级词法环境中找变量,这就形成了作用域链
变量提升及函数提升
就像我们之前所说,在编译阶段,包括变量和函数在内的所有声明都会在任何代码被执行前首先处理
当你看到 var a = 1;
时,可能会认为这是一个声明。但 JavaScript 实际上会将其看成两个意思:var a = undefined;
和 a = 2;
。第一个定义声明在编译阶段进行,第二个赋值声明会被留在原地等待执行阶段
举个例子:
var a = 1;
var b = true;
function foo() {
console.log(a);
}
foo();
在代码执行之前,即编译阶段:
a = undefined;
b = undefined;
foo = function () {
console.log(a);
};
执行阶段:
a = 1;
b = true;
foo = function () {
console.log(a);
};
函数优先
函数声明和变量声明都会被提升。但是这个值得注意的细节是函数的优先级大于变量
例如下面的代码:
foo();
var foo;
function foo() {
console.log(1);
}
foo = function () {
console.log(2);
};
答案
输出 1 而不是 undefined 或者 2
这段代码会被引起理解为如下形式:
function foo() {
console.log(1);
}
// var foo 被忽略
foo(); // 1
foo = function () {
console.log(2);
};
注意,var foo 尽管出现在 function foo() ... 的声明之前,但函数声明的优先级大于变量提升,即使它写在函数前面,但是还是会以函数为依据展示(变量被忽略)
foo();
function foo() {
console.log(1);
}
var foo = function () {
console.log(2);
};
function foo() {
console.log(3);
}
答案
输出 3
说到函数声明和变量声明,我们可以举出很多例子,例如这个例子
function bar() {
console.log('bar1');
}
var bar = function () {
console.log('bar2');
};
bar();
答案
bar2
调换顺序呢:
var bar = function () {
console.log('bar2');
};
function bar() {
console.log('bar1');
}
bar();
答案
bar2
本质上这些题目绕不开之前俺们说的原理:编译阶段进行函数、变量提升,执行阶段在原处执行代码。在编译阶段函数 bar
提升,执行阶段,bar 赋值给 function() {...},输出结果 bar2
var、let、const、function 等都会被提升(hoist),只是 let、const 不会被初始化,所以提前使用会报 ReferenceError
总结
我们介绍了词法环境,从它是怎么产生,到它是什么(由什么组成),再到后面的函数、变量提升
了解词法环境为是我们下一节—— 执行上下文与调用栈(后续文章更新)打下了基础
参考资料
- 理解 JavaScript 中的执行上下文和执行栈
- JS:深入理解 JavaScript-词法环境
- 书:你不知道的 JavaScript(上卷)
系列文章
- 深入理解JavaScript——开篇
- 深入理解JavaScript——JavaScript 是什么
- 深入理解JavaScript——JavaScript 由什么组成
- 深入理解JavaScript——一切皆对象
- 深入理解JavaScript——Object(对象)
- 深入理解JavaScript——new 做了什么
- 深入理解JavaScript——Object.create
- 深入理解JavaScript——拷贝的秘密
- 深入理解JavaScript——原型
- 深入理解JavaScript——继承
- 深入理解JavaScript——JavaScript 中的始皇
- 深入理解JavaScript——instanceof——找祖籍
- 深入理解JavaScript——Function
- 深入理解JavaScript——作用域
- 深入理解JavaScript——this关键字
- 深入理解JavaScript——call、apply、bind三大将
- 深入理解JavaScript——立即执行函数(IIFE)