【翻译】JavaScript中的作用域和声明提前

原文:http://www.adequatelygood.com/JavaScript-Scoping-and-Hoisting.html

===翻译开始===

你知道下面的JavaScript脚本执行结果是什么吗?

1 var foo=1;

2 function bar(){

3     if(!foo){

4         var foo=10;

5     }

6     alert(foo);

7 }

8 bar();

如果你对弹出的结果是"10"感到惊讶的话,那么下面这段脚本会让你晕头转向的:

1 var a=1;

2 function b(){

3     a=10;

4     return ;

5     function a(){};

6 }

7 b();

8 alert(a);

浏览器会弹出"1",这到底是怎么回事呢?这看起来很奇怪,事实上这恰好是语言的一个强大而又富有表现力的特性。我不知道这种特别的行为是否有一个标准的命名,但我喜欢把它叫做"hoisting"。接下来我会试着分析一下这种机制,但是我们有必要先理解一下JavaScript的作用域。

JavaScript中的作用域

对于JavaScript初学者来说,作用域常让他们感到困惑。事实上,一些资深的JavaScript开发者也不是完全理解作用域。JavaScript的作用域之所以让人如此困惑,因为它跟C系语言有点相似,请看下面的C程序:

 1 #include <stdio.h>

 2 int main(){

 3     int x=1;

 4     printf("%d\n",x);//1

 5     if(1){

 6         int x=2;

 7         printf("%d\n",x);//2

 8     }

 9     printf("%d\n",x);//1

10 }

程序会依次输出1,2,1,这是因为C系语言有块级作用域。当程序运行到一个程序块的时候(比如if语句),在该程序块里定义的新变量不会影响到外部作用域。但在JavsScript中却不相同,试着执行下面的脚本:

1 var x=1;

2 console.log(x);//1

3 if(true){

4     var x=2;

5     console.log(x);//2

6 }

7 console.log(x);//2

脚本执行后会依次输出1,2,2,这是因为JavsScript只有函数级作用域,这和C系语言有着根本的不同,程序块(比如if语句)是不会创建新的作用域的,只有函数才会。

对于一些使用C、C++、C#或者Java语言的开发者来说,这简直让人难以接受。还好JavaScript的函数足够灵活,可以用其它变通方法。如果你一定要在函数内创建一个临时的作用域,可以这样做:

 1 function foo(){

 2     var x=1;

 3     if(x){

 4         (function(){

 5             var x=2;

 6             //some other code

 7         }());

 8     }

 9     //x is still 1.

10 }

这个方法相当灵活,在任何需要的地方都可以使用,不止在块语句里。但是我强烈建议你花一些时间来真正理解和欣赏JavaScript的作用域,这是我最喜欢的语言特性之一,它真的非常强大。如果你理解了作用域,那么对于声明提前你会更容易理解。

声明,变量名,声明提前

在JavaScript中,一个变量可以通过以下四种方式之一进入作用域:

1、语言内置:所有作用域都默认包含"this"和"arguments"变量。

2、函数形参:函数可以拥有形参,所属作用域就是该函数体。

3、函数声明:形如"function foo(){}"的声明。

4、变量声明:形如"var foo;"的声明。

函数声明和变量声明总会被JavaScript解释器自动放到所属作用域的顶端,函数参数和语言内置的变量默认都是在最顶端。举个例子,有如下代码:

1 function foo(){

2     bar();

3     var x=1;

4 }

被解析器解析后变为:

1 function foo(){

2     var x;

3     bar();

4     x=1;

5 }

这说明了,无论声明语句放在哪里都会被执行,比如说下面两个函数,它们是相等的:

 1 function foo(){

 2     if(false){

 3         var x=1;

 4     }

 5     return;

 6     var y=1;

 7 }

 8 

 9 function foo(){

10     var x,y;

11     if(false){

12         x=1;

13     }

14     return;

15     y=1;

16 }

要注意的是,有时声明和赋值会写在一起,但是赋值部分并没有被提前,只有声明被提前了。函数声明就有些特别了,整个函数体也会被提前。但是不要忘了函数声明有两种方式,请看下面的代码:

 1 function test(){

 2     foo(); //TypeError "foo is not a function"

 3     bar(); //"this will run!"

 4     var foo=function(){ //function expression assigned to local variable "foo"

 5         alert('this won't run!');

 6     };

 7     function bar(){//function declaration,given the name 

 8         alert('this will run!');

 9     }

10 }

11 test();

在这个例子里,只有使用函数声明的函数体会被提前至顶端,而使用函数表达式赋值方式,只有名字"foo"被提前至顶端,函数体是没有的。

上面的例子基本覆盖了自动提前的情况,看起来并不是那么复杂让人迷惑。当然,一些其它比较特别的例子还是有一些复杂的。

变量识别顺序

我们要特别记住变量的识别顺序,前面说过变量名进入作用域有四种方式,我上面列举的顺序就是它们被识别的顺序。通常,如果一个变量名已经定义了,那么它就不会被其它相同名称的变量所覆盖。这意味着函数声明比变量声明优先级高,但这并不影响赋值操作,只是声明部分会被忽略而已。

PS:补充一段代码,表达作者的意思

function foo(){}

var foo=3;

console.log(foo);//3



这段代码会被解析为:

function foo(){}

//var foo; //这条语句就被忽略了

foo=3;

console.log(foo);



依我理解是这样子:

var foo;

foo=function foo(){}

foo=3;

console.log(foo);

接着原文,以下是几种特别情况:

1、内置的变量"arguments"表现比较奇怪,它好像定义在函数形参和函数声明之间。这意味着如果形参中有个变量为"arguments",那么它的优先级将高于内置的"arguments",即使它是undefined。这不是一个好的特性,不要使用"arguments"作为形参变量名。

2、使用"this"作为一个标识符会引起语法错误,这是一个好的特性。

3、如果多个形参中出现同名,那么最后一个将拥有最高的优先级,即使它是undefined。

带有名字的函数表达式

你也可以给函数表达式中的函数起个名字,采用类似函数声明的语法。但这并不能使它变成一个函数声明,并且这个函数名不会被添加到作用域,函数体也不会被提前至顶端,下面用一些代码来演示我说的意思:

 1 foo(); //TypeError "undefined is not a function"

 2 bar(); //valid

 3 baz(); //TypeError "undefined is not a function"

 4 spam();//ReferenceError "spam is not defined"

 5 

 6 var foo=function(){}; //anonymous function expression('foo' get hoisted)

 7 function bar(){};     //function declaration ('bar' and the function body get hoisted)

 8 var baz=function spam(){};//named function expression('only 'baz' get hoisted)

 9 

10 foo(); //valid

11 bar(); //valid

12 baz(); //valid

13 spam();//ReferenceError "spam is not defined"

怎么利用这些知识编程

现在你已经理解作用域和声明提前特性了,那么这些在JavaScript编程中有什么影响?最重要的是声明变量时要使用"var"关键字,我强烈建议你在每个作用域的顶端只写一个var语句(多变量的时候,用逗号连接)。如果你强制自己这样做,就不会对声明提升产生困惑了。不过,这么做会让你在当前作用域中寻找已经声明的变量变得更困难,我建议使用"JSLint"的"onevar"选项来验证代码,如果你照做了,你的代码看起来会像这样子:

1 /*jslint onevar: true [...]*/

2 function foo(a,b,c){

3     var x=1,

4         bar,

5         baz="something";

6 }

看看规范怎么说

我发现经常查阅ECMAScript规范文档有助于直接理解这些机制是怎么运行的,以下是规范对于变量声明和作用域的描述:

1 如果变量声明语句在函数声明里面,那么变量就是定义在函数内部作用域(参考章节10.1.3),否则它们就是定义在全局作用域内(作为全局对象的成员变量,参考章节10.1.3)。变量进入作用域的时候就会被创建,块语句不会定义一个新的执行作用域,只有程序和函数声明会产生新的作用域。变量在创建的时候会被初始化为"undefined",一个带有初始化语句的变量,在赋值语句执行的时候才会被赋上其赋值表达式对应的值,并不是变量创建的时候就赋值。

我希望这篇文章能够帮助JavaScript开发者理清一些困惑的问题,我已经尽可能的彻底把问题讲清楚,以免造成更多的疑惑。如果你发现我写错了或者遗漏了某些重要的东西,请一定让我知道。

===翻译完===

翻译参考:http://ju.outofmemory.cn/entry/85659

以下是一个例子:

 1 var x=0;

 2 var f=function(){

 3     x=1;

 4 }

 5 f();

 6 console.log(x);

 7 function f(){

 8     x=2;

 9 }

10 f();

11 console.log(x);

 

你可能感兴趣的:(JavaScript)