JavaScript类型转换原理

本文修改自本人以前写的文章。

从类型说起

js只有7种类型:

  • 原始类型(primitives types)

    • boolean
    • number

      • 包括Infinity和NaN,你可以通过typeof Infinity;来验证
    • string
    • null
    • undefined
    • Symbol (ECMAScript 6 新定义,暂时用不上,这篇文章不讨论)
  • Object 类型

    • js内置了很多对象供你使用,MDN文档列举了所有ES标准定义的内置对象。

js的自动装箱

虽然string是原始类型,但为什么我们好像可以调用“string的函数”呢?

var str = 'I am str';
str.toUpperCase();  // "I AM STR"

原因是js标准库给boolean、number、string分别提供了包装类型:Boolean、Number、String。在需要的时候,原始类型会自动转换成相应的包装对象(这个过程叫自动装箱)。上例的toUpperCase就是String标准对象定义的一个函数。

自动装箱就是临时创建一个包装对象,将原始类型的值封装起来,以便调用包装对象的函数。但是原来那个变量的值不会有任何变化!执行完上面例子的代码之后,str指向的依然是那个原始值:
typeof str;  // "string"

当然,你可以将Boolean 、Number 、String 这三个函数当作构造函数来使用通过手动new包装类来装箱(得到包装对象):

var str_object = new String('I am str_object');  //  手动装箱
str_object.toUpperCase();  //  "I AM STR_OBJECT"
typeof str_object;  //  "object"
这三个函数除了能当作构造函数,还能作为普通函数来调用(得到对应的原始类型值)。在文章的后面,我们会将这三个函数当作普通的函数使用,实现强制类型转换。

两个与类型转换有关的函数:valueOf()和toString()

  • valueOf()的语义是,返回这个对象逻辑上对应的原始类型的值。比如说,String包装对象的valueOf(),应该返回这个对象所包装的字符串。
  • toString()的语义是,返回这个对象的字符串表示。用一个字符串来描述这个对象的内容。

valueOf()和toString()是定义在Object.prototype上的方法,也就是说,所有的对象都会继承到这两个方法。但是在Object.prototype上定义的这两个方法往往不能满足我们的需求(Object.prototype.valueOf()仅仅返回对象本身),因此js的许多内置对象都重写了这两个函数,以实现更适合自身的功能需要(比如说,String.prototype.valueOf就覆盖了在Object.prototype中定义的valueOf)。当我们自定义对象的时候,最好也重写这个方法。重写这个方法时要遵循上面所说的语义。

以下是部分内置对象调用valueOf()的行为:

对象 返回值
Array 数组本身(对象类型)。
Boolean 布尔值(原始类型)。
Date 从 UTC 1970 年 1 月 1 日午夜开始计算,到所封装的日期所经过的毫秒数(原始类型)。
Function 函数本身(对象类型)。
Number 数字值(原始类型)。
Object 对象本身(对象类型)。如果自定义对象没有重写valueOf方法,就会使用它。
String 字符串值(原始类型)。

由上表可见,valueOf()虽然期望返回原始类型的值,但是实际上有一些对象在逻辑上无法找到与之对应的原始值,因此只能返回对象本身。

toString()则不一样,因为不管什么对象,我们总有办法“描述”它,因此js内置对象的toString()总能返回一个原始string类型的值。

var d = new Date();
d.toString()
// "Fri Apr 21 2017 14:54:04 GMT+0800 (中国标准时间)"

我们自己在重写toString()的时候也应该返回合理的string。

valueOf()和toString()经常会在类型转换的时候被js内部调用,比如说我们后文会谈到的ToPrimitive。在自定义对象上合理地覆盖valueOf()和toString(),可以控制自定义对象的类型转换。

js内部用于实现类型转换的4个函数

这4个方法实际上是ECMAScript定义的4个抽象的操作,它们在js内部使用,进行类型转换。我们js的使用者不能直接调用这些函数,但是了解这些函数有利于我们理解js类型转换的原理。

  • ToPrimitive ( input [ , PreferredType ] )
  • ToBoolean ( argument )
  • ToNumber ( argument )
  • ToString ( argument )
请区分这里的ToString()和上文谈到的toString(),一个是js引擎内部使用的函数,另一个是定义在对象上的函数。

ToPrimitive ( input [ , PreferredType ] )

将input转化成一个原始类型的值。PreferredType参数要么不传入,要么是Number 或 String。如果PreferredType参数是Number,ToPrimitive这样执行:

  1. 如果input本身就是原始类型,直接返回input。
  2. 调用input.valueOf(),如果结果是原始类型,则返回这个结果。
  3. 调用input.toString(),如果结果是原始类型,则返回这个结果。
  4. 抛出TypeError异常。

以下是PreferredType不为Number时的执行顺序。

  • 如果PreferredType参数是String,则交换上面这个过程的第2和第3步的顺序,其他执行过程相同。
  • 如果PreferredType参数没有传入

    • 如果input是内置的Date类型,PreferredType 视为String
    • 否则PreferredType 视为 Number
可以看出,ToPrimitive依赖于valueOf和toString的实现。

ToBoolean ( argument )

Argument Type Result
Undefined Return false
Null Return false
Boolean Return argument
Number 仅当argument为 +0, -0, or NaN时, return false; 否则一律 return true
String 仅当argument是空字符串(长度为0)时, return false; 否则一律 return true
Symbol Return true
Object Return true

表格来自ECMAScript标准。
只需要记忆0, null, undefined, NaN, ""返回false就可以了,其他一律返回true。

ToNumber ( argument )

Argument Type Result
Undefined Return NaN
Null Return +0
Boolean 如果 argument 为 true, return 1. 如果 argument 为 false, return +0
Number 直接返回argument
String 将字符串中的内容转化为数字(比如"23"->23),如果转化失败则返回NaN(比如"23a"->NaN)
Symbol 抛出 TypeError 异常
Object primValue = ToPrimitive(argument, Number),再对primValue 使用 ToNumber(primValue)

由上表可见ToNumber的转化并不总是成功,有时会转化成NaN,有时则直接抛出异常。

ToString ( argument )

Argument Type Result
Undefined Return "undefined"
Null Return "null"
Boolean 如果 argument 为 true, return "true".如果 argument 为 false, return "false"
Number 用字符串来表示这个数字
String 直接返回 argument
Symbol 抛出 TypeError 异常
Object 先primValue = ToPrimitive(argument, hint String),再对primValue使用ToString(primValue)

隐式类型转换(自动类型转换)

当js期望得到某种类型的值,而实际在那里的值是其他的类型,就会发生隐式类型转换。系统内部会自动调用我们前面说ToBoolean ( argument )、ToNumber ( argument )、ToString ( argument ),尝试转换成期望的数据类型。

例子1:

if ( !undefined
  && !null
  && !0
  && !NaN
  && !''
) {
  console.log('true');
} // true

例子1:因为在if的括号中,js期望得到boolean的值,所以对括号中每一个值都使用ToBoolean ( argument ),将它们转化成boolean。

例子2:

3 * { valueOf: function () { return 5 } };  //15

例子2:因为在乘号的两端,js期望得到number类型的值,所以对右边的那个对象使用ToNumber ( argument ),得到结果5,再与乘号左边的3相乘。

例子3:

> function returnObject() { return {} }
> 3 * { valueOf: function () { return {} }, toString: function () { return {} } }
// TypeError: Cannot convert object to primitive value

例子3:调用ToNumber ( argument )的过程中,调用了ToPrimitive ( input , Number ),因为在ToPrimitive中valueOf和toString都没有返回原始类型,所以抛出异常。

符号'+'是一个比较棘手的一个符号,因为它既可以表示“算数加法”,也可以表示“字符串拼接”。
简单理解版本:只要'+'两端的任意一个操作数是字符串,那么这个'+'就表示字符串拼接,否则表示算数加法。

12+3
// 15
12+'3'
// "123"

原理理解版本:根据ECMAScript的定义,对'+'运算的求值按照以下过程:

  1. 令lval = 符号左边的值,rval = 符号右边的值
  2. 令lprim = ToPrimitive(lval),rprim = ToPrimitive(rval)
    • 如果lprim和rprim中有任意一个为string类型,将ToString(lprim)和ToString(rprim)的结果做字符串拼接
    • 否则,将ToNumber(lprim)和ToNumber(rprim)的结果做算数加法

根据这个原理可以解释

[]+[]
//  ""
// 提示:ToPrimitive([])返回空字符串

[] + {}
//  "[object Object]"
//  提示:ToPrimitive({})返回"[object Object]"

123 + { toString: function () { return "def" } }
//  "123def"
//  提示:ToPrimitive(加号右边的对象)返回"def"

{} + []
//  0
// 结果不符合我们的预期:"[object Object]"
// 提示:在Chrome中,符号左边的{}被解释成了一个语句块,而不是一个对象
// 注意在别的执行引擎上可能会将{}解释成对象
//  这一行等价于'+[]'
// '+anyValue'等价于Number(anyValue)

({}) + []
//  "[object Object]"
// 加上括号以后,{}被解释成了一个对象,结果符合我们的预期了
'<'、'>'的情况与'+'类似,但是处理方式与'+'有些不同。如果好奇请自行查阅 文档。

显式类型转换(强制类型转换)

程序员显式调用Boolean(value)、Number(value)、String(value)完成的类型转换,叫做显示类型转换。
我们在文章的前面说过new Boolean(value)、new Number(value)、new String(value)传入各自对应的原始类型的值,可以实现“装箱”——将原始类型封装成一个对象。其实这三个函数不仅仅可以当作构造函数,它们可以直接当作普通的函数来使用,将任何类型的参数转化成原始类型的值:

Boolean('sdfsd');  //  true
Number("23");  //  23
String({a:24});  //  "[object Object]"

其实这三个函数用于类型转换的时候,调用的就是js内部的ToBoolean ( argument )、ToNumber ( argument )、ToString ( argument )方法!

这里解释一下String({a:24}); // "[object Object]"的过程:

  • 执行String({a:24})

    • 执行js内部函数ToString ( {a:24} )

      • 执行primValue = ToPrimitive({a:24}, hint String)

        1. 因为{a:24}不是原始类型,进入下一步。
        2. 在ToPrimitive内调用({a:24}).toString(),返回了原始值"[object Object]",因此直接返回这个字符串,ToPrimitive后面的步骤不用进行下去了。
      • primValue被赋值为ToPrimitive的返回值:"[object Object]"
      • 执行js内部函数ToString ( "[object Object]" ),返回"[object Object]"
      • 返回"[object Object]"
    • 返回"[object Object]"
  • 返回"[object Object]"
为了防止出现意料之外的结果, 最好在不确定的地方使用显式类型转换

参考文章:
ECMAScript类型转换规范
Object to primitive conversion
What is {} + {} in JavaScript?
JavaScript quirk 1: implicit conversion of values
Object.prototype.toString()的原理 - ECMAScript
改变Object.prototype.toString.call(myClass)的输出
比较操作符的类型转换

你可能感兴趣的:(javascript,前端)