这篇文章通过四种方式获取Javascript中的数据类型:通过隐藏的内置[[Class]]属性;通过typeof运算符;通过instanceof运算符;通过函数Array.isArray().我们也会看看原型对象的构造函数,可能会有意想不到的数据类型结果。
[这篇文章是我在adobe发布的文章,我发布在这里只是为了存档。]
在开始我们的话题之前,我们不得不复习一些所需的知识点
1.1 原始值和对象
Javascript中的数据,要么是原始值,要么是对象。
原始值。下面是原始值:
原始值是不变的,你不能给它们添加属性:
> var str = "abc";
> str.foo = 123; // try to add property "foo”
123
> str.foo // no change
undefined
原始值是通过数值进行比较的,如果它们有相同的内容就认为相等。
> ‘abc’ === ‘abc’ true
对象。所有非原始值都是对象。对象是可变的:
> var obj = {}; > obj.foo = 123; // try to add property “foo” 123 > obj.foo // property "foo" has been added 123
对象是通过引用进行比较的。每一个对象都有各自的特性,两个对象只有是同一个对象,才会被认为是相等的。
> {} === {} false > var obj = {}; > obj === obj true
对象封装类型。基本数据类型boolean、number和string都有各自对应的Boolean Number String对象封装类型。与原始值不同,后者都是对象的实例。它们的封装形式是:
> typeof new String("abc") 'object' > typeof "abc" 'string' > new String("abc") === "abc" false
对象封装类型很少被直接使用,但是它们的原型对象定义了原始值的方法。如:String.prototype是封装类型String的原型对象。它所有的方法对string也可用,原始值同样拥有String.prototype.indexOf,并不是不同的方法使用相同的名称,相同的方法是:
> String.prototype.indexOf === "".indexOf true
1.2 内部属性
Javascript中内部属性不能直接访问,但是它影响程序的运行。内部属性的名称以大写字母开始,并且写在双层方括号中。如:[[Extensible]]是一个布尔型的标志,决定对象是否可以扩展属性。它的值可以通过Object.isEntensible()间接的获取它的值,Object.preventExtensions()可以设置它的值为false。一旦变成false之后,就无法再变成true了。
1.3 术语:原型和原型对象
在Javascript中,原型拥有多重含义:
1. 一方面,是原型对象之间的关系。每一个对象都有一个隐藏属性[[Porototype]],指向它的原型对象或者是null。对象的原型是一个延续,如果一个属性无法在对象中找到,可以追溯到它的原型上查找。多个对象可以有相同的对象。
2. 另一方面,如果一个类型是由构造函数Foo实现的,那么这个构造函数有一个原型对象Foo.prototype,保存类型的原型对象。
为了很好的区分,我们写了关于原型(1)和原型对象(2)的例子。三种方法帮助我们处理原型:
> Object.getPrototypeOf({}) === Object.prototype true
> Object.create(Object.prototype) {}
Object.create()可以做的更多,但是超出了这篇文章的范围。
> Object.prototype.isPrototypeOf({}) true
1.4 constructor属性
实现一个构造函数Foo,它的原型Foo.prototype拥有一个属性Foo.prototype.constructor指向构造函数Foo。每个函数都有自动设置这个属性。
> function Foo() { } > Foo.prototype.constructor === Foo true > RegExp.prototype.constructor === RegExp true
所有构造函数的实例,继承原型对象上的所有属性,我们可以确定一个实例的构造函数。
> new Foo().constructor [Function: Foo] > /abc/.constructor [Function: RegExp]
2. 数据的类型
我们可以通过四种方式获取数据类型:
2.1 [[Class]]
[[Class]]是一个内部属性,它的值有:
"Arguments", "Array", "Boolean", "Date", "Error", "Function", "JSON", "Math", "Number", "Object", RegExp", “String"
Javascript只能通过toString()方法(Object.prototype.toString())获取。这个方法是通用的,返回:
如:
> Object.prototype.toString.call(undefined) '[object Undefined]' > Object.prototype.toString.call(Math) '[object Math]' > Object.prototype.toString.call({}) '[object Object]’
因此,下面的函数返回[[Class]]的值是x
function getClass(x) { var str = Object.prototype.toString.call(x); return /^\[object (.*)\]$/.exec(str)[1]; }
下面是一些应用:
> getClass(null) 'Null' > getClass({}) 'Object' > getClass([]) 'Array' > getClass(JSON) 'JSON' > (function () { return getClass(arguments) }()) 'Arguments' > function Foo() {} > getClass(new Foo()) ‘Object'
2.2 typeof
typeof对原始值进行分类,可以帮助我们区分原始值和对象。
typeof value
下面是一些值和结果的对照关系:
值 |
结果 |
undefined |
“undeifined" |
null |
“object" |
Boolean |
“boolean" |
Number |
“number" |
String |
“string" |
Function |
“function" |
其他值 |
“object" |
typeof null返回object是一个bug,但是不能修复,因为它会破坏现在存在的代码。注意,function也是一个对象,但是typeof做了区分,Array也是一个对象。
2.3 instanceof
instanceof检测值是不是一个构造函数的实例:
value instanceof Type
这个操作符看起来像Type.prototype,检测原型链是否有value。如果我们自己实现的话,就像下面这个样子(会有一些错误,比如说null):
function myInstanceof(value, Type) { return Type.prototype.isPrototypeOf(value); }
原始值使用instanceof都会返回false
> "" instanceof String false > "" instanceof Object false
2.4 Array.isArray()
Array.isArray()这个方法存在是因为浏览器的一个特殊的问题:每一个frame都有一个自己的运行环境。如:现在存在frame A和frame B(每一都有自己的document)。通过frame A 传递参数给frame B,frame B中不能通过instanceof判断,传递的参数是不是array。因为frame A中的Array和frame B中Array(array是它的一个实例)并不是同一个。
<html> <head> <script> // test() is called from the iframe function test(arr) { var iframeWin = frames[0]; console.log(arr instanceof Array); // false console.log(arr instanceof iframeWin.Array); // true console.log(Array.isArray(arr)); // true } </script> </head> <body> <iframe></iframe> <script> // Fill the iframe var iframeWin = frames[0]; iframeWin.document.write( '<script>window.parent.test([])</'+'script>'); </script> </body> </html>
因此,ES5中Array.isArray()使用[[Class]]来检查一个值是不是数组。它的意图是使JSON.stringify()更安全,instanceof的问题存在于各个类型中
3. 内置的原型对象
原型对象的内置类型是奇怪的值:他们都是原始的值,而不是实例。这就导致分类很诡异。为了摸清这个诡异的现象,我们需要深入理解分类。
3.1 Object.prototype
Object.prototype看起来更像是一个空对象:不存在任何可以枚举的属性(它的所有方法都是不可枚举的)。
> Object.prototype {} > Object.keys(Object.prototype) []
Object.prototype是一个对象,但是不是Object函数的实例。一方面,通过typeof和[[Class]]得到它是一个对象。
> getClass(Object.prototype) 'Object' > typeof Object.prototype ‘object'
另一方面,instanceof不认为它是Object的实例。
> Object.prototype instanceof Object false
为了让上面的结果变成true,Object.prototype必须在它的原型链上,这样就会原型链上形成一个死循环。这就是为什么Object.prototype没有prototype属性了,它是唯一一个内置对象。
> Object.getPrototypeOf(Object.prototype) null
这是所有内置对象的一个悖论:它算是实例类型但不是instanceof。
[[Class]], typeof and instanceof 在其他对象上是适用的:
> getClass({}) 'Object' > typeof {} 'object' > {} instanceof Object true
3.2 Function.prototype
Function.prototype是它的函数本身,接受任何的参数都返回undefined:
> Function.prototype("a", "b", 1, 2) undefined
Function.prototype是一个函数,但是不是Function的实例: 一方面, typeof Function.prototype的结果是一个函数:
> typeof Function.prototype
'function'
通过内部属性[[Class]]结果也一样:
> getClass(Function.prototype) 'Function'
另一方面, instanceof表明Function.prototype不是Function实例。
> Function.prototype instanceof Function false
这就是为什么Function.prototype没有存在它的原型链上. 相反, 它的原型是Object.prototype:
> Object.getPrototypeOf(Function.prototype) === Object.prototype true
其他函数没有什么特别的:
> typeof function () {} 'function' > getClass(function () {}) 'Function' > function () {} instanceof Function true
任何场景下,Function还是Function
> typeof Function 'function' > getClass(Function) 'Function' > Function instanceof Function true
3.3 Array.prototype
Array.prototype是一个空数组:它的长度是0.
> Array.prototype [] > Array.prototype.length 0
[[Class]]也认为它是array:
> getClass(Array.prototype) ‘Array'
Array.isArray()也是这样的,因为它是基于[[Class]]实现的:
> Array.isArray(Array.prototype) true
自然而然,instanceof不是这样的:
> Array.prototype instanceof Array false
在这个章节我们不会提醒y原型对象不是他们构造函数的实例。
3.4 RegExp.prototype
RegExp.prototype是一个匹配任何东西的正则表达式:
> RegExp.prototype.test("abc") true > RegExp.prototype.test("") true
RegExp.prototype也可以使用String.prototype.match通过[[Class]],检测参数是不是一个正则表达式. 检测结果如下:
> getClass(/abc/) 'RegExp' > getClass(RegExp.prototype) 'RegExp'
空的正则表达式. RegExp.prototype和“空正则表达式”相等。 可以通过一下两种方式实现:
new RegExp("") // constructor 构造函数 /(?:)/ // literal 字面量
如果你想动态的生成一个正则表达式,只能通过构造函数才能创建。通过字面量的方式创建一个空的正则表达式,如: // 是不能直接使用的。应该是用(?:)空的非捕捉分组来实现空的正则表达式。
> new RegExp("").exec("abc") [ '', index: 0, input: 'abc' ] > /(?:)/.exec("abc") [ '', index: 0, input: 'abc' ]
比较发现,空的分组不仅可以完成匹配,并且可以捕捉分组一中:
> /()/.exec("abc") [ '', // index 0 '', // index 1 index: 0, input: 'abc’ ]
有意思的是,空正则表达式不管是构造函数形式的还是RegExp.prototype形式的,它们最终的展现结果都是字面量:
> new RegExp("") /(?:)/ > RegExp.prototype /(?:)/
3.5 Date.prototype
Date.prototype也是date类型: > getClass(new Date()) 'Date' > getClass(Date.prototype) 'Date'
日期是数字. 在ES5.1中的描述是这样的:
A Date object contains a Number indicating a particular instant in time to within a millisecond. Such a Number is called a time value. A time value may also be NaN, indicating that the Date object does not represent a specific instant of time. Time is measured in ECMAScript in milliseconds since 01 January, 1970 UTC.
两种方式可以获取日期的时间戳,一种是通过调用valueof()方法,一种是调用Number函数:
> var d = new Date(); // now > d.valueOf() 1347035199049 > Number(d) 1347035199049
Date.prototype的时间戳是NaN:
> Date.prototype.valueOf()
NaN
> Number(Date.prototype)
NaN
Date.prototype是一个非法的日期, 好像是同过NAN创建的一样:
> Date.prototype Invalid Date > new Date(NaN) Invalid Date
3.6 Number.prototype
Number.prototype的值和new Number(0)是一样的:
> Number.prototype.valueOf() 0 转换成数字的话,返回基本数据类型: > +Number.prototype 0 比较: > +new Number(0) 0
3.7 String.prototype
String.prototype和new String("")的值是一样的:
> String.prototype.valueOf() '' 转化为字符串的话,返回基本数据类型: > "" + String.prototype '' 比较: > "" + new String("") ''
3.8 Boolean.prototype
Boolean.prototype和new Boolean(false)的值是一样的:
> Boolean.prototype.valueOf() false
布尔对象可以转化为布尔值,但是所有的结果都是true,因为对象转换成布尔值都是true。
> !!Boolean.prototype true > !!new Boolean(false) true > !!new Boolean(true) true
这个对象转化成数字或者字符串不同:如果对象封装了原始值,那么转换结果就是封装的原始值。
译者注:比如我使用Object实例化一个数字,我会这么操作:
> new Object(1); Number {[[PrimitiveValue]]: 1} //这就是上面所有的,被封装过的原始值
4. 推荐
本节给出了很多建议,怎么能最好的区分Javascript中的数据类型。
4.1 把原型对象作为原始类型的成员
一个原型对象总是一个原始类型的成员吗?不,这仅仅适用于内置的类型。一般而言,原型对象的行为很神奇,最好是把它们作为模拟类:它们包含所有实例共享的属性(通常方法)。
4.2 使用哪个分类机制
当决定如何最好的使用Javascript中分类机制,必须区分正常的代码和不同frame的代码。
普通代码:在普通代码中,使用typeof或者instanceof,而不是[[Class]]和Array.isArray()。你必须清楚的知道typeof的特殊结果:null的结果是object,有两个非原始值的分类:function和object。如判断一个函数是不是一个对象可以通过下面的方式:
function isObject(v) { return (typeof v === "object" && v !== null) || typeof v === "function"; }
尝试:
> isObject({}) true > isObject([]) true > isObject("") false > isObject(undefined) false
代码跨frame传递:如果接收其他frame传递的值,那么使用instanceof就不再可用了,必须考虑使用[[Class]]或者是Array.isArray()。另外一个选择就是获得构造函数名,但是这个也不是很靠谱:不是所有的对象都有构造函数,也不是所有的构造函数都有名称。下面是如何获得构造函数的名称:
function getConstructorName(obj) { if (obj.constructor && obj.constructor.name) { return obj.constructor.name; } else { return ""; } }
另外需要指出的是,函数的name属性(obj.constructor)不是一个标准,如:IE浏览器就不支持。
尝试:
> getConstructorName({}) 'Object' > getConstructorName([]) 'Array' > getConstructorName(/abc/) 'RegExp' > function Foo() {} > getConstructorName(new Foo()) 'Foo'
如果对原始值使用getConstructorName方法的话,它的值是该类型对应的构造函数:
> getConstructorName("") 'String'
那是因为原始值获取了原型对象上的constructor属性:
> "".constructor === String.prototype.constructor true
5. 下一步读些什么
通过这篇文章知道Javascript中,怎么对数据进行分类。不幸的是,为了能够正确的执行,需要了解一些详细的知识。作为两个主要的分类是有缺陷的:typeof null是object,instanceof不能跨frame。文章也介绍了解决缺陷的建议。
下一步,需要进一步了解Javascript的继承,下面的四篇博客可以作为入门: