第八条 :理解“对象等同性”这一概念
根据“等同性“(equality)来比较对象是一个非常有用的功能。
不过按照”==“操作符比较出来的结果未必是我们想要的,因为该操作比较的是两个指针本身,而不是其所指的对象。应该使用NSObject协议中声明的”isEqual“:方法来判断两个对象的等同性。
一般来说,两个类型不同的对象总是不相等(unequal)。某些对象提供了特殊的”等同性判断方法“,如果已经知道两个受测对象都属于同一类,那么就可以使用这种方法。
NSString类实现了一个自己独有的等同性判断方法,名叫“isEqualToString:”。传递给该方法的对象必须是NSString。调用该方法比调用“isEqual”方法快。因为isEqual方法不知道受测对象的类型。
NSObject协议中有两个用于判断等同行的方法:
-(BOOL)isEqual:(id)object;
-(NSUInteger)hash;
NSObject类对这两个方法的默认实现是:当且仅当“指针值”(pointer value)完全相等时,这两个对象才相等。若想在自定义的对象中,正确复写这些方法,就必须先理解其约定(contract)。
如果isEqual:方法判定两个对象相等,那么其hash也必须返回同一个值。
但是,如果两个对象的hash方法返回同一个值,那么“isEqual:”方法未必会认为两者相等。
collection:array、dictionary、set等数据结构的总称
collection在检索hash表时,会用对象的哈希码做索引。假如某个collection是用set实现的,那么set可能会根据哈希码把对象分装到不同的数组中。在向set中添加对象时,要根据其哈希码找到与之相关的的那个数组,依次检查各个元素,看数组中已有的对象是否和将要添加的对象相等。如果相等,那就说明将要添加的对象已经在set中了。如果令每个对象都返回hash码,那么必然会产生性能问题。
hash方法也可以这样来实现:
将NSString对象中的所有属性都放在一个字符串中,然后领hash方法返回该字符串的hash码。这样做也符合约定,两个相同对象会返回相同的hash码。
但是这样做还需负担创建字符串的开销,所以比返回单一值要慢。
把这种对象放入collection中也会产生性能问题,因为想要添加对象,必须先计算其hash码。
另一种计算hash码的办法:
-(NSUInteger)hash{
NSUInteger firstNameHash = [_firstName hash];
NSUInteger lastNameHash = [_lastName hash];
NSUInteger ageHash = _age;
return firstNameHash ^ lastNameHash ^ ageHash;
}
这种做法既能保持高效,又能使生成的hash码至少位于一定范围内,而不会过于频繁的重复。
当然,这种算法生成的hash码还是会碰撞(collision),不过至少可以保证hash码有多种可能的取值。
特定类所具有的等同性判定方法
如果某些特定类需要经常判断等同性,那么可能需要自己来创建等同性判定方法,因为无须检测参数类型,所以能大大提升检测速度。
在编写判定方法时,也应一并复写“isEqual”方法。后者的常见实现方法为:如果受测的参数与接收该消息的对象都属于同一个类,那么就调用自己写的判定方法,否则就交由超类来判断。
等同性判定的执行深度
创建等同性判定方法时,需要决定是根据整个对象来判断等同性,还是仅根据其中几个字段来判断。
例如:NSArray的检测方式为先看两个数组所含对象的个数是否相同,若相同,则在每个对应位置的两个对象身上调用其“isEqual:”方法。如果对应位置上的对象均相等,那么这两个数组就相等,这叫做“深度等同性判定”(deep equality)。
不过,有时候无须将所有的数据逐个比较,只根据其中部分数据即可判明二者是否等同。
容器中可变类的等同性
如果在容器中放入可变类对象的时候,把某个对象放入collection中后,就不应再改变其hash码了。collection会把各个对象按照其hash码分装到不同的“箱子数组”中。如果对象的hash码在放入”箱子“之后又变了,那么其所在的这个箱子对他来说就是”错误“的。
要想解决这个问题,要保证,对象的hash码,不是根据对象的可变部分计算来的。
或者保证放入collection之后就不再改变对象内容了。
【要点】
1.若想要检测对象的”对象的等同性“,请提供”isEqual:“与hash方法
2.相同的对象必须具有相同的hash码,但是两个hash码相同的对象却未必相同
3.不要盲目地逐个检测每条属性,而是应该依照具体需求来制定检测方案
4.编写hash方法时,应该使用计算速度快而且hash碰撞几率低的算法