52个有效方法(8) - 理解“对象等同性”这一概念

“等同性”(equality)
  • “等同性”(equality)在开发中时常作为逻辑判断的依据。

  • 按照 “==”操作符比较,对于常规的数据类型比较是,比如 9 == 9 ;对于对象的比较,使用 == 则比较的是两个指针本身,而不是其所指的对象。

判断等同性的关键方法

对于系统框架中的对象相等比较,我们可以使用NSObject协议中声明的“isEqual:”方法来判断两个对象的等同性。

//NSObject协议中有两个用于判断等同性的关键方法
- (BOOL)isEqual:(id)object;
- (NSUInteger)hash;

NSObject类对这两个方法的默认实现是:当且仅当其“指针值”(内存地址)完全相等时,这两个对象才相等。

  • 如果"isEqual:"方法判定两个对象相等, 那么其hash方法也必须返回同一个值。

  • 但是, 如果两个对象的hash方法返回同一个值, 那么"isEqual:" 方法未必会认为两者相等。

自定义"isEqual:"方法
@interface EOCPerson : NSObject
@property (nonatomic, copy) NSString *firstName;
@property (nonatomic, copy) NSString *lastName;
@property (nonatomic, assign) NSUInteger age;
@end
-(BOOL)isEqual:(id)object{
    if (self == object) return YES;
    if ([self class] != [object class]) return NO;
    
    EOCPerson *otherPerson = (EOCPerson *)object;
    if(![_firstName isEqualToString:otherPerson.firstName])
        return NO;
    if(![_lastName isEqualToString:otherPerson.lastName])
        return NO;
    if(_age != otherPerson.age)
        return NO;
    return YES;
}

  • 实现hash方法(1)
- (NSUInteger)hash{
    return 1337;
}

上面的写法,在collection中使用这种对象将产生性能问题, 因为collection在检索哈希表(hash table) 时, 会用对象的哈希码做索引。 假如某个collection 是用set 实现的,那么set可能会根据哈希码把对象分装到不同的数组中。在向set中添加新对象时, 要根据其哈希码找到与之相关的那个数组, 依次检查其中各个元素, 看数组中已有的对象是否和将要添加的新对象相等。如果相等, 那就说明要添加的对象已经在set里面了。 由此可知, 如果令每个对象都返回相同的哈希码, 那么在set中已有1000000个对象的情况下, 若是继续向其中添加对象, 则需将这 1000000个对象全部扫描一遍。

  • 实现hash方法(2)
- (NSUInteger)hash {
    NSString *stringToHash = [NSString stringWithFormat:@"%@:%@:%i",_firstName, _lastName, _age];
    return [stringToHash hash];
}

这次所用的办法是将NSString对象中的属性都塞入另一个字符串中, 然后令hash方法返回该字符串的哈希码。这么做符合约定, 因为两个相等的EOCPerson对象总会返回相同的哈希码。但是这样做还需负担创建字符串的开销, 所以比返回单一值要慢。把这种对象添加到collection中时, 也会产生性能问题, 因为想要添加, 必须先计算其哈希码。

  • 实现hash方法(3)
- (NSUInteger)hash {
    NSUInteger firstNameHash = [_firstName hash];
    NSUInteger lastNameHash = [_lastName hash];
    NSUInteger ageHash = _age;
    return firstNameHash ^ lastNameHash ^ ageHash;
}

这种做法既能保持较高效率, 又能使生成的哈希码至少位于一定范围之内, 而不会过于频繁地重复。当然, 此算法生成的哈希码还是会碰撞(collision), 不过至少可以保证哈希码有多种可能的取值. 编写hash方法时, 应该用当前的对象做实验, 以便在减少碰撞频度与降低运算复杂程度之间取舍。

  • 编写hash方法时,应该使用计算速度快而且哈希码碰撞几率低的算法。
自定义等同性判定方法

如果经常需要判断等同性, 那么可能会自己来创建等同性判定方法, 因为无须检测参数类型, 所以能大大提升检测速度。

在编写判定方法时, 也应一并覆写"isEqual:"方法。后者的常见实现方式为: 如果受测的参数与接收该消息的对象都属于同一个类, 那么就调用自己编写的判定方法, 否则就交由超类来判断。

- (BOOL)isEqualToPerson:(EOCPerson *)otherPerson{
    if (self == object) return YES;
    if (![_firstName isEqualToString:otherPerson.firstName])
        return NO;
    if (![_lastName isEqualToString:otherPerson.lastName])
        return NO;
    if (_age != otherPerson.age)
        return NO;
    return YES;
}
- (BOOL)isEqual:(id)object{
    if ([self class] == [object class]){
        return [self isEqualToPerson:(EOCPerson *)object];
    } else {
        return [super isEqual:object];
    }
}
特定类所具有的等同性判断方法
  • NSString类具有特殊的等同性判断方法"isEqualToString:"。

  • NSArray类具有特殊的等同性判断方法"isEqualToArray:"。

  • NSDictionary类具有特殊的等同性判断方法"isEqualToDictionary:"。

容器中可变类的等同性

容器中放入可变类对象的时候, 把某个对象放入collection之后, 就不应再改变其哈希码了。

collection会把各个对象按照其哈希码分装到不同的"箱子数组"中。如果某对象在放入"箱子"之后哈希码又变了, 那么其现在所处的这个箱子对它来说就是"错误"的。

//1. 把一个数组加入set中
NSMutableSet *set = [NSMutableSet new];
NSMutableArray *arrayA = [@[@1, @2] mutableCopy];
[set addObject:arrayA];
NSLog(@“set = %@“,set);
// set = {((1,2))}
//2. 再向set加入一个数组,此数组与前一个数组所含的对象相同,顺序也相同
NSMutableArray *arrayB = [@[@1, @2] mutableCopy];
[set addObject:arrayB];
NSLog(@“set = %@“,set);
// set = {((1,2))} 
//3. 此时仍只有一个对象,因为刚才要加入的那个数组对象和set中已有的数组对象相等,所以set并不会改变
NSMutableArray *arrayC = [@[@1] mutableCopy];
[set addObject:arrayC];
NSLog(@“set = %@“,set);
// set = {((1),(1,2))}  
//4. 然后我们再改变arrayC的内容
[arrayC addObject:@2];
NSLog(@“set = %@“,set);
// set = {((1,2),(1,2))}  
//5. 此时set中就包含了两个彼此相等的数组,根据set语义是不允许出现这种情况的。然后现在却无法保证这一点。
//6. 若是拷贝此set
NSSet *setB = [set copy];
NSLog(@“setB = %@“,setB);
// setB = {((1,2))} 
//所以说,如果把某个对象放入set后又修改其内容,那么后面的行为将很难预测

所以容器里的对象应该是不可改变的。

要点:
  1. 要想检测对象的等同性,请提供“isEqual:”与hash方法。

  2. 相同的对象必须具有相同的哈希码,但是两个哈希码相同的对象未必相同。

  3. 不要盲目地逐个检测每条属性,而是应该依照具体需求来定制检测方案。

  4. 编写hash方法时,应该使用计算速度快而且哈希码碰撞几率低的算法。

你可能感兴趣的:(52个有效方法(8) - 理解“对象等同性”这一概念)