Java基础篇之hashcode原理

开题:为什么一般覆写equals()后还要覆写hashCode()?

不复写equals()默认是按照比较对象地址来判断两个对象是否相同的,复写equals()是用于根据自己的规则来实现比较对象的目的。为什么还要复写hashCode()呢?
一 Object.hashCode的通用约定
如下约定内容摘自Object规范:

  1. 在应用程序中,只要对象的euqals方法的比较操作所用的信息没有修改,那么对于同一个对象的调用多次hashCode,必须始终如一返回同一个哈希值。
  2. 如果两个对象通过equals比较相等,那么它们的哈希值相同。
  3. 如果两个对象通过euqals比较不等,他们的哈希值可能相同,取决于hashCode的实现,由此散列表的性能也会有区别。

二 hashCode本质
hashCode()方法和equals()方法都是Object类中的方法,不过hashCode()方法是一个native方法,它的返回值默认与System.identityHashCode(object)一致。这个值是对象头的一部分二进制位组成的数字,这个数字具有一定的标识对象的意义所在,但绝不等价于地址。

引用:java特种兵一书

三 hashCode作用:

hashCode简单理解为对象的标识,一般用于hash算法中,这样就可以在查找数据的时候根据这个key快速的缩小数据范围。hashCode与equals似乎是天生一对,一个未来算法快速定位数据而存在,一个是为了对比真实值而存在。但是不能说hashCode是唯一的,不同对象的hashCode值可能会相同。

四 违背hashCode约定带来的影响

Object.hashCode的通用约定会导致该类无法和基于散列的集合(HashMap,HashSet和HashTable)一起正常使用。
一般情况下如果两个对象相同,那么它们的hashCode值一定要相同;如果两个对象的hashCode相同,它们并不一定相同。
hashCode()不同,一定能推出equals()也不同;hashCode()相同,equals()可能相同,也可能不同。

五 用实例来说明实现equals()不实现hashCode()带来的影响

public class testhashcode {
        public static void main(String[] args) {
             HashSet hs=new HashSet(); 
             hs.add(new Student("zhangsan",1));
             hs.add(new Student("zhangsan",1));
             System.out.println(hs.size());
             //不注释代码是1,注释代码是2
        }
    }
    
    class Student{
        String name;
        int age;
        public Student(String name,int age) {
            this.age=age;
            this.name=name;
        }
        //setter getter
        @Override
        public boolean equals(Object obj) {
            Student s = (Student)obj;
            if(this.name.equals(s.name)
                    && this.age == s.age)
                return true;
            return false;
        }
    //  @Override
    //  public int hashCode() {
    //      return age * name.hashCode();
    //  }
    }

可想而知,hashSet可以保证保存不同的对象,但是是有前提条件的。如果开发过程中不知道这些细节,写出来的代码会是什么样的呢?

在hashMap等集合的查找过程中是这样处理的,首先会对比根据hashCode值确定对应的桶,然后在桶里查找equals相同的对象,因此hashMap的查找速率比List要快。

试想覆写了equals()的两个对象相同,但没有覆写hashCode方法,很有可能会造成两个对象不再一个桶,这样map中的contains方法在查找的时候就找不到在其他桶的相同的对象了。

在深入一些,hashMap的hashCode方法对Object的hashCode值进行了优化,使之更加的散列到不同的桶,因为只有每个桶的分布比较均匀的时候,查询效率才更快,如果都堆到一个桶的话,效率就和list没有区别了。

希望通过本篇可以更好的理解hashCode的原理和用途!
如有错误,欢迎指正!转载请注明源出处。www.jianshu.com/p/b1d10c7d27de

你可能感兴趣的:(Java基础篇之hashcode原理)