关于hashCode方法的作用

当用Set进行排重时,往往需要对T的类进行equals()和hashCode()方法进行重写,为什么呢?

Java中的集合(Collection)有两类,一类是List,再有一类是Set。 

它们的区别是什么?前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。


那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢? 

这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。 

也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。    

于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。 

哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法,那需要更多的文章篇幅,我在这里就不介绍了。 

初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。   

这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。 

如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了, 

就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。 

所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。


所以,Java对于eqauls方法和hashCode方法是这样规定的: 

1、如果两个对象相同,那么它们的hashCode值一定要相同;2、如果两个对象的hashCode相同,它们并不一定相同     上面说的对象相同指的是用eqauls方法比较。   


上面这个例子很形象的说明了hashcode的查找过程。


转自:https://blog.csdn.net/anmoyyh/article/details/76019777

你可能感兴趣的:(关于hashCode方法的作用)