SparseArray、ArrayMap替代HashMap原因

背景

对于Android这种对内存非常敏感的移动平台,很多时候使用一些java的api并不能达到更好的性能,相反反而更消耗内存,所以针对Android这种移动平台,也推出了更符合自己的api,比如SparseArray、ArrayMap用来代替HashMap在有些情况下能带来更好的性能提升。

HashMap

HashMap内部是使用一个默认容量为16的数组来存储数据的,而数组中每一个元素却又是一个链表的头结点,所以,更准确的来说,HashMap内部存储结构是使用哈希表的拉链结构(数组+链表),这种存储数据的方法叫做拉链法。


SparseArray、ArrayMap替代HashMap原因_第1张图片

每一个节点都是Entry类型

final K key;
V value;
final int hash;
HashMapEntry next;

Entry存储的内容有key、value、hash值、和next下一个Entry,那么,这些Entry数据是按什么规则进行存储的呢?就是通过计算元素key的hash值,然后对HashMap中数组长度取余得到该元素存储的位置,计算公式为hash(key)%len,比如:假设hash(14)=14,hash(30)=30,hash(46)=46,我们分别对len取余,得到
hash(14)%16=14,hash(30)%16=14,hash(46)%16=14,所以key为14、30、46的这三个元素存储在数组下标为14的位置,如:

SparseArray、ArrayMap替代HashMap原因_第2张图片

PS:
HashMap中处理hash冲突的方法是链地址法,处理hash冲突的方法有以下几种:

  • 开放地址法
  • 再哈希法
  • 链地址法
  • 建立公共溢出区

HashMap中默认的存储大小就是一个容量为16的数组,所以当我们创建出一个HashMap对象时,即使里面没有任何元素,也要分别一块内存空间给它,而且,我们再不断的向HashMap里put数据时,当达到一定的容量限制时(这个容量满足这样的一个关系时候将会扩容:HashMap中的数据量>容量*加载因子,而HashMap中默认的加载因子是0.75),HashMap的空间将会扩大,而且扩大后新的空间一定是原来的2倍。

只要一满足扩容条件,HashMap的空间将会以2倍的规律进行增大。假如我们有几十万、几百万条数据,那么HashMap要存储完这些数据将要不断的扩容,而且在此过程中也需要不断的做hash运算,这将对我们的内存空间造成很大消耗和浪费,而且HashMap获取数据是通过遍历Entry[]数组来得到对应的元素,在数据量很大时候会比较慢,所以在Android中,HashMap是比较费内存的,我们在一些情况下可以使用SparseArray和ArrayMap来代替HashMap。


SparseArray

它内部则是通过两个数组来进行数据存储的,一个存储key,另外一个存储value,为了优化性能,它内部对数据还采取了压缩的方式来表示稀疏数组的数据,从而节约内存空间,我们从源码中可以看到key和value分别是用数组表示:

    private int[] mKeys;
    private Object[] mValues;

在put添加数据的时候,会使用二分查找法和之前的key比较当前我们添加的元素的key的大小,然后按照从小到大的顺序排列好,所以,SparseArray存储的元素都是按元素的key值从小到大排列好的

而在获取数据的时候,也是使用二分查找法判断元素的位置,所以,在获取数据的时候非常快,比HashMap快的多,因为HashMap获取数据是通过遍历Entry[]数组来得到对应的元素。

优点:

  • 避免了基本数据类型的装箱拆箱操作

  • 和Map每个存储结点都是一个类对象不同,SparseArray不需要用于包装的的结构体,单个元素的存储成本更加低廉

  • 在数据量不大的情况下,查找效率较高(二分查找法)

  • 延迟了垃圾回收的时机,只在需要的时候才一次进进行

缺点:

  • 插入新元素可能会导致移动大量的数组元素

  • 数据量较大时,查找效率(二分查找法)会明显降低


ArrayMap

ArrayMap利用两个数组,mHashes用来保存每一个key的hash值,mArrray大小为mHashes的2倍,依次保存key和value

 mHashes[index] = hash;
 mArray[index<<1] = key;
 mArray[(index<<1)+1] = value;

当插入时,根据key的hashcode()方法得到hash值,计算出在mArrays的index位置,然后利用二分查找找到对应的位置进行插入,当出现哈希冲突时,会在index的相邻位置插入。

假设数据量都在千级以内的情况下:

1、key的类型为int类型,使用SparseArray,因为它避免了自动装箱的过程,
key为long类型,它还提供了一个LongSparseArray。
2、如果key类型为其它的类型,则使用ArrayMap。


SparseArray详情

拆箱装箱

你可能感兴趣的:(SparseArray、ArrayMap替代HashMap原因)