Java基础面试题之集合(三)

HashMap工作原理是什么

Java 中最常用的两种结构是数组模拟指针(引用),几乎所有的数据结构都可以利用这两种来组合实现,HashMap 也是如此。实际上 HashMap 是一个链表散列
HashMap 是基于 hashing 的原理。

Java基础面试题之集合(三)_第1张图片

  1. 使用 #put(key, value) 方法来存储对象到 HashMap 中,使用 get(key) 方法从 HashMap
    中获取对象。
  2. 给 #put(key, value) 方法传递键和值时,我们先对键调用 #hashCode() 方法,返回的 hashCode 用于找到 bucket(桶)位置来储存 Entry 对象。

当两个对象的 hashCode 相同会发生什么?

  1. 因为 hashcode 相同,所以它们的 bucket 位置相同,“碰撞”会发生。
  2. 因为 HashMap 使用链表存储对象,这个 Entry(包含有键值对的 Map.Entry 对象)会存储在链表中。

hashCode 和 equals 方法有何重要性?

HashMap 使用 key 对象的 #hashCode() 和 #equals(Object obj) 方法去决定 key-value 对的索引。当我们试着从 HashMap 中获取值的时候,这些方法也会被用到。

  • 如果这两个方法没有被正确地实现,在这种情况下,两个不同 Key 也许会产生相同的 #hashCode() 和 #equals(Objectobj) 输出,HashMap 将会认为它们是相同的,然后覆盖它们,而非把它们存储到不同的地方。

同样的,所有不允许存储重复数据的集合类都使用 #hashCode() 和 #equals(Object obj) 去查找重复,所以正确实现它们非常重要。#hashCode() 和 #equals(Object obj) 方法的实现,应该遵循以下规则:

  • 如果 o1.equals(o2) ,那么 o1.hashCode() == o2.hashCode() 总是为 true 的。
  • 如果 o1.hashCode() == o2.hashCode() ,并不意味 o1.equals(o2) 会为 true 。

HashMap 默认容量是多少?

默认容量都是 16 ,负载因子是 0.75 。就是当 HashMap 填充了 75% 的 busket 是就会扩容,最小的可能性是(16 * 0.75 = 12),一般为原内存的 2 倍。

有哪些顺序的 HashMap 实现类?

  • LinkedHashMap ,是基于元素进入集合的顺序或者被访问的先后顺序排序。
  • TreeMap ,是基于元素的固有顺序 (由 Comparator 或者 Comparable 确定)。

我们能否使用任何类作为 Map 的 key?

我们可以使用任何类作为 Map 的 key ,然而在使用它们之前,需要考虑以下几点:

  1. 如果类重写了 equals 方法,它也应该重写 hashcode 方法。

  2. 类的所有实例需要遵循与 equals 和 hashcode 相关的规则。

  3. 如果一个类没有使用 equals ,你不应该在 hashcode 中使用它。

  4. 用户自定义 key 类的最佳实践是使之为不可变的,这样,hashcode 值可以被缓存起来,拥有更好的性能。不可变的类也可以确保hashcode 和 equals 在未来不会改变,这样就会解决与可变相关的问题了。

     //传递给MyKey的name参数被用于equals()和hashCode()中
     MyKey key = new MyKey('Pankaj'); //assume hashCode=1234
     myHashMap.put(key, 'Value');
     // 以下的代码会改变key的hashCode()和equals()值
     key.setName('Amit'); //assume new hashCode=7890
     //下面会返回null,因为HashMap会尝试查找存储同样索引的key,而key已被改变了,匹配失败,返回null
     myHashMap.get(new MyKey('Pankaj'));
    

这就是为何 StringInteger 被作为 HashMap 的 key 大量使用。

HashMap 的长度为什么是 2 的幂次方?

为了能让 HashMap 存取高效,尽量较少碰撞,也就是要尽量把数据分配均匀,每个链表/红黑树长度大致相同。这个实现就是把数据存到哪个链表/红黑树中的算法。

这个算法应该如何设计呢?我们首先可能会想到采用 % 取余的操作来实现。但是,重点来了:

  • 取余(%)操作中如果除数是 2 的幂次则等价于与其除数减一的与(&)操作(也就是说 hash % length == hash & (length - 1) 的前提是 length 是 2 的 n 次方;)。
  • 并且,采用二进制位操作 &,相对于 % 能够提高运算效率,

这就解释了 HashMap 的长度为什么是 2 的幂次方。

HashSet 的工作原理是什么?

HashSet 是构建在 HashMap 之上的 Set hashing 实现类。让我们直接撸下源码,代码如下:

// HashSet.java

private transient HashMap map;

private static final Object PRESENT = new Object();
  • map 属性,当我们创建一个 HashMap 对象时,其内部也会创建一个 map 对象。后续 HashSet 所有的操作,实际都是基于这个map 之上的封装。
  • PRESENT 静态属性,所有 map 中 KEY 对应的值,都是它,避免重复创建。

HashSet 如何检查重复?

当你把对象加入 HashSet 时,HashSet会先计算对象的hashcode值来判断对象加入的位置,同时也会与其他加入的对象的hashcode值作比较。

  • 如果没有相符的 hashcode ,HashSet会假设对象没有重复出现。
  • 但是如果发现有相同 hashcode 值的对象,这时会调用 equals 方法来检查 hashcode 相等的对象是否真的相同。
    • 如果两者相同,HashSet 就不会让加入操作成功。
    • 如果两者不同,HashSet 就会让加入操作成功。

EnumSet 是什么?

java.util.EnumSet ,是使用枚举类型的集合实现。

  • 当集合创建时,枚举集合中的所有元素必须来自单个指定的枚举类型,可以是显示的或隐示的。EnumSet 是不同步的,不允许值为 null的元素。

  • 它也提供了一些有用的方法,比如 #copyOf(Collection c)、#of(E first, E… rest) 和
    #complementOf(EnumSet s) 方法。

     public enum Gfg {
         /**
          * 编码
          */
         CODE,
         /**
          * 学习
          */
         LEARN,
         /**
          * 贡献
          */
         CONTRIBUTE,
         /**
          * 测验
          */
         QUIZ,
         MCQ
     }
         /*
     EnumSet案例
      */
     @Test
     public void demo5(){
         //声明集合
         EnumSet set1, set2, set3, set4;
         //添加元素
         set1 = EnumSet.of(Gfg.QUIZ, Gfg.CONTRIBUTE,
                 Gfg.LEARN, Gfg.CODE);
         //创建包含与指定的Enum_Set类型相同的元素的EnumSet,其中的值存在于枚举中但不包含在指定的Enum_Set中的值。
         set2 = EnumSet.complementOf(set1);
         set3 = EnumSet.allOf(Gfg.class);
         //用于创建枚举集,其中包含由参数中指定范围定义的元素。
         set4 = EnumSet.range(Gfg.CODE, Gfg.CONTRIBUTE);
         System.out.println("Set 1: " + set1);
         System.out.println("Set 2: " + set2);
         System.out.println("Set 3: " + set3);
         System.out.println("Set 4: " + set4);
     }
    

Java Priority Queue 是什么?

PriorityQueue(优先级队列) 是一个基于优先级堆的无界队列,它的元素都以他们的自然顺序有序排列。

  • 在它创建的时候,我们可以可以提供一个比较器 Comparator 来负责PriorityQueue 中元素的排序。
  • PriorityQueue 不允许 `` null元素,不允许不提供自然排序的对象,也不允许没有任何关联 Comparator 的对象。
  • 最后,PriorityQueue 不是线程安全的,在执行入队和出队操作它需要 O(log(n)) 的时间复杂度。

poll 方法和 remove 方法的区别?

poll 和 remove 方法,都是从队列中取出一个元素,差别在于:

  • poll 方法,在获取元素失败的时候会返回空
  • remove() 方法,失败的时候会抛出异常。

LinkedHashMap 和 PriorityQueue 的区别是什么?

  • PriorityQueue 保证最高或者最低优先级的的元素总是在队列头部,LinkedHashMap 维持的顺序是元素插入的顺序。
  • 当遍历一个 PriorityQueue 时,没有任何顺序保证,但是 LinkedHashMap 课保证遍历顺序是元素插入的顺序。

你可能感兴趣的:(Java)