标题:设计哈希映射
出处:706. 设计哈希映射
3 级
不使用任何内建的哈希表库设计一个哈希映射。
实现 MyHashMap \texttt{MyHashMap} MyHashMap 类:
示例 1:
输入:
["MyHashMap", "put", "put", "get", "get", "put", "get", "remove", "get"] \texttt{["MyHashMap", "put", "put", "get", "get", "put", "get", "remove", "get"]} ["MyHashMap", "put", "put", "get", "get", "put", "get", "remove", "get"]
[[], [1, 1], [2, 2], [1], [3], [2, 1], [2], [2], [2]] \texttt{[[], [1, 1], [2, 2], [1], [3], [2, 1], [2], [2], [2]]} [[], [1, 1], [2, 2], [1], [3], [2, 1], [2], [2], [2]]
输出:
[null, null, null, 1, -1, null, 1, null, -1] \texttt{[null, null, null, 1, -1, null, 1, null, -1]} [null, null, null, 1, -1, null, 1, null, -1]
解释:
MyHashMap myHashMap = new MyHashMap(); \texttt{MyHashMap myHashMap = new MyHashMap();} MyHashMap myHashMap = new MyHashMap();
myHashMap.put(1, 1); \texttt{myHashMap.put(1, 1);} myHashMap.put(1, 1); // myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1]] \texttt{[[1,1]]} [[1,1]]
myHashMap.put(2, 2); \texttt{myHashMap.put(2, 2);} myHashMap.put(2, 2); // myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1], [2,2]] \texttt{[[1,1], [2,2]]} [[1,1], [2,2]]
myHashMap.get(1); \texttt{myHashMap.get(1);} myHashMap.get(1); // 返回 1 \texttt{1} 1, myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1], [2,2]] \texttt{[[1,1], [2,2]]} [[1,1], [2,2]]
myHashMap.get(3); \texttt{myHashMap.get(3);} myHashMap.get(3); // 返回 -1 \texttt{-1} -1(未找到), myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1], [2,2]] \texttt{[[1,1], [2,2]]} [[1,1], [2,2]]
myHashMap.put(2, 1); \texttt{myHashMap.put(2, 1);} myHashMap.put(2, 1); // myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1], [2,1]] \texttt{[[1,1], [2,1]]} [[1,1], [2,1]](更新已有的值)
myHashMap.get(2); \texttt{myHashMap.get(2);} myHashMap.get(2); // 返回 1 \texttt{1} 1, myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1], [2,1]] \texttt{[[1,1], [2,1]]} [[1,1], [2,1]]
myHashMap.remove(2); \texttt{myHashMap.remove(2);} myHashMap.remove(2); // 删除键为 2 \texttt{2} 2 的数据, myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1]] \texttt{[[1,1]]} [[1,1]]
myHashMap.get(2); \texttt{myHashMap.get(2);} myHashMap.get(2); // 返回 -1 \texttt{-1} -1(未找到), myHashMap \texttt{myHashMap} myHashMap 现在为 [[1,1]] \texttt{[[1,1]]} [[1,1]]
这道题和「设计哈希集合」非常相似,区别在于这道题存储的不是 key \textit{key} key 本身,而是 ( key , value ) (\textit{key}, \textit{value}) (key,value) 的键值对。这道题也可以使用「设计哈希集合」的解法。
由于 key \textit{key} key 和 value \textit{value} value 的取值范围是 [ 0 , 1 0 6 ] [0, 10^6] [0,106],因此可以创建长度为 1 0 6 + 1 10^6 + 1 106+1 的整型数组表示哈希表,数组中的下标为 key \textit{key} key 的元素值表示 key \textit{key} key 映射的 value \textit{value} value, value ≥ 0 \textit{value} \ge 0 value≥0 表示存在 key \textit{key} key 的映射, value < 0 \textit{value} < 0 value<0 表示不存在 key \textit{key} key 的映射,当 value < 0 \textit{value} < 0 value<0 时一定有 value = − 1 \textit{value} = -1 value=−1。
构造方法中,将数组初始化为长度 1 0 6 + 1 10^6 + 1 106+1 的数组,并将数组中的全部元素初始化为 − 1 -1 −1。
对于 put \textit{put} put 操作,将数组中的下标为 key \textit{key} key 的元素设为 value \textit{value} value。
对于 get \textit{get} get 操作,返回数组中的下标为 key \textit{key} key 的元素。
对于 remove \textit{remove} remove 操作,将数组中的下标为 key \textit{key} key 的元素设为 − 1 -1 −1。
需要说明的是,该解法虽然实现简单,但是不适合在面试中使用。
class MyHashMap {
int[] map;
public MyHashMap() {
map = new int[1000001];
Arrays.fill(map, -1);
}
public void put(int key, int value) {
map[key] = value;
}
public int get(int key) {
return map[key];
}
public void remove(int key) {
map[key] = -1;
}
}
时间复杂度:构造方法的时间复杂度是 O ( C ) O(C) O(C),各项操作的时间复杂度都是 O ( 1 ) O(1) O(1),其中 C C C 是 key \textit{key} key 的取值范围的元素个数,这道题中 C = 1 0 6 + 1 C = 10^6 + 1 C=106+1。
构造方法需要创建长度为 C C C 的数组并将每个元素设为初始值,时间复杂度是 O ( C ) O(C) O(C)。
各项操作只需要对数组中的一个元素赋值或返回元素值,时间复杂度是 O ( 1 ) O(1) O(1)。
空间复杂度: O ( C ) O(C) O(C),其中 C C C 是 key \textit{key} key 的取值范围的元素个数,这道题中 C = 1 0 6 + 1 C = 10^6 + 1 C=106+1。需要创建长度为 C C C 的数组表示哈希集合。
哈希表的常见实现方法是链表数组,数组的每个下标对应哈希函数可以映射到的索引,当出现哈希冲突时,使用链地址法解决哈希冲突。
用 BASE \textit{BASE} BASE 表示链表数组的长度,则可以使用一个简单的哈希函数: hash ( x ) = x m o d BASE \text{hash}(x) = x \bmod \textit{BASE} hash(x)=xmodBASE,每个键经过哈希函数映射之后的值一定在范围 [ 0 , BASE − 1 ] [0, \textit{BASE} - 1] [0,BASE−1] 内。为了将哈希函数的值尽可能均匀分布,降低哈希冲突的频率,链表数组的长度应选择质数。此处取链表数组的长度为 1013 1013 1013。
由于哈希表存储的元素包含键和值,因此链表中存储的元素为键值对。
构造方法中,将链表数组初始化为长度 BASE \textit{BASE} BASE 的链表数组,并将链表数组中的全部元素初始化为空链表。
对于各项操作,首先计算 key \textit{key} key 对应的哈希值,得到链表数组的下标,根据下标在链表数组中得到相应的链表,然后在链表中执行相应操作。
对于 put \textit{put} put 操作,在链表数组中得到相应的链表之后,遍历链表,如果遇到元素的键等于 key \textit{key} key 则将元素的值设为 value \textit{value} value 并直接返回,如果遍历结束没有遇到元素的键等于 key \textit{key} key 则在链表末尾添加元素 ( key , value ) (\textit{key}, \textit{value}) (key,value)。
对于 get \textit{get} get 操作,在链表数组中得到相应的链表之后,遍历链表,如果遇到元素的键等于 key \textit{key} key 则返回元素的值,如果遍历结束没有遇到元素的键等于 key \textit{key} key 则返回 − 1 -1 −1。
对于 remove \textit{remove} remove 操作,在链表数组中得到相应的链表之后,遍历链表,如果遇到元素的键等于 key \textit{key} key 则将其删除,如果遍历结束没有遇到元素的键等于 key \textit{key} key 则不执行任何操作。
实现方面,为了提升运行效率,使用迭代器遍历链表和执行删除操作。
class MyHashMap {
private class Entry {
private int key;
private int value;
public Entry(int key, int value) {
this.key = key;
this.value = value;
}
public int getKey() {
return key;
}
public int getValue() {
return value;
}
public void setValue(int value) {
this.value = value;
}
}
private static final int BASE = 1013;
private LinkedList<Entry>[] map;
public MyHashMap() {
map = new LinkedList[BASE];
for (int i = 0; i < BASE; i++) {
map[i] = new LinkedList<Entry>();
}
}
public void put(int key, int value) {
int index = key % BASE;
LinkedList<Entry> list = map[index];
Iterator<Entry> iterator = list.iterator();
while (iterator.hasNext()) {
Entry entry = iterator.next();
if (entry.getKey() == key) {
entry.setValue(value);
return;
}
}
list.offerLast(new Entry(key, value));
}
public int get(int key) {
int index = key % BASE;
LinkedList<Entry> list = map[index];
Iterator<Entry> iterator = list.iterator();
while (iterator.hasNext()) {
Entry entry = iterator.next();
if (entry.getKey() == key) {
return entry.getValue();
}
}
return -1;
}
public void remove(int key) {
int index = key % BASE;
LinkedList<Entry> list = map[index];
Iterator<Entry> iterator = list.iterator();
while (iterator.hasNext()) {
Entry entry = iterator.next();
if (entry.getKey() == key) {
iterator.remove();
break;
}
}
}
}
时间复杂度:构造方法的时间复杂度是 O ( BASE ) O(\textit{BASE}) O(BASE),各项操作的时间复杂度都是 O ( n BASE ) O\Big(\dfrac{n}{\textit{BASE}}\Big) O(BASEn),其中 n n n 是哈希集合中的元素个数, BASE \textit{BASE} BASE 是链表数组的长度。
构造方法需要创建长度为 BASE \textit{BASE} BASE 的数组并将每个元素设为初始值,时间复杂度是 O ( BASE ) O(\textit{BASE}) O(BASE)。
各项操作需要根据哈希函数计算哈希值,然后遍历链表。计算哈希值需要 O ( 1 ) O(1) O(1) 的时间,假设哈希值分布均匀,每个链表的平均长度是 O ( n BASE ) O\Big(\dfrac{n}{\textit{BASE}}\Big) O(BASEn),因此需要 O ( n BASE ) O\Big(\dfrac{n}{\textit{BASE}}\Big) O(BASEn) 的时间遍历哈希表。
空间复杂度: O ( n + BASE ) O(n + \textit{BASE}) O(n+BASE),其中 n n n 是哈希集合中的元素个数, BASE \textit{BASE} BASE 是链表数组的长度。存储 n n n 个元素需要 O ( n ) O(n) O(n) 的空间,链表数组需要 O ( BASE ) O(\textit{BASE}) O(BASE) 的空间。