设计一种数据结构,实现常数时间的增删改查

LeeCode经典题:常数时间插入、删除和获取随机元素

原题:

设计一个支持在平均 时间复杂度 O(1) 下,执行以下操作的数据结构。

insert(val):当元素 val 不存在时,向集合中插入该项。
remove(val):元素 val 存在时,从集合中移除该项。
getRandom:随机返回现有集合中的一项。每个元素应该有相同的概率被返回。

解答:

我们需要在平均复杂度为 \mathcal{O}(1)O(1) 实现以下操作:

insert
remove
getRadom
让我们想想如何实现它。从 insert 开始,我们具有两个平均插入时间为 \mathcal{O}(1)O(1) 的选择:

哈希表:Java 中为 HashMap,Python 中为 dictionary。
动态数组:Java 中为 ArrayList,Python 中为 list。
让我们一个个进行思考,虽然哈希表提供常数时间的插入和删除,但是实现 getRandom 时会出现问题。

getRandom 的思想是选择一个随机索引,然后使用该索引返回一个元素。而哈希表中没有索引,因此要获得真正的随机值,则要将哈希表中的键转换为列表,这需要线性时间。解决的方法是用一个列表存储值,并在该列表中实现常数时间的 getRandom。

列表有索引可以实现常数时间的 insert 和 getRandom,则接下来的问题是如何实现常数时间的 remove。

删除任意索引元素需要线性时间,这里的解决方案是总是删除最后一个元素。

将要删除元素和最后一个元素交换。
将最后一个元素删除。
为此,必须在常数时间获取到要删除元素的索引,因此需要一个哈希表来存储值到索引的映射。

综上所述,我们使用以下数据结构:

动态数组存储元素值
哈希表存储存储值到索引的映射。

设计一种数据结构,实现常数时间的增删改查_第1张图片

设计一种数据结构,实现常数时间的增删改查_第2张图片

完整代码:

class RandomizedSet {
  Map dict;
  List list;
  Random rand = new Random();

  /** Initialize your data structure here. */
  public RandomizedSet() {
    dict = new HashMap();
    list = new ArrayList();
  }

  /** Inserts a value to the set. Returns true if the set did not already contain the specified element. */
  public boolean insert(int val) {
    if (dict.containsKey(val)) return false;

    dict.put(val, list.size());
    list.add(list.size(), val);
    return true;
  }

  /** Removes a value from the set. Returns true if the set contained the specified element. */
  public boolean remove(int val) {
    if (! dict.containsKey(val)) return false;

    // move the last element to the place idx of the element to delete
    int lastElement = list.get(list.size() - 1);
    int idx = dict.get(val);
    list.set(idx, lastElement);
    dict.put(lastElement, idx);
    // delete the last element
    list.remove(list.size() - 1);
    dict.remove(val);
    return true;
  }

  /** Get a random element from the set. */
  public int getRandom() {
    return list.get(rand.nextInt(list.size()));
  }
}

复杂度分析:

时间复杂度:

getRandom 时间复杂度为\mathcal{O}(1),insert 和 remove 平均时间复杂度为\mathcal{O}(1) ,在最坏情况下为 \mathcal{O}(N),当元素数量超过当前分配的动态数组和哈希表的容量导致空间重新分配时。

空间复杂度:

\mathcal{O}(N),在动态数组和哈希表分别存储了 N 个元素的信息。

 

你可能感兴趣的:(数据分析)