Java集合取差集之List.removeAll性能优化

List.removeAll()是通过for循化调用contains()比较,然进行remove()。

分析

一、HashSet.contains()的效率高于List.contains()

List调用contains方法时,每次都会重新遍历集合中的所有元素,并调用equals()方法,时间复杂度为O(n)。

HashSet调用contains方法时,会直接根据对象的Hash值定位集合中的元素,然后调用equals()方法,时间复杂度为O(1) 。

二、LinkedList.remove()效率高于ArrayList.remove()

ArrayList的实现是基于动态数组,每删除一个元素,其后面的元素都要往前移动,这种方式效率低,消耗资源大。

LinkedList的实现是基于双向链表,删除元素只需要改变前后节点的位置信息。

三、LinkedList.iterator()效率高于LinkedList.for()

使用Iterator迭代器时不用考虑集合下标的问题,也不用担心ConcurrentModificationException异常

ArrayList 对随机访问比较快,而for循环中的get(),采用的即是随机访问的方法,因此在 ArrayList 里,for循环较快
LinkedList 则是顺序访问比较快,Iterator 中的 next(),采用的即是顺序访问的方法,因此在 LinkedList 里,使用 Iterator 较快。

方案

/**
 * 差集
 */
public static List differenceList(List maxList, List minList) {
    // 大集合用LinkedList
    LinkedList linkedList = new LinkedList<>(maxList);
    // 小集合用HashSet
    HashSet hashSet = new HashSet<>(minList);
    // 采用Iterator迭代器进行遍历
    Iterator iterator = linkedList.iterator();

    while (iterator.hasNext()) {
        if (hashSet.contains(iterator.next())) {
            iterator.remove();
        }
    }
    return new ArrayList<>(linkedList);
}

/**
 * 交集
 */
public static List intersectList(List maxList, List minList) {
    // 大集合用LinkedList
    LinkedList linkedList = new LinkedList<>(maxList);
    // 小集合用HashSet
    HashSet hashSet = new HashSet<>(minList);
    // 采用Iterator迭代器进行遍历
    Iterator iterator = linkedList.iterator();

    while (iterator.hasNext()) {
        if (!hashSet.contains(iterator.next())) {
            iterator.remove();
        }
    }
    return new ArrayList<>(linkedList);
}

/**
 * 并集
 */
public static List unionList(List maxList, List minList) {
    Set treeSet = new TreeSet<>(maxList);
    // Set自动去重
    treeSet.addAll(minList);
    return new ArrayList<>(treeSet);
}

你可能感兴趣的:(Java集合取差集之List.removeAll性能优化)