并查集

定义接口

package unionfind;

/**
 * 并查集接口
 */
public interface UF {
    int getSize();
    boolean isConnected(int p, int q); // find(p) == find(q) O(1)
    void unionElements(int p, int q);
}

版本1

package unionfind;

/**
 * 并查集版本1:数组中存放着集合的id
 */
public class UnionFind1 implements UF {

    private int[] id; // 存放数据所属集合的id,数组的下标本身就代表数据
    // 然而在并查集里,数据本身并不重要,数据和数据的关系才是讨论的重点

    public UnionFind1(int size) {
        id = new int[size];
        // 初始化时,每一个元素都是独立的,分配在不同的集合中
        for (int i = 0; i < id.length; i++) {
            id[i] = i;
        }
    }

    @Override
    public int getSize() {
        return id.length;
    }

    // 查找元素p所在的集合的编号
    private int find(int p) {
        // 检查p的合法性
        if (p < 0 || p >= id.length)
            throw new IllegalArgumentException("p is out of bound.");
        return id[p];
    }

    // 时间复杂度O(1)
    // 查看元素p和元素q是否在同一个集合
    @Override
    public boolean isConnected(int p, int q) {
        // 检查p和q的集合id是否同一个
        return find(p) == find(q);
    }

    /**
     * 合并操作:将元素放在同一个集合
     * 将元素的id设置为同一个
     * union(1, 4),将4的id改成和1相同,同时和4相同的id全部改成和1相同
     */
    @Override
    public void unionElements(int p, int q) {
        int pID = find(p);
        int qID = find(q);
        // 如何p和q在同一个集合,return
        if (pID == qID) {
            return;
        }

        // 如何p和q不在同一个集合,遍历所有元素,将和p(q)不在同一个集合的数据id全部改成p(q)所在集合的编号
        // 时间复杂度O(n)
        for (int i = 0; i < id.length; i++) {
            if (id[i] == qID)
                id[i] = pID; // 或者id[i] = qID
        }
    }
}

版本2

package unionfind;

/**
 * 并查集版本2:森林结构
 */
public class UnionFind2 implements UF {

    private int[] parent;// 保存的数据是代表上一个节点的下标,当i == parent[i],代表根节点

    public UnionFind2(int size) {
        parent = new int[size];

        for (int i = 0; i < parent.length; i++) {
            parent[i] = i;
        }
    }

    @Override
    public int getSize() {
        return parent.length;
    }

    // 找元素所在的根节点(集合)
    // 时间复杂度O(h),h代表p所在的树的高度
    private int find(int p) {
        if (p < 0 || p >= parent.length)
            throw new IllegalArgumentException("p is out of bound.");
        while (parent[p] != p)
            p = parent[p];

        return p;
    }

    // O(h)
    @Override
    public boolean isConnected(int p, int q) {
        return find(p) == find(q);
    }

    // 时间复杂度O(h),h代表p所在的树的高度
    @Override
    public void unionElements(int p, int q) {
        int pRoot = find(p);
        int qRoot = find(q);

        if (pRoot == qRoot)
            return;

        parent[pRoot] = qRoot; // 或者parent[qRoot] = pRoot
    }
}

版本3

package unionfind;


/**
 * 并查集版本3:
 * 基于size的优化:
 * 记录每一棵树的元素个数,
 * 树中节点少的指向树中节点多的,避免出现退化成链表的极端情况
 */
public class UnionFind3 implements UF {

    private int[] parent;// 保存的数据是代表上一个节点的下标,当i == parent[i],代表根节点
    private int[] sz;

    public UnionFind3(int size) {
        parent = new int[size];
        sz = new int[size];

        for (int i = 0; i < parent.length; i++) {
            parent[i] = i;
            sz[i] = 1;
        }
    }

    @Override
    public int getSize() {
        return parent.length;
    }

    // 找元素所在的根节点(集合)
    // 时间复杂度O(h),h代表p所在的树的高度
    private int find(int p) {
        if (p < 0 || p >= parent.length)
            throw new IllegalArgumentException("p is out of bound.");
        while (parent[p] != p)
            p = parent[p];

        return p;
    }

    // O(h)
    @Override
    public boolean isConnected(int p, int q) {
        return find(p) == find(q);
    }


    @Override
    public void unionElements(int p, int q) {
        int pRoot = find(p);
        int qRoot = find(q);

        if (pRoot == qRoot)
            return;

        /*
        基于版本2的改造逻辑:
        不再是简单粗暴的让pRoot指向qRoot
        而是在进行指向的时候,判断:
        树中节点少的指向树中节点多的,并维护记录节点个数的数组sz
         */
        if (sz[pRoot] < sz[qRoot]) {
            parent[pRoot] = qRoot;
            sz[qRoot] += sz[pRoot];
        } else {
            parent[qRoot] = pRoot;
            sz[pRoot] += sz[qRoot];
        }
    }
}

版本4

package unionfind;


/**
 * 并查集版本4:
 * 基于rank的优化:
 * 记录每一棵树的高度
 * 树中高度少的指向树中高度多的
 */
public class UnionFind4 implements UF {

    private int[] parent;// 保存的数据是代表上一个节点的下标,当i == parent[i],代表根节点
    private int[] rank;

    public UnionFind4(int size) {
        parent = new int[size];
        rank = new int[size];

        for (int i = 0; i < parent.length; i++) {
            parent[i] = i;
            rank[i] = 1;
        }
    }

    @Override
    public int getSize() {
        return parent.length;
    }

    // 找元素所在的根节点(集合)
    // 时间复杂度O(h),h代表p所在的树的高度
    private int find(int p) {
        if (p < 0 || p >= parent.length)
            throw new IllegalArgumentException("p is out of bound.");
        while (parent[p] != p)
            p = parent[p];

        return p;
    }

    // O(h)
    @Override
    public boolean isConnected(int p, int q) {
        return find(p) == find(q);
    }


    @Override
    public void unionElements(int p, int q) {
        int pRoot = find(p);
        int qRoot = find(q);

        if (pRoot == qRoot)
            return;

        if (rank[pRoot] < rank[qRoot]) {
            parent[pRoot] = qRoot;
        } else if(rank[pRoot] > rank[qRoot]) {
            parent[qRoot] = pRoot;
        } else { // 相等的时候
            parent[qRoot] = pRoot;
            rank[pRoot] += 1;
        }
    }
}

版本5

package unionfind;

/**
 * 并查集版本5:路径压缩
 * 由于并查集只关心节点最终的根节点,中途经历的节点可以进行压缩。
 */
public class UnionFind5 implements UF {

    private int[] parent;// 保存的数据是代表上一个节点的下标,当i == parent[i],代表根节点
    private int[] rank;

    public UnionFind5(int size) {
        parent = new int[size];
        rank = new int[size];

        for (int i = 0; i < parent.length; i++) {
            parent[i] = i;
            rank[i] = 1;
        }
    }

    @Override
    public int getSize() {
        return parent.length;
    }

    // 找元素所在的根节点(集合)
    // 时间复杂度O(h),h代表p所在的树的高度
    private int find(int p) {
        if (p < 0 || p >= parent.length)
            throw new IllegalArgumentException("p is out of bound.");
        while (parent[p] != p) {
            // 指向父节点所指向的父节点。达到压缩路径的目的
            parent[p] = parent[parent[p]];
            p = parent[p];
        }

        return p;
    }

    // O(h)
    @Override
    public boolean isConnected(int p, int q) {
        return find(p) == find(q);
    }


    @Override
    public void unionElements(int p, int q) {
        int pRoot = find(p);
        int qRoot = find(q);

        if (pRoot == qRoot)
            return;

        if (rank[pRoot] < rank[qRoot]) {
            parent[pRoot] = qRoot;
        } else if(rank[pRoot] > rank[qRoot]) {
            parent[qRoot] = pRoot;
        } else { // 相等的时候
            parent[qRoot] = pRoot;
            rank[pRoot] += 1;
        }
    }
}

版本6

package unionfind;

/**
 * 并查集版本6:路径压缩
 * 由于并查集只关心节点最终的根节点,中途经历的节点可以进行压缩。
 */
public class UnionFind6 implements UF {

    private int[] parent;// 保存的数据是代表上一个节点的下标,当i == parent[i],代表根节点
    private int[] rank;

    public UnionFind6(int size) {
        parent = new int[size];
        rank = new int[size];

        for (int i = 0; i < parent.length; i++) {
            parent[i] = i;
            rank[i] = 1;
        }
    }

    @Override
    public int getSize() {
        return parent.length;
    }

    // 找元素所在的根节点(集合)
    // 时间复杂度O(h),h代表p所在的树的高度
    private int find(int p) {
        if (p < 0 || p >= parent.length)
            throw new IllegalArgumentException("p is out of bound.");
        if (parent[p] != p)
            // 指向父节点所指向的父节点。达到压缩路径的目的
            parent[p] = find(parent[p]);

        return parent[p];
    }

    // O(h)
    @Override
    public boolean isConnected(int p, int q) {
        return find(p) == find(q);
    }

    @Override
    public void unionElements(int p, int q) {
        int pRoot = find(p);
        int qRoot = find(q);

        if (pRoot == qRoot)
            return;

        if (rank[pRoot] < rank[qRoot]) {
            parent[pRoot] = qRoot;
        } else if(rank[pRoot] > rank[qRoot]) {
            parent[qRoot] = pRoot;
        } else { // 相等的时候
            parent[qRoot] = pRoot;
            rank[pRoot] += 1;
        }
    }
}

测试不同版本的并查集的性能

package unionfind;

import java.util.Random;

public class Main {

    private static double testUF(UF uf, int m) {
        int size = uf.getSize();
        Random random = new Random();

        long startTime = System.nanoTime();

        // m控制进行几轮union
        for (int i = 0; i < m; i++) {
            int a = random.nextInt(size);
            int b = random.nextInt(size);
            uf.unionElements(a, b);
        }

        // m控制进行几轮isConnected
        for (int i = 0; i < m; i++) {
            int a = random.nextInt(size);
            int b = random.nextInt(size);
            uf.isConnected(a, b);
        }

        long endTime = System.nanoTime();

        return (double) (endTime - startTime) / 1000000000;
    }

    public static void main(String[] args) {
        int size = 10000000;
//        int m = 10000;
        int m = 10000000;

//        UnionFind1 unionFind1 = new UnionFind1(size);
//        System.out.println("UNIONFIND1:"+ testUF(unionFind1, m) + "s");
//
//        UnionFind2 unionFind2 = new UnionFind2(size);
//        System.out.println("UNIONFIND2:" + testUF(unionFind2, m) + "s");

        UnionFind3 unionFind3 = new UnionFind3(size);
        System.out.println("UNIONFIND3:" + testUF(unionFind3, m) + "s");

        UnionFind4 unionFind4 = new UnionFind4(size);
        System.out.println("UNIONFIND4:" + testUF(unionFind4, m) + "s");

        UnionFind5 unionFind5 = new UnionFind5(size);
        System.out.println("UNIONFIND5:" + testUF(unionFind5, m) + "s");

        UnionFind6 unionFind6 = new UnionFind6(size);
        System.out.println("UNIONFIND6:" + testUF(unionFind6, m) + "s");

    }
}

你可能感兴趣的:(并查集)