算法专题:Connected Components

In graph theory, a connected component (or justcomponent) of an undirected graph is a subgraph in which any two vertices are connected to each other by paths, and which is connected to no additional vertices in the supergraph.
Connected Components即连通域,适用于无向图。一个连通域,指的是这里面的任意两个顶点,都能找到一个path连通。
连通域问题偶尔也会遇到,好在这种题一般用常规做法计数连通域个数就可以了。下面详细介绍这个做法:

class UnionFind(object):
    def __init__(self, n):
        self.set = list(range(n))
        self.count = n

    def find_set(self, x):
       if self.set[x] != x:
           self.set[x] = self.find_set(self.set[x])  # path compression.
       return self.set[x]

    def union_set(self, x, y):
        x_root, y_root = map(self.find_set, (x, y))
        if x_root != y_root:
            self.set[min(x_root, y_root)] = max(x_root, y_root)
            self.count -= 1


class Solution(object):
    def countComponents(self, n, edges):
        """
        :type n: int
        :type edges:List[List[int]]
        :rtype: int
        """
        union_find = UnionFind(n)
        for i, j in edges:
            union_find.union_set(i, j)
         return union_find.count  

首先,数据类型是[node1, node2]的edge的list,node的值代表其序号,从0到n-1;其次,算法的核心思想,就是把连在一起的节点的root值设置成为一样。为了实现这个目的,算法把一个连通域里面的所有点的root设置成为最大节点的序号。
然后,值得注意的就是路径压缩了。因为连接有先后顺序,比如1连2,2连3,那么1其实也连着3,如何更新1的root值呢?就是通过这个find_set函数,意思是root值找下标,而不是具体的某个写定的数。这样,1看2的root,2看3的root,3最大,root就是它自己,因此1最后也能看到3的root。而假如3再和更大的数相连而改变root值,没关系,1照样能一路找过来。
时间复杂度是O(nlgn),空间复杂度是O(n)。

例1.Graph Valid Tree。给出n个节点,序号从0~n-1,以及一个edge的list,表示一个无向图,且edge不会重复,即假如已经有[0,1]就不会再有[1,0]。返回这个图是不是一棵树。
【解】其实这道题是在问两个问题:有没有环?是不是一整个连通域?
环很好解决,假设V个节点,E条边,没有环的话E=V-1,否则E>=V。
至于连通域,就用上面的方法可以做:

class UnionFind(object):
    def __init__(self, n):
        self.set = list(range(n))
        self.count = n

    def find_set(self, x):
       if self.set[x] != x:
           self.set[x] = self.find_set(self.set[x])  # path compression.
       return self.set[x]

    def union_set(self, x, y):
        x_root, y_root = map(self.find_set, (x, y))
        if x_root != y_root:
            self.set[min(x_root, y_root)] = max(x_root, y_root)
            self.count -= 1
class Solution:
    # @param {int} n an integer
    # @param {int[][]} edges a list of undirected edges
    # @return {boolean} true if it's a valid tree, or false
    def validTree(self, n, edges):
        # Write your code here
        if len(edges) != n - 1:  # Check number of edges.
            return False
        elif n == 1:
            return True

        union_find = UnionFind(n)
        for i, j in edges:
            union_find.union_set(i, j)
        return union_find.count == 1

时间和空间复杂度,和之前是一样的。

2.Number of islands。海岛个数。有一个mxn的全0矩阵,表示一片海,现在给出一个二维坐标list,代表按照顺序把对应的坐标置1,返回每一步操作之后海岛的数目。所谓海岛,就是通过上下左右相连的都是1的整个部分。比如给出n=m=3,和操作[[0,0],[0,1],[2,2],[2,1]],返回[1,1,2,2]。(斜对角不算相连,不会对已经是1的坐标进行操作,不会给出无效坐标)。
【解】本质上还是求连通域的个数。
首先进行图的转换,因为要求序号在0~num-1,mxn矩阵总共有m*n个节点,因此每个节点的序号可以用行列数来决定,即row*n+col,序号从0到m*n-1。
然后每一步,看看周围有没有存在的连通域,这里需要考虑多个域在一个节点汇聚的情况,一个个都要merge,所以要依次遍历上下左右。merge只需要把两个点merge一下,路径压缩会自动把它们的root导到一起。因为序号都是不重复的,所以假如碰到下一个连通域,照样merge。代码如下:

# Time: O(klog*k) ~= O(k), k is the length of the positions
# Space: O(k)
class Solution(object):
    def numIslands2(self, m, n, positions):
        """
        :type m: int
        :type n: int
        :type positions: List[List[int]]
        :rtype: List[int]
        """
        def node_id(node, n):
            return node[0] * n + node[1]

        def find_set(x):
           if set[x] != x:
               set[x] =find_set(set[x])  # path compression.
           return set[x]

        def union_set(x, y):
            x_root, y_root = find_set(x), find_set(y)
            set[min(x_root, y_root)] = max(x_root, y_root)
  
        numbers= []
        number = 0
        directions= [(0, -1), (0, 1), (-1, 0), (1, 0)]
        set = {}
        for position in positions:
            node = (position[0], position[1])
            set[node_id(node, n)] = node_id(node, n)
            number += 1

            for d in directions:
                neighbor = (position[0] + d[0], position[1] + d[1])
                if 0 <= neighbor[0] < m and 0 <= neighbor[1] < n and \
 node_id(neighbor, n) in set:
                   if find_set(node_id(node, n)) !=find_set(node_id(neighbor, n)):
                       # Merge different islands, amortised time: O(log*k) ~= O(1)
                       union_set(node_id(node, n), node_id(neighbor, n))
                       number -= 1
            numbers.append(number)

          return numbers

你可能感兴趣的:(算法专题:Connected Components)