力扣 leetcode 839. 相似字符串组 (python)

Topic

如果交换字符串 X 中的两个不同位置的字母,使得它和字符串 Y 相等,那么称 X 和 Y 两个字符串相似。如果这两个字符串本身是相等的,那它们也是相似的。
例如,“tars” 和 “rats” 是相似的 (交换 0 与 2 的位置); “rats” 和 “arts” 也是相似的,但是 “star” 不与 “tars”,“rats”,或 “arts” 相似。
总之,它们通过相似性形成了两个关联组:{“tars”, “rats”, “arts”} 和 {“star”}。注意,“tars” 和 “arts” 是在同一组中,即使它们并不相似。形式上,对每个组而言,要确定一个单词在组中,只需要这个词和该组中至少一个单词相似。
给你一个字符串列表 strs。列表中的每个字符串都是 strs 中其它所有字符串的一个字母异位词。请问 strs 中有多少个相似字符串组?

Example_1

输入:strs = [“tars”,“rats”,“arts”,“star”]
输出:2

Example_2

输入:strs = [“omv”,“ovm”]
输出:1

Tips

1 <= strs.length <= 100
1 <= strs[i].length <= 1000
sum(strs[i].length) <= 2 * 104
strs[i] 只包含小写字母。
strs 中的所有单词都具有相同的长度,且是彼此的字母异位词。

Solution

用字典实现并查集和用列表实现并查集均可
但用列表实现并查集可以减少一个循环的使用,更推荐列表法

首先既然要判断相似字符串组的个数
那么如何判断字符串是否相似就是难点

判断字符串是否相似

设计一个is_similar函数判断两个字符串是否相等
由于题目中说明了strs 中的所有单词都具有相同的长度,且是彼此的字母异位词。
所以可以采用如下方法:

同时遍历两个字符串
如果其中不相等的字符恰好是两个
那么就说明他们只有两位字母发生了互换
他们满足相似字符的条件
输出True
反之则不满足返回False

在这里可以通过交换字符串数大于2break循环判断
增加运行效率

利用并查集判断组的个数

先初始化一个并查集加入所有节点

之后运用两层for循环
第二层为第一层中字符串往后的所有字符串

只要满足字符串相等或者满足相似字符串条件
将两个字符串的对应节点合并

利用并查集输出连通分量数即为结果

可以通过先判断节点是否连接增加运行效率
对于已经连接的无需连接
对于未连接的进行连接

Code

class UnionFind:
    def __init__(self, n):
        self.father = list(range(n))
        self.size = [1] * n
        # 当前连通分量数目
        self.setCount = n
    
    def find(self, x):
        if self.father[x] == x:
            return x
        self.father[x] = self.find(self.father[x])		
        return self.father[x]

    
    def merge(self, x, y):
        x, y = self.find(x), self.find(y)
        if x == y:
            return False
        if self.size[x] < self.size[y]:
            x, y = y, x
        self.father[y] = x
        self.size[x] += self.size[y]
        self.setCount -= 1
        return True
    
    def is_connected(self, x, y):
        return self.find(x) == self.find(y)


class Solution:
    def numSimilarGroups(self, strs: List[str]) -> int:
        def is_similar(A, B):
            n = len(A)
            diff = 0

            for i in range(n):
                if A[i] != B[i]: 
                    diff += 1
                if diff > 2:
                    break
            return diff == 2

        m = len(strs)
        uf = UnionFind(m)

        for j in range(m):
            for z in range(j + 1, m):
                if not uf.is_connected(j, z):
                    if strs[j] == strs[z] or is_similar(list(strs[j]), list(strs[z])):
                        uf.merge(j, z)
        
        return uf.setCount

Result

力扣 leetcode 839. 相似字符串组 (python)_第1张图片

你可能感兴趣的:(python,leetcode,字符串,列表,python,leetcode,算法)