清点代码库(Python)

题目描述

清点代码库

清点代码库(Python)_第1张图片

上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”

这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式:

输入在第一行中给出 2 个正整数,依次为 N ( ≤ 1 0 4 ) N(≤10^4) N(104) M ( ≤ 1 0 2 ) M(≤10^2) M(102),对应功能模块的个数和系列测试输入的个数。

随后 N N N 行,每行给出一个功能模块的 M M M 个对应输出,数字间以空格分隔。

输出格式:

首先在第一行输出不同功能的个数 K K K。随后 K K K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。

注:所谓数列 A 1 ​ , . . . , A M ​ { A_1​ , ..., A_M​ } A1,...,AM B 1 ​ , . . . , B M { B_1​ , ..., B_M } B1,...,BM 大,是指存在 1 ≤ i < M 1≤i1i<M,使得 A 1 = B 1 , . . . , A i = B i A_1 =B_1 ,...,A_i =B_i A1=B1...Ai=Bi 成立,且 A i + 1 > B i + 1 A_{i+1} >B_{i+1} Ai+1>Bi+1

输入样例:

7 3
35 28 74
-1 -1 22
8 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

输出样例:

4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35


解题思路

这是一个寻找功能重复的代码的问题。题目描述中给出了一个简化问题,即两个功能模块如果接受相同的输入并且产生相同的输出,则它们是功能重复的。为了解决这个问题,我们可以设计一系列测试输入,检查每个功能模块的输出,并找出功能重复的代码。

这个问题的关键在于理解题目要求的功能重复的定义,并通过适当的数据结构和排序方式来实现对功能重复代码的查找。这个问题可以通过使用字典(dictionary)来解决,使用字典记录功能模块的输出和对应的模块个数,并对字典进行排序,能够很好地解决问题。

我们可以遍历每个功能模块的输出,并将其作为字典的键,对应的模块个数作为字典的值。接下来,我们只需要根据字典的值进行排序和输出即可。

具体步骤如下:

  1. 输入功能模块的个数N和测试输入的个数M;
  2. 创建一个空字典用于记录功能模块的输出和对应的模块个数;
  3. 遍历每个功能模块:
    • 获取当前功能模块的对应输出;
    • 如果该输出已经在字典中,增加对应模块个数;
    • 否则将该输出加入到字典中,并设置模块个数为1;
  4. 根据模块个数和输出对字典进行排序,首先按照模块个数非递增顺序排序,如果有并列,则按输出序列的递增序排序;
  5. 输出不同功能的个数;
  6. 输出排序后的模块个数和对应的输出。

Python代码实现

# 输入功能模块个数N和测试输入个数M
N, M = map(int, input().split())

# 创建一个空字典用于记录功能模块的输出和对应的模块个数
modules = {}

# 遍历每个功能模块
for _ in range(N):
    # 获取当前功能模块的对应输出
    outputs = tuple(map(int, input().split()))
    
    # 如果该输出已经在字典中,增加对应模块个数
    if outputs in modules:
        modules[outputs] += 1
    # 否则将该输出加入到字典中,并设置模块个数为1
    else:
        modules[outputs] = 1

# 根据模块个数和输出对字典进行排序
sorted_modules = sorted(modules.items(), key=lambda x: (-x[1], x[0]))

# 输出不同功能的个数
print(len(sorted_modules))

# 输出排序后的模块个数和对应的输出
for module in sorted_modules:
    count = module[1]
    outputs = ' '.join(str(x) for x in module[0])
    print(count, outputs)

这段代码首先读取输入的功能模块个数N和测试输入个数M。接下来,我们创建一个空字典modules来记录功能模块的输出和对应的模块个数。

然后,我们使用for循环遍历每个功能模块。在每次迭代中,我们首先将当前功能模块的对应输出读取为一个元组outputs。如果该输出已经在字典中,说明之前已经有相同的功能模块,我们增加对应模块个数。否则,我们将该输出加入到字典中,并设置模块个数为1。

完成字典的构建后,我们使用sorted函数对字典按照模块个数进行排序。排序时,我们使用lambda函数作为key参数,使得排序首先按照模块个数的非递增顺序进行,然后再按照输出序列的递增顺序进行。

最后,我们输出不同功能的个数len(sorted_modules),以及排序后的模块个数和对应的输出。其中,我们使用了一个for循环来遍历sorted_modules,并将输出格式化为题目要求的形式。

你可能感兴趣的:(Python,python)