python删除注释_722. 删除注释(Python)

题目

难度:★★★☆☆

类型:字符串

方法:逻辑判断

力扣链接请移步本题传送门

更多力扣中等题的解决方案请移步力扣中等题目录

给一个 C++ 程序,删除程序中的注释。这个程序source是一个数组,其中source[i]表示第i行源码。 这表示每行源码由\n分隔。

在 C++ 中有两种注释风格,行内注释和块注释。

字符串// 表示行注释,表示//和其右侧的其余字符应该被忽略。

字符串/* 表示一个块注释,它表示直到/的下一个(非重叠)出现的所有字符都应该被忽略。(阅读顺序为从左到右)非重叠是指,字符串//并没有结束块注释,因为注释的结尾与开头相重叠。

第一个有效注释优先于其他注释:如果字符串//出现在块注释中会被忽略。 同样,如果字符串/*出现在行或块注释中也会被忽略。

如果一行在删除注释之后变为空字符串,那么不要输出该行。即,答案列表中的每个字符串都是非空的。

样例中没有控制字符,单引号或双引号字符。比如,source = "string s = "/* Not a comment. */";" 不会出现在测试样例里。(此外,没有其他内容(如定义或宏)会干扰注释。)

我们保证每一个块注释最终都会被闭合, 所以在行或块注释之外的/*总是开始新的注释。

最后,隐式换行符可以通过块注释删除。 有关详细信息,请参阅下面的示例。

从源代码中删除注释后,需要以相同的格式返回源代码。

示例 1:

输入:

source = ["/*Test program /", "int main()", "{ ", " // variable declaration ", "int a, b, c;", "/ This is a test", " multiline ", " comment for ", " testing */", "a = b + c;", "}"]

示例代码可以编排成这样:

/*Test program /

int main()

{

// variable declaration

int a, b, c;

/ This is a test

multiline

comment for

testing */

a = b + c;

}

输出: ["int main()","{ "," ","int a, b, c;","a = b + c;","}"]

编排后:

int main()

{

int a, b, c;

a = b + c;

}

解释:

第 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。

示例 2:

输入:

source = ["a/comment", "line", "more_comment/b"]

输出: ["ab"]

解释: 原始的 source 字符串是 "a/comment\nline\nmore_comment/b", 其中我们用粗体显示了换行符。删除注释后,隐含的换行符被删除,留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].

注意:

source的长度范围为[1, 100].

source[i]的长度范围为[0, 80].

每个块注释都会被闭合。

给定的源码中不会有单引号、双引号或其他控制字符。

解答

这道题没有用到更多的特别的算法,相当于实现编译器的第一步,即解码部分。

c++注释有两种类型,基于“//”的单行注释和基于“/**/”的多行注释。输入的每一行以列表形式给出。这里比较麻烦的是,注释的标志符并非总是出现在每一行的开头,所以每一行都要逐个字符的遍历,需要一个全局变量in_block来标记当前遍历的字符是不是在注释块内。

每一次循环,只要不是in_block=True,也就是这一行第一个字符开始遍历时,该字符不再注释块内,我们就建立一个空串new_line,用来存储这一行的结果。这里必须要加入这一判断,要避免的就是可能存在多行注释并非严格的以某一行的开头作为注释块开头的情况,例如有些多行注释块,“/”同一行左边是有代码的,“/”同一行右边也可能有代码,这种情况就需要着重的考虑。

遍历一行中每个字符,首先根据in_block标志位判断当前遍历的行最开始的字符是注释还是代码,如果是代码,那么我们就寻找有没有注释块的起始表示符“//”或“/”,如果发现“/”,修改in_block标志位为False的同时,将指针挪到“/*”以后的字符,如果发现“//”,则整行跳过,继续下一行的判断。注意这里不需要修改标志位。

另一种情况,如果in_block=True,说明当前遍历的行以及当前行遍历的字符在多行代码块内(实际上单独一行也可以出现“/*/”代码块,这里是一个名称罢了),我们需要随时判断是否会出现结尾标识符“/”,如果检测到,需要进行in_block状态的修改,并移动指针到合法位置。

遍历完一行后,当且仅当new_line中存储有字符串,并且多行注释标志位in_block为False时,把本行加入结果列表中。实际上,加入结果列表中的行有两种情况,第一种是普通合法的代码行,第二种是由于多行代码块的插入而合并的两行代码。

class Solution(object):

def removeComments(self, source):

in_block = False

ans = []

for line in source:

i = 0

if not in_block:

newline = ""

while i < len(line):

if not in_block:

if line[i:i+2] == '/*':

in_block = True

i += 2

continue

elif line[i:i + 2] == '//':

break

else:

newline += line[i]

elif line[i:i+2] == '*/':

in_block = False

i += 2

continue

i += 1

if newline and not in_block:

ans.append(newline)

return ans

如有疑问或建议,欢迎评论区留言~

有关更多力扣中等题的python解决方案,请移步力扣中等题解析

你可能感兴趣的:(python删除注释)