Python正则表达式findall()函数

# list = re.findall(regex,string,flag)

import re
string0 = 'abcdefgh'
list0 = re.findall('ab',string0)
print(list0)
# ['ab']


string1 = 'abcdefghab'
list1 = re.findall('ab',string1)
print(list1)
# ['ab', 'ab']


string2 = 'abcdefghab'
list2 = re.findall('(ab)cd',string2)
print(list2)
# ['ab']


string3 = 'abcdefghabcd'
list3 = re.findall('(ab)cd',string3)
print(list3)
# ['ab', 'ab'] 一个字组匹配到两处 只显示子组内容


string4 = 'abcdefghabcd'
list4 = re.findall('(ab)cd(ef)',string4)
print(list4)
# [('ab', 'ef')]

string5 = 'abcdefghabcd'
list5 = re.findall('((ab)cd(ef))',string5)
print(list5)
# [('abcdef', 'ab', 'ef')]  整体匹配到1处,有3个子组

string6 = 'abcdefghabcdef'
list6 = re.findall('(ab)cd(ef)',string6)
print(list6)
# [('ab', 'ef'), ('ab', 'ef')]


# 注意:
# 1.用findall来匹配时,如果正则表达式中没有子组,则返回的列表中的每一项都是匹配到的字符串,匹配到几处就有几个
#
#
# 2.如果正则表达式中含有一个子组,
# 则返回的列表中的各项是匹配到的字符串的子组内容,整体匹配到几处就有几个子组内容
#
#
# 3.如果正则表达式中含有多个子组
# 则返回含有元组的列表
# 正则字符串整体匹配到几处就有几个元组
# 每个元组中的内容是 正则表达式每个子组匹配到的内容

你可能感兴趣的:(Python)