第10课 正则中用sub和subn函数搜索与替换
# 使用sub和subn函数搜索和替换

'''
sub(正则表达式,要替换的字符串,母字符串)
'''

import re
result = re.sub('Bill','Mike', 'Bill is my son.')
print(result)       # Mike is my son.   把Bill 替换成 Mike

result = re.subn('Bill', 'Mike', 'Bill is my son, I like Bill')
print(result)       # ('Mike is my son, I like Mike', 2)    分组    把Bill 全部替换成 Mike  后面为2次
print(result[0])    # Mike is my son, I like Mike
print('已经替换了{}次'.format(result[1]))    # 已经替换了2次

# 使用'\N'引用匹配字符串的分组
# 1abc 1:abc   2xyz 2:xyz   9hfg 9:hfg
result = re.sub('([0-9])([a-z]+)',r'\1:\2' ,'01-1abc,02-2xyz,03-9hfg')
print(result)   # 01-1:abc,02-2:xyz,03-9:hfg

# 这里面 可以是函数
def fun():
    return r'[\1*\2]'
result = re.subn('([0-9])([a-z]+)',fun() ,'01-1abc,02-2xyz,03-9hfg')
print(result)      # ('01-[1*abc],02-[2*xyz],03-[9*hfg]', 3)
print(result[0])   # 01-[1*abc],02-[2*xyz],03-[9*hfg]
print(result[1])   # 3
第11课 正则中 使用split函数分隔字符串
# 使用split函数分隔字符串

import re
result = re.split(';','Bill;Mike;John')
print(result)     # ['Bill', 'Mike', 'John']

# 至少有1个逗号(,)或分号(;)或点(\.)或空白符空格(\s) *****
result = re.split(r'[,;\.\s]+','a,b,,,d.x,;ok')
print(result)     # ['a', 'b', 'd', 'x', 'ok']

# 用以3个小写字母开头,紧接着一个连字符(-),并以两个数字结尾的字符串作为分隔符
# abc-12
result = re.split('[a-z]{3}-[0-9]{2}','testabc-3213productxyz-45abill')
print(result)         # ['test', '13product', 'abill']
result = re.split('[a-z]{3}-[0-9]{2}','testabc-3213productxyz-45abill',maxsplit=1)
print(result)         # ['test', '13productxyz-45abill']    只分割了一次
第12课 练习题

# 练习题讲解

'''
1.  编写一个正则表达式,匹配这几个单词:bat、Bit、But、hAt、hit、hut。
'''
import re
s1 = '^[bh][aiu]t$'
list =['bat','Bit','But','hAt','hit','hut']
for value in list:
    print(re.match(s1, value,re.I))
print("-------------------")

s2 = '^[bh][aiu]t$'
list =['bat','Bit','But','hAt','hit','hut']
for value in list:
    #print(re.match(s1, value,re.I))
    m = re.match(s2, value, re.I)
    print(m.group())
print("-------------------")

# 练习题讲解
'''
2.  编写一个正则表达式,匹配信用卡号。格式如下:
xxxx xxxx xxxx xxxx,其中x表示0到9的数字。每一组是4个数字,组与组之间需要有至少一个空格。\s+  至少一个空格
1234 4321 5432 1234    # 空白符空格(\s)
'''
import re
s = '^\d{4}\s+\d{4}\s+\d{4}\s+\d{4}$'
list = ['1234 4321 5432 1234','12345 4321 5432 1234']
for value in list:
    print(re.match(s,value,re.I))
'''
结果为第一个是匹配的 第二个是不匹配的 

None
'''

print("-----------")
# 练习题讲解
'''
3. 编写一个匹配日期的正则表达式,日期格式:YYYY-MM?-DD?。
其中YYYY表示4位的年,MM?表示1位或2位的月,DD?表示1位或2位的日。
而且4位的年必须在2000年以后,包括2000年。
例如,2001-4-5、2004-05-1都符合要求。

'''
import re
s = '2\d{3}-\d{1,2}-\d{1,2}'
print(re.match(s, '2002-12-1'))   # 

ss = '日期1:2012-4-12   日期2:1997-1-4   日期3:2045-1-2'
print(re.findall(s,ss))    # ['2012-4-12', '2045-1-2']