正则表达式

正则表达式即用来进行字符串匹配。获取符合自己期望的信息


常规匹配:


泛匹配:使用.*来表示中间任意字符


对group进行划分:注意()内的字符需是同一类型


贪婪模式和非贪婪模式:.*与.*?(从左到右泛匹配时匹配到何时停止)



有换行的情况:.*无法匹配换行符,添加参数re.S之后可以匹配任意的字符



转义:使用\来转义


search与match方法的差别

注意search仍然可以用^和$来表示开头和结尾,但是必须要和content首尾相同,否则无法匹配。

*与?一个表示匹配0或多个之前的字符,另一个表示匹配0或多个之前的片段。

re.sub方法:

re.sub

替换字符串中每一个匹配的子串后返回替换后的字符串。


r表示保留原生字符。\1表示group1。


体会下换行符

strip(剥去)方法:


去除换行符


使用compile将正则表达式保存为模式,方便多次使用


你可能感兴趣的:(正则表达式)