记录一下操作步骤,懒得翻代码,复制使用。
例如:asd2312ssa213sda
import re
content =content.replace(" ","")
model = re.compile("[0-9]+")
if model.search(content) is not None:
pos = model.search(content).span()
return int(content[pos[0]:pos[1]])
反馈 :2312
[0-9]+ :表示匹配数字开头直到不是数字的子字符,+为贪婪
想要获取所有匹配的数字列表是十分简单的:
content ="1uhi2uhi2h2ih3uh4"
model = re.compile("[0-9]+")
retlist = model.findall(content)
print retlist
反馈就是['1','2','2','2','3','4'].
变量能用数字加上字母与下划线组成,sd_1等等,从不规范的代码中获取其特定变量的位置。
要求:匹配所有制定变量并修改其名称。
CONTINUOUSUPDATE := 2.3,AAA:= Q2, OUTAAA => Q2);Q1.AAA:=Q2;Q2 := Q1.OUTAXIS;
AAA11 :=2;AAA:= 4;
例如匹配AAA变量修改为BBB
代码如下:
remodel5 = re.compile(r"\WAAA(?:\s)*:=(?:\s)*\w+")
list5 = remodel5.findall(mycon)
if len(list5) >0:
for i in list5:
xxx
print i
有可能代码比较乱,以上匹配结果是:
,AAA:= Q2
.AAA:=Q2
;AAA:= 4
\W:不是数字字母和下划线 (\s)* 任意个空格 \w+ 一个数字字母下划线组成的字符串。如果想要匹配C变量格式的可以使用“
[a-zA-Z_]\w*
”
然后使用python的replace函数进行循环替换即可。但是如果使用re.sub()会更加简单:
import re
str1 = "CONTINUOUSUPDATE := 2.3,AAA:= Q2, OUTAAA => Q2);Q1.AAA:=Q2;Q2 := Q1.OUTAXIS;AAA11 :=2;AAA:= 4;"
str2 = re.sub(r"(\bAAA\b)",r"\1BBB",str1)
print str1
print str2
CONTINUOUSUPDATE := 2.3,AAA:= Q2, OUTAAA => Q2);Q1.AAA:=Q2;Q2 := Q1.OUTAXIS;AAA11 :=2;AAA:= 4;
CONTINUOUSUPDATE := 2.3,AAABBB:= Q2, OUTAAA => Q2);Q1.AAABBB:=Q2;Q2 := Q1.OUTAXIS;AAA11 :=2;AAABBB:= 4;
注意re.sub()中的“\1”的作用是第一个正则参数的每一个使用小括号()括起来的内容。
有了对字符串分割的目的,使用re.split就自然而然了。
基本用法:
>>> s= "qweqwabqwesabfefweabtewgfsabsda"
>>> ret = re.split("ab",s)
>>> ret
['qweqw', 'qwes', 'fefwe', 'tewgfs', 'sda']
将例子中的“ab”作为分割符可以分为多个列表字符串。
保留匹配的部分数据:
['qweqw', 'qwes', 'fefwe', 'tewgfs', 'sda']
>>> ret = re.split("a(b)",s)
>>> ret
['qweqw', 'b', 'qwes', 'b', 'fefwe', 'b', 'tewgfs', 'b', 'sda']
这里使用小括号,可以单独作为一个字符串写入返回的列表中。
1.在python代码中使用(),需要加上?:变成(?:***)使用!不然list5会有两个空格元素!
2.使用匹配小数点的时候,需要加上[],即 [.]表示匹配小数点,而.可以匹配很多种字符。