打开第1234676289次

《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

第 1 章正则表达式常用函数与方法使用

正则表达式 (regular expression) 描述了一种字符串匹配的模式（ pattern ），可以用来检查

一个串是否含有某种子串。对匹配成功的字符串进行提取、拆分、替换等对应的数据处理。

几乎所有的编程语言都支持正则表达式。总体规则相同，但不同编程语言正则的处理方式却

略有不同。在整理零乱的数据时非常有用，比如做抓取网页数据、做数据验证等就经常用到。

1.01 正则表达式的两种使用方法

2. 直接使用 re 模块做正则表达式的匹配。

import re # 导入正则模块

lst1=re.findall( r'\d' , '9527' ) # 使用正则模块下的函数进行匹配

print (lst1) # 返回正则函数执行的结果

返回结果

['9', '5', '2', '7']

2. 用编译后的正则表达式去匹配字符串

import re # 导入正则模块

pattern=re.compile( r'\d' ) # 使用 compile 函数生成正则表达式对象

lst2=pattern.findall( '9527' ) # 使用正则对象的方法进行匹配

print (lst2) # 返回正则方法执行的结果

返回结果

['9', '5', '2', '7']

如果要重复使用正则表达式，则可以先将正则表达式先预编译好，也就是上面的第 2 种

方法，然后就可以重复使用了，而且效率更高。但在后面的章节讲解正则的相关函数和方法

时，我们会同时讲解这两种方式的表示方法。

不同的函数（方法）匹配成功后，返回的数据类型可能不一样。可能返回 re.Match （匹

配对象）、 list （列表）、 iterator （迭代器）、 str （字符串）等数据类型。其中 re.Match 对象中

有很多匹配成功的信息需要获取，可以通过使用 Match 对象的方法和属性来获取。后面章节

将系统讲解这些方法和属性。

1.02 从头匹配字符串（ match ）

Match 函数（方法）返回的是一个 re.match 对象。如果希望从字符串的开始位置匹配字

符串，则可以使用正则模块的 match 函数。如果匹配成功，就返回一个相应的匹配对象。如《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

果没有匹配，就返回 None 。

注意，如果被匹配的字符串能多次匹配成功，则只返回第 1 次匹配成功的 Match 对象。

1.02.1 re.match 函数

函数及参数说明：

re.match(pattern, string, flags=0)

pattern 匹配的正则表达式

string

要匹配的字符串。

flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

等。参见：正则表达式修饰符 - 可选标志

示例如下：

前面说过， Match 对象中有很信息可以提取，但由于现在还是初学正同阶段，所以先不

系统讲解，后面再讲。这里只讲解提取一个最常用的信息，就是提取匹配成功的字符串。比

如上面的案例中 m 代表 Match 对象 ,m[0] 则表示提取匹配成功的字符串。

1.02.2 regex.match 方法

方法及参数说明：

regex.match(string[, pos[, endpos]])

string

必选，被匹配的字符串。

pos

可选，指定起始位置。

endpos 可选，指定结束位置。

示例如下：

import re

m=re.match( r'apple' , 'apple 苹果 ' ) # 匹配以 'apple' 开头的字符串

print (m , m[ 0 ]) # 返回匹配结果

返回结果

apple 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

注意： re.compile(r'\d+') 中的“

\d+ ”表示什么意思呢？如果你是从未使用过的正则的用

户，可能很疑惑，它实际上是正则表达式中的元字符（特殊字符），表示至少有一个数字，并

尽可能匹配更多的数字。这里主要是为了稍微表现一下正则的强大，也方便举例。后面也会

详细讲解所有的元字符应用。

1.02.3 re.fullmatch 与 regex.fullmatch 的从头完全匹配

前面学习了关于 match 的函数和方法匹配方法，如果需要从最开始（或指定位置开始）

完整的匹配字符串，则可以使用 funllmatch 函数和 funllmatch 方法（可以从指定的位置开始）。

1.03 实例应用（提取金额）

我们来做个应用，如图 1-1 所示，将表中 A 列业绩中的金额部分，提取到 B 列，虽然有

很多方法可以完成，但现在我们希望使用刚刚学习的正则中的 match 函数（方法）来完成。

图 1-1

代码如下所示：

import re

pattern=re.compile( r'\d+' ) # 匹配多个数字

m1=pattern.match( '20kg,apple 苹果 ,123 元 ' , ) # 从最左边开始匹配

m2=pattern.match( '20kg,apple 苹果 ,123 元 ' , 13 ) # 从指定位置开始匹配

print (m1 , m1[ 0 ]) # 返回匹配结果

print (m2 , m2[ 0 ]) # 返回匹配结果

返回结果

123 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

1.04 任意匹配字符串（ search ）

之前学习的 match 是必须从起始位置开始匹配，如果不需要从起始位置匹配，则可以使

用 search 。如果匹配成功，就返回一个相应的匹配对象。如果没有匹配，就返回 None 。

注意，如果被匹配的字符串能多次匹配成功，则只返回第 1 次匹配成功的 Match 对象。

1.04.1 re.search 函数

函数及参数说明：

search(pattern, string, flags=0)

pattern 匹配的正则表达式

string

要匹配的字符串。

flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

参见：正则表达式修饰符 - 可选标志

1.04.2 regex.search 方法

import re , openpyxl

wb=openpyxl.load_workbook( ' 部门业绩表 .xlsx' ) # 读取工作簿

ws=wb.active # 读取工作簿中的活动工作表

pattern=re.compile( r'\d+' ) # 正则样式

for v in ws[ 'a:a' ][ 1 :]: # 读取 A 列每个单元格的数据

m=pattern.match(v.value , 4 ) # 从指定位置开始匹配

v.offset( 0 , 1 ).value= int (m[ 0 ]) # 将匹配成功的数据写入第 2 列

ws.cell( 1 , 2 , ' 金额 ' ) # 编写第 2 列标题

wb.save( ' 提取结果 .xlsx' ) # 保存为另外的文件

import re

lst1=re.search( r'\d+' , '120 元 / 千克 - 牛肉 ' )

lst2=re.search( r'\d+' , ' 牛肉 -120 元 / 千克 ' )

print (lst1)

print (lst2)

返回结果

《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

方法及参数说明：

regex.search(string[, pos[, endpos]])

string

必选，被匹配的字符串。

pos

可选，指定起始位置。

endpos 可选，指定结束位置。

1.05 实例应用（提取单价与数量求金额）

统计每种产品的采购金额是多少？效果如图 1-2 中 B 列所示。

图 1-2

代码如下：

import re

pattern=re.compile( r'\d+' )

lst1=pattern.search( '10 斤牛肉 460 元 ' )

lst2=pattern.search( '10 斤牛肉 460 元 ' , 4 , 7 )

print (lst1)

print (lst2)

返回结果

import re , openpyxl

wb=openpyxl.load_workbook( ' 采购表 .xlsx' )

ws=wb.active

pattern=re.compile( r'\d+' )

for val in ws[ 'a:a' ][ 1 :]:

l1=pattern.search(val.value)

l2=pattern.search(val.value , l1.span()[ 1 ])

price= int (l1.group()) # 获取单价

number= int (l2.group()) # 获取数量

val.offset( 0 , 1 ).value=price*number

wb.save( ' 结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

1.06 拆分字符串（

split ）

Python 中虽然有 split 拆分，但没有正则中的 split 强大、灵活。正则中的 Split 返回的是

列表。

1.06.1 re.split 函数

函数及参数说明：

re.split(pattern, string[, maxsplit=0, flags=0])

pattern 匹配的正则表达式

string

要匹配的字符串。

maxsplit 分隔次数， maxsplit=1 分隔一次，默认为 0 ，不限制次数。

Flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

参见：正则表达式修饰符 - 可选标志

用 pattern 分开 string 。如果在 pattern 中捕获到括号，那么所有的组里的文字也会包含

在列表里。如果 maxsplit 非零，最多进行 maxsplit 次分隔，剩下的字符全部返回到列表的最

后一个元素。

1.06.2 regex.split 方法

方法及参数说明：

regex.split(string, maxsplit=0)

import re

# 常规拆分

lst1=re.split( r'-' , '01 张三 -02 李四 -03 王五 -04 陈小兵 -05 大龙 ' )

# 添加括号拆分

lst2=re.split( r'(-)' , '01 张三 -02 李四 -03 王五 -04 陈小兵 -05 大龙 ' )

# 指定拆分次数

lst3=re.split( r'-' , '01 张三 -02 李四 -03 王五 -04 陈小兵 -05 大龙 ' , 3 )

print (lst1)

print (lst2)

print (lst3)

返回结果

['01 张三 ', '02 李四 ', '03 王五 ', '04 陈小兵 ', '05 大龙 ']

['01 张三 ', '-', '02 李四 ', '-', '03 王五 ', '-', '04 陈小兵 ', '-', '05 大龙 ']

['01 张三 ', '02 李四 ', '03 王五 ', '04 陈小兵 -05 大龙 '] 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

string

要匹配的字符串。

maxsplit 分隔次数， maxsplit=1 分隔一次，默认为 0 ，不限制次数。

1.07 实例应用（整理数据方法 1 ）

整理参赛表中的数据，将每个班的参加名单整理成一个规范的表格。如图 1-3 所示。

图 1-3

代码如下所示：

import re

# 常规拆分

pattern1=re.compile( r'-' )

lst1=pattern1.split( '01 张三 -02 李四 -03 王五 -04 陈小兵 -05 大龙 ' )

# 添加括号拆分

pattern2=re.compile( r'(-)' )

lst2=pattern2.split( '01 张三 -02 李四 -03 王五 -04 陈小兵 -05 大龙 ' )

# 指定拆分次数

lst3=pattern1.split( '01 张三 -02 李四 -03 王五 -04 陈小兵 -05 大龙 ' , 3 )

print (lst1)

print (lst2)

print (lst3)

返回结果

['01 张三 ', '02 李四 ', '03 王五 ', '04 陈小兵 ', '05 大龙 ']

['01 张三 ', '-', '02 李四 ', '-', '03 王五 ', '-', '04 陈小兵 ', '-', '05 大龙 ']

['01 张三 ', '02 李四 ', '03 王五 ', '04 陈小兵 -05 大龙 '] 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

1.08 查找字符串 -1 （

findall ）

之前的 match,fullmatch,search 只匹配一次，并且返回的是 Match 对象，但 Findall 函数（方

法）返回所有匹配成功的字符串。返回的是列表类型。如果没有找到匹配的，则返回空列表。

Findall 如果没有分组，则直接返回匹配成功的所有字符串；如只有一个分组，则返回分

组中的值到列表；如果多于一个分组，则以元组的方式将每个分组内容返回到列表中。

1.08.1 re.findall 函数

函数及参数说明：

re.findall(pattern,string)

pattern 匹配的正则表达式

string

要匹配的字符串。

flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

参见：正则表达式修饰符 - 可选标志

对 string 返回一个不重复的 pattern 的匹配列表， string 从左到右进行扫描，匹配按找

到的顺序返回。如果样式里存在一到多个组，就返回一个组合列表；就是一个元组的列表（如

果样式里有超过一个组合的话）。空匹配也会包含在结果里。

import re , openpyxl

wb=openpyxl.load_workbook( ' 参赛表 .xlsx' )

ws=wb.active

nwb=openpyxl.Workbook()

nws=nwb.active

pattern = re.compile( '(\d+)' )

nws.append([ ' 班级 ' , ' 学号 ' , ' 姓名 ' ])

for r1 , r2 in ws.iter_rows( 2 ):

lst = pattern.split(r2.value)[ 1 :]

for i in range ( 0 , len (lst) , 2 ):

nws.append([r1.value]+lst[i:i+ 2 ])

nwb.save( ' 结果表 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

1.08.2 regex.findall 方法

方法及参数说明：

regex.findall(string[, pos[, endpos]])

string

待匹配的字符串。

pos

可选参数，指定字符串的起始位置，默认为 0 。

endpos 可选参数，指定字符串的结束位置，默认为字符串的长度。

import re

s= ' 张三 2 李四 3 王五 4 陈小兵 15 大龙 '

# 常规匹配

l1=re.findall( r'\d+\D+' , s)

# 添加一组括号

l2=re.findall( r'(\d+)\D+' , s)

# 添加两组括号

l3=re.findall( r'(\d+)(\D+)' , s)

print (l1)

print (l2)

print (l3)

返回结果

['2 李四 ', '3 王五 ', '4 陈小兵 ', '15 大龙 ']

['2', '3', '4', '15']

[('2', ' 李四 '), ('3', ' 王五 '), ('4', ' 陈小兵 '), ('15', ' 大龙 ')] 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re

s= '31 张三 2 李四 3 王五 4 陈小兵 15 大龙 '

# 常规匹配

pattern1=re.compile( r'\d+\D+' )

l1=pattern1.findall(s)

# 添加一组括号

pattern2=re.compile( r'(\d+)\D+' )

l2=pattern2.findall(s)

# 添加多组括号

pattern3=re.compile( r'(\d+)(\D+)' )

l3=pattern3.findall(s)

print (l1)

print (l2)

print (l3)

返回结果

['31 张三 ', '2 李四 ', '3 王五 ', '4 陈小兵 ', '15 大龙 ']

['31', '2', '3', '4', '15']

[('31', ' 张三 '), ('2', ' 李四 '), ('3', ' 王五 '), ('4', ' 陈小兵 '), ('15', ' 大龙 ')]

1.09 实例应用（整理数据方法 2 ）

如图 1-4 所示，前面我们整理个参赛表，但希望能再改进一下。

图 1-4

代码如下所示：《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

1.10 查找字符串 -2 （ finditer ）

finditer 和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并把它们作为

一个迭代器返回。迭代器中的每个元素则是 re.Match 对象。

1.10.1 re.finditer

函数及参数说明：

re.finditer(pattern, string, flags=0)

pattern 匹配的正则表达式

string

要匹配的字符串。

flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

参见：正则表达式修饰符 - 可选标志

import re , openpyxl

wb=openpyxl.load_workbook( ' 参赛表 .xlsx' )

ws=wb.active

nwb=openpyxl.Workbook()

nws=nwb.active

pattern = re.compile( '

(\d+)(\D+)' )

nws.append([ ' 班级 ' , ' 学号 ' , ' 姓名 ' ])

for r1 , r2 in ws.iter_rows( 2 ):

lst = pattern.findall(r2.value)

for x in lst:

nws.append((r1.value , )+x)

nwb.save( ' 结果表 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

re.Match[0] ，有无分组均提取匹配成功所有字符串。

re.Match[1] ，有分组，提取分组中的第 1 组的内容。

re.Match[…] ，有分组，提取分组中指定组的内容。

1.10.2 regex.finditer 方法

方法及参数说明：

regex.finditer(string[, pos[, endpos]])

string

待匹配的字符串。

pos

可选参数，指定字符串的起始位置，默认为 0 。

endpos 可选参数，指定字符串的结束位置，默认为字符串的长度。

使用了编译后样式，也可以接收可选参数 pos 和 endpos ，限制搜索范围。并且执行结

果是一个迭代器对象，不占内存空间，匹配速度更快。

import re

s= '31 张三 2 李四 3 王五 4 陈小兵 15 大龙 '

# 常规匹配

l1=re.finditer( r'\d+\D+' , s)

# 添加一组括号

l2=re.finditer( r'\d+(\D+)' , s)

# 添加两组括号

l3=re.finditer( r'(\d+)(\D+)' , s)

print ([i[ 0 ] for i in l1])

print ([(i[ 0 ] , i[ 1 ]) for i in l2])

print ([(i[ 0 ] , i[ 1 ] , i[ 2 ]) for i in l3])

返回结果

['31 张三 ', '2 李四 ', '3 王五 ', '4 陈小兵 ', '15 大龙 ']

[('31 张三 ', ' 张三 '), ('2 李四 ', ' 李四 '), ('3 王五 ', ' 王五 '), ('4 陈小兵 ', ' 陈小兵 '), ('15

大龙 ', ' 大龙 ')]

[('31 张三 ', '31', ' 张三 '), ('2 李四 ', '2', ' 李四 '), ('3 王五 ', '3', ' 王五 '), ('4 陈

小兵 ', '4', ' 陈小兵 '), ('15 大龙 ', '15', ' 大龙 ')] 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re

s= '31 张三 2 李四 3 王五 4 陈小兵 15 大龙 '

# 常规匹配

pattern1=re.compile( r'\d+\D+' )

l1=pattern1.finditer(s)

print (l1)

# 添加一组括号

pattern2=re.compile( r'(\d+)\D+' )

l2=pattern2.finditer(s)

# 添加两组括号

pattern3=re.compile( r'(\d+)(\D+)' )

l3=pattern3.finditer(s)

print ([i[ 0 ] for i in l1])

print ([(i[ 0 ] , i[ 1 ]) for i in l2])

print ([(i[ 0 ] , i[ 1 ] , i[ 2 ]) for i in l3])

返回结果

['31 张三 ', '2 李四 ', '3 王五 ', '4 陈小兵 ', '15 大龙 ']

[('31 张三 ', '31'), ('2 李四 ', '2'), ('3 王五 ', '3'), ('4 陈小兵 ', '4'), ('15

大龙 ', '15')]

[('31 张三 ', '31', ' 张三 '), ('2 李四 ', '2', ' 李四 '), ('3 王五 ', '3', ' 王五 '),

('4 陈小兵 ', '4', ' 陈小兵 '), ('15 大龙 ', '15', ' 大龙 ')]

1.11 实例应用（表格数据整理）

如图 1-5 所示，将数据转换成规范的表格。

图 1-5 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

代码如下：

1.12 Sub 函数与方法

可以对匹配成功的字符串进行替换处理。

1.12.1 re.sub 函数

函数及参数说明：

re.sub(pattern, repl, string, count=0, flags=0)

pattern 正则中的模式字符串。

repl

替换的字符串，也可为一个函数。

string

要被查找替换的原始字符串。

count

模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

flags

编译时用的匹配模式，数字形式。

第二参数为字符串的查找替换

第二参数为函数的查找替换

import re , openpyxl

pattern=re.compile( r'(\d+)(\D+)' )

wb=openpyxl.load_workbook( ' 捐款表 .xlsx' )

ws=wb.active

nws=wb.create_sheet( ' 结果 ' )

nws.append([ ' 公司名 ' , ' 姓名 ' , ' 金额 ' ])

for v in ws[ 'a:a' ][ 1 :]:

s=v.value.split( '-' )

i=pattern.finditer(v.value , len (s[ 0 ]))

l=[[s[ 0 ] , m[ 2 ] , int (m[ 1 ])] for m in i]

for l1 in l:

nws.append(l1)

wb.save( ' 整理结果 .xlsx' )

import re

s1=re.sub( r'\d+' , ' 、 ' , ' 张三平 2800 李四 7054 林森 11200' )

print (s1)

返回结果

张三平、李四、林森、《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

1.12.2 Regex.sub 方法

方法及参数说明：

regex.sub(repl, string, count=0)

repl

替换的字符串，也可为一个函数。

string

要被查找替换的原始字符串。

count

模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

第一参数是为字符串时的查找替换

第一参数是为函数时的查找替换

import re

# --------- 自定义函数 ----------

def fun (m):

return m[0] + ' 、 '

#-----------------------------

s1=re.sub( r'\d+' , fun , ' 张三平 2800 李四 7054 林森 11200' )

print (s1)

返回结果

张三平 2800 、李四 7054 、林森 11200 、

import re

pattern=re.compile( r'\d+' )

s1=pattern.sub( ' 、 ' , ' 张三平 2800 李四 7054 林森 11200' )

print (s1)

返回结果

张三平、李四、林森、《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re

pattern=re.compile( r'\d+' )

# --------- 自定义函数 ----------

def fun (m):

return '(' +m[0]+ ') 、 '

#-----------------------------

s1=pattern.sub(fun , ' 张三平 2800 李四 7054 林森 11200' )

print (s1)

返回结果

张三平 (2800) 、李四 (7054) 、林森 (11200) 、

还有一种 subn 的方式，则是增加了查找替换成功的次数，与结果组合成一个元组。

1.13 实例应用（判断字符串中的数字）

如图 1-6 所示，判断 B 列的分数，如果大于等于 90 分，则显示为“优秀”，否则显示为

“普通”。

图 1-6

代码如下所示：《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

第 2 章正则表达式元字符详解

在第 1 章中讲解了，

Python 中正则表达式的常用函数和方法，这对数据的处理非常有用。

但还有最重要的一项技术（正则表达式字符）没有讲解，使得这些函数和方法还不能完全发

挥作用。本章将系统讲解这一内容。

2.01 元字符之单个字符（字母、数字、任意）

实例

描述

使用 re.ASCII 或 re.A 属性，

内联标志为 ?a

让 \w, \W, \b, \B, \d, \D, \s

和 \S 只匹配 ASCII ，而不是

Unicode 。

转义，将普通字符与特殊字符的互转。

匹配一个数字字符。等价于 [0-9] 。

匹配一个非数字字符。等价于 [^0-9] 。

匹配 Unicode 字符、数字及下划线。

匹配 Unicode 中非包括下划线的任何字符。

匹配任何空白字符，包括空格、制表符、换页符

等等。等价于 [ \f\n\r\t\v] 。

匹配任何非空白字符。等价于 [^ \f\n\r\t\v] 。

匹配任意字符，除了换行符 \n ，当

re.DOTALL\re.S\(?s) 标记被指定时，则可以匹配包

括换行符的任意字符。

2.02 实例应用（单词整理）

如图 2-1 所示，统计 txt 演讲稿中，每个单词出现的频次。

import re , openpyxl

wb=openpyxl.load_workbook( ' 成绩表 .xlsx' )

ws=wb.active

pattern=re.compile( r'\d+' )

# --------------------------------------

def fun (m):

n= int (m[ 0 ])

level= '( 优秀 )' if n>= 90 else '( 普通 )'

return m[ 0 ]+level

# --------------------------------------

for c in ws[ 'b:b' ][ 1 :]:

c.value=pattern.sub(fun , c.value)

wb.save( ' 成绩表 -1.xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

图 2-1

代码如下：

2.03 元字符之单个字符（字符组）

字符组 [ … ] 可以是一段字符范围，或单个字符的指定。下面举例说明：

代码

含义

[0-9] 、 [1-59]

所有单个数字、 1 到 5 或者 9

[A-Za-z] 、 [A-z] 、 [d-mz4-8] 所有字母、所有字母、字母 d 到 m 数字 4 到 8

[ 一 - 龥 ] [\u4e00-\u9fa5]

汉字范围。

[\d\w]

可以将元字符放在里面。

[^ …… ]

匹配输入字符串的开始位置，除非在方括号表达式中使用，此

import re , openpyxl

wb=openpyxl.Workbook() # 新建工作簿

ws=wb.active # 获取工作表对象

pattern=re.compile( r'\w+' , re.A)

dic={}

with open ( ' 演讲稿 .txt' , 'r' ) as f: # 读取 txt 文件

m=f.read()

for w in pattern.findall(m): # 将拆分出的单词进行统计

if w in dic.keys():

dic[w]+= 1

else :

dic[w]= 1

l= sorted (dic.items() , key = lambda x:x[ 1 ] , reverse = 1 ) # 排序处理

for v in l:

ws.append(v) # 写入工作表

wb.save( ' 统计结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

时它表示不接受该字符集合。要匹配 ^ 字符本身，请使用 \^ 。

或关系，可以单字符的或关系，也可以表达式的或关系。

2.04 实例应用（统计达标的科目数）

如图 2-2 所示，统计 B 列中分数大于等于 80 以上的科目数有多少？

图 2-2

代码如下所示：

2.05 元字符之计数功能（长度表示）

前面两种我们把各种数符的表示方法基本学习完成，但都只能表示一个字符。本小节学

习如何对字符长度的控制。有些地方也叫量词。

字符

描述

{n}

n 是一个非负整数。匹配确定的 n 次。例如， 'o{2}' 不能匹配 "Bob" 中的 'o' ，

但是能匹配 "food" 中的两个 o 。

{n,}

n 是一个非负整数。至少匹配 n 次。例如， 'o{2,}' 不能匹配 "Bob" 中的 'o' ，但

能匹配 "foooood" 中的所有 o 。 'o{1,}' 等价于 'o+' 。 'o{0,}' 则等价于 'o*' 。

{n,m}

m 和 n 均为非负整数，其中 n <= m 。最少匹配 n 次且最多匹配 m 次。例如，

"o{1,3}" 将匹配 "fooooood" 中的前三个 o 。 'o{0,1}' 等价于 'o?' 。请注意在逗号

和两个数之间不能有空格。

匹配前面的子表达式零次或多次。例如， zo* 能匹配 "z" 以及 "zoo" 。 * 等价于

{0,} 。

匹配前面的子表达式一次或多次。例如， 'zo+' 能匹配 "zo" 以及 "zoo" ，但不能

匹配 "z" 。 + 等价于 {1,} 。

匹配前面的子表达式零次或一次。例如， "do(es)?" 可以匹配 "do" 、 "does" 中

import re , openpyxl

wb=openpyxl.load_workbook( ' 成绩表 .xlsx' )

ws=wb.active

pattern=re.compile( '[89]\d|100' )

for v in ws[ 'b:b' ][ 1 :]:

v.offset( 0 , 1 ).value= len (pattern.findall(v.value))

wb.save( ' 结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

的 "does" 、 "doxy" 中的 "do" 。 ? 等价于 {0,1} 。

2.06 实例应用（提取数据重构表格）

如图 2-3 的示，提取姓名，并根据身份证号再提取年龄和性别，形成一个规范的表格。

图 2-3

代码如下所示：

2.07 元字符之位置匹配符（单词边界、开头结尾）

字符

描述

匹配一个单词边界，即字与空格间的位置。

非单词边界匹配。

指定匹配必须出现在字符串的开头（忽略 re.M 选项）。

指定匹配必须出现在字符串的结尾（忽略 re.M 选项）。

匹配输入字符串开始的位置。设置 re.M 后，支持多行。

匹配输入字符串结尾的位置。设置 re.M 后，支持多行。

2.08 实例应用（统计以 26 个字母开头的单词个数）

import re , openpyxl , datetime

wb=openpyxl.load_workbook( ' 名单表 .xlsx' )

ws=wb.active

nws=wb.create_sheet( ' 整理结果 ' )

nws.append([ ' 姓名 ' , ' 年龄 ' , ' 性别 ' ])

td=datetime.date.today().year

pattern=re.compile( '([^\w]+)\d{6}(\d{4})\d{6}(\d)\d' , re.A)

for v in ws[ 'a:a' ]:

l=pattern.findall(v.value)[ 0 ]

nws.append((l[ 0 ] , td- int (l[ 1 ]) , ' 男 ' if int (l[ 2 ])% 2 else ' 女 ' ))

wb.save( ' 整理结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

如图 2-4 所示，统计演讲稿中以 26 个字母开头的音词个数。

图 2-4

代码如下所示：

2.09 分组捕获

2.09.1 普通分组

分组，就是希望对正则表达式字符串中的某一部分当作整体看待，便于表示，如果要提

取分组中的数据，也更方便。

2.09.1 命名分组

命名分组是 python 正则中的一种特殊的分组方式，它可对分组进行命名，从而在引用时

可以不同序号方式引用，而用命称来引用。命名组很有用，因为它们允许你使用容易记住的

名称，而不必记住数字。

分组命名格式为：在分组的左括号后面加 ?P< 名称 > ，注意 P 字母是大写的。然后，后面

是正常的正则字符编写。

import re , openpyxl

wb=openpyxl.Workbook()

ws=wb.active

ws.append([ ' 字母 ' , ' 数量 ' ])

with open ( ' 演讲稿 .txt' , 'r' ) as f: # 读取 txt 文件

m=f.read()

for i in range ( 65 , 91 ):

p=re.findall( r'\b' + chr (i)+ r'\w+\b' , m , re.A|re.I)

ws.append([ chr (i) , len (p)])

wb.save( ' 统计结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

2.09.2 分组元素的提取

如果要提取分组中的值，可以使用 match 、 search 、 finditer 、 findall 等函数，如果要出现

多次匹配，则只能使用 findall 或 finditer ，

findall 只能获取分组内容，而 finditer 返回是迭代器，

循环出来的是 re.match 对象，可以获取更多匹配信息。分组中的信息可以用 re.Match[ 索引 ]

或 re.Match[ 分组名 ] 的方式提取。

2.10 实例应用（对字符串中的分数进行统计和排序）

如图 2-5 所示，每个人的分数是零乱的，如果需要对分数进行排序并统计科目数。

图 2-5

代码如下所示：

import re

print (re.findall( r'(\d+)( ?P [A-z]+)([ 一 - 龥 ]+)' , '985Jack 我来了 ' ))

返回结果

[('985', 'Jack', ' 我来了 ')]

import re , openpyxl

wb=openpyxl.load_workbook( ' 分数表 .xlsx' )

ws=wb.active

def fun (x):

l1=x[ 2 ].split( ' 、 ' )

l2= sorted (l1 , key = int , reverse = True )

s= ' 、 ' .join(l2)

return x[ 1 ]+s+ '( 共 %d 科 )' % len (l1)

for v in ws[ 'a:a' ]:

p2=re.sub( r'([ 一 - 龥 ]+)([\d 、 ]+)' , fun , v.value)

v.offset( 0 , 1 ).value=p2

wb.save( ' 处理结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

2.11 分组引用

分组优点很多，可以直接在正则字符串中表示，也可以在正则字符串的再次引用。其次，

除了在 re.Match 中获取引用，也可以在替换函数中引用使用。

2.11.1 分组在正则中的引用

案例 1 ：叠字识别。

import re

s= ' 我们欢欢喜喜的来到了公园，蹦蹦跳跳的 '

p2=re.finditer( r'([ 一 - 龥 ])\1([ 一 - 龥 ])\2' , s)

print ([i[ 0 ] for i in p2])

返回结果

[' 欢欢喜喜 ', ' 蹦蹦跳跳 ']

案例 2 ：叠词识别。

import re

s= ' 先巴拉巴拉，再收敛收敛，就行了。 '

p2=re.finditer( r'([ 一 - 龥 ]{2})\1' , s)

print ([i[ 0 ] for i in p2])

返回结果

[' 巴拉巴拉 ', ' 收敛收敛 ']

如果是命名分组，要获取

import re

s= ' 先巴拉巴拉，再收敛收敛，就行了。 '

p2=re.finditer( r'( ?P [ 一 - 龥 ]{2})( ?P=n )' , s)

print ([i[ 0 ] for i in p2])

返回结果

[' 巴拉巴拉 ', ' 收敛收敛 ']

2.11.2 分组在 sub 中的应用

在使用 sub 在替换时，也可以引用分组中的内容，可以使用 \1 、 \g<1> 、 \g 三种方

法引用。《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re

s= '85 张三 100 李四平 98 王大花 74 刘生 '

p1=re.sub( r'(\d+)([ 一 - 龥 ]+)' , r'\2\1 、 ' , s)

p2=re.sub( r'(\d+)([ 一 - 龥 ]+)' , r'\g<2>\g<1> 、 ' , s)

p3=re.sub( r'(?P\d+)(?P[ 一 -

龥 ]+)' , r'\g\g 、 ' , s)

print (p1)

print (p2)

print (p3)

返回结果

张三 85 、李四平 100 、王大花 98 、刘生 74 、

2.11.3 分组顺序

如果有很多分组，甚至有嵌套，那么如何匹配组号呢，其实很基础，数左括号就可以，

第几个左括号，就是第几组。

import re

target = 'tree/combined 010-12345'

pattern = r'(([^/]*)(/.*)?)[\s]+((\d{3})\-(\d{3,8})$)' # [^] ：匹配

除了里面列出的任一字符

m = re.findall(pattern , target)

print (m)

返回结果

[('tree/combined', 'tree', '/combined', '010-12345', '010', '12345')]

2.12 实例应用（汇总文本中的商品金额）

如图 2-6 所示，计算每个订单的消费总金额。对 C 列中各商品的金额进行求和。《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

图 2-6

代码如下所示：

import re , openpyxl

wb=openpyxl.load_workbook( ' 餐表 .xlsx' )

ws=wb.active

l=ws[ 'c:c' ][ 1 :]

pattern=re.compile( r' ￥ (\d+\.\d+)' )

for v in l:

sumval= sum ([ float (i) for i in pattern.findall(v.value)])

v.offset( 0 , 1 ).value=sumval

wb.save( ' 统计结果 .xlsx' )

2.13 分组选择匹配

(?(id/name)yes-pattern|no-pattern) ，如果给定的 id 或 name 存在，将会尝试匹配

yes-pattern ，否则就尝试匹配 no-pattern ， no-pattern 可选，也可以被忽略。

1. 分组 1 是有 < ，结尾一定有 > 。

import re

s= ' 曾贤志 Jack>; 张三李明 '

i=re.finditer( r'(<)?[A-z]+(?(1)>)' , s)

for m in i:

print (m[ 0 ])

返回结果

Jack

Bob

2. 分组 1 是数字，结尾一定是数字。否则，结尾就是汉字。《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re

l=[ '42luccs450' , 'Jack 张三 ' , 'Lily599' , '9Bob95' , 'Lucy 李萌萌 ' , '6Na' ]

for s in l:

m=re.search( r'(\d+)?[A-z]+(?(1)\d+|[ 一 - 龥 ]+)' , s)

if m!= None :

print (m[ 0 ])

返回结果

42luccs450

Jack 张三

9Bob95

Lucy 李萌萌

2.14 实例应用（按条件筛选金额）

如图 2-7 所示，将金额列中的整数，或者小数点两位以前的金额筛选出来。

图 2-7

代码如下所示：《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

2.15 非分组捕获

(?…) ，这是个扩展标记法。 '?' 后面的第一个字符决定了这个构建采用什么样的语法。这

种扩展通常并不创建新的分组， (?P...) 命名分组是唯一的例外。

本节学习使用了 ? ，但不具有分组捕获的功能。

2.15.1 内联标记

编译标志允许你修改正则表达式的工作方式。

(?aimsx) ， ( 'a', 'i', 'm', 's', 'x' 中的一个或多个 ) 这个组合匹配一个空字符串，这个方法就很

有用，免去了在 re.compile() 中传递 flag 参数。标记应该在表达式字符串首位表示。

re.A

re.ASCII

(?a)

让 \w, \W, \b, \B, \d, \D, \s 和 \S 只匹配 ASCII ，而不是 Unicode 。这只对

Unicode 样式有效，会被 byte 样式忽略。相当于前面语法中的内联标志

(?a) 。

ire.I

re.IGNORECASE

(?i)

进行忽略大小写匹配；表达式如 [A-Z] 也会匹配小写字符。 Unicode 匹配

（比如 Ü 匹配 ü）同样有用，除非设置了 re.ASCII 标记来禁用非 ASCII

匹配。当前语言区域不会改变这个标记，除非设置了 re.LOCALE 标记。

这个相当于内联标记 (?i) 。

re.M

re.MULTILINE

(?m)

设置以后，样式字符 '^' 匹配字符串的开始，和每一行的开始（换行符后

面紧跟的符号）；样式字符 '$' 匹配字符串尾，和每一行的结尾（换行符

前面那个符号）。默认情况下，’ ^ ’ 匹配字符串头， '$' 匹配字符串尾。

对应内联标记 (?m) 。

re.S

re.DOTALL

(?s)

让 '.' 特殊字符匹配任何字符，包括换行符；如果没有这个标记， '.' 就匹

配除了换行符的其他任意字符。对应内联标记 (?s) 。

re.X

re.VERBOSE

这个标记允许你编写更具可读性更友好的正则表达式。通过分段和添加注

释。空白符号会被忽略，除非在一个字符集合当中或者由反斜杠转义，或

import re , openpyxl

wb=openpyxl.load_workbook( ' 金额表 .xlsx' )

ws=wb.active

nws=wb.create_sheet( ' 筛选结果 ' )

n= 0

nws.append([ ' 序号 ' , ' 产品 ' , ' 金额 ' ])

for v in ws[ 'b:b' ]:

m = re.search( r'^\d+(\.)?(?(1)\d{1,2})$' , v.value)

if m != None :

n+= 1

nws.append([ '%02d' %n , v.offset( 0 , - 1 ).value , m[ 0 ]])

wb.save( ' 筛选结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

(?x)

者在 *?, (?: or (?P< … > 分组之内。当一个行内有 # 不在字符集和转义序

列，那么它之后的所有字符都是注释。对应内联标记 (?x) 。

内联标记演示 1

内联标记演示 2

2.15.2 注释

(?#…)

注释；里面的内容会被忽略。

2.15.3 非分组

import re

p=re.findall( r'(?im)^[A-Z ]+$' , 'Who am I \n Are you Ok' )

print (p)

返回结果

['Who am I', 'Are you Ok']

import re

s= 'Jack99 \n Lucass100 \n Bob85 \n 88Lily86'

print (re.findall( r'''

(?imx) # 编译标志

^ # 开头为

[A-Z]+ # 配置更多的字母

\d+ # 配置更多的数字

$ # 结尾

''' , s))

返回结果

['Jack99', 'Lucass100', 'Bob85']

import re

s= 'Jack99 \n Lucass100 \n Bob85 \n 88Lily86'

print (re.findall( r'(?i)(?# 内联标记 )[a-z]+(?# 提取姓名 )' , s))

返回结果

['Jack', 'Lucass', 'Bob', 'Lily'] 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

(?:…) 正则括号的非捕获版本。匹配在括号内的任何正则表达式，但该分组所匹配的子字

符串不能在执行匹配后被获取或是之后在模式中被引用。主要应用需要分组，但又不需要捕

获分组内容时，因为捕获分组还是要占用内存空间的。

import re

pattern=re.compile( r'(?: 成都 | 重庆 )\d+' )

p=pattern.findall( ' 北京 987 成都 101 上海 780 重庆 67' )

print (p)

返回结果

[' 成都 101', ' 重庆 67']

2.16 实例应用（多条件提取数据汇总）

要求：求长春和上海公司的管理部、人事部、销售部的总金额

方法 1

import re , openpyxl

wb=openpyxl.load_workbook( ' 信息表 .xlsx' )

ws=wb.active

pattern=re.compile( r' (?: 长春 | 上海 ).*-\D+(\d+) （ (?: 管理部 | 人事部 | 销售部 ) ' )

l=[]

for v in ws[ 'a:a' ]:

l+=pattern.findall(v.value)

print ( sum ([ int (i) for i in l]))

方法 2

import re , openpyxl

wb=openpyxl.load_workbook( ' 信息表 .xlsx' )

ws=wb.active

s= 0

pattern=re.compile( r' (?: 长春 | 上海 ).*-\D+(\d+) （ (?: 管理部 | 人事部 | 销售部 ) ' )

for v in ws[ 'a:a' ]:

p=pattern.search(v.value)

if p!= None :

s+= int (p[ 1 ])

print (s)

2.17 零宽断言 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

在使用正则表达式时，有时需要捕获的内容前后必须是特定内容，但又不捕获这些特定

内容的时候，这时则使用零宽断言。有的叫 " 环视 " 或者 " 预搜索 " 等。

零宽断言正如它的名字一样，是一种零宽度的匹配，它匹配到的内容不会保存到匹配结

果中去，最终匹配结果只是一个位置而已。作用是给指定位置添加一个限定条件，用来规定

此位置之前或者之后的字符必须满足限定条件才能使正则中的字表达式匹配成功。

表达式

说明

(?=exp)

它断言此位置后面匹配表达式 exp

(?!exp)

它断言此位置后面不匹配表达式 exp

(?<=exp)

它断言此位置前面匹配表达式 exp

反向断言不支持匹配

不定长的表达式

它断言此位置前面不匹配表达式 exp

(?=exp) 零宽正向先行断言 (zero-width positive lookahead assertion)

(?!exp) 零宽负向先行断言 (zero-width negative lookahead assertion)

(?<=exp) 零宽正向后行断言 (zero-width positive lookbehind assertion)

(? 零宽负向后行断言 (zero-width negative lookbehind assertion)

例如：给数字添加分隔线

import re

pattern= re.compile( r'[ 一 - 龥 ]+(?=\d+)' )

print (pattern.findall( ' 张三 100, 李四 85, 王五 79, 麻子 Job, 小明 ' ))

pattern= re.compile( r'[ 一 - 龥 ]+(?!\d+)' )

print (pattern.findall( ' 张三 100, 李四 85, 王五 79, 麻子 Job, 小明 ' ))

pattern= re.compile( r'(?<=[ 一 - 龥 ])\d+' )

print (pattern.findall( ' 张三 100, 李四 85, 王五 79, 麻子 Job, 小明 ' ))

pattern= re.compile( r'(? 一 - 龥 ])\d+' )

print (pattern.findall( ' 张三 100, 李四 85, 王五 79, 麻子 Job, 小明 ' ))

返回结果

[' 张三 ', ' 李四 ', ' 王五 ']

[' 张 ', ' 李 ', ' 王 ', ' 麻子 ', ' 小明 ']

['100', '85', '79']

['00', '5', '9'] 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re

print (re.sub( r'(?=\d)' , r'-' , ' 张三 9527' ))

print (re.sub( r'(?<=\d)' , r'-' , ' 张三 9527' ))

print (re.sub( r'(?<=\d)(\d)' , r'-\1' , ' 张三 9527' ))

print (re.sub( r'(? , r'-\1' , ' 张三 9527' ))

print (re.sub( r'(\d)(?=\d)' , r'\1-' , ' 张三 9527' ))

print (re.sub( r'(\d)(?!$)' , r'\1-' , ' 张三 9527' ))

返回结果

张三 -9-5-2-7

张三 9-5-2-7-

张三 9-5-2-7

2.18 实例应用（将考号规范化）

如图 2-8 所示，将括号中的考号规范成四位数。

图 2-8

代码如下：

import re , openpyxl

wb=openpyxl.load_workbook( ' 晋级表 .xlsx' )

ws=wb.active

def fun (m):

return '%04d' % int (m[ 0 ])

pattern= re.compile( r'(?<= （ )\d{1,3}(?= ） )' )

for v in ws[ 'b:b' ][ 1 :]:

v.value=pattern.sub(fun , v.value)

wb.save( ' 处理结果 .xlsx' )

2.19 贪婪与非贪婪（惰性） 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

贪婪：能匹配多少就多少。

非贪婪：能匹配多少就多少。

量词默认是贪婪模式；在量词后面直接加上一个问号？就是非贪婪模式。

非贪婪类型

注释

重复任意次，但尽可能少重复

重复 1 次或更多次，但尽可能少重复

重复 0 次或 1 次，但尽可能少重复

{n,m}?

重复 n 到 m 次，但尽可能少重复

{n,}?

重复 n 次以上，但尽可能少重复

示例如下：

2.20 实例应用（整理零乱的员工信息）

图 2-9

import re

p=re.findall( r'.+?(?=\d)' , '1. 四川大学 2. 石河子大学 3. 东南大学 ' )

for i in p:

print (i)

返回结果

1. 四川大学

2. 石河子大学《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

图 2-10

2.21 re.match 对象的方法与属性

可以返回 re.match 对像的方法 ( 函数 ) 有 match,fullmatch,search,finditer 。下面就讲讲

re.match 对象有哪些方法和属性。

方法或属性

注释

string

要被匹配的字符串。

正则表达式对象。

lastgroup

返回最后一个分组的组名字，没有产生匹配返回 None 。

lastindex

捕获组的最后分组索引值，相当于计算组数，没有分组则返回 None 。

endpos

定位被匹配字符串的终点位置，可以看做字符串长度。

pos

定位被匹配字符串的起点位置，默认是 0 ，用户如果重新指定位置，

则该属性则会随之改变。

import re , openpyxl

wb=openpyxl.Workbook()

ws=wb.active

with open ( ' 员工信息 .txt' , 'r' ) as f: # 读取 txt 文件

m=f.read()

p=re.findall( r'([ 一 - 龥 ]+) (\w{18}) ([ 男女 ]) (\d+) ([\w ]+?) (?=[ 一 -

龥 ]+ \d)' , m+ ' 一 1' )

ws.append([ ' 姓名 ' , ' 身份证号 ' , ' 性别 ' , ' 年龄 ' , ' 籍贯 ' ])

for t in p:

ws.append(t)

wb.save( ' 整理结果 .xlsx' ) 《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

span([group])

返回匹配成功的字符串位置，返回一个二元组 ( 起始 , 终止 ) ， span()

和 span(0) 表示整个匹配的起止位置。

也可返回指定分组的起止位置。如 span(2) 表示返回第 2 个分组的起

止位置。

start([group])

end([group])

返回匹配成功字符串起始和结束位置，相当于对 span 的拆分，表示

方式与 span 相同。

group([group1, ...])

返回匹配成功的所有字符串，如有分组，也可以返回指定分组中的

内容。如 group() 和 group(0) 表示返回全部， group(1,2) 表示返回第 1 、

第个分组的内容。如果有命名分组，也可以用 group('number','name')

groups(default=None)

返回一个元组，包含所有匹配的子组。如果有分组没有参与匹配，

则默认返回 None 。

groupdict(default=None) 返回一个字典，只包含所有的命名分组。 key 就是组名。如果有分

组没有参与匹配，则默认返回 None 。

__getitem__(g)

该方法与 group 表示方式相同，但不能同时返回多个分组内容。与

之前讲解的 re.match[ 索引 ] 用法相同。

expand(template)

将匹配到的分组内容代入 template 中，然后返回。是相当于分组中

的内容格式化。 template 中可以使用 \id 或 \g 、 \g 引用分组，但不能

使用编号 0 。 \id 与 \g 是等价的；但 \10 将被认为是第 10 个分组，如

果你想表达 \1 之后是字符’ 0 ’，只能使用 \g<1>0 。《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

第 3 章综合应用

3.01 实际案例：提取指定数据到新表

数据源

完成效果：

代码：《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re,openpyxl

wb=openpyxl.load_workbook('test.xlsx')

ws=wb['Sheet1']

for cell in ws['E'][1:]:

mat=re.findall('( 第 \d+ 段 ) 压裂施工 .+? 入井液量

(\d+(?:\.\d+)?)m3.+? 本层加砂量 (\d+(?:\.\d+)?)m3',cell.value)

for val in mat:

wb[' 提取结果 '].append((cell.offset(0,-2).value,)+val)

wb.save('test2.xlsx')

3.02 实际案例：汇总提取的数据

数据源《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

完成效果

代码：《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re,openpyxl

wb=openpyxl.load_workbook('test.xlsx')

ws=wb.active

dic={}

for cell in ws['B']:

mat=re.findall('([ 一 - 龥 ]+)(\d+) 人 ',cell.value)

for val in mat:

if not val[0] in dic.keys():

dic[val[0]]=int(val[1])

else:

dic[val[0]] +=int(val[1])

nwb=openpyxl.Workbook()

nwb.active.append([' 工种 ',' 人数 '])

for key,item in dic.items():

nwb.active.append([key,item])

nwb.save(' 统计结果 .xlsx')

3.03 实际案例：规范时间数据

将下面不规范时间整理成时间规范时间。

代码《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志

import re,openpyxl

wb=openpyxl.load_workbook(r'test.xlsx')

ws=wb.active

for cell in ws['A'][1:]:

mat=re.match(r'(?:(\d+) 小 ? 时 )?(?:(\d+) 分钟 ?)?(?:(\d+) 秒

钟 ?)?',cell.value)

time=[int(t) for t in mat.groups(0)]

ftime='{:02}:{:02}:{:02}'.format(*time)

cell.offset(0,1).value=ftime

wb.save('test.xlsx')

你可能感兴趣的:(python,正则表达式,算法)

Python 3.11.6 Windows 64位版安装程序下载：轻松上手Python最新版本惠凯忱Montague
Python3.11.6Windows64位版安装程序下载：轻松上手Python最新版本去发现同类优质开源项目:https://gitcode.com/项目介绍在编程领域，Python无疑是一种极为流行且强大的编程语言。Python3.11.6Windows64位版安装程序的推出，为Windows用户提供了官方最新版本的安装便利。这个版本不仅包含了许多优化和新特性，而且确保了在64位Windows
【YOLOv11】ultralytics最新作品yolov11 AND 模型的训练、推理、验证、导出以及使用 Jackilina_Stone #Deep Learning 【改进】YOLO系列 YOLO 人工智能 python 计算机视觉深度学习
目录一ultralytics公司的最新作品YOLOV111yolov11的创新2安装YOLOv113PYTHONGuide二训练三验证四推理五导出模型六使用文档：https://docs.ultralytics.com/models/yolo11/代码链接：https://github.com/ultralytics/ultralyticsPerformanceMetrics
python中常用函数表_Python列表中几个常用函数总结 weixin_39934613 python中常用函数表
1、append()方法用于在列表末尾添加新的对象。语法：list.append(obj)参数：list定义的列表obj所要添加到列表的对象例：list=['Microsoft','Amazon','Geogle']list.append('Apple')print(list)显示结果为：['Microsoft','Amazon','Geogle','Apple']2、extend()函数用于在列
Python 与面向对象编程（OOP） lanbing 面向对象（OOP）python 开发语言面向对象
Python是一种支持面向对象编程（OOP）的多范式语言，其OOP实现简洁灵活，但在某些设计选择上与传统OOP语言（如Java、C#）存在显著差异。以下是Python面向对象编程的核心特性、优势和局限性的全面解析：一、Python的OOP核心特性1.万物皆对象Python中所有数据类型（如整数、字符串）均为对象，继承自object基类。函数、模块、异常等也都是对象，可以赋值、传递或动态修改。例如n
【Python】Python —— 列表 (文末附思维导图）
Python——列表1定义用于存储任意数目、任意类型的数据集合。List（列表）是Python内置的一种数据类型。标准语法格式：1.a=[10,20,30,40]2.a=[10,20,‘abc’,True]是一种有序的集合，可以随时增加或删除其中的元素。标识是中括号[]。2创建2.1基本语法创建a=[10,20,'yangyaqi','石家庄学院',True]a[10,20,‘yangyaqi’,
《dlib库中的聚类》算法详解：从原理到实践 A小庞算法算法聚类数据挖掘机器学习 c++
一、dlib库与聚类算法的关联1.1dlib库的核心功能dlib是一个基于C++的机器学习和计算机视觉工具库，其聚类算法模块提供了多种高效的无监督学习工具。聚类算法在dlib中主要用于：数据分组：将相似的数据点划分为同一簇。特征分析：通过聚类结果发现数据潜在的结构。降维辅助：结合聚类结果进行特征选择或数据压缩。dlib支持的经典聚类算法包括K-Means和ChineseWhispers，适用于图像
python源码编译安装和常见问题解决运维天坑笔记 python 开发语言 linux
python编译安装1、下载源码包wgethttps://www.python.org/ftp/python/3.9.10/Python-3.9.10.tgztar-zxfPython-3.9.10.tgzcdpython39/2、编译安装./configure--prefix=/usr/local/python39--enable-shared--enable-optimizationsmake
点云从入门到精通技术详解100篇-基于二维激光雷达的隧道形貌三维重建（续）格图素书算法人工智能
目录3.4点云数据精简3.4.1数据精简的要求3.4.2经典精简算法分析3.5点云三维重建算法3.5.1曲面重建方式的分类3.5.2点云数据的三角剖分3.5.3Delaunay三角剖分算法3.5.4贪婪投影三角化算法3.5.5泊松曲面重建算法4特征保留优化的点云精简4.1引言4.2点云精简的思想4.3基于图信号的特征保留优化的点云精简算法4.3.2定义密度均匀性损失4.4点云精简实验结果及分析5隧
Python语法笔记 XiTang1 python 笔记开发语言
Python的基本语法1.计算机相关的名词知识1.1计算机的组成计算机之父：冯.诺依曼，根据冯.诺依曼结构体系，计算机是分为5部分的1.输入设备把信息传递到计算机中，比如键盘、鼠标2.输出设备信息从计算机中传递出来，比如音响、显示器、打印机等等3.存储区计算机被发明出来就是用于数据的存储和计算的计算机上有两个存储数据的设备：内存、硬盘硬盘：电脑上的磁盘分区，存储在硬盘中的数据都是持久化存储【只要不
Python编程：实现文件比对倔强老吕 C++与python交互编程 python 哈希算法
Python提供了多个用于文件比对的库，适用于不同的比较场景。以下是主要的文件比对库及其特点：1.标准库中的比对工具1.1filecmp模块功能：文件和目录比较特点：比较文件内容（浅层和深层比较）比较目录结构内置dircmp类用于目录比较典型用途：importfilecmp#文件比较filecmp.cmp('file1.txt','file2.txt',shallow=False)#目录比较com
Python, C ++,C #开发全球英才阐教版集结令APP Geeker-2025 python c++c语言
以下是为使用**Python、C++和C#**开发**全球英才(阐教版)集结令APP**的深度技术方案，融合三语言优势构建跨平台、高智能的玄门英才聚合系统：---###一、系统架构设计```mermaidgraphTDA[多端客户端]-->B{C#阐道引擎}B-->C[C++玄法核心]C-->D[Python慧识层]D-->E[AI英才匹配]C-->F[天机推演]B-->G[三界通信]G-->H[
Python, Rust 开发教育/医疗/文化资源去中心化分配APP Geeker-2025 python rust
以下是为教育、医疗、文化资源设计的**去中心化分配APP**的完整技术方案，结合Python的灵活性和Rust的高性能与安全性，实现公平透明的资源分配：---###系统架构设计```mermaidgraphTDA[用户终端]-->B[区块链网络]A-->C[分配引擎]B-->D[智能合约]C-->E[资源数据库]D-->F[分配记录]subgraph技术栈C-.Rust.->G[核心分配算法]D-
Python, Go 开发客户服务软件APP Geeker-2025 python golang
以下是一个结合Python和Go开发的**客户服务软件APP**的完整技术方案，充分利用Python的AI能力和Go的高并发特性，构建高性能、智能化的客户服务系统：---###系统架构设计```mermaidgraphTDA[客户端]-->B[GoAPI网关]B-->C[工单管理]B-->D[实时聊天]B-->E[知识库]B-->F[AI引擎]C-->G[工单数据库]D-->H[消息队列]F-->
基于nodejs+vue.js服装商店电子商务管理系统
如果你是一个小白,你不懂得像javaPHP、Python等编程语言，那么Node.js是一个非常好的选择。采用vscode软件开发,配套软件安装.包安装调试部署成功,有视频讲解前端:html+vue+elementui+jQuery、js、css数据库：mysql,Navicatvue框架于Node运行环境的Web框架,随着互联网技术的飞速发展，世界逐渐成了一个地球村，空间的距离也不再是那么重要。
《Effective Python》第十一章性能——延迟加载模块，通过动态导入减少 Python 程序启动时间不学无术の码农 Effective Python 精读笔记 python 开发语言
引言本文基于《EffectivePython:125SpecificWaystoWriteBetterPython,3rdEdition》第11章:性能中的Item98：Lazy-LoadModuleswithDynamicImportstoReduceStartupTime。本文旨在总结书中关于延迟加载模块的核心观点，并结合我自己的开发经验，深入探讨其在实际项目中的应用场景与优化价值。Pytho
「日拱一码」010 Python常用库——statistics 胖达不服输「日拱一码」python python常用库 statistics
目录平均值相关mean()：计算算术平均值，即所有数值相加后除以数值的个数fmean()：与mean()类似，但使用浮点运算，速度更快，精度更高geometric_mean()：计算几何平均值，即所有数值相乘后开n次方根（n为数值的个数）harmonic_mean()：计算调和平均值，即数值个数除以每个数值的倒数之和median()：计算中位数，即将一组数值按大小顺序排列后位于中间的数。如果数值个
「日拱一码」013 Python常用库——Numpy 胖达不服输「日拱一码」python numpy 常用库
目录数组创建numpy.array：创建一个ndarray对象numpy.zeros：创建一个指定形状和数据类型的全零数组numpy.ones：创建一个指定形状和数据类型的全1数组numpy.empty：创建一个指定形状和数据类型的未初始化数组。其元素值是随机的，取决于内存中的初始状态numpy.arange：类似于Python内置的range函数，但返回的是ndarraynumpy.linspa
python日记Day17——Pandas之Excel处理石石石大帅 Python笔记 excel python 数据分析
python日记——Pandas之Excel处理创建文件importpandasaspddf=pd.DataFrame({'ID':[1,2,3],'Name':['Tom','BOb','Gigi']})df.to_excel("C:/Temp/Output.xlsx")print("done!")读取文件importpandasaspdpeople=pd.read_excel("C:/Temp
尚未调用 CoInitialize 问题解决
在线程开头处添加即可importpythoncompythoncom.CoInitialize()执行完成需要用pythoncom.CoUninitialize释放资源
机器学习：集成算法的装袋法（Bagging）：随机森林（Random Forest） rubyw #概念及理论机器学习算法随机森林
随机森林（RandomForest）是一种集成学习方法，通过构建多个决策树并结合其预测结果来提升模型的性能和稳定性。它由LeoBreiman于2001年提出，广泛应用于分类和回归任务。以下是随机森林的详细介绍，包括其基本概念、构建过程、优缺点及应用场景。基本概念随机森林是一种基于决策树的集成算法，通过生成多棵决策树，并将这些树的预测结果结合起来，以提高整体模型的预测准确性和稳定性。每棵决策树都是在
JWT认证授权原理和简单实现风铃喵游 node
1.关于JWT:(1).JWT(jsonwebtoken)是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准(2).JWT的声明一般被用于在身份提供者和服务提供者之间传递被认证的用户身份信息，以便于从资源服务器获取资源。最为常见的场景就是用户登录认证(3).因为数字签名的存在，这些信息是可信的，JWT可以使用HMAC算法或者是RSA的公私密钥对进行签名2.主要的应用场景:(1).身份
【常见问题】Python自动化办公，打开输出的word文件，报错AttributeError: module ‘win32com.gen_py.00020905-0000-0000-
Python自动化办公，打开输出的word文件，出现ERROR：File"D:\Develop\Building_save_energy\BuildingDiagnoseRenovationTool.py",line2930,inopen_docdoc_app=win32.gencache.EnsureDispatch('Word.Application')File"C:\Users\Jay\.c
森林的智慧：随机森林与集成学习的民主之道田园Coder 人工智能科普人工智能科普
当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界，展示了“团结弱者为强者”的集成魅力时，另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”，但走的是一条与AdaBoost截然不同的路径：它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本，而是致力于创造尽可能多样化的模型，然后让这些模型平等地投票。它的核心哲学是：如果每
第十一节：Vben Admin 最新 v5.0 (vben5) + Python Flask 快速入门 - 角色菜单授权锅锅来了 Vben vben5 Vben Admin python3 后台管理框架
Vben5系列文章目录基础篇✅第一节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门✅第二节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门-PythonFlask后端开发详解(附源码)✅第三节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门-对接后端登录接口(上)✅第四节：VbenAdmin最新v5.0(v
python 内置函数大全及完整使用示例慧一居士 Python python
Python内置函数是预先定义好的高效工具，涵盖数学运算、类型转换、序列操作等多个领域。以下是常见内置函数的分类大全及使用示例：一、数学运算函数abs(x)返回数值的绝对值，支持整数、浮点数和复数[1][2][4]。abs(-10)#输出10abs(-3.5)#输出3.5abs(3+4j)#输出5.0divmod(a,b)返回商和余数的元组，等价于(a//b,a%b)[2][4]。divmod(9
Python —— pandas 主要方法和常用属性（一）墨码笔记知识点 python 数据分析 Pandas
Pandas基础类型Series类型创建SeriesSeries的自定义索引读取SeriesPandaspandas数据分析统计包，是一款功能强大的用于数据分析的操作工具，由于其的实用性对操作数据的方便性广受欢迎，今天就来学习一下Pandas数据包的用法吧！在此之前推荐了解一下numpy基础类型说道数据类型，大家熟知的大概都是intstrbool等数据类型，或者是Python中的listtuple
大模型算法工程师面试宝典：精选面试题及参考答案全解析，助你备战AI算法工程师岗位！大模型入门学习人工智能产品经理大数据机器学习程序员大模型大模型学习
大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，正成为未来商业环境的重要组成部分。截至目前大模型已超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关面试也是越来越卷。我今天给大家分享一篇大模型的面试题总结，内容较长，喜欢记得收藏、关注、点赞。ii.为什么会出现LLMs复读机问题？出现LLMs复读机问题可能
「日拱一码」014 Python常用库——Pandas
目录数据结构pandas.Series：一维数组，类似于数组，但索引可以是任意类型，而不仅仅是整数pandas.DataFrame：二维表格型数据结构，类似于Excel表格，每列可以是不同的数据类型数据读取与写入读取数据pd.read_csv()：读取CSV文件pd.read_excel()：读取Excel文件pd.read_sql()：从数据库读取数据写入数据DataFrame.to_csv()
Python 项目完整结构示例慧一居士 Python python
以下是一个典型的Python项目完整结构示例，适用于中等规模的应用程序或库。该结构遵循最佳实践，具有良好的模块化、可维护性和扩展性。项目结构示例my_project/├──src/#源代码目录│├──__init__.py#标记为Python包│├──main.py#主程序入口（可选）│├──core/#核心功能模块││├──__init__.py││├──app.py││└──utils.py│
python tab键自动补全怎么用_python Tab自动补全命令设置 weixin_39961636 python tab键自动补全怎么用
Mac/Windows下需要安装模块儿pipinstallpyreadlinepipinstallrlcompleterpipinstallreadline注意，需要先安装pyreadline之后才能顺利安装readlineMac下代码如下>>>importrlcompleter>>>importreadline>>>importos>>>importsys>>>>>>if'libedit'inr
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

《用 Python 处理 Excel 数据之正则表达式视频教程》 曾贤志

你可能感兴趣的:(python,正则表达式,算法)

《用 Python 处理 Excel 数据之正则表达式视频教程》曾贤志