-柚子皮-

python模块-re模块

http://blog.csdn.net/pipisorry/article/details/25909899
Python除了 str 对象自带的一些方法外，re文字处理能力也很强大。

正则表达式元字符说明

[python正则表达式]

导入和查看正则表达式模块

import re
查看正则表达式模块方法
dir(re)
[‘DEBUG’, ‘DOTALL’, ‘I’, ‘IGNORECASE’, ‘L’, ‘LOCALE’, ‘M’, ‘MULTILINE’, ‘S’, ‘Scanner’, ‘T’,’TEMPLATE’, ‘U’, ‘UNICODE’, ‘VERBOSE’, ‘X’, ‘_MAXCACHE’, ‘all‘, ‘builtins‘, ‘doc‘,’file‘, ‘name‘, ‘package‘, ‘version‘, ‘_alphanum’, ‘_cache’, ‘_cache_repl’,’_compile’, ‘_compile_repl’, ‘_expand’, ‘_pattern_type’, ‘_pickle’, ‘_subx’, ‘compile’,’copy_reg’, ‘error’, ‘escape’, ‘findall’, ‘finditer’, ‘match’, ‘purge’, ‘search’, ‘split’,’sre_compile’, ‘sre_parse’, ‘sub’, ‘subn’, ‘sys’, ‘template’]

提示：

1. 当我们不会用模块方法的时候用help

2. py2中pattern中的字符串要和string的编码一致，不然会找不到，这个经常出现。

正则表达式中使用原始字符串

Raw string notation (r"text") keeps regular expressions sane. Without it,every backslash ('\') in a regular expression would have to be prefixed withanother one to escape it.

皮皮Blog

正则表达式语法

基本规则

‘[‘ ‘]’ 字符集合设定符

由一对方括号括起来的字符，表明一个字符集合，能够匹配包含在其中的任意一个字符。比如 [abc123]，表明字符’a’ ‘b’ ‘c’ ‘1’ ‘2’ ‘3’都符合它的要求。可以被匹配。
在’[‘ ‘]’中还可以通过 ’-‘ 减号来指定一个字符集合的范围，比如可以用[a-zA-Z]来指定所以英文字母的大小写，不可以把大小的顺序颠倒了。
如果在’[‘ ‘]’里面的开头写一个 ‘^’ 号，则表示取非，即在括号里的字符都不匹配。如[^a-zA-Z]表明不匹配所有英文字母。但是如果 ‘^’不在开头，则它就不再是表示取非，而表示其本身，如[a-z^A-Z]表明匹配所有的英文字母和字符’^’。

Note: []中只有-和^是特殊字符，其它都是普通字符，如.|()等。

‘|’ 或规则

A|B， A 和 B 可以是任意正则表达式，创建一个正则表达式，匹配 A 或者 B. 任意个正则表达式可以用 '|'连接。它也可以在组合（见下列）内使用。扫描目标字符串时， '|' 分隔开的正则样式从左到右进行匹配。当一个样式完全匹配时，这个分支就被接受。意思就是，一旦 A 匹配成功， B 就不再进行匹配，即便它能产生一个更好的匹配。或者说，'|' 操作符绝不贪婪。

将两个规则并列起来，以‘|’连接，表示只要满足其中之一就可以匹配。比如
[a-zA-Z]|[0-9] 表示满足数字或字母就可以匹配，这个规则等价于 [a-zA-Z0-9]
’|’要注意两点：
第一，它在’[‘ ‘]’之中不再表示或，而表示他本身的字符。
第二，它的有效范围是它两边的整条规则，比如‘dog|cat’匹配的是‘dog’和’cat’，而不是’g’和’c’。如果想限定它的有效范围，必需使用一个无捕获组 ‘(?: )’包起来。比如要匹配 ‘I have a dog’或’I have a cat’，需要写成r’I have a (?:dog|cat)’ ，而不能写成 r’I have a dog|cat’，其中dog和cat是字符串，不能是变量。
例:

s = ‘I have a dog , I have a cat’
re.findall( r’I have a (?:dog|cat)’ , s )
[‘I have a dog’, ‘I have a cat’] #正如我们所要的
下面再看看不用无捕获组会是什么后果：
re.findall( r’I have a dog|cat’ , s )
[‘I have a dog’, ‘cat’] #它将’I have a dog’ 和’cat’当成两个规则了
至于无捕获组的使用，后面将仔细说明。这里先跳过。

一个bug？

上面正如官网[re — Regular expression operations¶]所说，'|' 操作符绝不贪婪，但是print(re.search('(?

‘.’ 匹配所有字符匹配除换行符’\n’外的所有字符

如果使用了=re.S选项，匹配包括’\n’的所有字符。
例：

s=’123 \n456 \n789’
findall(r‘.+’,s)
[‘123’, ‘456’, ‘789’]
re.findall(r‘.+’ , s , re.S)
[‘123\n456\n789’]

‘^’和’$’ 匹配字符串开头和结尾

注意’^’不能在‘[ ]’中，否则请看上面的’[‘ ‘]’说明。

在多行模式下，它们可以匹配每一行的行首和行尾。具体请看后面compile函数说明的’M’选项部分

‘\A’ 匹配字符串开头

匹配字符串的开头。它和’^’的区别是，’\A’只匹配整个字符串的开头（相当于单行模式），即使在’M’模式下，它也不会匹配其它行的行首。

‘\Z’ 匹配字符串结尾

匹配字符串的结尾。它和’$’的区别是，’\Z’只匹配整个字符串的结尾，即使在’M’模式下，它也不会匹配其它各行的行尾。
例：

s= ‘12 34\n56 78\n90’
re.findall( r’^\d+’ , s , re.M ) #匹配位于行首的数字
[‘12’, ‘56’, ‘90’]
re.findall( r’\A\d+’, s , re.M ) #匹配位于字符串开头的数字
[‘12’]
re.findall( r’\d+$’ , s , re.M ) #匹配位于行尾的数字
[‘34’, ‘78’, ‘90’]
re.findall( r’\d+\Z’ , s , re.M ) #匹配位于字符串尾的数字
[‘90’]

‘\d’ 匹配数字

’\d’表示匹配一个数字，即等价于[0-9]

‘\D’ 匹配非数字

匹配一个非数字的字符，等价于[^0-9]

‘\w’ 匹配字母和数字

匹配所有的英文字母和数字（还包括中文！！！）~~，即等价于[a-zA-Z0-9]~~。
‘\W’ 匹配非英文字母和数字
即’\w’的补集，等价于[^a-zA-Z0-9]。

‘\s’ 匹配间隔符

即匹配空格符、制表符、回车符等表示分隔意义的字符，它等价于[ \t\r\n\f\v]。（注意最前面有个空格)
‘\S’ 匹配非间隔符
即间隔符的补集，等价于[^ \t\r\n\f\v]

‘\b’ 匹配单词边界(相当于前向界定和后向界定)

它匹配一个单词的边界，比如空格等，不过它是一个‘0’长度字符，它匹配完的字符串不会包括那个分界的字符。而如果用’\s’来匹配的话，则匹配出的字符串中会包含那个分界符。
例：

s = ‘abc abcde bc bcd’
re.findall( r’\bbc\b’ , s ) #匹配一个单独的单词 ‘bc’ ，而当它是其它单词的一部分的时候不匹配
[‘bc’] ＃只找到了那个单独的’bc’
re.findall( r’\sbc\s’ , s ) ＃匹配一个单独的单词 ‘bc’
[’ bc ‘] #只找到那个单独的’bc’，不过注意前后有两个空格，可能有点看不清楚

‘\B’ 匹配非边界

和’\b’相反，它只匹配非边界的字符。它同样是个0长度字符。

re.findall( r’\Bbc\w+’ , s ) #匹配包含’bc’但不以’bc’为开头的单词
[‘bcde’] #成功匹配了’abcde’中的’bcde’，而没有匹配’bcd’

精确匹配和最小匹配

Python正则式还可以精确指定匹配的次数：

1. ‘{m}’ 精确匹配m次; ‘{m,n}’ 匹配最少m次，最多n次。(n>m)

2. 如果你只想指定一个最少次数或只指定一个最多次数，你可以把另外一个参数空起来。比如你想指定最少3次，可以写成 {3,} （注意那个逗号），同样如果只想指定最大为5次，可以写成{，5}，也可以写成{0,5}。

例寻找下面字符串中

a：3位数

b: 2位数到4位数

c: 5位数以上的数

d: 4位数以下的数

>>> s= ‘ 1 22 333 4444 55555 666666 ‘
>>> re.findall( r’\b\d{3}\b’ , s ) # a：3位数
['333']
>>> re.findall( r’\b\d{2,4}\b’ , s ) # b: 2位数到4位数
['22', '333', '4444']
>>> re.findall( r’\b\d{5,}\b’, s ) # c: 5位数以上的数
['55555', '666666']
>>> re.findall( r’\b\d{1,4}\b’ , s ) # 4位数以下的数
['1', '22', '333', '4444']

数量词的贪婪模式与非贪婪模式 ‘*?’ ‘+?’ ‘??’ 最小匹配

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；非贪婪的则相反，总是尝试匹配尽可能少的字符。例如：正则表达式"ab*"如果用于查找"abbbc"，将找到"abbb"。而如果使用非贪婪的数量词"ab*?"，将找到"a"。[python正则表达式]

‘*’ ‘+’ ‘?’通常都是尽可能多的匹配字符。有时候我们希望它尽可能少的匹配。比如一个c语言的注释 ‘/* part 1 */ /* part 2 */’，如果使用最大规则：

>>> s =r ‘/* part 1 */ code /* part 2 */’
>>> re.findall( r’/\*.*\*/’ , s )
[‘/* part 1 */ code /* part 2 */’]

结果把整个字符串都包括进去了。如果把规则改写成

>>> re.findall( r’/\*.*?\*/’ , s ) #在*后面加上?，表示尽可能少的匹配
['/* part 1 */', '/* part 2 */']

结果正确的匹配出了注释里的内容

‘(?:)’ 无捕获组

当你要将一部分规则作为一个整体对它进行某些操作，比如指定其重复次数时，你需要将这部分规则用’(?:’ ‘)’把它包围起来，而不能仅仅只用一对括号。
例：匹配字符串中重复的’ab’

s=’ababab abbabb aabaab’
re.findall( r’\b(?:ab)+\b’ , s )
[‘ababab’]
如果仅使用一对括号： re.findall( r’\b(ab)+\b’ , s )
[‘ab’]
这是因为如果只使用一对括号，那么这就成为了一个组(group)。

‘(?# )’ 注释

Python允许你在正则表达式中写入注释，在’(?#’ ‘)’之间的内容将被忽略。

(?iLmsux) 编译选项指定
Python的正则式可以指定一些选项，这个选项可以写在findall或compile的参数中，也可以写在正则式里，成为正则式的一部分。这在某些情况下会便利一些。具体的选项含义请看后面的compile函数的说明。
此处编译选项’i’ 等价于IGNORECASE ，L 等价于 LOCAL ，m 等价于 MULTILINE ，s 等价于 DOTALL ，u 等价于 UNICODE ， x 等价于 VERBOSE 。
请注意它们的大小写。在使用时可以只指定一部分，比如只指定忽略大小写，可写为 ‘(?i)’，要同时忽略大小写并使用多行模式，可以写为 ‘(?im)’。
另外要注意选项的有效范围是整条规则，即写在规则的任何地方，选项都会对全部整条正则式有效。

前向界定与后向界定

有时候需要匹配一个跟在特定内容后面的或者在特定内容前面的字符串，Python提供一个简便的前向界定和后向界定功能，或者叫前导指定和跟从指定功能。它们是：
‘(?<=…)’ 前向界定
匹配字符串的当前位置，它前面匹配 … 的内容到当前位置。这叫:dfn:positive lookbehind assertion（正向后视断定）。 (?<=abc)def 会在 'abcdef' 中找到一个匹配，因为后视会往后看3个字符并检查是否包含匹配的样式。包含的匹配样式必须是定长的，即使用前向界定的字符串长度必须是常数，意思就是 abc 或 a|b 是允许的，但是 a* 和 a{3,4}还有a|bc不可以，否则报错：sre_constants.error: look-behind requires fixed-width pattern。解决方案是相同长度的字符串加到不同的n个前向界定如(?

示例：

前面不能是两个字符（包括中文）以上就替换：

a = "省|自治区|市|特别行政区|县|自治州|(? print(re.sub(a, '', "文山州"))　　print(re.sub(a, '', "苏州"))

输出：文山　苏州

Note：java中的实现：(?

注意以 positive lookbehind assertions 开始的样式，如 (?<=abc)def ，并不是从 a 开始搜索，而是从 d 往回看的。
‘(?=…)’ 后向界定
括号中的’…’代表你希望匹配的字符串后面应该出现的字符串。
例：你希望找出c语言的注释中的内容，它们是包含在’/’和’/’之间，不过你并不希望匹配的结果把’/’和’/’也包括进来，那么你可以这样用：

s=r'/* comment 1 */ code /* comment 2 */'
print(re.findall(r'(?<=/\*).*?(?=\*/)', s))
[' comment 1 ', ' comment 2 ']

Note:

1. 注意这里我们仍然使用了最小匹配，以避免把整个字符串给匹配进去了。
2. 前向界定括号中的表达式必须是常值，也即你不可以在前向界定的括号里写正则式或者变量。

比如你如果在下面的字符串中想找到被字母夹在中间的数字，你不可以用前向界定：
s = ‘aaa111aaa , bbb222 , 333ccc ‘
re.findall( r’(?<=[a-z]+)\d+(?=[a-z]+)’ , s ) # 错误的用法
它会给出一个错误信息：
error: look-behind requires fixed-width pattern

不过如果你只要找出后面接着有字母的数字，你可以在后向界定写正则式：

re.findall( r’\d+(?=[a-z]+)’, s )
[‘111’, ‘333’]
如果你一定要匹配包夹在字母中间的数字，你可以使用组（group）的方式
re.findall (r’[a-z]+(\d+)[a-z]+’ , s )
[‘111’]
组的使用将在后面详细讲解。

前向非界定和后向非界定

‘(?< !…)’前向非界定(<和!中间是没有空格的，makedown编辑器会将博客中的< !当成注释不显示， - -！给醉了。。。)
只有当你希望的字符串前面不是’…’的内容时才匹配
‘(?!…)’后向非界定
只有当你希望的字符串后面不跟着’…’内容时才匹配。
接上例，希望匹配后面不跟着字母的数字

re.findall( r’\d+(?!\w+)’ , s )
[‘222’]
注意这里我们使用了\w而不是像上面那样用[a-z]，因为如果这样写的话，结果会是：
re.findall( r’\d+(?![a-z]+)’ , s )
[‘11’, ‘222’, ‘33’]
这和我们期望的似乎有点不一样，是因为’111’和’222’中的前两个数字也是满足这个要求的。正则式的使用还是要相当小心的。

组

上面那些规则的话，还是有很多情况下会非常麻烦，比如使用前向界定和后向界定取夹在字母中间的数字的例子。用前面讲过的规则都很难达到目的，但是用了组以后就很简单了。

‘(‘’)’ 无命名组

最基本的组是由一对圆括号括起来的正则式。比如上面匹配包夹在字母中间的数字的例子中使用的(\d+)，我们再回顾一下这个例子：

s = 'aaa111aaa , bbb222 , 333ccc '
print(re.findall (r'[a-z]+(\d+)[a-z]+' , s ) )
[‘111’]

Note:findall函数只返回了包含在’()’中的内容，而虽然前面和后面的内容都匹配成功了，却并不包含在结果中。

用组来实现前后向界定

s = 'dfidabc：dfidefdoildef'
pre = 'abc'
post = 'def'
patten = pre + '[:：].+?' + post
answer = re.findall(patten, s)
print(answer)
['abc：dfidef']

Note:其中还用到了上面的最小匹配规则

‘(?P…)’ 命名组

‘(?P’代表这是一个Python的语法扩展’<…>’里面是你给这个组起的名字，比如你可以给一个全部由数字组成的组叫做’num’，它的形式就是’(?P\d+)’ {’(?P\d+)’吧}。起了名字之后，我们就可以在后面的正则式中通过名字调用这个组，它的形式是‘(?P=name)’ 调用已匹配的命名组。

要注意，再次调用的这个组是已被匹配的组，也就是说它里面的内容是和前面命名组里的内容是一样的。

s=’aaa111aaa,bbb222,333ccc,444ddd444,555eee666,fff777ggg’
我们看看下面的正则式会返回什么样的结果：
re.findall( r’([a-z]+)\d+([a-z]+)’ , s ) # 找出中间夹有数字的字母
[(‘aaa’, ‘aaa’), (‘fff’, ‘ggg’)]
re.findall( r ‘(?P[a-z]+)\d+(?P=g1)’ , s ) #找出被中间夹有数字的前后同样的字母
[‘aaa’]
re.findall( r’[a-z]+(/d+)([a-z]+)’ , s ) #找出前面有字母引导，中间是数字，后面是字母的字符串中的中间的数字和后面的字母
[(‘111’, ‘aaa’), (‘777’, ‘ggg’)]

我们可以通过命名组的名字在后面调用已匹配的命名组，不过名字也不是必需的。

‘\number’ 通过序号调用已匹配的组

正则式中（并不能使用在sub函数中）的每个组都有一个序号，序号是按组从左到右，从1开始的数字，你可以通过下面的形式来调用已匹配的组
比如上面找出被中间夹有数字的前后同样的字母的例子，也可以写成：

re.findall( r’([a-z]+)\d+\1’ , s )
[‘aaa’]
结果是一样的。
再看一个例子
s=’111aaa222aaa111 , 333bbb444bb33’
re.findall( r’(\d+)([a-z]+)(\d+)(\2)(\1)’ , s ) #找出完全对称的数字－字母－数字－字母－数字中的数字和字母
[(‘111’, ‘aaa’, ‘222’, ‘aaa’, ‘111’)]

条件匹配功能(Python2.4以后的re模块)

‘(?(id/name)yes-pattern|no-pattern)’ 判断指定组是否已匹配，执行相应的规则
这个规则的含义是，如果id/name指定的组在前面匹配成功了，则执行yes-pattern的正则式，否则执行no-pattern的正则式。
举个例子，比如要匹配一些形如 usr@mail 的邮箱地址，不过有的写成< usr@mail >即用一对<>括起来，有点则没有，要匹配这两种情况，可以这样写

>>> s= usr2@maill2'
>>> re.findall( r'(<)?\s*(\w+@\w+)\s*(?(1)>)' , s )
[('<', 'usr1@mail1'), ('', 'usr2@maill2')]

不过如果目标字符串如下

>>> s='  usr2@maill2   < usr5@mail5  '

而你想得到要么由一对<>包围起来的一个邮件地址，要么得到一个没有被<>包围起来的地址，但不想得到一对<>中间包围的多个地址或不完整的<>中的地址，那么使用这个式子并不能得到你想要的结果

>>> re.findall( r'(<)?\s*(\w+@\w+)\s*(?(1)>)' , s )
[('<', 'usr1@mail1'), ('', 'usr2@maill2'), ('', 'usr3@mail3'), ('', 'usr4@mail4'), ('', 'usr5@mail5')]

它仍然找到了所有的邮件地址。想要实现这个功能，单纯的使用findall有点吃力，需要使用其它的一些函数，比如match或search函数，再配合一些控制功能。

[Regular Expression Syntax¶]

皮皮Blog

re模块常用的正则表达式处理函数Module Contents

Python正则库API及正则选项

re选项

re库API中，一般都有flags参数，通过该参数指定正则表达式选项。传递时一般使用简写，比如开启DOTALL和MULTILINE使用re.I|re.M

A ASCII       使\w\W\b\B\d\D匹配ASCII字符
I IGNORECASE 忽略大小写
L LOCALE      使\w\W\b\B匹配本地字符集
M MULTILINE   多行模式，"^" 匹配每行开头，"$"匹配每行结尾
S DOTALL      "." 匹配所有字符，包括"\n"
X VERBOSE     详细模式，忽略空白可以加入注释
U UNICODE     使\w\W\b\B\d\D匹配unicode字符集

API速查

这里只是列出API，便于查阅，后面会详细介绍API的使用。建议先跳过这一段，直接看后面的Sample，再回过头来看这一段。

API分为三组，第一组是模块API(Module Contents),通过re.xx()使用；第二组是表达式API(Regular Expression Objects)，re.complie()函数会返回一个表达式对象，通过该对象使用的函数；第三组是匹配对象API(Match Objects)，像search这些函数都会返回一个匹配结果，这组API用于操作结果集。

re库对于很多函数，例如match，都提供了两种调用方式，一是直接通过re库调用，将正则表达式作为参数，二是先用complie编译表达式，通过返回的对象调用，方法二在正则表达式会被多次使用时会减少重复编译花费的时间。

模块APII(Module Contents)

re.compile(pattern, flags=0)                预编译一个正则表达式，返回一个表达式对象(Regular Expression Objects)
re.search(pattern, string, flags = 0)       搜索任意位置的，在字符串中找匹配的串，返回第一个匹配到的匹配对象。
re.match(pattern, string, flags=0)          搜索边界的。从头开始匹配!!!返回匹配对象。只从字串的开始位置进行匹配，如果失败，它就此放弃，这是和search本质区别。
re.fullmatch(pattern, string, flags=0)    搜索的字符与内容全部匹配。py3.4新增。
re.split(pattern, string, maxsplit=0, flags=0)  使用pattern分割字符串，返回一个结果list
re.findall(pattern, string, flags=0)        search加强版，返回所有的匹配对象的list
re.finditer(pattern, string, flags=0)       返回一个match对象的迭代器，用户可以使用迭代器查看所有match对象，通过match对象属性得到匹配对象和ind下标等。
index = [(m.start(), m.end()) for m in re.finditer(skin_patterns, sent)] 查看所有匹配对象的位置
re.sub(pattern, repl, string, count=0, flags=0)  使用repl替换string中pattern匹配到的部分；
                                                 这里repl可以是一个函数，参数是匹配对象，返回要替代的串
re.subn(pattern, repl, string, count=0, flags=0) 类似sub，返回元组(new_string, number_of_subs_made)
re.escape(string)                           将所有的非字母数字字符前加"\"后返回
re.purge()                                  清空正则表达式缓存

表达式API(Regular Expression Objects)
flags                                       编译时的flag
groups                                      表达式中分组的数量
groupindex                                  以有别名的组别名为键、编号为值的字典
pattern                                     编译时用的表达式字符串
search(string[, pos[, endpos]])             从Pos处开始查找字符串，返回匹配对象
match(string[, pos[, endpos]])              从Pos处匹配字符串，返回匹配对象
split(string, maxsplit=0)                   同re.split
findall(string[, pos[, endpos]])            从Pos处查找所有匹配的字符串，返回所有匹配对象的list
finditer(string[, pos[, endpos]])           从Pos处查找所有的字符串，返回一个迭代器
sub(repl, string, count=0)                  同re.sub
subn(repl, string, count=0)                 同re.subn

匹配对象API(Match Objects)
pos                     传递给函数的pos
endpos                  传递给函数的endpos
lastindex               最后一个捕获的group的下标
lastgroup               最后一个捕获的group的名字
re                      调用match或者search的表达式对象
string                  match或者search的字符串
expand(template)        将匹配到的分组代入template中然后返回。template中可以使用\id或\g、\g引用分组
                        注意0不能使用，另外\10将被认为是第10个分组，如果你想表达\1之后是字符'0'，只能使用\g<1>0。
group([group1, ...])    获得一个或多个分组截获的字符串；指定多个参数时将以元组形式返回，0代表整个匹配串
groups([default])       以元组形式返回全部分组截获的字符串，相当于调用group((1,2,…n))
groupdict([default])    返回以有别名的组的别名为键、以该组截获的子串为值的字典
start([group])          返回指定组的串在原串中的起始索引
end([group])            返回指定组的串在原串中的结束索引
span([group])           返回(start(group), end(group))

[基于Python官方手册的翻译和整理]

Match Object对象拥有的方法

1.group([group1,…])

返回值：返回匹配到的一个或者多个子组。

参数group1：如果是一个参数，那么结果就是一个字符串，如果是多个参数，那么结果就是一个参数一个item的元组。参数group1的默认值为0(将返回所有的匹配值)。如果groupN参数为0，相对应的返回值就是全部匹配的字符串，如果group1的值是[1…99]范围之内的,那么将匹配对应括号组的字符串。如果组号是负的或者比pattern中定义的组号大，那么将抛出IndexError异常。如果pattern没有匹配到，但是group匹配到了，那么group的值也为None。如果一个pattern可以匹配多个，那么组对应的是样式匹配的最后一个。另外，子组是根据括号从左向右来进行区分的。

示例：
　>m=re.match(“(\w+) (\w+)”,”abcd efgh, chaj”)
　>m.group() # 匹配全部
　‘abcd efgh’
　>m.group(1) # 第一个括号的子组.
　‘abcd’
　>m.group(2)
　‘efgh’
　>m.group(1,2) # 多个参数返回一个元组
　(‘abcd’, ‘efgh’)
　>m=re.match("(?P\w+) (?P\w+)","sam lee")

m.group(“first_name”) #使用group获取含有name的子组
‘sam’
m.group(“last_name”)
‘lee’

　下面把括号去掉
　>m=re.match(“\w+ \w+”,”abcd efgh, chaj”)
　>m.group()
　‘abcd efgh’
　>m.group(1)
　Traceback (most recent call last):File “pyshell#32>”, line 1, in m.group(1)　IndexError: no such group
如果一个组匹配多个，那么仅仅返回匹配的最后一个的（If a group matches multiple times, only the last match is accessible）。
　>m=re.match(r”(..)+”,”a1b2c3”)
　>m.group(1)
　‘c3’
　>m.group()
　‘a1b2c3’

2.groups([default])

　返回一个包含所有子组的元组。Default是用来设置没有匹配到组的默认值的。Default默认是”None”,
　>m=re.match(“(\d+).(\d+)”,”23.123”)
　>m.groups()
　(‘23’, ‘123’)
　>m=re.match(“(\d+).?(\d+)?”,”24”) #这里的第二个\d没有匹配到，使用默认值”None”
　>m.groups()
　(‘24’, None)
　>m.groups(“0”)
　(‘24’, ‘0’)

3.groupdict([default])

　返回匹配到的所有命名子组的字典。Key是name值，value是匹配到的值。参数default是没有匹配到的子组的默认值。这里与groups()方法的参数是一样的。默认值为None
　>m=re.match(“(\w+) (\w+)”,”hello world”)
　>m.groupdict()
　{}
　>m=re.match(“(?P\w+) (?P\w+)”,”hello world”)
　>m.groupdict()
　{‘secode’: ‘world’, ‘first’: ‘hello’}
通过上例可以看出，groupdict()对没有name的子组不起作用

[Match Objects¶]

re常用模块

re.compile(pattern, flags=0)

re.compile 可以把正则表达式编译成一个正则对象。可以把那些经常使用的正则表达式编译成正则表达式对象，这样可以提高一定的效率。在使用正则表达式时，利用好其预编译功能，可以有效加快正则匹配速度。但是一般不要在方法体内定义。

Compile a regular expression pattern into a regular expression object, whichcan be used for matching using its match() andsearch() methods.

help(re.compile)
compile(pattern, flags=0)

第一个参数：规则
第二个参数：标志位
实例：

test=”Hi, nice to meet you where are you from?”
k=re.compile(r’\w*o\w*’) #匹配带o的字符串
dir(k)
[‘copy‘, ‘deepcopy‘, ‘findall’, ‘finditer’, ‘match’, ‘scanner’, ‘search’, ‘split’,’sub’, ‘subn’]
print k.findall(test) #显示所有包涵o的字符串
[‘to’, ‘you’, ‘you’, ‘from’]
print k.sub(lambdam: ‘[‘+m.group(0) +’]’,test) # 将字符串中含有o的单词用[]括起来
Hi, nice [to] meet [you] where are [you] [from]?

[Regular Expression Objects¶]

re.search(pattern, string, flags=0)

re.search 函数会在字符串内查找模式匹配，直到找到第一个匹配然后返回一个对象k。return a corresponding match object.

k.group(0)代表整个匹配模式对应的字符串，k.group(1)代表匹配模式中的组对应的字符串

如果字符串没有匹配，则返回None。

help(re.search)
search(pattern, string, flags=0)
第一个参数：规则
第二个参数：表示要匹配的字符串
第三个参数：标致位，用于控制正则表达式的匹配方式

实例：下面的例子kuangl
name=”Hello,My name is kuangl,nice to meet you…”
k=re.search(r’k(uan)gl’,name)
if k:
… print k.group(0),k.group(1)
… else:
… print ”Sorry,not search!”
…
kuangl uan

re.match(pattern, string, flags=0)

re.match 尝试从字符串的开始匹配一个模式，也等于说是匹配第一个单词。return a corresponding match object.

help(re.match)
match(pattern, string, flags=0)

第一个参数：规则
第二个参数：表示要匹配的字符串
第三个参数：标致位，用于控制正则表达式的匹配方式

实例1：下面的例子匹配Hello单词

name=”Hello,My name is kuangl,nice to meet you…”
k=re.match(r”(\H….)”,name)
if k:
… print k.group(0),’\n’,k.group(1)
… else:
… print “Sorry,not match!”
…
Hello
Hello

re.match与re.search的区别：re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

实例2：判断字符串i是否是一个数字串

if re.match('\d+', i)

re.split(pattern, string, maxsplit=0, flags=0)

re.split 用于来分割字符串

help(re.split)
split(pattern, string, maxsplit=0)

第一个参数：规则
第二个参数：字符串
第三个参数：最大分割字符串，默认为0，表示每个匹配项都分割
实例：分割所有的字符串

test=”Hi, nice to meet you where are you from?”
re.split(r”\s+”,test)
[‘Hi,’, ‘nice’, ‘to’, ‘meet’, ‘you’, ‘where’, ‘are’, ‘you’, ‘from?’]
re.split(r”\s+”,test,3) #分割前三个
[‘Hi,’, ‘nice’, ‘to’, ‘meet you where are you from?’]

python使用多个分隔符分割字符串

下面是使用汉语标点符号[。！？，]和英文标点符号[!?,]以及微博转发符号“//@”作为断句的分隔符的示例

line = '地丁 一。雪！地陪？霜 ，阿!地?地址,鄄鄄//@村鄄李' print(re.split(r'[。！？，!?,]|//@', line))

['地丁一', '雪', '地陪', '霜 ', '阿', '地', '地址', '鄄鄄', '村鄄李']

re.findall(pattern, string, flags=0)

re.findall 在目标字符串查找符合规则的字符串

help(re.findall)
findall(pattern, string, flags=0)

第一个参数：规则
第二个参数：目标字符串
但三个参数：后面还可以跟一个规则选择项
返回的结果是一个列表：如果有括号()分组，则返回所有分组tuple的列表（如果其它|分割的规则中没有()，则对应为''，所以最好不要同时使用()和|规则）；如果没有括号()分组，则列表中存放的是符合规则的字符串；如果没有符合规则的字符串找到，就会返回一个空值。

示例1

s = 'aaa111k222aaa , bbb222 , 333ccc '
print(re.findall(r'[a-z]+(\d+)k(\d+)[a-z]+', s)) #有多个分组则返回的是[(tuple)]，否则返回[string]

[('111', '222')]
示例2：查找邮件账号

mail=' [email protected]'
print(re.findall(r'(\w+@m....[a-z]{3})',mail))

['[email protected]', '[email protected]', '[email protected]']

示例3：

post_ori_text = r'sinaSSOController.preloginCallBack({"retcode":0,"servertime":1441512360,"pcid":"gz-da3c627b7b8260ba5cfd453f4eb3347ca01f","nonce":"9OZ4S7","pubkey":
"EB2A385686618****","rsakv":"1330428213","exectime":3})'
re.findall('{"retcode":(.*?),"servertime":(.*?),"pcid":"(.*?)","nonce":"(.*?)","pubkey":"(.*?)","rsakv":"(.*?)","exectime":(.*?)}', post_ori_text, re.I)[0]

上面的结果为(u'0', u'1441512470', u'gz-eae72a8b0f6be469f4ac627ca38f7069d5c5', u'D2HXK0', u'EB2A38568661887FA18******', u'1330428213', u'2')

示例4：和re.finditer示例对比：

text = "He was carefully disguised but captured quickly by 10 caps."
print(re.findall(r"ca(p)|gui", text))
for i in re.finditer(r"ca(p)|gui", text):print(i)
['', 'p', 'p']
<_sre.SRE_Match object; span=(20, 23), match='gui'>
<_sre.SRE_Match object; span=(31, 34), match='cap'>
<_sre.SRE_Match object; span=(54, 57), match='cap'>

Note: 规则中有()时，findall大致等效于以下finditer()代码：[i for m in re.finditer(r"ca(p)", text) for i in m.groups()]。

[为什么使用括号时re.findalll和re.finditer的输出不同？ [重复]]

re.finditer(pattern, string, flags=0)

返回一个迭代器（元素为match对象），用户可以使用迭代器查看所有匹配对象。

Note: 打印匹配对象时，它返回包含整个匹配字符串的第一个匹配组。即直接print match对象相当于print(match.group(0))。所以会出现上面示例4中findall返回['p'，'p']，而finditer返回两个“ cap”。

查看所有匹配对象的位置，重叠匹配，lookahead将这样做
index = [(m.start(), m.end()) for m in re.finditer(skin_patterns, sent)]

查看所有匹配对象及其位置

[(i.group(0), i.span()) for i in re.finditer(pattern, query)]

查找所有没有重叠，你可以结合正反面lookahead到一个表达式像这样：

>>> search = 'tt'
>>> [m.start() for m in re.finditer('(?=%s)(?!.{1,%d}%s)' % (search, len(search)-1, search), 'ttt')]
[1]

[re.finditer(pattern, string, flags=0)¶]

re.sub(pattern, repl, string, count=0, flags=0)

re.sub 用于替换字符串的匹配项。If the pattern isn’t found,string is returned unchanged.

第一个参数：规则
第二个参数：替换后的字符串
第三个参数：字符串
第四个参数：替换个数。默认为0，表示每个匹配项都替换

第二个参数：repl
repl，就是replacement，被替换的字符串的意思。repl可以是字符串，也可以是函数。
repl是字符串
如果repl是字符串的话，其中的任何反斜杠转义字符，都会被处理的。
\n：会被处理为对应的换行符；
\r：会被处理为回车符；
其他不能识别的转移字符，则只是被识别为普通的字符：
比如\j，会被处理为j这个字母本身；
反斜杠加g以及中括号内一个名字，即：\g，对应着命了名的组，named group

repl是函数

import re;
def pythonReSubDemo():
    inputStr = "hello 123 world 456";

    def _add111(matched):
        intValue = int(matched.group("number"))
        return str(intValue + 111)

    replacedStr = re.sub("(?P\d+)", _add111, inputStr);
    print replacedStr

#hello 234 world 567

In string-type repl arguments, in addition to the character escapes andbackreferences described above,\g will use the substring matched by the group named name, asdefined by the (?P...) syntax. \g uses the correspondinggroup number; \g<2> is therefore equivalent to \2, but isn’t ambiguousin a replacement such as \g<2>0. \20 would be interpreted as areference to group 20, not a reference to group 2 followed by the literalcharacter '0'. The backreference \g<0> substitutes in the entiresubstring matched by the RE.

示例（使用组和原始字符串）

import os
import re

origin_str = '..bin/clang -g  -DUNDEF_THREADS_HACK -c -o chared.o chared.c'
dir = 'path'
new_str = re.sub('-c', '-emit-llvm -c', origin_str)
new_str = re.sub('(-o\s*)(.*?\.o)', r'\1' + os.path.join(dir, r'\2') + '.bc', new_str)
print(new_str)
../bin/clang -g  -DUNDEF_THREADS_HACK -emit-llvm -c -o path/chared.o.bc chared.c

[re.sub(pattern, repl, string, count=0, flags=0)]

[详解Python中re.sub]

re.subn(pattern, repl, string, count=0, flags=0)

Perform the same operation as sub(), but return a tuple (new_string,number_of_subs_made).

皮皮Blog

re其它部分

Simulating scanf()

Python does not currently have an equivalent to scanf(). Regularexpressions are generally more powerful, though also more verbose, thanscanf() format strings. The table below offers some more-or-lessequivalent mappings between scanf() format tokens and regularexpressions.

`scanf()` Token	Regular Expression
`%c`	`.`
`%5c`	`.{5}`
`%d`	`[-+]?\d+`
`%e`, `%E`, `%f`, `%g`	`[-+]?(\d+(\.\d*)?\|\.\d+)([eE][-+]?\d+)?`
`%i`	`[-+]?(0[xX][\dA-Fa-f]+\|0[0-7]*\|\d+)`
`%o`	`[-+]?[0-7]+`
`%s`	`\S+`
`%u`	`\d+`
`%x`, `%X`	`[-+]?(0[xX])?[\dA-Fa-f]+`

[Simulating scanf()¶]

from:http://blog.csdn.net/pipisorry/article/details/25909899

ref: [re — Regular expression operations]

[re --- 正则表达式操作¶]

通配符和正则表达式

Python正则式的基本用法

你可能感兴趣的:(Python类,函数和模块)

AI教你学Python 第4天：函数和模块凡人的AI工具箱 AI教你学Python python 开发语言人工智能 AIGC
第四天：数据结构一、什么是数据结构？数据结构是计算机科学中用于组织和存储数据的特定方式。良好的数据结构能够提高数据的访问效率、修改频率和管理能力。Python提供了多种内置数据结构，如列表、元组、字典和集合，便于开发者更有效地处理数据。二、Python中的基本数据结构1.列表（List）定义：列表是一个有序的可变集合，允许重复元素。使用方括号[]表示。#示例：定义一个列表fruits=['appl
python错误集锦--类型错误：‘NoneType‘ object is not subscriptable 程序员的修养 python python 开发语言后端
python类型错误：‘NoneType’objectisnotsubscriptable网上查到的原因和方案如下，但是小编给变量的命名不太像系统内置关键字。原因：变量使用了系统内置的关键字list解决：重新定义下这个变量小编需求是获取网络数据，从中获取某个key的值然后赋值给变量，代码如下targetData=monitorData['MonitorData’]既然是网络数据就有可能没有这个ke
python 重载风华明远重载 python
重载是面向对象的一个重要概念，在很多程序实现中都会用到。最常见的是运算重载，比如+、-、x、÷等。python可以重载的方法一共有118个，有些是常用的，有些是不常用的。本文总结了所有的重载方法并提供实现实例以及说明供大家参考。为了便于阅读，本文分为常用的重载方法、其余重载方法以及重载方法列表。一、重载的概念重载的概念及时重新编写python类中的方法，以实现特定的算法或者处理。比如自定义的类的相
python类变量初始化_python中用函数初始化类变量 | 学步园 weixin_39573512 python类变量初始化
今天在写python的时候遇到一个问题:定义了一个list类型的类变量,但是这个list需要在初始化的时候给它加很多的url进去.这样的话我们就需要用倒函数了.结果自己刚开始这样写的:classTianyaSpider(CrawlSpider):definit_start():url_l=u'http://search.tianya.cn/s?tn=sty&rn=10&pn='url_r=u'&s
fastapi 大型应用_FastAPI使用小结行走的VCD fastapi 大型应用
以一个实际构建API的例子介绍FastAPI在已有数据情况下的简单应用简介FastAPI是一个现代、快速(高性能)的Web框架，基于标准Python类型提示，使用Python3.6+构建API。主要特征是：高速：与NodeJS和Go相当，拥有高性能。现有最快的Python框架之一。快速编码：将功能开发速度提高约200％至300％。更少的Bug：减少约40％的人为(开发人员)导致的错误。直观：更好的
Python JSON - 奇客谷qikegu.com 八狐云|酷画册|二维码生成 python Python 教程 python
Python介绍Python开发环境搭建Python语法Python变量Python数值类型Python类型转换Python字符串(String)Python运算符Python列表(list)Python元组(Tuple)Python集合(Set)Python字典(Dictionary)PythonIf…ElsePythonWhile循环PythonFor循环Python函数PythonLambd
SQLAlchemy有哪些常用的操作方法 Botiway FlaskWeb python 后端 web3 flask linux
SQLAlchemy是一个流行的PythonSQL工具包和对象关系映射（ORM）库，它提供了一系列丰富的操作方法用于数据库操作。以下是一些SQLAlchemy常用的操作方法：1.创建表在SQLAlchemy中，可以通过声明式或经典式两种方式创建表。声明式方式较为常用，通过定义Python类来映射数据库表。声明式方式：使用declarative_base()创建一个基类，然后继承这个基类定义模型类，
【Python篇】Python 类和对象：详细讲解（上篇） Trouvaille ~ Python python 开发语言类和对象继承属性和方法类的实例化
文章目录Python类和对象：详细讲解1.什么是类（Class）类的定义2.什么是对象（Object）创建对象3.属性和方法属性（Attributes）方法（Methods）在类中定义属性和方法使用对象的属性和方法4.self参数的作用5.总结1两个问题1.Python类中的缩进2.为什么Python没有像C++那样单独定义成员变量2.1动态语言的特性2.2`__init__`方法的灵活性2.3灵
Django----Form的来龙去脉（-）使用篇墨痕_777 python
Django----Form的来龙去脉（-）使用篇（注：个人学习总结，仅供参考）####Form表单的功能自动生成HTML表单元素检查表单数据的合法性如果验证错误，重新显示表单（数据不会重置）数据类型转换（字符类型的数据转换成相应的Python类型）####Form相关的对象包括Widget：用来渲染成HTML元素的工具，如：forms.Textarea对应HTML中的标签Field：Form对象
Annotated是Python类型注解系统的工具黑金IT python
Annotated是Python类型注解系统的工具Annotated是Python类型注解系统中的一个工具不是具体的函数，它允许你为已有的类型添加元数据。这些元数据可以用于多种目的，但它们在运行时不会改变类型的行为或对类型进行强制约束。Annotated的主要作用是提供一种机制，使得开发者能够在类型注解中包含额外的信息，这些信息可以被静态类型检查器、IDE、代码分析工具等使用。为什么使用Annot
自动化Python编程利器：AutomatePython 平奇群Derek
自动化Python编程利器：AutomatePython在快速发展的数字时代，自动化是提高效率的关键。如果你是一名Python开发者，那么你一定想要有一款工具能够帮助你简化日常的任务自动化。这就是我要向你推荐的项目——。项目简介AutomatePython是一个强大的Python脚本库，它集合了一系列实用的函数和模块，旨在帮助开发者轻松实现各种自动化任务。由陈国辉开发并维护，该项目的目标是让Pyt
python oop示例_Python 进阶_OOP 面向对象编程_实例属性和方法 Samuel BI python oop示例
目录构造器和解构器构造器__init__()类函数__init__()是Python类中预定义的方法，需要被重载才会生效。以双下划线“__”开头和结尾,在Python中使用这种命名方式的方法会被理解为是一种特殊方法,Python的特殊方法功能非常丰富,种类也很多,在声明变量名的时候要注意不要和特殊方法重名.通常，构造器用于在实例化对象被创建后，返回这个实例之前的这段时间里，执行一些特定的任务或设置
【Python】Pydantic：快速上手 T0uken python fastapi 数据库
Pydantic是一个用于数据验证和设置管理的Python库，基于Python类型提示构建。它通过创建数据模型类并使用类型提示进行数据验证，使得数据的验证和解析变得简单而可靠，广泛应用于数据模型的定义和验证，特别是在构建API时。Python类型提示Python的类型提示（TypeHinting）是一种可选的静态类型检查机制，通过在代码中添加类型注释来帮助开发者更好地理解代码的预期行为，从而提高代
Django — 类视图和中间件永远十八的小仙女~ Django django python
目录一、类视图1、基于类的结构2、常见的类视图基类3、类视图的优点4、代码案例二、中间件1、定义2、工作原理3、自带中间件4、中间件开发流程5、自定义中间件6、案例一、类视图类视图（Class-BasedViews）是Django中用于处理HTTP请求和生成HTTP响应的一种方式，它们基于Python类来定义视图逻辑。相对于基于函数的视图，类视图提供了更结构化、可维护和可扩展的方式来编写Web应用
PySpark介绍及其安装教程文景大大
一、PySpark是什么PythonPySpark是Spark官方提供的一个Python类库，其中内置了完全的SparkAPI，使得Python用户在导入这个类库后，可以使用自己熟悉的Python语言来编写Spark应用程序，并最终将程序提交到Spark集群运行。PySpark是基于Python语言开发的类库，仅支持在单机环境下供Python用户开发调试使用，需要将程序提交到Spark集群上才能使
Python - 面向对象编程 - 类变量、实例变量/类属性、实例属性咖啡加剁椒软件测试 python 开发语言软件测试功能测试自动化测试程序人生职场和发展
什么是对象和类什么是Python类、类对象、实例对象类变量、实例变量/类属性、实例属性前言只是叫法不一样实例属性=实例变量类属性=类变量个人认为叫属性更恰当类属性和实例属性区别类属性，所有实例对象共享该属性实例属性，属于某一个实例对象的属性，用于描述具体的对象从实际栗子了解类属性、实例属性有一个表格，四个常见的明星姓名年龄周润发58成龙55刘德华53周星驰54总结一下四个人归类为明星每个明星都有两
django的基本使用-ORM(二) smile_pbb pyhton框架 django 数据库
一、简介ORM对象关系映射，它允许你使用类和对象对数据库进行操作，从而避免通过SQL语句操作数据库模型层:负责和数据库之间进行通信模型是一个Python类，它是由django.db.models.Model派生出的子类一个模型类代表数据库中的一张表模型类中每一个类属性都代表数据库中的一个字段模型是数据交互的接口，是表示和操作数据库的方法和方式二、基本配置1.配置settings.pyDATABAS
FastAPI从入门到实战（2）——Pydantic模型九陌斋 FastAPI fastapi python
前面了解了一下python的类型提示，这里就接着记录一下Pydantic这个用来执行数据校验的库。而且FastAPI就是基于python的类型提示和Padantic实现的数据验证。简介官网：https://pydantic-docs.helpmanual.io/Pydantic就是一个基于Python类型提示来定义数据验证、序列化和文档(使用JSON模式)的库；使用Python的类型提示来进行数据
流畅的Python(九)-符合Python风格的对象 maplea2012 Python python 开发语言数据库
一、核心要义接续第一章，说明如何实现很多Python类型中常见的特殊方法1.支持使用生成对象其他表示形式的内置函数(如repr(),bytes()等)2.使用类方法，实现备选构造方法3.扩展内置的format()函数和str.format()方法使用的格式微语言4.实现只读属性5.把对象变成可散列的，以便在集合中作为dict的键使用6.利用__slots__节省内存二、代码示例1、对象表现形式#!
PySide2 中加载ui文件的两种方法比较 xiaojieluo
PySide2中有两种加载.ui文件的方法生成Python类再加载先将QtDesigner生成的.ui文件转换成python类，再在项目中导入这个类。可以使用pyside2-uic这个工具来实现ui文件转python类的操作，执行以下命令即可：pyside2-uicmainwindow.ui-oui_mainwindow.py注意：PySide2官网中的例子是使用管道将pyside2-uic的输出
python表示乘方的运算符_Python学习笔记Day3 - Python运算符 weixin_39684454 python表示乘方的运算符
1.Python类型转换常用数据类型转换2.Python算术运算符Python算术运算符2.1加法(+)运算符m=10n=97sum1=m+nx=7.2y=15.3sum2=x+yprint("sum1=%d,sum2=%.2f"%(sum1,sum2))运行结果：sum1=107,sum2=22.50拼接字符串当+用于数字时表示加法，但是当+用于字符串时，它还有拼接字符串(将两个字符串连接为一个
django中实现数据库操作攻城狮的梦 python开发 python django
在Django中，数据库操作通常通过Django的ORM（Object-RelationalMapping）来实现。ORM允许你使用Python类来表示数据库表，并可以使用Python语法来查询和操作数据库。以下是在Django中实现数据库操作的基本步骤：一：定义模型首先，你需要在Django应用中定义模型。模型是数据库表的抽象表示，通常定义在models.py文件中。例如，假设我们有一个名为Pe
Python学习之路-初识爬虫:数据提取 geobuins python 学习爬虫
Python学习之路-初识爬虫:数据提取什么是数据提取简单的来说，数据提取就是从响应中获取我们想要的数据的过程爬虫中数据的分类结构化数据：json，xml等处理方式：直接转化为python类型非结构化数据：HTML处理方式：正则表达式、xpath数据提取之json为什么要复习json由于把json数据转化为python内建数据类型很简单，所以爬虫中，如果我们能够找到返回json数据的URL，就会尽
第8.18节 Python类中内置析构方法__del__ LaoYuanPython 老猿Python Python __del__析构方法
一、引言基本上所有支持OOP设计的语言都支持析构方法（也称析构函数），析构方法都是在对象生命周期结束时调用，一般用来实施实例相关生命周期内访问数据的扫尾工作，包括关闭文件、释放内存、输出日志、清理数据等。二、析构方法语法Python中所有类的析构方法都是特殊方法__del__，析构方法同样是一个实例方法，其语法如下：del(self)self就是对象自身，所有实例方法都有该参数，真正调用时无需传递
第4章表单与类视图笔触狂放 Flask python flask virtualenv
学习目标熟悉Flask处理表单的方式，能够归纳在Flask程序中如何处理表单掌握Flask-WTF扩展包的安装，能够借助pip工具安装Flask-WTF扩展包掌握使用Flask-WTF创建表单的方式，能够独立使用Flask-WTF创建表单掌握在模板中渲染表单的方式，能够在模板文件中渲染使用Python类定义的表单掌握Flask-WTF验证表单的方式，能够通过validate_on_submit()
python中的魔法方法__new___python魔法方法，详解__new__（）和__init__() weixin_39856265
魔法方法__new__()和__init__()真是困扰了我好久。其实就是对__new__()一直不是很理解。今天做一个小小的总结吧，在这个知识点上真是花了太久的时间了。首先回顾一下类与对象python中一切皆为对象，python类本身也是一种对象，我们可以称其为类对象。对象=属性+方法，对象是类的实例，准确地来说，应该是：实例对象是类对象的实例。《python编程：从入门到实践》中是这么说的：面
fastapi 大型应用_FastAPI 快速入门研究生欧阳同学呀 fastapi 大型应用
FastAPl.pngFastAPIframework,highperformance,easytolearn,fasttocode,readyforproductionFastAPI框架，高性能，易于学习，快速编码，准备投入生产。FastAPI是一个现代的、快速的(高性能的)web框架，用于基于标准Python类型提示用Python3.6+构建api。主要特点如下：快:非常高的性能，与NodeJ
python类和对象 Withered@ python 开发语言
九、类和对象9.1、创建类和对象"""格式：class类名：类的属性（成员变量）类的行为（成员方法）"""#设计类class类名：name=None #创建对象---->对象=类名（）stu_1=类名()stu_2=类名()#对象属性赋值stu_1.name="值"stu_2.name="值"9.2、成员方法在类中定义成员方法和定义函数基本一直，但仍有区别：#格式：def方法名(self,形
python类装饰器详解-Python类中的装饰器在当前类中的声明与调用详解 weixin_37988176
我的Python环境：3.7在Python类里声明一个装饰器，并在这个类里调用这个装饰器。代码如下：classTest():xx=Falsedef__init__(self):passdeftest(func):defwrapper(self,*args,**kwargs):print(self.xx)returnfunc(self,*args,**kwargs)returnwrapper@tes
python类里面装饰器_Python类中的装饰器在当前类中的声明与调用详解 weixin_39697660 python类里面装饰器
我的Python环境：3.7在Python类里声明一个装饰器，并在这个类里调用这个装饰器。代码如下：classTest():xx=Falsedef__init__(self):passdeftest(func):defwrapper(self,*args,**kwargs):print(self.xx)returnfunc(self,*args,**kwargs)returnwrapper@tes
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交