python 详解re模块

Python正则表达式指南

本文介绍了Python对于正则表达式的支持，包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式，这些主题请查看其他教程。

注意：本文基于Python2.4完成；如果看到不明白的词汇请记得百度谷歌或维基，whatever。

尊重作者的劳动，转载请注明作者及原文地址 >.<html

1. 正则表达式基础

1.1. 简单介绍

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式，只需要简单看一看就可以上手了。

下图展示了使用正则表达式进行匹配的流程：

正则表达式的大致匹配过程是：依次拿出表达式和文本中的字符比较，如果每一个字符都能匹配，则匹配成功；一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界，这个过程会稍微有一些不同，但也是很好理解的，看下图中的示例以及自己多使用几次就能明白。

下图列出了Python支持的正则表达式元字符和语法：

1.2. 数量词的贪婪模式与非贪婪模式

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；非贪婪的则相反，总是尝试匹配尽可能少的字符。例如：正则表达式"ab*"如果用于查找"abbbc"，将找到"abbb"。而如果使用非贪婪的数量词"ab*?"，将找到"a"。

1.3. 反斜杠的困扰

与大多数编程语言相同，正则表达式里使用"\"作为转义字符，这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\"：前两个和后两个分别用于在编程语言里转义成反斜杠，转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题，这个例子中的正则表达式可以使用r"\\"表示。同样，匹配一个数字的"\\d"可以写成r"\d"。有了原生字符串，你再也不用担心是不是漏写了反斜杠，写出来的表达式也更直观。

1.4. 匹配模式

正则表达式提供了一些可用的匹配模式，比如忽略大小写、多行匹配等，这部分内容将在Pattern类的工厂方法re.compile(pattern[, flags])中一起介绍。

2. re模块

2.1. 开始使用re

Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例，然后使用Pattern实例处理文本并获得匹配结果（一个Match实例），最后使用Match实例获得信息，进行其他的操作。

 
          # encoding: UTF-8 
         
          import 
          re 
         
          # 将正则表达式编译成Pattern对象 
         
          pattern  
          = 
          re. 
          compile 
          (r 
          'hello' 
          ) 
         
          # 使用Pattern匹配文本，获得匹配结果，无法匹配时将返回None 
         
          match  
          = 
          pattern.match( 
          'hello world!' 
          ) 
         
          if 
          match: 
         
          # 使用Match获得分组信息 
         
          print 
          match.group() 
         
          ### 输出 ### 
         
          # hello

re.compile(strPattern[, flag]):

这个方法是Pattern类的工厂方法，用于将字符串形式的正则表达式编译为Pattern对象。第二个参数flag是匹配模式，取值可以使用按位或运算符'|'表示同时生效，比如re.I | re.M。另外，你也可以在regex字符串中指定模式，比如re.compile('pattern', re.I | re.M)与re.compile('(?im)pattern')是等价的。可选值有：

re.I(re.IGNORECASE): 忽略大小写（括号内是完整写法，下同）
M(MULTILINE): 多行模式，改变'^'和'$'的行为（参见上图）
S(DOTALL): 点任意匹配模式，改变'.'的行为
L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释。以下两个正则表达式是等价的：

 
          a  
          = 
          re. 
          compile 
          (r 
          """\d +  # the integral part 
         
 
                              
          \.    # the decimal point 
         
 
                              
          \d *  # some fractional digits""" 
          , re.X) 
         
 
          b  
          = 
          re. 
          compile 
          (r 
          "\d+\.\d*" 
          ) 
         

re提供了众多模块方法用于完成正则表达式的功能。这些方法可以使用Pattern实例的相应方法替代，唯一的好处是少写一行re.compile()代码，但同时也无法复用编译后的Pattern对象。这些方法将在Pattern类的实例方法部分一起介绍。如上面这个例子可以简写为：

1 2	`m` `=` `re.match(r` `'hello'` `,` `'hello world!'` `)` `print` `m.group()`

re模块还提供了一个方法escape(string)，用于将string中的正则表达式元字符如*/+/?等之前加上转义符再返回，在需要大量匹配元字符时有那么一点用。

2.2. Match

Match对象是一次匹配的结果，包含了很多关于此次匹配的信息，可以使用Match提供的可读属性或方法来获取这些信息。

属性：

string: 匹配时使用的文本。
re: 匹配时使用的Pattern对象。
pos: 文本中正则表达式开始搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
endpos: 文本中正则表达式结束搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
lastindex: 最后一个被捕获的分组在文本中的索引。如果没有被捕获的分组，将为None。
lastgroup: 最后一个被捕获的分组的别名。如果这个分组没有别名或者没有被捕获的分组，将为None。

方法：

group([group1, …]): 获得一个或多个分组截获的字符串；指定多个参数时将以元组形式返回。group1可以使用编号也可以使用别名；编号0代表整个匹配的子串；不填写参数时，返回group(0)；没有截获字符串的组返回None；截获了多次的组返回最后一次截获的子串。
groups([default]): 以元组形式返回全部分组截获的字符串。相当于调用group(1,2,…last)。default表示没有截获字符串的组以这个值替代，默认为None。
groupdict([default]): 返回以有别名的组的别名为键、以该组截获的子串为值的字典，没有别名的组不包含在内。default含义同上。
start([group]): 返回指定的组截获的子串在string中的起始索引（子串第一个字符的索引）。group默认值为0。
end([group]): 返回指定的组截获的子串在string中的结束索引（子串最后一个字符的索引+1）。group默认值为0。
span([group]): 返回(start(group), end(group))。
expand(template): 将匹配到的分组代入template中然后返回。template中可以使用\id或\g<id>、\g<name>引用分组，但不能使用编号0。\id与\g<id>是等价的；但\10将被认为是第10个分组，如果你想表达\1之后是字符'0'，只能使用\g<1>0。

 
          import 
          re 
         
          m  
          = 
          re.match(r 
          '(\w+) (\w+)(?P<sign>.*)' 
          ,  
          'hello world!' 
          ) 
         
          print 
          "m.string:" 
          , m.string 
         
          print 
          "m.re:" 
          , m.re 
         
          print 
          "m.pos:" 
          , m.pos 
         
          print 
          "m.endpos:" 
          , m.endpos 
         
          print 
          "m.lastindex:" 
          , m.lastindex 
         
          print 
          "m.lastgroup:" 
          , m.lastgroup 
         
          print 
          "m.group(1,2):" 
          , m.group( 
          1 
          ,  
          2 
          ) 
         
          print 
          "m.groups():" 
          , m.groups() 
         
          print 
          "m.groupdict():" 
          , m.groupdict() 
         
          print 
          "m.start(2):" 
          , m.start( 
          2 
          ) 
         
          print 
          "m.end(2):" 
          , m.end( 
          2 
          ) 
         
          print 
          "m.span(2):" 
          , m.span( 
          2 
          ) 
         
          print 
          r 
          "m.expand(r'\2 \1\3'):" 
          , m.expand(r 
          '\2 \1\3' 
          ) 
         
          ### output ### 
         
          # m.string: hello world! 
         
          # m.re: <_sre.SRE_Pattern object at 0x016E1A38> 
         
          # m.pos: 0 
         
          # m.endpos: 12 
         
          # m.lastindex: 3 
         
          # m.lastgroup: sign 
         
          # m.group(1,2): ('hello', 'world') 
         
          # m.groups(): ('hello', 'world', '!') 
         
          # m.groupdict(): {'sign': '!'} 
         
          # m.start(2): 6 
         
          # m.end(2): 11 
         
          # m.span(2): (6, 11) 
         
          # m.expand(r'\2 \1\3'): world hello!

2.3. Pattern

Pattern对象是一个编译好的正则表达式，通过Pattern提供的一系列方法可以对文本进行匹配查找。

Pattern不能直接实例化，必须使用re.compile()进行构造。

Pattern提供了几个可读属性用于获取表达式的相关信息：

pattern: 编译时用的表达式字符串。
flags: 编译时用的匹配模式。数字形式。
groups: 表达式中分组的数量。
groupindex: 以表达式中有别名的组的别名为键、以该组对应的编号为值的字典，没有别名的组不包含在内。

 
          import 
          re 
         
          p  
          = 
          re. 
          compile 
          (r 
          '(\w+) (\w+)(?P<sign>.*)' 
          , re.DOTALL) 
         
          print 
          "p.pattern:" 
          , p.pattern 
         
          print 
          "p.flags:" 
          , p.flags 
         
          print 
          "p.groups:" 
          , p.groups 
         
          print 
          "p.groupindex:" 
          , p.groupindex 
         
          ### output ### 
         
          # p.pattern: (\w+) (\w+)(?P<sign>.*) 
         
          # p.flags: 16 
         
          # p.groups: 3 
         
          # p.groupindex: {'sign': 3}

实例方法[ | re模块方法]：

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]): 这个方法将从string的pos下标处起尝试匹配pattern；如果pattern结束时仍可匹配，则返回一个Match对象；如果匹配过程中pattern无法匹配，或者匹配未结束就已到达endpos，则返回None。 pos和endpos的默认值分别为0和len(string)；re.match()无法指定这两个参数，参数flags用于编译pattern时指定匹配模式。注意：这个方法并不是完全匹配。当pattern结束时若string还有剩余字符，仍然视为成功。想要完全匹配，可以在表达式末尾加上边界匹配符'$'。示例参见2.1小节。

search(string[, pos[, endpos]]) | re.search(pattern, string[, flags]): 这个方法用于查找字符串中可以匹配成功的子串。从string的pos下标处起尝试匹配pattern，如果pattern结束时仍可匹配，则返回一个Match对象；若无法匹配，则将pos加1后重新尝试匹配；直到pos=endpos时仍无法匹配则返回None。 pos和endpos的默认值分别为0和len(string))；re.search()无法指定这两个参数，参数flags用于编译pattern时指定匹配模式。

 
            # encoding: UTF-8  
           
            import 
            re  
           
            # 将正则表达式编译成Pattern对象  
           
            pattern  
            = 
            re. 
            compile 
            (r 
            'world' 
            )  
           
            # 使用search()查找匹配的子串，不存在能匹配的子串时将返回None  
           
            # 这个例子中使用match()无法成功匹配  
           
            match  
            = 
            pattern.search( 
            'hello world!' 
            )  
           
            if 
            match:  
           
            # 使用Match获得分组信息  
           
            print 
            match.group()  
           
            ### 输出 ###  
           
            # world

split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]): 按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数，不指定将全部分割。

 
            import 
            re 
           
            p  
            = 
            re. 
            compile 
            (r 
            '\d+' 
            ) 
           
            print 
            p.split( 
            'one1two2three3four4' 
            ) 
           
            ### output ### 
           
            # ['one', 'two', 'three', 'four', '']

findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]): 搜索string，以列表形式返回全部能匹配的子串。

 
            import 
            re 
           
            p  
            = 
            re. 
            compile 
            (r 
            '\d+' 
            ) 
           
            print 
            p.findall( 
            'one1two2three3four4' 
            ) 
           
            ### output ### 
           
            # ['1', '2', '3', '4']

finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags]): 搜索string，返回一个顺序访问每一个匹配结果（Match对象）的迭代器。

 
            import 
            re 
           
            p  
            = 
            re. 
            compile 
            (r 
            '\d+' 
            ) 
           
            for 
            m  
            in 
            p.finditer( 
            'one1two2three3four4' 
            ): 
           
            print 
            m.group(), 
           
            ### output ### 
           
            # 1 2 3 4

sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]): 使用repl替换string中每一个匹配的子串后返回替换后的字符串。当repl是一个字符串时，可以使用\id或\g<id>、\g<name>引用分组，但不能使用编号0。当repl是一个方法时，这个方法应当只接受一个参数（Match对象），并返回一个字符串用于替换（返回的字符串中不能再引用分组）。 count用于指定最多替换次数，不指定时全部替换。

 
            import 
            re 
           
            p  
            = 
            re. 
            compile 
            (r 
            '(\w+) (\w+)' 
            ) 
           
            s  
            = 
            'i say, hello world!' 
           
            print 
            p.sub(r 
            '\2 \1' 
            , s) 
           
            def 
            func(m): 
           
            return 
            m.group( 
            1 
            ).title()  
            + 
            ' ' 
            + 
            m.group( 
            2 
            ).title() 
           
            print 
            p.sub(func, s) 
           
            ### output ### 
           
            # say i, world hello! 
           
            # I Say, Hello World!

subn(repl, string[, count]) |re.sub(pattern, repl, string[, count]): 返回 (sub(repl, string[, count]), 替换次数)。

 
            import 
            re 
           
            p  
            = 
            re. 
            compile 
            (r 
            '(\w+) (\w+)' 
            ) 
           
            s  
            = 
            'i say, hello world!' 
           
            print 
            p.subn(r 
            '\2 \1' 
            , s) 
           
            def 
            func(m): 
           
            return 
            m.group( 
            1 
            ).title()  
            + 
            ' ' 
            + 
            m.group( 
            2 
            ).title() 
           
            print 
            p.subn(func, s) 
           
            ### output ### 
           
            # ('say i, world hello!', 2) 
           
            # ('I Say, Hello World!', 2)

以上就是Python对于正则表达式的支持。熟练掌握正则表达式是每一个程序员必须具备的技能，这年头没有不与字符串打交道的程序了。笔者也处于初级阶段，与君共勉，^_^

另外，图中的特殊构造部分没有举出例子，用到这些的正则表达式是具有一定难度的。有兴趣可以思考一下，如何匹配不是以abc开头的单词，^_^

正则表达式 re模块

hejiasheng 于 2014-02-10 07:00:17+00:00 更新访问次数：1547

Regular Expression、regex或regexp，（缩写为RE）是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。

计算机里处理文本和数据是非常重要的事情。

一般匹配规则：¶

1 字符串匹配

"abcd" 这种是没有特殊规则，就是完全按照字符去匹配。例如："hello，abcd" 可以匹配。 "hello,abc" 匹配不上。

>>> import re
>>> re.search("abcd","hello,abcd")
<_sre.SRE_Match object at 0x994e2c0>
>>> re.search("abcd","hello,abdc")

2 选择匹配 gray|grey ,“gray” 和"grey " 都能匹配上。或者用 gr(a|e)y 规则来匹配后面2个单词 "gray","grey"。

>>> print re.search("gray|grey","gray")
<_sre.SRE_Match object at 0x994e2c0>
>>> print re.search("gray|grey","grey")
<_sre.SRE_Match object at 0x994e2c0>
>>> print re.search("gray|grey","grcy")
None
>>> print re.search("gr(a|e)y","gray")
<_sre.SRE_Match object at 0xb77268a0>

3 数量限定

‘+’ 加号代表前面的字符必须至少出现一次。(1次、或多次)。例如，“goo+gle”可以匹配google、gooogle、goooogle等;
? 问号代表前面的字符最多只可以出现一次。(0次、或1次)。例如，“colou?r”可以匹配color或者colour;
‘*’ 星号代表前面的字符可以不出现，也可以出现一次或者多次。(0次、或1次、或多次)。例如，“0*42” 可以匹配42、042、0042、00042等。

>>> re.search("goo+gle","google")
<_sre.SRE_Match object at 0xb7717e20>
>>> re.search("goo+gle", "gogle")
>>> re.search("goo+gle", "goooogle")
<_sre.SRE_Match object at 0x994e2c0>

“？” 例子

>>> re.search("colou?r","color")
<_sre.SRE_Match object at 0xb7717e20>
>>> re.search("colou?r","colour")
<_sre.SRE_Match object at 0x994e2c0>
>>> re.search("colou?r","colouur")
>>> #对比 "+"
>>> re.search("colou+r","colouur")
<_sre.SRE_Match object at 0xb7717e20>
>>> re.search("colou+r","color")

“*” 例子:

>>> re.search("goo*gle","google")
<_sre.SRE_Match object at 0xb7717e20>
>>> re.search("goo*gle","gooogle")
<_sre.SRE_Match object at 0x994e2c0>

4 [...] 括号里面包含的任意字符

b[aeou]d 匹配"bad","bed","bod","bud"

>>> re.search("b[aeoud]d","bad")
<_sre.SRE_Match object at 0x994e2c0>
>>> re.search("b[aeoud]d","bed")
<_sre.SRE_Match object at 0xb7717e20>
>>> re.search("b[aeoud]d","bud")
<_sre.SRE_Match object at 0x994e2c0>
>>> re.search("b[aeoud]d","bcd")
>>> re.search("b[aeoud]d","baed")

匹配 [0-9],[0-9a-z]

>>> re.search('b[0-9a-z]d',"b12d")
>>> re.search('b[0-9a-z]d',"b1d")
<_sre.SRE_Match object at 0xb7717e20>
>>> re.search('b[0-9a-z]d',"bad")
<_sre.SRE_Match object at 0x994e2c0>

5 多字符匹配 {n}

[0-9]{3} ： []以内的字母、数字在后面字符串中出现的次数。 “hd543”,符合规则。 "hello32rew",不符合规则。

>>> re.search("[0-9]{3}","hd23")
>>> re.search("[0-9]{3}","hd232")
<_sre.SRE_Match object at 0x92ec2c0>
>>> re.search("[0-9]{3}","hd234")
<_sre.SRE_Match object at 0xb77bee20>
>>>
>>> re.search("[0-9]{4}","hd234")
>>> re.search("[0-9d]{4}","hd234")
<_sre.SRE_Match object at 0x92ec2c0>

6. []{m,n}, 按照[]内规则匹配 m---n之间个数，m必须小于n。

7 "." 匹配任何1个字符。

>>> import re
>>> re.search('b.b',"beb")
<_sre.SRE_Match object at 0xb7280170>
>>> re.search('b.b',"bab")
<_sre.SRE_Match object at 0xb7280368>
>>> re.search('b.b',"badb")
>>> re.search('b..b',"badb")
<_sre.SRE_Match object at 0xb7280170>
>>>

8 “^” 匹配字符串的开始

>>> re.search('^bad',"badb")
<_sre.SRE_Match object at 0xb7280368>
>>> re.search('^ad',"badb")
>>> re.search('^.ad',"badb")
<_sre.SRE_Match object at 0xb7280170>
>>> re.search('^..ad',"badb")
>>>

"$" 匹配字符串的结尾

>>> re.search('adb$',"badb")
<_sre.SRE_Match object at 0xb7280170>
>>> re.search('.db$',"badb")
<_sre.SRE_Match object at 0xb7280368>

'\d' 匹配数字
‘\D' 匹配非数字

>>> re.search('\d',"badec3b2v432")
<_sre.SRE_Match object at 0xb7280368>
>>> re.search('\D',"badec3b2v432")
<_sre.SRE_Match object at 0xb7280170>
>>>

'\w' 匹配任意数字和字母
'\W' 非数字和字母

'\s' 匹配任意空白字符，相当于 [ \t\n\r\f\v]
\S 匹配任意非空白字符，相当于 [^ \t\n\r\f\v]

使用方法¶

compiled_pattern = re.compile(pattern)
result = compiled_pattern.match(string)

result = re.match(pattern, string)

pattern,就是上面提到的规则。

除了match，以为还有几个函数，我们一起做说明: match() 函数只在字符串的开始位置尝试匹配正则表达式，也就是只报告从位置 0 开始的匹配情况。

search() 函数是扫描整个字符串来查找匹配。如果想要搜索整个字符串来寻找匹配，应当用 search()。但search 返回第一个匹配的字符串。

split() 将字符串按照规则分成list。如果按照规则里面找不到，就不分割，返回原字符串。

>>> re.split(":","test:test1:test2")
['test', 'test1', 'test2']

findall（）函数搜索整个字符串，返回所有匹配项。返回一个list。

sub() 函数查找并替换

>>> re.sub("one","num","one world, on dream",1)
'num world, on dream'
>>> re.sub("one","num","one world, one dream",1)
'num world, one dream'
>>> re.sub("one","num","one world, one dream",2)
'num world, num dream'
>>>

可以：

>>> p = re.compile( '(one|two|three)')
>>> p.sub( 'num', 'one word two words three words')
'num word num words num words'

匹配网址的实例：

#coding=utf-8
import re
urls=r'fdsa<a class="pic" href= "http://www.jeapedu.com ">... </a> '
s = re.findall("<a.*href.*>",urls)
print s

非贪婪匹配 + 后结束标记

all_buf = re.findall(r'<a.*?href.*?=(.*?)[> ]',buf)
for n in all_buf:
print n

简单匹配 @ 后面的用户正则

#s = "@fdsa;1232"
s = "fdsfds@fdsa你好.1, 232"
a = re.findall("""@(.*?)(?=[;,| '".?])""",s)
print a[0]

如果@后面没有任何特殊符号，就结束了匹配方法，加了$：

>>> a= re.compile("@(.*?)(?=[ ,'$]|$)")
>>> print a.findall("@sina @abd, @fds")

其他正则表达式参考网址 http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

正则表达式的元字符有. ^ $ * ? { [ ] | ( ) ．表示任意字符［］用来匹配一个指定的字符类别，所谓的字符类别就是你想匹配的一个字符集，对于字符集中的字符可以理解成或的关系。 ^ 如果放在字符串的开头，则表示取非的意思。[^5]表示除了5之外的其他字符。而如果^不在字符串的开头，则表示它本身。
具有重复功能的元字符： * 对于前一个字符重复0到无穷次对于前一个字符重复1到无穷次？对于前一个字符重复0到1次 {m,n} 对于前一个字符重复次数在为m到n次，其中，{0,} = *,{1,} = , {0,1} = ? {m} 对于前一个字符重复m次
\d 匹配任何十进制数；它相当于类 [0-9]。 \D 匹配任何非数字字符；它相当于类 [^0-9]。 \s 匹配任何空白字符；它相当于类 [ fv]。 \S 匹配任何非空白字符；它相当于类 [^ fv]。 \w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。 \W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]。

正则表达式(可以称为REs，regex，regex pattens)是一个小巧的，高度专业化的编程语言，它内嵌于python开发语言中，可通过re模块使用。正则表达式的

pattern可以被编译成一系列的字节码，然后用C编写的引擎执行。下面简单介绍下正则表达式的语法

正则表达式包含一个元字符(metacharacter)的列表，列表值如下: . ^ $ * + ? { [ ] \ | ( )

　 1.元字符([ ]),它用来指定一个character class。所谓character classes就是你想要匹配的字符(character)的集合.字符(character)可以单个的列出，也可以通过"-"来分隔两个字符来表示一个范围。例如，[abc]匹配a，b或者c当中任意一个字符，[abc]也可以用字符区间来表示---[a-c].如果想要匹配单个大写字母，你可以用 [A-Z]。

元字符(metacharacters)在character class里面不起作用，如[akm$]将匹配"a","k","m","$"中的任意一个字符。在这里元字符(metacharacter)"$"就是一个普通字符。

2.元字符[^]. 你可以用补集来匹配不在区间范围内的字符。其做法是把"^"作为类别的首个字符；其它地方的"^"只会简单匹配 "^"字符本身。例如，[^5] 将匹配除 "5" 之外的任意字符。同时，在[ ]外，元字符^表示匹配字符串的开始，如"^ab+"表示以ab开头的字符串。

举例验证，

    >>> m=re.search("^ab+","asdfabbbb")
　 >>> print m
    None
    >>> m=re.search("ab+","asdfabbbb")
    >>> print m
    <_sre.SRE_Match object at 0x011B1988>
    >>> print m.group()
    abbbb

上例不能用re.match,因为match匹配字符串的开始，我们无法验证元字符"^"是否代表字符串的开始位置。

    >>> m=re.match("^ab+","asdfabbbb")
    >>> print m
    None
    >>> m=re.match("ab+","asdfabbbb")
    >>> print m
    None

#验证在元字符[]中，"^"在不同位置所代表的意义。
　>>> re.search("[^abc]","abcd") #"^"在首字符表示取反，即abc之外的任意字符。
　<_sre.SRE_Match object at 0x011B19F8>
　>>> m=re.search("[^abc]","abcd")
　>>> m.group()
　'd'
　>>> m=re.search("[abc^]","^") #如果"^"在[ ]中不是首字符，那么那就是一个普通字符
　>>> m.group()
　'^'

不过对于元字符”^”有这么一个疑问.官方文档http://docs.python.org/library/re.html有关元字符”^”有这么一句话，Matches the start

of the string, and in MULTILINE mode also matches immediately after each newline.

我理解的是”^”匹配字符串的开始，在MULTILINE模式下，也匹配换行符之后。

　>>> m=re.search("^a\w+","abcdfa\na1b2c3")

>>> m.group()

　'abcdfa'

　>>> m=re.search("^a\w+","abcdfa\na1b2c3",re.MULTILINE)，

　>>> m.group() #

　'abcdfa'

我认为flag设定为re.MULTILINE，根据上面那段话，他也应该匹配换行符之后，所以应该有m.group应该有"a1b2c3",但是结果没有，用findall来尝试，可以找到结果。所以这里我理解之所以group里面没有，是因为search和match方法是匹配到就返回，而不是去匹配所有。

　>>> m=re.findall("^a\w+","abcdfa\na1b2c3",re.MULTILINE)

　>>> m

　['abcdfa', 'a1b2c3']

3. 元字符(\),元字符backslash。做为 Python 中的字符串字母，反斜杠后面可以加不同的字符以表示不同特殊意义。

它也可以用于取消所有的元字符，这样你就可以在模式中匹配它们了。例如，如果你需要匹配字符 "[" 或 "\"，你可以在它们之前用反斜杠来取消它们的特殊意义： \[ 或 \\

4。元字符($)匹配字符串的结尾或者字符串结尾的换行之前。（在MULTILINE模式下，"$"也匹配换行之前）

正则表达式"foo"既匹配"foo"又匹配"foobar",而"foo$"仅仅匹配"foo".

　 >>> re.findall("foo.$","foo1\nfoo2\n")#匹配字符串的结尾的换行符之前。
['foo2']

　 >>> re.findall("foo.$","foo1\nfoo2\n",re.MULTILINE)
['foo1', 'foo2']

　　>>> m=re.search("foo.$","foo1\nfoo2\n")
　　>>> m
　　<_sre.SRE_Match object at 0x00A27170>
　　>>> m.group()
　　'foo2'
　　>>> m=re.search("foo.$","foo1\nfoo2\n",re.MULTILINE)
　　>>> m.group()
　　'foo1'

看来re.MULTILINE对$的影响还是蛮大的。

5.元字符(*),匹配0个或多个

6.元字符(?)，匹配一个或者0个

7.元字符(+), 匹配一个或者多个
8,元字符(|), 表示"或"，如A|B，其中A，B为正则表达式，表示匹配A或者B

9.元字符({})

{m},用来表示前面正则表达式的m次copy，如"a{5}"，表示匹配5个”a”,即"aaaaa"

　>>> re.findall("a{5}","aaaaaaaaaa")
　['aaaaa', 'aaaaa']
　>>> re.findall("a{5}","aaaaaaaaa")
　['aaaaa']

{m.n}用来表示前面正则表达式的m到n次copy,尝试匹配尽可能多的copy。

>>> re.findall("a{2,4}","aaaaaaaa")
　['aaaa', 'aaaa']
通过上面的例子，可以看到{m,n}，正则表达式优先匹配n，而不是m，因为结果不是["aa","aa","aa","aa"]

>>> re.findall("a{2}","aaaaaaaa")
　['aa', 'aa', 'aa', 'aa']

{m,n}? 用来表示前面正则表达式的m到n次copy，尝试匹配尽可能少的copy　　　

　>>> re.findall("a{2,4}?","aaaaaaaa")
　['aa', 'aa', 'aa', 'aa']

10。元字符( "( )" ),用来表示一个group的开始和结束。

比较常用的有(REs),(?P<name>REs),这是无名称的组和有名称的group，有名称的group，可以通过matchObject.group(name)

获取匹配的group，而无名称的group可以通过从1开始的group序号来获取匹配的组，如matchObject.group(1)。具体应用将在下面的group()方法中举例讲解

11．元字符(.)

　元字符“.”在默认模式下，匹配除换行符外的所有字符。在DOTALL模式下，匹配所有字符，包括换行符。

　>>> import re

　>>> re.match(".","\n")

　>>> m=re.match(".","\n")

　>>> print m

　None

　>>> m=re.match(".","\n",re.DOTALL)

　>>> print m

　<_sre.SRE_Match object at 0x00C2CE20>

　>>> m.group()

　'\n'

　下面我们首先来看一下Match Object对象拥有的方法,下面是常用的几个方法的简单介绍

　1.group([group1,…])

　返回匹配到的一个或者多个子组。如果是一个参数，那么结果就是一个字符串，如果是多个参数，那么结果就是一个参数一个item的元组。group1的默认值为0(将返回所有的匹配值).如果groupN参数为0，相对应的返回值就是全部匹配的字符串，如果group1的值是[1…99]范围之内的,那么将匹配对应括号组的字符串。如果组号是负的或者比pattern中定义的组号大，那么将抛出IndexError异常。如果pattern没有匹配到，但是group匹配到了，那么group的值也为None。如果一个pattern可以匹配多个，那么组对应的是样式匹配的最后一个。另外，子组是根据括号从左向右来进行区分的。

　>>> m=re.match("(\w+) (\w+)","abcd efgh, chaj")

　>>> m.group() # 匹配全部

　'abcd efgh'

　>>> m.group(1) # 第一个括号的子组.

　'abcd'

　>>> m.group(2)

　'efgh'

　>>> m.group(1,2) # 多个参数返回一个元组

　('abcd', 'efgh')

　>>> m=re.match("(?P<first_name>\w+) (?P<last_name>\w+)","sam lee")
　>>> m.group("first_name") #使用group获取含有name的子组
　'sam'
　>>> m.group("last_name")
　'lee'

　下面把括号去掉

　>>> m=re.match("\w+ \w+","abcd efgh, chaj")

　>>> m.group()

　'abcd efgh'

　>>> m.group(1)

　Traceback (most recent call last):

File "<pyshell#32>", line 1, in <module>

m.group(1)

　IndexError: no such group

　If a group matches multiple times, only the last match is accessible:

如果一个组匹配多个，那么仅仅返回匹配的最后一个的。

　>>> m=re.match(r"(..)+","a1b2c3")

　>>> m.group(1)

　'c3'

　>>> m.group()

　'a1b2c3'

　Group的默认值为0，返回正则表达式pattern匹配到的字符串

　>>> s="afkak1aafal12345adadsfa"

　>>> pattern=r"(\d)\w+(\d{2})\w"

　>>> m=re.match(pattern,s)

　>>> print m

　None

　>>> m=re.search(pattern,s)

　>>> m

　<_sre.SRE_Match object at 0x00C2FDA0>

　>>> m.group()

　'1aafal12345a'

　>>> m.group(1)

　'1'

　>>> m.group(2)

　'45'

　>>> m.group(1,2,0)

　('1', '45', '1aafal12345a')

　2。groups([default])

　返回一个包含所有子组的元组。Default是用来设置没有匹配到组的默认值的。Default默认是"None”,

　>>> m=re.match("(\d+)\.(\d+)","23.123")

　>>> m.groups()

　('23', '123')

　>>> m=re.match("(\d+)\.?(\d+)?","24") #这里的第二个\d没有匹配到，使用默认值"None"

　>>> m.groups()

　('24', None)

　>>> m.groups("0")

　('24', '0')

　3.groupdict([default])

　返回匹配到的所有命名子组的字典。Key是name值，value是匹配到的值。参数default是没有匹配到的子组的默认值。这里与groups()方法的参数是一样的。默认值为None

　>>> m=re.match("(\w+) (\w+)","hello world")

　>>> m.groupdict()

　{}

　>>> m=re.match("(?P<first>\w+) (?P<secode>\w+)","hello world")

　>>> m.groupdict()

　{'secode': 'world', 'first': 'hello'}

　通过上例可以看出，groupdict()对没有name的子组不起作用

正则表达式对象

　re.search(string[, pos[, endpos]])

　扫描字符串string，查找与正则表达式匹配的位置。如果找到一个匹配就返回一个MatchObject对象(并不会匹配所有的)。如果没有找到那么返回None。

　第二个参数表示从字符串的那个位置开始，默认是0

　第三个参数endpos限定字符串最远被查找到哪里。默认值就是字符串的长度。.

　>>> m=re.search("abcd", '1abcd2abcd')
　>>> m.group() #找到即返回一个match object，然后根据该对象的方法，查找匹配到的结果。
　'abcd'
　>>> m.start()
　1
　>>> m.end()
　5

　>>> re.findall("abcd","1abcd2abcd")
　['abcd', 'abcd']

　re.split(pattern, string[, maxsplit=0, flags=0])

　用pattern来拆分string。如果pattern有含有括号，那么在pattern中所有的组也会返回。

　>>> re.split("\W+","words,words,works",1)

　['words', 'words,works']

　>>> re.split("[a-z]","0A3b9z",re.IGNORECASE)

　['0A3', '9', '']

　>>> re.split("[a-z]+","0A3b9z",re.IGNORECASE)

　['0A3', '9', '']

　>>> re.split("[a-zA-Z]+","0A3b9z")

　['0', '3', '9', '']

　>>> re.split('[a-f]+', '0a3B9', re.IGNORECASE)#re.IGNORECASE用来忽略pattern中的大小写。

　['0', '3B9']

　如果在split的时候捕获了组，并且匹配字符串的开始，那么返回的结果将会以一个空串开始。

　>>> re.split('(\W+)', '...words, words...')

　['', '...', 'words', ', ', 'words', '...', '']

　>>> re.split('(\W+)', 'words, words...')

　['words', ', ', 'words', '...', '']

　re.findall(pattern, string[, flags])

　以list的形式返回string中所有与pattern匹配的不重叠的字符串。String从左向右扫描，匹配的返回结果也是以这个顺序。

　Return all non-overlapping matches of pattern in string, as a list of strings. The string is scanned left-to-right, and matches are returned in the order found. If one or more groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result unless they touch the beginning of another match.

　>>> re.findall('(\W+)', 'words, words...')

　[', ', '...']

　>>> re.findall('(\W+)d', 'words, words...d')

　['...']

　>>> re.findall('(\W+)d', '...dwords, words...d')

　['...', '...']

　re.finditer(pattern, string[, flags])

　与findall类似，只不过是返回list，而是返回了一个叠代器

　我们来看一个sub和subn的例子

　>>> re.sub("\d","abc1def2hijk","RE")

　'RE'

　>>> x=re.sub("\d","abc1def2hijk","RE")

　>>> x

　'RE'

　>>> re.sub("\d","RE","abc1def2hijk",)

　'abcREdefREhijk'

　>>> re.subn("\d","RE","abc1def2hijk",)

　('abcREdefREhijk', 2)

　通过例子我们可以看出sub和subn的差别：sub返回替换后的字符串，而subn返回由替换后的字符串以及替换的个数组成的元组。

　re.sub(pattern, repl, string[, count, flags])

用repl替换字符串string中的pattern。如果pattern没有匹配到，那么返回的字符串没有变化]。Repl可以是一个字符串，也可以是一个function。如果是字符串，如果repl是个方法/函数。对于所有的pattern匹配到。他都回调用这个方法/函数。这个函数和方法使用单个 match object作为参数，然后返回替换后的字符串。下面是官网提供的例子:

>>> def dashrepl(matchobj):

...     if matchobj.group(0) == '-': return ' '

...     else: retu

你可能感兴趣的:(python)

【2025美赛B题——管理可持续旅游】2025年美国大学生数学建模竞赛思路、代码、论文优化更新中..... 稷下科研社数学建模旅游
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️美赛及概况1找程序网站推荐2公式编辑器、流程图、论文排版325年美赛B题——管理可持续旅游4思路、Python、Matlab代码、论文分享......⛳️美赛及概况详细内容请看文末卡片，有即将开始的美赛思路、配套Python、Matlab代码及成品论文等，美赛论文
华为OD机试Python - 微服务的集成测试 steven_my 华为OD机试 Python 华为od python java c++javascript 华为OD机试算法
微服务的集成测试前言：本专栏将持续更新互联网大厂机试真题，并进行详细的分析与解答，包含完整的代码实现，希望可以帮助到正在努力的你。关于大厂机试流程、面经、面试指导等，如有任何疑问，欢迎联系我，wechat：steven_moda；email：[email protected]；备注：CSDN。题目描述现有n个容器服务，服务的启动可能有一定的依赖性（有些服务启动没有依赖），其次服务自身启动加载会消
Python实现新春烟花（渐变效果）南风过闲庭 pygame python 开发语言
过年了~，给大伙放个电子烟花庆祝一下，祝大家新春快乐！来年：蛇行千里步步高，财聚八方滚滚来！importpygameimportrandomimportmathimportsysfrompygame.localsimport*#初始化pygame.init()pygame.mixer.init()WIDTH,HEIGHT=800,600screen=pygame.display.set_mode(
Python-pptx Placeholders Yohann丶blog python 开发语言
imageMasterPlaceholder对象Classpptx.shapes.placeholder.MasterPlaceholder幻灯片母版上的占位符形状。auto_shape_type标识此自动形状类型的枚举值，例如MSO_SHAPE.ROUNDED_RECTANGLE。如果此形状不是自动形状，则引发ValueError。click_action提供访问点击行为的ActionSetti
python使用 PIL 和 fpdf 将图片转为PDF 阿离牙多 python pdf
1.准备:安装依赖项pipinstallPillowpipinstallfpdf代码如下:fromPILimportImagefromfpdfimportFPDFdefimgToPDF(imgName,outputName):img=Image.open(imgName)ifimg.mode!='RGB':img=img.convert('RGB')pdf=FPDF(unit='pt',forma
办公自动化--python-pptx python-码博士办公自动化 python 办公软件
安装pipinstallpython-pptxpython操作pptx文件frompptximportPresentation创建ppt文件prs=Presentation()#创建ppt文件prs.save('texst01_ppt.pptx')#保存ppt文件创建副件prs1=Presentation('texst01_ppt.pptx')prs1.save('texst01_ppt副件.pp
【Python科研数据爬虫】基于国家标准查询平台和能源标准化信息平台的海上风电相关行业标准查询信息爬取及处理 lys_828 python科研数据处理及绘图 python 爬虫能源行业标准国家标准
基于国家标准查询平台和能源标准化信息平台的海上风电相关行业标准查询信息爬取及处理1背景2标准检索平台2.1能源标准化信息平台2.2全国标准信息公共服务平台3标准信息数据的爬取与处理3.1能源标准化信息平台的信息爬取3.2全国标准信息公共服务平台的信息爬取3.3标准信息处理1背景在进行项目背景介绍时，有时需要使用到有关标准进行背书，因此查询某一行业领域的标准信息就是第一步操作。接下来就是以海上风电相
Python多张图片存入PDF：一步步教你实现木头左 python办公自动化 python 钉钉自动化
哈喽，大家好，我是木头左！引言在当今的数字时代，经常需要将多张图片整合成一个PDF文件。无论是为了分享、备份还是打印，PDF都是一个理想的格式。在这篇文章中，我将详细介绍如何使用Python将多张图片存入PDF。准备工作在开始之前，需要确保已经安装了以下库：Pillow：一个强大的图像处理库，用于打开、操作和保存各种图像文件格式。ReportLab：一个用于创建PDF文件的库。你可以通过以下命令安
python实现PDF (附完整源码) 源代码大师 Python实战教程 python pdf 前端
python实现PDF安装ReportLab完整源码示例代码说明使用FPDF生成PDF（可选）安装FPDF2完整源码示例代码说明总结要使用Python生成PDF文件，ReportLab是一个功能强大且广泛使用的库。下面是使用ReportLab生成简单PDF的完整源码示例。安装ReportLab首先，确保已经安装了ReportLab库。你可以使用pip来安装：pipinstallreportlab完
Python的未来 future模块 gftygff
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！转载：http://omencathay.itpub.net/post/30163/414347简单介绍一下python未来将会支持的一些语言特点,虽然Ibm的网站上也有介绍.但是太凌乱了.而且中翻译过后,代码的
华为OD机试E卷 - 最优资源分配/芯片资源占用（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为华为od 华为OD机试E卷 python java javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述某块业务芯片最小容量单位为1.25G，总容量为M*1.25G，对该芯片资源编号为1，2，…，M。该芯片支持3种不同的配置，分别为A、B、C。配置A：占用容量为1.25*1=1.25G配置B：占用容量为1.25*2=2.5G配置C：占用容量为1.25*8=10G某块板卡上集成了N块上述芯片，对芯片编号为1，2，…，N，各
华为OD机试 - 微服务的集成测试（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为华为OD 华为od 华为机试算法
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述现在有n个容器服务，服务的启动可能有一定的依赖性（有些服务启动没有依赖），其次服务自身启动加载会消耗一些时间。给你一个nxn的二维矩阵useTime，其中useTime[i][i]=10表示服务i自身启动加载需要消耗10suseTime[i][j]=1表示服务i启动依赖服务j启动完成useTime[i][k]=0表示服
python实现get请求 admin`` Python python http
python——get请求importurllib.requesturl="http://www.csdn.net"response=urllib.request.urlopen(url)#打印请求的状态码print(response.getcode())msg=response.read()#打印请求的网页内容的长度print(len(msg))输出：2001148023Processfinis
Python进行HTTP GET请求华科℡云微服务云原生自动化
在Python编程中，HTTPGET请求是获取网络资源的一种常用方式。GET请求通过向服务器发送请求行和请求头，从指定的URL获取数据。本文将详细介绍如何在Python中使用requests库发送HTTPGET请求，并处理响应。一、安装requests库首先，确保你的Python环境中安装了requests库。如果没有安装，可以使用以下命令进行安装：bash复制代码pipinstallreques
【Python】2.1字面量我是初九人生苦短我爱Python python 字符串
字面量(literal)在计算机科学中，字面量（literal）是用于表达源代码中一个固定值的表示法（notation）。几乎所有计算机编程语言都具有对基本值的字面量表示，诸如：整数、浮点数以及字符串；而有很多也对布尔类型和字符类型的值也支持字面量表示；还有一些甚至对枚举类型的元素以及像数组、记录和对象等复合类型的值也支持字面量表示法。简单地说，字面量是用于表示固定值的符号(token)字面量是某
typing库离开那天 windows
typing库是Python标准库的一部分，用于支持静态类型检查。通过使用typing库，你可以为函数、变量和类添加类型注解，从而提高代码的可读性和可维护性，并帮助工具如IDE和类型检查器（例如mypy）进行静态类型检查。以下是typing库的一些常见用法和示例：1.基本类型注解你可以为函数参数和返回值添加类型注解：defgreet(name:str)->str:returnf"Hello,{na
python 类型标注-typing --- 类型标注支持 — Python 3.7.9 文档 weixin_39892481
类,函数和修饰器.¶这个模块定义了如下的类,模块和修饰器.classtyping.TypeVar¶类型变量用法:T=TypeVar("T")#CanbeanythingA=TypeVar("A",str,bytes)#MustbestrorbytesTypevariablesexistprimarilyforthebenefitofstatictypecheckers.Theyserveasthe
Python基础 - 发起http请求 shawn.zhang. python java ajax json curl
目录[-]1、Python发起http请求#!/usr/bin/envpython#coding=utf-8#licenseremovedfor******importrospyimportpycurlimportStringIOimporturllibfromstd_msgs.msgimportStringimportjsonimporthashlibfromcyber_msgs.msgimpo
青少年编程与数学 02-008 Pyhon语言编程基础 03课题、环境准备明月看潮生编程与数学第02阶段青少年编程 python 编程与数学编程语言
青少年编程与数学02-008Pyhon语言编程基础03课题、环境准备一、开发环境二、PyCharm安装PyCharm配置PyCharm三、VSCode安装VSCode配置VSCode四、Python（解释器）Windows系统：macOS系统：Linux系统：五、PythonShell特点：如何打开PythonShell：使用示例：六、PythonIDLE特点如何使用IDLE局限性七、Jupyte
在 Python 中，`typing` 模块提供了类型提示（Type Hints）的功能，可以用来标记变量、函数参数和返回值等的类型，Any, Dict, List, Literal, Optiona 愚昧之山绝望之谷开悟之坡笔记 python python 开发语言
在Python中，typing模块提供了类型提示（TypeHints）的功能，可以用来标记变量、函数参数和返回值等的类型。下面是typing模块中几个常用的类型的详细解释和举例。Any类型表示一个可以是任何类型的值，它可以作为变量的类型、函数的参数类型或返回类型等。这个类型通常用于那些无需考虑类型约束，或是需要通过检查变量类型来进行调试的代码中。以下是一个使用Any类型的例子：fromtyping
深入解析华为OD机试：开放日活动“取出尽量少的球”题解及C++、Java、JavaScript、Python详细实现 m0_57781768 华为od c++java
深入解析华为OD机试：开放日活动“取出尽量少的球”题解及C++、Java、JavaScript、Python详细实现在华为OD机试的算法考题中，字符串处理、动态规划、二分查找等算法问题都频繁出现。这不仅是为了考查面试者的算法基础，还要求能够通过高效的逻辑思维解决问题。今天我们将深度分析一道关于“取出尽量少的球”的题目，并通过C++、Java、JavaScript、Python四种编程语言详细解析和
【华为OD-E卷 - VLAN资源池 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 java 华为od python c++javascript
【华为OD-E卷-VLAN资源池100分（python、java、c++、js、c）】题目VLAN是一种对局域网设备进行逻辑划分的技术，为了标识不同的VLAN，引入VLANID(1-4094之间的整数)的概念。定义一个VLANID的资源池(下称VLAN资源池)，资源池中连续的VLAN用开始VLAN-结束VLAN表示，不连续的用单个整数表示，所有的VLAN用英文逗号连接起来。现在有一个VLAN资源池
Python中的HTTP请求：从菜鸟到高手的全面指南傻啦嘿哟 python http 开发语言
目录一、HTTP请求基础知识二、Python中的HTTP请求库安装requests库使用requests库发送HTTP请求GET请求POST请求PUT请求DELETE请求三、处理HTTP响应获取状态码获取响应头获取响应体四、高级技巧与实践使用连接池设置请求头处理Cookies和Session错误处理设置超时时间使用代理HTTP认证五、高级功能与实践自定义请求头文件上传流式响应处理重定向SSL证书验
【2024年华为OD机试】 (A卷,200分)- 开放日活动、取出尽量少的球（JavaScript&Java & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od javascript java c语言 python
一、问题描述题目描述某部门开展FamilyDay开放日活动，其中有个从桶里取球的游戏，游戏规则如下：有N个容量一样的小桶等距排开。每个小桶默认装了数量不等的小球，记录在数组bucketBallNums中。游戏开始时，要求所有桶的小球总数不能超过SUM。如果小球总数超过SUM，则需对所有小桶统一设置一个容量最大值maxCapacity，并将超过容量最大值的小球拿出来，直至小桶里的小球数量小于maxC
Python3.9、Python3.10、Python3.11和Python3.12的发展历程和区别 Ceeeeen 编程与算法 python3.11 python 开发语言
文章目录1.Python3.9（2020年10月发布）主要新特性2.Python3.10（2021年10月发布）主要新特性：3.Python3.11（2022年10月发布）主要新特性4.Python3.12（2023年10月发布）主要新特性总结对比：1.Python3.9（2020年10月发布）主要新特性引入了新的字典运算符|和|=，简化了字典的合并和更新操作。#合并字典dict1={"a":1,
【Python高阶篇】探索人工智能：使用Python构建一个简单的聊天机器人码农必胜客 python 人工智能机器人
人工智能是计算机科学中一个非常热门的领域，近年来得到了越来越多的关注。它通过模拟人类思考过程和智能行为来实现对复杂任务的自主处理和学习，已经被广泛应用于许多领域，包括语音识别、自然语言处理、机器人技术、图像识别和推荐系统等。本文将介绍如何使用Python构建一个简单的聊天机器人，以展示人工智能的基本原理和应用。我们将使用Python语言和自然语言处理库来构建一个聊天机器人，该机器人可以接收用户的输
Python使用socket传输对数据AES和MD5加密夜语醉星辰 Python python
一、使用socket通信defclient_communication(data):#通信host="127.0.0.1"#服务器IP地址port=12345#服务器端口号#处理发送数据data=json.dumps(data)#将字典转换为json字符串data=encryption_AES(data)#加密数据try:client_socket=socket.socket(socket.AF_
盘点Python网页开发轻量级框架Flask知识傻啦嘿哟关于python那些事儿 python flask 开发语言
目录一、Flask框架概述二、核心组件1、WSGI服务器2、Jinja2模板引擎3、URL路由4、数据库集成三、应用场景博客平台内容管理系统（CMS）API开发四、优缺点优点：缺点：五、总结随着Web开发的日益普及，各种开发框架也层出不穷。其中，Python的Flask框架作为一种轻量级的Web开发工具，受到了广泛的欢迎。本文将对Flask框架进行深入的剖析，让您全面了解它的基本概念、核心组件、应
通过python实现发送钉钉个人工作通知白白不白zab pyhton python 钉钉开发语言
一、钉钉官方开放文档https://open.dingtalk.com/document/isvapp/before-you-start在开发前需要看一遍官方开放文档的相关内容，来避免一些奇奇怪怪的问题出现，比如新旧版接口域名变更，请求方式不同、调用频率限制、是否开放对应接口权限、白名单等等。二、开发前准备首先开发使用的账号需要有钉钉管理员权限在钉钉后台自建应用获取应用AGENT_ID,APP_K
vs2019安装ironpython_选择并安装 Python 解释器 - Visual Studio | Microsoft Docs weixin_39861905
安装Python解释器InstallPythoninterpreters06/05/2019本文内容默认情况下，在VisualStudio2017和更高版本中安装Python开发工作负载也会同时安装Python3(64位)。Bydefault,installingthePythondevelopmentworkloadinVisualStudio2017andlateralsoinstallsPy
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比