tomato__

Python正则表达式：如何使用正则表达式

正则表达式（简称RE）本质上可以看作一个小的、高度专业化的编程语言，在Python中可以通过re模块使用它。使用正则表达式，你需要为想要匹配的字符串集合指定一套规则，字符串集合可以包含英文句子、e-mail地址、TeX命令或者其它任何你希望的字符串。然后您能提这样的问题：“这个字符串匹配这个模式吗？”，或者“在这个字符串中存在这个模式的匹配吗？”。你也能使用正则表达式修改一个字符串或者分离它。
正则表达式被编译到一系列的字节码，然后被C语言实现的匹配引擎执行。在一些高级应用场景，必须关注引擎怎么执行一个RE，以根据引擎的特征编写RE提高字节码的处理效率。这篇文章不包含优化，优化需要对匹配引擎的内部实现有好的理解。

正则表达式相对小并且存在限制，所以不是所有的字符串处理任务都能用正则表达式解决。也存在有些任务可以用正则表达式做，但表达式非常复杂。在这些情况下，更好的选择是使用Python代码处理，但Python代码相对正则表达式会更慢，但却可能更好理解。

正则表达式简述

我们将从最简单的正则表达式开始，由于正则表达式被用于字符串的操作，我们将从最常用的任务开始：匹配字符。

匹配字符串

大部分字母和字符将匹配他们自身，例如，正则表达式test将匹配字符串test（你可以开始大小写不敏感模式，这样RE可以匹配Test或者TEST）。
这个规则存在例外，一些字符是特殊元字符，不匹配他们自身。他们暗示一些不寻常的事将被匹配，或者他们影响RE的其它部分，例如重复他们或者改变他们的含义。文章的其余部分都主要讨论各种元字符和他们的含义。
下面是元字符的列表，后面将介绍他们的含义：

. ^ $ * + ? { } [ ] \ | ( )

首先我们看[和]，他们被用于指定一个字符类，表示你希望匹配的一套字符集。字符能被单独列出，或者使用'-'来指示字符的范围，例如：[abc]将匹配字符a、b或c的任意一个；[a-c]也是匹配a、b或c中的任意一个。如果你想匹配仅小写字母，那么RE应该为[a-z]。
在类中（[ ]内）的元字符不是激活的，例如：[akm$]将匹配'a'、'k'、'm'或'$'中的任意一个，'$'是一个元字符，但是在字符类中它作为普通字符使用。
你也能排除类中列出的字符集，通过将'^'作为类的第一个字符，注意在类之外的'^'将仅仅匹配'^'字符，例如：[^5]将匹配除了5之外的任何字符。
或许最重要的元字符是反斜杠\。在Python中，反斜杠能被各种字符跟随作为各种特殊序列使用。它也能被用于取出元字符的特殊性将其作为本身匹配，例如：如果你需要匹配一个[或者\，你能在它们之前带上一个反斜杠移除它们的特殊含义，即\[或者\\。
以'\'开始的特殊序列中的一些表示了经常被使用的预定义字符集，例如数字集合、字符集合、或者非空白的任意字符集合。
让我们看一个例子：\w匹配任何字母数字。如果正则表达式模式以字节为单位，这等价于类[a-zA-Z0-9_]。如果正则表达式模式是字符串，则\w将匹配所有被unicodedata模块提供的在Unicode数据库总的字符。当编译正则表达式时，你能添加re.ASCII标志给\w更严格的限制。
下面提供了部分特殊序列供参考：
\d：匹配任意数字，等价于[0-9]；
\D：匹配任意非数据字符，等价于[^0-9]；
\s：匹配任意空白字符，等价于[ \t\n\r\f\v]；
\S：匹配任意非空白字符，等价于[^ \t\n\r\f\v]；
\w：匹配任意字母数字，等价于[a-zA-Z0-9_]；
\W：匹配任意非字母和数字，等价于[^a-zA-Z0-9_]。
这些序列可以被包含到字符类中，例如：[\s,.]是一个字符类，将匹配任意的空白字符，或者','，或者'.'。
在这节中最后的元字符是'.'，它匹配除了新行字符之外的任何字符，使用交替模式（re.DOTALL）它将匹配包括新行的所有字符，'.'通常被用于需要匹配“任意字符”的场景。

处理重复

正则表达式的首要功能是匹配字符集，而正则表达式的另一个能力则是指定RE中特定部分必须被重复多少次。
处理重复的第一个元字符是'*'，'*'不会匹配字符'*'，它表示先前的字符能被匹配0次或者多次。
例如：ca*t将匹配ct（0个a）、cat（1个a）、caaat（3个a）、等等。RE引擎内部会限制a的匹配的数量，但通常足够了。
重复（例如*）算法是贪婪的，对于重复的RE，匹配引擎将尝试尽可能多的重复次数，如果模式的后面部分不匹配，则匹配引擎将回退并再次尝试更少的重复次数。
例如，考虑表达式a[bcd]*b，这匹配单词'a'，0个或者多个来自类[bcd]的字母，最后以'b'结束。下面是RE匹配abcbd的过程：
1、匹配a：RE匹配a成功；
2、匹配abcbd：引擎匹配[bcd]*，由于尽可能的匹配更多，所以匹配了整个字符串；
3、匹配失败：引擎试着匹配b，但是已经到达字符串结尾，因此失败；
4、匹配abcb：回退，[bcd]*匹配减少一个字符；
5、匹配失败：再次尝试b，但当前位置的字符为d；
6、匹配abc：继续回退，以至于[bcd]*仅匹配bc；
7、匹配abcb：再次尝试b，这次当前位置的字符为b，匹配成功，结束。
RE最终匹配abcb，整个过程演示了匹配引擎的匹配过程，首先匹配尽可能多的字符，如果不匹配，则不断回退再次尝试。它将回退直到[bcd]*匹配0个字符，如果任然失败，则引擎得出结论“字符串不匹配RE”。
另一个重复的元字符是+，匹配一次或者多次。小心*和+之间的不同，*匹配0次或者多次，即可以匹配空；+则需要至少出现一次。例如：ca+t将匹配cat(1个a)，caaat(3个a)，但不匹配ct。
另外还有两个重复限定符，其一是问号'?'，表示匹配一次或者0次，例如：home-?brew匹配homebrew或者home-brew。
最复杂的重复限定符是{m,n}，其中m和n都是正整数，表示至少匹配m次，最多匹配n次。例如：a/{1,3}b将匹配a/b，a//b，和a///b，它将不匹配ab，或者a////b。
你能忽略m或者n，忽略m表示最小值为0，而忽略n表示无限制。
你可能已经注意到，使用最后一个限定符可以取代前面3个限定符：{0,}等价于*；{1,}等价于+；{0,1}等价于?。为什么使用*、+或者?呢？主要在于，更简短的表达式更利于阅读和理解。

使用正则表达式

现在我们已经了解了正则表达式的基本语法，下面看在Python中怎么使用正则表达式。re模块提供了使用正则表达式的接口，允许你编译RE到对象，然后使用它们。

编译正则表达式

正则表达式被编译到模式对象，提供了各种操作的方法，例如模式匹配或者替换。

>>> import re
>>> p = re.compile('ab*')
>>> p
re.compile('ab*')

re.compile()也提供了一个可选的flags参数，用于激活各种特征，后面将详细介绍，下面是一个简单的例子：

>>> p = re.compile('ab*', re.IGNORECASE)

RE作为一个字符串传给re.compile()。RE被作为字符串处理是因为正则表达式不是Python语言核心的一部分，没有特定的语言用于创建它们。re模块仅仅是Python包含的一个C语言扩展模块，就像socket和zlib模块一样。
将RE作为字符串保持了Python语言的简单，但也存在不利，例如下一节将讲述的内容。

反斜杠问题

如前所述，正则表达式使用反斜杠来表示一些特殊组合或者允许特殊字符作为普通字符使用。这一点和Python对于发斜杠的使用冲突。
你如果想写一个RE匹配字符串\section，我们看看怎么构造一个正则表达式对象：首先，我们使用整个字符串作为正则表达式；其次，找出反斜杠和其它元字符，在它们前面添加反斜杠，变为\\section；最后，字符串被传入到re.compile()，由于传入的必须为\\section，结合Python语法，每个\的前面必须再次添加一个\，因此，最终在Python中传入的字符串为"\\\\section"。
简而言之，为了匹配一个反斜杠，在Python中你需要写'\\\\'作为RE字符串。这导致了很多重复的反斜杠，使语法很难于理解。
解决方案是为正则表达式使用Python的原生字符串注释。当字符串带有前缀'r'时，反斜杠将不以特殊字符处理，于是r"\n"是包含'\'和'n'的两个字符的字符串，而"\n"是包含换行符的一个字符的字符串。在Python中正则表达式将经常采用这种方式编写。

执行匹配

一旦你有一个已编译的正则表达式对象，你就可以使用该对象的方法和属性，下面做一个简单的介绍。
1）match()
确定RE是否匹配字符串的开头。
2）search()
扫描字符串，查找和RE匹配的任何位置。
3）findall()
找到所有RE匹配的子字符串，并作为一个列表返回。
4）finditer()
发现所有RE匹配的子字符串，并作为一个iterator返回。
如果找到匹配，match()和search()返回None；如果匹配成功，则返回一个匹配对象实例，包含匹配的信息：开始和结束点、匹配的子字符串、等等。
下面来看看Python中怎么使用正则表达式。
首先，运行Python解释器，导入re模块，并且编译一个RE：

>>> import re
>>> p = re.compile('[a-z]+')
>>> p
re.compile('[a-z]+')

现在，你能尝试匹配各种字符串，一个空字符串将根本不匹配，由于+意味着‘一个或者更多’，match()将返回None，你能直接打印结果：

>>> p.match("")
>>> print(p.match(""))
None

接下来，我们尝试一个匹配的字符串，这时，match()将返回一个匹配对象，因此你应该存储结果在一个变量中以供后面使用：

>>> m = p.match('tempo')
>>> m  
<_sre.SRE_Match object; span=(0, 5), match='tempo'>

现在你能询问匹配对象关于匹配字符串的信息。匹配对象也有几个方法和属性，最重要的几个是：
1）group()
返回被RE匹配的字符串
2）start()
返回匹配的开始位置
3）end()
返回匹配的结束位置
4）span()
返回包含匹配位置的元组（开始，结束）
下面是一些使用这些方法的例子：

>>> m.group()
'tempo'
>>> m.start(), m.end()
(0, 5)
>>> m.span()
(0, 5)

由于match()仅检查RE是否匹配字符串的开始，start()将总是返回0。然而，search()方法扫描整个字符串，因此开始位置不一定为0：

>>> print(p.match('::: message'))
None
>>> m = p.search('::: message'); print(m)  
<_sre.SRE_Match object; span=(4, 11), match='message'>
>>> m.group()
'message'
>>> m.span()
(4, 11)

在实际编程汇总，通常将匹配对象存入一个变量中，然后检查它是否为None，例如：

p = re.compile( ... )
m = p.match( 'string goes here' )
if m:
    print('Match found: ', m.group())
else:
    print('No match')

findall()返回匹配字符串的列表：

>>> p = re.compile('\d+')
>>> p.findall('12 drummers drumming, 11 pipers piping, 10 lords a-leaping')
['12', '11', '10']

findall()在返回结果前必须创建完整的列表，而finditer()则返回匹配对象实例作为一个iterator：

>>> iterator = p.finditer('12 drummers drumming, 11 ... 10 ...')
>>> iterator  

>>> for match in iterator:
...     print(match.span())
...
(0, 2)
(22, 24)
(29, 31)

模块级函数

你不是一定需要创建一个模式对象然后调用它的方法，re模块也提供了模块级的函数match()、search()、findall()、sub()、等等。这些函数采用和对应的模式方法同样的参数，也同样返回None或者匹配对象实例：

>>> print(re.match(r'From\s+', 'Fromage amk'))
None
>>> re.match(r'From\s+', 'From amk Thu May 14 19:12:10 1998')  
<_sre.SRE_Match object; span=(0, 5), match='From '>

这些函数创建一个模式对象，并调用它上面的方法，它们也存储编译后的对象到缓存中，以至于未来使用同样的RE将不需要重新编译。
你应该用这些模块及的函数，还是应该通过模块对象来调用呢？如果你正在做一个正则表达式的循环，则预编译将节省许多函数调用，否则，两个方式没有太大区别。

编译标志

编译标志让你修改正则表达式如何工作的一些方面。在re模块中标志可以使用两种名称，长名称，例如IGNORECASE，和短名称，例如I。通过位或运算，多个标志能被指定，例如re.I | re.M设置I和M标志。
下面是可用标志的列表和每个标志的解释：
1）ASCII, A
当使用\w、\b、\s和\d时仅匹配ASCII字符；
2）DOTALL, S
使'.'匹配任何字符，包括新行；
3）IGNORECASE, I
忽略大小写匹配；
4）LOCALE, L
做地域相关匹配；
5）MULTILINE, M
多行匹配，影响^和$；
6）VERBOSE, X (for ‘extended’)
启动详细的RE，能更清晰的组织和更好理解。
例如，下面使用了re.VERBOSE，使RE更容易阅读：

charref = re.compile(r"""
 &[#]                # Start of a numeric entity reference
 (
     0[0-7]+         # Octal form
   | [0-9]+          # Decimal form
   | x[0-9a-fA-F]+   # Hexadecimal form
 )
 ;                   # Trailing semicolon
""", re.VERBOSE)

如果没有使用re.VERBOSE，则RE将是这样：

charref = re.compile("&#(0[0-7]+"
                     "|[0-9]+"
                     "|x[0-9a-fA-F]+);")

在上面的例子中，Python的自动字符串串联被用于将RE分化到多个片段，但是它任然比使用re.VERBOSE更难理解。

正则表达式的更多特性

到目前为止我们仅覆盖了正则表达式的部分特性，在这里，我们将探索一些新的特性。

分组

组通过'('和')'元字符标识，'('和')'在这里和数学表达式中的含义相同，它们将内部的表达式归为一个分组，你能指定一个分组重复的次数，通过使用重复元字符*、+、?或者{m,n}。例如，(ab)*将匹配0个或者多个ab。

>>> p = re.compile('(ab)*')
>>> print(p.match('ababababab').span())
(0, 10)

组也能获取它们匹配的字符串的开始和结束点，通过传递一个参数到group()、start()、end()和span()。组的编号从0开始，组0总是存在的，他就是整个RE，因此匹配对象方法将组0作为他们的默认参数。

>>> p = re.compile('(a)b')
>>> m = p.match('ab')
>>> m.group()
'ab'
>>> m.group(0)
'ab'

子组从左到右编号，从1开始。组能是嵌套的。为了确定编号，从左向右只算开放括号字符。

>>> p = re.compile('(a(b)c)d')
>>> m = p.match('abcd')
>>> m.group(0)
'abcd'
>>> m.group(1)
'abc'
>>> m.group(2)
'b'

group()一次能被传递多个组编号，这种情况下它将返回一个元组：

>>> m.group(2,1,2)
('b', 'abc', 'b')

groups()方法返回包含所有子组匹配的字符串的元组，子组从1开始：

>>> m.groups()
('abc', 'b')

在模式中的反向应用允许你指定一个先前组的内容，例如，\1表示在当前位置的内容和组1匹配的内容相同。注意在Python中必须使用原始字符串表示。
例如，下面的RE探测同时出现两个相同单词的情况：

>>> p = re.compile(r'(\b\w+)\s+\1')
>>> p.search('Paris in the the spring').group()
'the the'

这种匹配方式在搜索中很少使用，但在字符串替换时却非常有用。

非捕获和命名组

RE可以使用许多组，用于捕获感兴趣的子字符串或者使复杂的RE结构更清晰，这使通过组编号进行跟踪变得非常困难。有两个方法可以解决这个问题，我们首先看第一个。
有时你将想要使用一个组表示正则表达式的一部分，但是不想要获取该组的内容。这时，你能使用非捕获组：(?:...)，将...替换为任何正则表达式。

>>> m = re.match("([abc])+", "abc")
>>> m.groups()
('c',)
>>> m = re.match("(?:[abc])+", "abc")
>>> m.groups()
()

除了你不能获取组匹配的内容，一个非捕获组的行为和捕获组的行为完全一致，你能放任何内容在它里面，可以使用重复元字符（例如*）重复它，或者嵌套其它组（捕获或者非捕获）。当修改一个已经存在的模式时(?:...)是特别有用的，因为你可以增加新的组而不改变已有的组的编号。但需要注意，使用非捕获组和捕获组在匹配上没有任何效率上的不同。
另一个更有意义的特征是命名组：取代为组编号，改为使用为组指定一个名称。
命名组是Python特定扩展之一，语法为：(?P...)，name是组的名称。匹配对象方法可以接受组的编号或者组的名称，因此你能使用两种方法得到组的匹配信息：

>>> p = re.compile(r'(?P\b\w+\b)')
>>> m = p.search( '(((( Lots of punctuation )))' )
>>> m.group('word')
'Lots'
>>> m.group(1)
'Lots'

命名组是便利的，因为名称比编号更容易记忆，下面是一个来自imaplib模块的RE的例子：

InternalDate = re.compile(r'INTERNALDATE "'
        r'(?P[ 123][0-9])-(?P[A-Z][a-z][a-z])-'
        r'(?P[0-9][0-9][0-9][0-9])'
        r' (?P[0-9][0-9]):(?P[0-9][0-9]):(?P[0-9][0-9])'
        r' (?P[-+])(?P[0-9][0-9])(?P[0-9][0-9])'
        r'"')

显然使用名称的方式m.group('zonem')比使用组编号9获取匹配值的方式更加容易使用。
对于向后应用的语法，例如(...)\1，引用了组的编号，使用组名代替编号语法有一些改变。这是另一个Python扩展：(?P=name)，表示组名为name的内容应该和当前点的内容匹配。为发现2个连续重复单词的正则表达式，(\b\w+)\s+\1能被写为(?P\b\w+)\s+(?P=word)：

>>> p = re.compile(r'(?P\b\w+)\s+(?P=word)')
>>> p.search('Paris in the the spring').group()
'the the'

预测先行断言

另一个零宽度断言是预测先行断言。预测先行断言可以在正、负形式使用，像这样：
1）(?=...)
正预测先行断言。如果包含...表示的正则表达式在当前位置被成功匹配，则成功，否则失败。但是，虽然包含的正则表达式被尝试，但匹配引擎并不会前进，模式的其余部分还是从断言开始的地方开始匹配。
2）(?!...)
负预测先行断言。和正预测先行断言相反，如果它包含的正则表达式不匹配当前位置的字符串，则成功。
为了使描述更加具体，我们看一个例子说明预测先行的作用。考虑一个简单的模式，用于匹配一个文件名，并将它拆分为文件名和扩展名。例如，news.rc中，news表示文件名，rc表示扩展名。
匹配的模式很简单：

.*[.].*$

注意.需要放到字符类中，因为它是一个元字符；也注意$，用于确保所有字符串的其余部分被包含在扩展中。这个正则表达式可以匹配foo.bar、autoexec.bat、sendmail.cf和printers.conf。
现在，考虑一个稍复杂点的情况，如果你想匹配扩展名不是bat的文件名该怎么做？下面是一些不正确的尝试：
1）.*[.][^b].*$
这个尝试要求扩展名的第一个字符不是b来排除bat。这时错误的，因为该模式也不匹配foo.bar。
2）.*[.]([^b]..|.[^a].|..[^t])$
这个比上一个更复杂一点，要求：扩展的第一个字符不匹配b，或者第二个字符不匹配a，或者第三个字符不匹配t。这个模式匹配foo.bar，不匹配autoexec.bat，但是它要求扩展名必须为3个字符，将不匹配带有2个字符扩展名的文件，例如sendmail.cf。我们将继续完善它。
3）.*[.]([^b].?.?|.[^a]?.?|..?[^t]?)$
在这个尝试中，第二个和第三个字符都是可选的，为了匹配的扩展名小于三个字符的情况，例如sendmail.cf。
现在模式开始复杂起来了，开始难于阅读和理解。更糟的是，如果问题改变，你想同时排除扩展名bat和exe，模式将变得更为复杂和难于理解。
一个负预测先行断言可以解决这个问题。
.*[.](?!bat$).*$
含义为：如果当前点表达式bat不匹配，则尝试模式的其余部分；如果bat$匹配，整个模式将失败。结尾的$用于防止出现sample.batch的情况。
排除另一个文件扩展名现在也容易了，简单的增加它作为断言的二选一。下面的模式同时排除bat和exe：
.*[.](?!bat$|exe$).*$

修改字符串

目前为止，我们仅适用正则表达式查询字符串，正则表达式也可用于修改字符串，使用下面的方法：
1）split()
从RE匹配的地方将字符串分解为字符串列表；
2）sub()
找到RE匹配的所有子字符串，并使用不同的字符串取代它们；
3）subn()
和sub做的事相同，但是返回新字符串和替换的次数。

分解字符串

split()方法用于分解一个字符串，使用RE匹配的子字符串作为分隔符，返回分解后的子字符串列表。它和字符串的split()方法是类似的，但是提供了更为通用的分隔符；字符串的split()方法仅支持空格或者固定的字符串。re也提供了一个模块级的re.split()函数。
split(string[, maxsplit=0])
通过正则表达式的匹配分解字符串。如果在RE中使用了括号，则正则表达式的匹配也将出现在结果列表中。如果maxsplit值大于0，则最多做maxsplit次分解。
你能通过设置maxsplit的值限制分解的数量。当maxsplit大于0时，最多进行maxsplit次分解，字符串的剩余部分被作为列表的最后一个元素返回。在下面的例子中，分隔符时任何非字符或数字的字符组合：

>>> p = re.compile(r'\W+')
>>> p.split('This is a test, short and sweet, of split().')
['This', 'is', 'a', 'test', 'short', 'and', 'sweet', 'of', 'split', '']
>>> p.split('This is a test, short and sweet, of split().', 3)
['This', 'is', 'a', 'test, short and sweet, of split().']

有时你不仅对分隔符之间是什么感兴趣，而且需要知道哦分隔符是什么。如果在RE中使用了括号，那么他们的值也将出现在返回列表中。比较下面的调用：

>>> p = re.compile(r'\W+')
>>> p2 = re.compile(r'(\W+)')
>>> p.split('This... is a test.')
['This', 'is', 'a', 'test', '']
>>> p2.split('This... is a test.')
['This', '... ', 'is', ' ', 'a', ' ', 'test', '.', '']

模块级的函数re.split()增加了RE作为第一个参数，其余的相同：

>>> re.split('[\W]+', 'Words, words, words.')
['Words', 'words', 'words', '']
>>> re.split('([\W]+)', 'Words, words, words.')
['Words', ', ', 'words', ', ', 'words', '.', '']
>>> re.split('[\W]+', 'Words, words, words.', 1)
['Words', 'words, words.']

替换

另一个常见的操作是发现字符串中的所有匹配，并将其替换为另一个字符串。sub()方法传入参数replacement，可以是一个字符串，或者一个函数。
sub(replacement, string[, count=0])
返回替换后的字符串，替换采用从左到右并且非重叠的方式。如果模式未被发现，返回未改变的字符串。
可选参数count用于指定替换的最大次数；count必须非负。默认值0意味着替换所有。
下面是一个简单的例子。它使用colour替换所有匹配的颜色名：

>>> p = re.compile( '(blue|white|red)')
>>> p.sub( 'colour', 'blue socks and red shoes')
'colour socks and colour shoes'
>>> p.sub( 'colour', 'blue socks and red shoes', count=1)
'colour socks and red shoes'

subn()方法做同样的事，但是返回一个长度为2的元组，包含新字符串和替换的次数：

>>> p = re.compile( '(blue|white|red)')
>>> p.subn( 'colour', 'blue socks and red shoes')
('colour socks and colour shoes', 2)
>>> p.subn( 'colour', 'no colours at all')
('no colours at all', 0)

空匹配只有当不和前一个匹配相邻时才做替换：

>>> p = re.compile('x*')
>>> p.sub('-', 'abxd')
'-a-b-d-'

如果replacement是一个字符串，在它里面的任何反斜杠转义符都会被处理。即，\n会被转换为一个新行字符，\r被转换为回车符，等等。未知的转义符例如\j被遗留。反向引用，例如\6，被RE中的对应组匹配的子字符串取代。这让你在替换后的结果字符串中能合并原始字符串的部分。
下面的例子匹配单词section，被一个{}包含的字符串跟随，并且改变section到subsection：

>>> p = re.compile('section{ ( [^}]* ) }', re.VERBOSE)
>>> p.sub(r'subsection{\1}','section{First} section{second}')
'subsection{First} subsection{second}'

也可以使用(?P...)命名的组。\g将通过组名来匹配，\g将通过组编号来匹配。因此\g<2>等价于\2，当可以避免歧义，例如\g<2>0表示匹配组2，而\20则会被解释为匹配组20。下面替换的例子都是等价的，但是使用了3种不同的方式：

>>> p = re.compile('section{ (?P [^}]* ) }', re.VERBOSE)
>>> p.sub(r'subsection{\1}','section{First}')
'subsection{First}'
>>> p.sub(r'subsection{\g<1>}','section{First}')
'subsection{First}'
>>> p.sub(r'subsection{\g}','section{First}')
'subsection{First}'

replacement也可以是一个函数，可以给你更多的控制。如果replacement是一个函数，函数会处理每一个模式匹配的非重叠的子字符串。在每次调用，函数被传递一个匹配对象作为参数，函数可以使用这个信息计算替换字符串并返回它。
在下面的例子中，replacement函数转换10进制数到16进制：

>>> def hexrepl(match):
...     "Return the hex string for a decimal number"
...     value = int(match.group())
...     return hex(value)
...
>>> p = re.compile(r'\d+')
>>> p.sub(hexrepl, 'Call 65490 for printing, 49152 for user code.')
'Call 0xffd2 for printing, 0xc000 for user code.'

当使用模块级别的re.sub()函数时，模式作为第一个参数传入。模式可以为一个对象或者字符串；如果你需要指定正则表达式标志，你必须使用一个模式对象作为第一个参数，或者在模式字符串中用嵌入的修饰语，例如：sub("(?i)b+", "x", "bbbb BBBB")返回'x x'。

常见问题

正则表达式在一些应用中是有用的工具，但他们的行为不是直观的，有时并不按照你所期望的方式工作。这节将描述一些常见的陷阱。

用String方法

有时使用re模块是错误的。如果你正在匹配一个固定的字符串，或者一个单个的字符类，并且你并没有用到任何re特征，例如IGNORECASE标志，那么正则表达式的威力并不被需要。String有几个为固定的字符串执行操作的方法，并且它们通常更快，因为他们的实现是单个的C循环，并且针对该场景做了优化。
一个常见的例子是替换一个固定的字符串为另一个，例如，你想替换word为deed，re.sub()似乎可以用于这种场景，但是你应该考虑replace()方法。注意replace()也将替换单词内的word，例如修改swordfish为sdeedfish，但是简单的RE word也将做那。（为了避免单词内的替换，模式将必须是\bword\b，为了要求word是一个独立的单词。这一点超出了replace()的能力。）
另一个常见任务是探测字符串中某个字符的位置，或者使用另一个字符替换它。你可以使用类似这样的操作来实现：re.sub('\n', ' ', S)，但是translate()也可以完成这样的任务，并且比任何正则表达式的操作都更快。
总之，使用re模块之前，考虑你的问题是否能使用更快、更简单的字符串方法解决。

match() VS search()

match()函数仅检查RE是否在字符串的开始匹配，而search()将扫描整个字符串。记住这一点非常重要，match()将仅报告在起点为0进行的成功匹配；如果匹配的起点不为0，match()将不报告它。

>>> print(re.match('super', 'superstition').span())
(0, 5)
>>> print(re.match('super', 'insuperable'))
None

另一个方面，search()将扫描整个字符串，报告发现的第一个成功匹配。

>>> print(re.search('super', 'superstition').span())
(0, 5)
>>> print(re.search('super', 'insuperable').span())
(2, 7)

有时你会被引诱使用re.match()，仅仅增加.*到你的RE之前。你应该拒绝这个诱惑，转而使用re.search()。正则表达式编译器会做一些RE的分析，为了加速查找匹配的处理。一个如此的分析是分析出匹配的首字符必定是什么；例如，一个以Crow开始的模式必须匹配首字符'C'。这个分析使引擎快速扫描字符串查询开始字符，当'C'被发现时才继续向下匹配。
增加.*将使这个优化无效，要求扫描到字符串的结尾，在回溯发现RE其余部分的一个匹配。因此，优先使用re.search()。

贪婪 VS 非贪婪

当重复一个正则表达式时，例如a*，正则表达式的行为是尽可能多的匹配。这一点经常会导致一些问题，当你尝试匹配一对对称的限定符时，例如包含HTML标签的尖括号，由于.*的贪婪特性，简单的匹配一个HTML标签的模式不工作：

>>> s = 'Title'
>>> len(s)
32
>>> print(re.match('<.*>', s).span())
(0, 32)
>>> print(re.match('<.*>', s).group())
Title

RE在中匹配'<'，然后.*消费字符串其余的所有部分，由于RE最后的>不能匹配，于是正则表达式引擎不得不回溯字符直到它为>找到一个匹配。最后的匹配就是从的'<'到的'>'，并不是你想要的。
在这种场景，应该使用非贪婪限制符*?、+?、??、或者{m,n}?，他们将匹配尽可能少的字符。在上面的例子中，在第一个'<'匹配之后，'>'将被立即尝试，如果失败，引擎每次前进一个字符，再次尝试，最后得到正确的结果：

>>> print(re.match('<.*?>', s).group())

（注意使用正则表达式解析HTML或者XML是痛苦的。因为写一个能处理所有场景的正则表达式是非常复杂的，使用HTML或者XML解析器来完成这样的任务。）

使用re.VERBOSE

到现在你可能注意到正则表达式是一个非常紧凑的形式，但是他们不是非常易读的。中等复杂程度的RE能成为反斜杠、括号和元字符的冗长的集合，使他们呢难于阅读和理解。
为如此的RE，当编译正则表达式时指定re.VERBOSE标志是有帮助的，因为它允许你格式化正则表达式使其更清晰。
re.VERBOSE标志有几个影响。在正则表达式中但不在字符类中的空格将被忽略，这意味着一个表达式例如dog | cat将等价于dog|cat，但是[a b]任然匹配字符'a'、'b'和空格。此外，你也能放注释在一个RE中；注释从一个#字符到下一行。当用三引号字符串时，RE被格式化的更加清晰：

pat = re.compile(r"""
 \s*                 # Skip leading whitespace
 (?P[^:]+)   # Header name
 \s* :               # Whitespace, and a colon
 (?P.*?)      # The header's value -- *? used to
                     # lose the following trailing whitespace
 \s*$                # Trailing whitespace to end-of-line
""", re.VERBOSE)

和下面的表达式比起来，这是更可读的：

pat = re.compile(r"\s*(?P[^:]+)\s*:(?P.*?)\s*$")

你可能感兴趣的:(python)

Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
[python] Class 小公鸡卡哇伊呀~ Python
FisrtLook使用C++术语，Python类的所有成员（包括函数和数据）均为"public"，所有函数均为"virtual"。支持多继承支持操作符重载内建类型可用作基类关于global,nonlocal的区别，Pythondocumentation给出的例子：defscope_test():defdo_local():spam="localspam"#local变量defdo_nonlocal
用Python爬取网易云歌单 Avaricious_Bear python 开发语言
最近，博主喜欢上了听歌，但是又苦于找不到好音乐，于是就打算到网易云的歌单中逛逛本着“用技术改变生活”的想法，于是便想着写一个爬虫爬取网易云的歌单，并按播放量自动进行排序这篇文章，我们就来讲讲怎样爬取网易云歌单，并将歌单按播放量进行排序1、用requests爬取网易云歌单打开网易云音乐歌单首页，不难发现这是一个静态网页，而且格式很有规律，爬取起来应该十分简单按照以前的套路，很快就可以写完代码，无非就
基于Python的Twitter Card数据爬取与分析实战：从入门到精通 Python爬虫项目 python twitter dreamweaver 自动化开发语言宽度优先爬虫
摘要本文详细介绍了如何使用Python最新技术栈构建一个高效的TwitterCard数据爬虫系统。我们将从TwitterCard的基本概念讲起，逐步深入到爬虫架构设计、反爬策略应对、数据解析与存储等核心环节。文章包含完整的代码实现，使用Playwright+Asyncio的高性能爬取方案，以及数据分析与可视化的实战案例。通过本文，读者将掌握大规模社交媒体数据采集的关键技术，并能够将这些技术应用于实
Python爬虫实战：高效解析OpenGraph协议数据 Python爬虫项目 python 爬虫开发语言宽度优先音视频 json
OpenGraph协议简介OpenGraph协议是由Facebook于2010年推出的一种网页元数据标准，旨在使任何网页都能成为社交图中的丰富对象。通过在网页的部分添加特定的标签，网站所有者可以控制内容在社交媒体上分享时的呈现方式。OpenGraph协议的核心元数据包括：html这些标签不仅被Facebook使用，也被Twitter、LinkedIn、WhatsApp等主流社交平台广泛支持。据统计
Python高级数据类型：字典（Dictionary） PythonicCC python 开发语言
字典是Python中非常重要且实用的数据结构，本文将全面详细地介绍字典的所有知识点，从基础概念到高级用法，帮助初学者彻底掌握字典的使用。1.字典简介1.1为什么需要字典？假设我们需要存储公司员工的姓名、年龄、职务和工资信息。使用列表可以这样实现：staff_list=[["tom",20,"teacher",6000],["rose",18,"hr",5000],["jack",20,"行政",4
【小白记录python】——类（class）的简单解释 faderbic python 开发语言
目录什么是类类和函数的区别构建一个类什么是类在编程中，类（Class）是一种用户自定义的数据类型，它将数据（通常称为属性或成员变量）和对这些数据进行操作的函数（通常称为方法或成员函数）封装在一起，相比于一般的函数更方便调用，通俗来讲，类就是很多函数的集合，这些函数共用一个数据源。类可以被看作是创建对象的模板或蓝图。通过类，可以创建多个具有相同结构和行为的对象实例。以下是对类的几个关键特点的解释：数
使用 Python 爬取网易云音乐歌单数据（完整教程） Python爬虫项目 python 开发语言 github selenium 爬虫
一、引言随着在线音乐平台的普及，网易云音乐（NetEaseCloudMusic）凭借其个性化的推荐算法和丰富的用户互动，吸引了大量用户。网易云音乐的歌单中包含了丰富的音乐数据，包括歌曲名、歌手、专辑、播放量、评论数等信息。通过爬取这些数据，可以对音乐流行趋势进行分析，挖掘音乐推荐策略，甚至训练个性化推荐模型。本教程将使用Python构建一个爬虫，解析网易云音乐的歌单接口，获取歌曲数据并进行数据分析
用AI“看病”，靠谱吗？｜聊聊如何用Python生成个性化健康建议 Echo_Wish 前沿技术人工智能人工智能 python 开发语言
用AI“看病”，靠谱吗？｜聊聊如何用Python生成个性化健康建议说实话，健康这事儿，谁不关心？可问题是，现代人越来越不想“看病”，倒不是说我们不在乎身体，而是——太麻烦、太贵、太笼统！你可能遇到过这种情况：明明每天健身，还被体检报告说“轻度脂肪肝”；营养均衡，但血糖还是偏高；去医院，医生说“少吃多动”，这谁听了不头疼？问题就出在一个词上：“个性化”。好消息是，AI已经可以提供定制化的健康建议了，
Python 单例模式几种实现方式 @MMiL PyBuild python matplotlib numpy pandas
文章目录1基础实现方式1.1模块导入法（推荐）1.2重写`__new__`方法2进阶实现方式2.1元类（Metaclass）控制2.2线程安全单例2.3单例装饰器3关键问题分析4实践建议各位老板好,单例模式确保一个类只有一个实例，并提供全局访问点。适用于日志记录、配置管理、数据库连接池等场景。以下是Python单例模式的5种实现方式：1基础实现方式1.1模块导入法（推荐）Python模块天然支持单
opencv、torch、torchvision、tensorflow的区别
一、框架定位与核心差异PyTorch动态计算图：实时构建计算图支持Python原生控制流（如循环/条件），调试便捷。学术主导：2025年工业部署份额24%，适合快速原型开发（如无人机自动驾驶、情绪识别）。TensorFlow静态计算图优化：预编译图结构提升部署效率支持动态图（Eager模式）兼顾灵活性。工业部署首选：市场份额38%，擅长边缘计算（YOLO部署）和大规模项目（工业自动化）-59）。O
Python简化常用技巧优雅的心情自动化测试 python 开发语言
文章目录一、列表表达式二、语法糖一、列表表达式Python为了简化程序的代码行数做了很多努力，其中最经典的就是列表表达式。比如我有如下函数，用来输出一个单词中的所有字符：defoutput_letter(letter):l=[]foriteminletter:l.append(item)returnlif__name__=="__main__":print(output_letter('kevin
Python 网络编程从入门到精通：架构、协议与 Socket 实现
Python网络编程从入门到精通：架构、协议与Socket实现网络编程是现代软件开发的核心技术之一，它允许不同设备上的程序通过网络进行通信和数据交换。本文将深入探讨网络编程的基础知识，包括软件架构设计模式、网络通信三要素、TCP与UDP协议的特点，以及Python中Socket编程的实现方法。一、软件架构设计模式1.C/S架构（Client/Server）C/S架构是最经典的网络应用架构，由客户端
python求基本勾股数_第一章：勾股数组（1）
毕达哥拉斯定理(即勾股定理)，它表明任一个直角三角形的两条直角边长的平方和等于斜边长的平方。用公式表示就是a^2+b^2=c^2第一个问题是，是否存在无穷多个勾股数组，即满足方程a^2+b^2=c^2的自然数三元组(a,b,c)。答案是“肯定的”。如果取勾股数组(a，b，c)，用整数d乘它，则得到新的勾股数组(da，db，dc)。这是成立的，因为(da)^2+(db)^2=d^2(a^2+b^2)
python flask restful_Flask应用示例1 - 通过Flask实现Restful服务 weixin_39548787 python flask restful
1，前言Python的强大，已经涉及到软件开发领域的方方面面。然而，Python入门容易，精确很难，需要深入研究。在Web方面同样如此，常用的PythonWeb框架，例如Django、Flask、Tornado等等，共计有100多种，各有优劣。本文以Flask为例，介绍Flask的Restful实现方式，主要实现对数据表的增删查改操作。2，需求在开发代码之前，需要提前明确URL请求、HTTP方法与
Python中几个有趣的语法糖 weixin_34368949 python
2019独角兽企业重金招聘Python工程师标准>>>withwith语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭、线程中锁的自动获取和释放等。http://www.ibm.com/developerworks/cn/opensource/os-cn-pythonwith/fieldyield的好处是显而易见的，把一个函
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
实用:python中的语法糖 Monkey_24 python Python学习记录语法糖 python if else yield from for in
案例一:for循环:foriin[1,2,3]:print(i)等价于:foriin[1,2,3]:print(i)案例二:yield生成器:foriin(lambdan:(yieldfromrange(n)))(3):print(i)等价于:deffn(n):foriinrange(n):yieldigt=fn(3)foriingt:print(i)案例三:ifelse判断(lambdan:pr
【工具篇】【从冷笑话到职场革命：Manus 100 问挑战人类认知极限】再见孙悟空_ AI 进阶之旅》【2025 AI工具合集】【2025 AI学习从零单排系列】Manus AI Manus manus邀请码 manus体验 Manus PPT Manus 对比 DeepSeek
一、基础认知篇1.Manus到底是什么？它是全球首款通用型AI智能体，简单来说就是能独立完成任务的数字助手。比如你让它分析股票，它不仅能给出报告，还能自动调用Python生成图表，甚至在你睡觉的时候还能在云端继续工作。2.名字“Manus”有什么含义？来自拉丁语“MensetManus”，直译是“心智与手”。官方解释是希望它既能思考又能行动，把人类的想法变成现实，就像有个AI助手帮你干活。3.谁开
python +pyautocad 在CAD中画一个线段带箭头默金…… AutoCAD python 前端数据库
python+pyautocad在CAD中画一个线段带箭头#!/usr/bin/envpython#-*-coding:utf-8-*-frompyautocadimportAutocad,APoint,aDoubleimportmathpyacad=Autocad(create_if_not_exists=True)pyacad.prompt("Hello!Autocadfrompyautoca
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
python 语法糖【不断更新】 linzch3 python python
1.得到a和b两个数的最大值solution:c=[b,a][a>b]测试：>>>a=1>>>b=2>>>c=[b,a][a>b]>>>c22.假设现在给定了一个list:a=[[1,2],[3,4,5],[6,7],[8],[9]]问如何将其转化成：[1,2,3,4,5,6,7,8,9]其实就是将所有数据都拿出来组成一个1*n的list。solution1:使用列表表达式>>>a=[[1,2],
pyautocad 的项目扩展与二次开发
pyautocad的项目扩展与二次开发1.项目的基础介绍pyautocad是一个开源项目，它提供了一个Python库，用于与AutoCAD进行交互。通过这个库，开发者可以在Python脚本中调用AutoCAD的功能，实现自动化的绘图、修改和管理等功能。该项目的目标是让开发者能够更加便捷地控制AutoCAD，提高工作效率。2.项目的核心功能pyautocad的核心功能包括：与AutoCAD的COM接
深入解析 SymPy 中的符号计算：导数与变量替换的实践指南老歌老听老掉牙 python sympy
在符号计算领域，SymPy作为Python的核心代数库，为数学推导提供了强大支持。然而，当处理复杂表达式时，用户常遇到两个典型挑战：函数导数的正确计算和变量的有效替换。本文将深入探讨这些问题，提供专业解决方案，并揭示其背后的数学原理函数导数的正确计算方法问题本质分析在SymPy中计算导数时，常见错误是将函数视为独立符号而非变量依赖关系。考虑以下情景：h=symbols('h')R_h=symbol
springboot+vue生态系统的气象数据可视化平台Java+python-计算机毕业设计
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python：勾股数 Dominick_Su Python编程 python 开发语言后端
找出一定范围内的勾股数a,b,c（均为正整数），而且三个数互质。importmathMAX=100#设定范围,a,b,c都在100以内PN=[]#PythagoreanNumber勾股数forainrange(2,int(MAX//math.sqrt(2))+1):forbinrange(a+1,int(math.sqrt(MAX*MAX-a*a))+1,2):c=int(math.sqrt(s:
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
如何使用爬虫简单的爬取一个网页的静态前端代码
什么是爬虫？Python爬虫是一种使用Python语言编写的程序，用于自动访问网页并提取所需信息。它通常用于网络数据抓取、数据挖掘和信息收集。Python爬虫可以模拟浏览器行为，向服务器发送请求并接收响应数据，然后解析这些数据以获取有用的信息。爬虫的基本原理（流程）发送请求：爬虫向目标网站的服务器发送HTTP请求（通常是GET请求）。获取响应：服务器返回网页的HTML内容。解析内容：爬虫解析HTM
[Python] -项目实战8- 构建一个简单的 Todo List Web 应用（Flask）踏雪无痕老爷子 Python python 开发语言
一、为什么选Flask？轻量上手快：仅需几行代码就能跑一个可用的Web应用。灵活扩展：可接入数据库、身份认证、前端框架等。教育性强：涵盖前后端交互基础，适合入门全栈开发。二、项目结构建议flask_todo/├──app.py├──templates/│└──index.html├──static/│└──style.css├──todo.db└──requirements.txtapp.py：后
Python连接AutoCAD第三方库pyautocad基础介绍（一） Smile丶Life丶 AutoCAD插件开发 python 开发语言 AutoCAD pyautocad
一、前言在开始探索Python连接CAD实现自动化绘图之前，让我们先明确一下读懂本教程所需的技术及知识基础。首先需要你熟练使用Python编程语言，其次，对于CAD软件，本教程将以常见的AutoCAD平台为例，但您至少需要对CAD的基本操作和绘图原理有初步的认识。了解如何创建、编辑图形对象，设置图层、颜色、线型等属性，以及保存和导出CAD图纸的基本流程。以下是本文所使用的开发环境：Python解释
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL