weixin_34236497

【python3的进阶之路一】正则表达式

一、常见正则表达式符号和特殊字符

表达式	描述	正则表达式示例
符号
literal	匹配文本字符串的字面值literal	foo
rel1\|rel2	匹配正则表达式rel1或rel2	foo\|bar
.	匹配任何字符（除了\n之外）	b.b
^	匹配字符串起始部分	^Dear
$	匹配字符串终止部分	/bin/*sh$
*	匹配0次或者多次前面出现的正则表达式	[A-Za-z0-9]*
+	匹配1次或者多次前面出现的正则表达式	[a-z]+\.com
?	匹配0次或者1次前面出现的正则表达式	goo?
{N}	匹配N次前面出现的正则表达式	[0-9]{3}
{M,N}	匹配M~N次前面出现的正则表达式	[0-9]{5,9}
[...]	匹配来自字符集的任意单一字符	[aeiou]
[..x-y..]	匹配x~y范围中的任意单一字符	[0-9],[A-Za-z]
[^...]	不匹配此字符集中出现的任何一个字符，包括某一范围的字符（如果此字符集中出现）	[^aeiou],[^A-Za-z0-9]
(*\|+\|?\|{})？	用于匹配上面频繁出现/重复出现符号的非贪婪版本（*、+、？、{}）	.*?[a-z]
(...)	匹配封闭的正则表达式，然后另存为子组	([0-9]{3})?,f(oo\|u)bar
特殊字符
\d	匹配任何十进制数字，与[0-9]一致（\D与\d相反，不匹配任何非数值型的数字）	data\d+.txt
\w	匹配任何字母数字字符，与[A-Za-z0-9]相同（\W与之相反）	[A-Za-z_]\w+
\s	匹配任何空格字符，与[\n\t\r\v\f]相同（\S与之相反）	of\sthe
\b	匹配任何单词边界（\B与之相反）
\N	匹配已保存的子组N（参见上面的(...)）	price:\16
\c	逐字匹配任何特殊字符c（即仅按照字面意义匹配，不匹配特殊含义）	\.,\\,\*
\A(\Z)	匹配字符串的起始(结束)（另见上面介绍的^和$）	\ADear
扩展表示法
(?iLmsux)	在正则表达式中嵌入一个或者多个特殊“标记”参数（或者通过函数/方法）	(?x),(? im)
(?:...)	表示一个匹配不用保存的分组	(?:w+\.)*
(?P...)	像一个仅由name标识而不是数字ID标识的正则分组匹配	(?P)
(?P=name)	在同一字符串中匹配由(?P)分组的之前文本	(?P=data)
(?#...)	表示注释，所有内容都被忽略	(?#comment)
(?=...)	匹配条件是如果...出现之后的位置，而不使用输入字符串；称作正向前视断言	(?=.com)
(?!...)	匹配条件不是如果...出现之后的位置，而不使用输入字符串；称作负向前视断言	(?!.net)
(?<=...)	匹配条件是如果...出现之前的位置，而不使用输入字符串；称作正向后视断言	(?<=800-)
(?	匹配条件是如果...不出现之前的位置，而不使用输入字符串；称作负向后视断言	()?
(?(id/name)Y\|N)	如果分组所提供的id或name存在，就返回正则表达式的条件匹配Y，如果不存在，就返回N；\|N是可选项	(?(1)y\|x)

1.1 使用择一匹配符号匹配多个正则表达式

正则表达式模式	匹配的字符串
at\|home	at、home
bat\|bet\|bit	bat、bet、bit
\| 表示从多个模式中选择其一

1.2 匹配任意单个字符

正则表达式模式	匹配的字符串
f.o	匹配在字母“f”和“o”之间的任意一个字符：例如f#o、f9o
..	任意俩个字符
.end	匹配在字符串end之前的任意一个字符
.\.	匹配句点符号本身
句号符号能匹配换行符\n以外的任何字符，但是Python正则表达式有一个编译标记[S或者DOTALL]能够推翻这个限制，使句号能够有匹配换行符

1.3 从字符串起始或者结尾或者单词边界匹配

正则表达式模式	匹配的字符串
^From	任何以From作为起始的字符串
/bin/tcsh$	任何以/bin/tcsh作为结尾的字符串
^Subject:hi$	任何由单独的字符串Subject:hi构成的字符串
.*\$$	匹配任何以美元符号结尾的字符串
如果要匹配字符串的开始位置，就须使用脱字符^或字符\A，后者主要用于没有脱字符的键盘。美元符号$或者\Z将用于匹配字符串的末尾位置

正则表达式模式	匹配的字符串
the	任何包含the的字符串
\bthe	任何以the开始的字符串
\bthe\b	仅仅匹配单词the
\Bthe	任何包含但并不以the作为起始的字符串
\b将用于匹配一个单词的边界，意味着如果一个模式必须位于单词的起始部分，就不管单词前面（单词位于字符串中间）是否由任何字符（单词位于行首）。同样，\B将匹配出现一个单词中间的模式（不是单词边界）

1.4 创建字符集

正则表达式模式	匹配的字符串
b[aeiu]t	bat、bet、bit、but
[cr][23][dp][o2]	一个包含四个字符串，第一个字符使“c”或“r”，然后是“2”或“3”，后面是“d”或“p”，最后是“o”或“2”，例如：c2do、r3p2
如果要匹配一个字母的字符串，就可以使用正则表达式[ab]或a\|b

1.5 限定范围和否定

正则表达式模式	匹配的字符串
z.[0-9]	字母“z”后面跟着任何一个字符，然后跟着一个数字
[r-u][env-y][us]	字母“r”、“s”、“t”或者“u”后面跟着“e”、“n”、“v”、“w”、“x”或者“y”，然后跟着“u”或者“s”
[^aeiou]	一个非元音字符
[^\t\n]	不匹配制表符或者\n
[“-a]	在一个ASCII系统中，所有字符都位于“”和“a”之间，即34~97之间
如果脱字符^紧跟在左方括号后面，这个符号就表示不匹配给定字符集中的任何一个字符

1.6 使用闭包操作符实现存在性和频数匹配

正则表达式模式	匹配的字符串
[dn]ot?	字母“d”或者“n”，后面跟着一个“o”，然后是最多一个“t”，例如：do、no、dot、not
0?[1-9]	任何数值数字，它可能前置一个“0”，例如，匹配一系列数（表示从1~9数值），不管是一个还是俩个数字
[0~9]{15,16}	匹配15或者16个数字（例如信用卡号码）
]+>	匹配全部有效的（和无效的）HTML标签
[KQRBNP][a-h][1-8]-[a-h][1-8]	在“长代数”标记法中，表示国际象棋合法的棋盘移动（仅移动，不包括吃子和将军）。即“K”、“Q”、“R”、“B”、“N”、“P”等字母后面加上“a1”~“h8”之间的棋盘坐标。前面的坐标表示从哪里开始走棋，后面的坐标代表走到那个位置（棋格）上
星号将匹配其左边的正则表达式出现零次或者多次的情况（在计算机编程语言和编译原理中，该操作称为Kleene闭包）；加号+将匹配一次或多次出现的正则表达式（也叫做正闭包操作符）；问号?将匹配零次或者一次出现的正则表达式。举例： runoo+b，可以匹配 runoob、runooob、runoooooob 等。 runoob，可以匹配 runob、runoob、runoooooob 等。 colou?r 可以匹配 color 或者 colour。大括号{}里面是单个值或者是一对由逗号分隔的值。这将最终精确地匹配前面的正则表达式N次或者M~N次出现。这些符合能够由反斜线符号转义 \*匹配星号在之前的表格中曾多次使用问号（重载），这意味着要么匹配0次，要么匹配1次，或者其他含义：如果问号紧跟在任何使用闭合操作符的匹配后面，它将直接要求正则表达式引擎匹配尽可能少的次数 “尽可能少的次数”？当模式匹配使用分组操作符时，正则表达式引擎将试图“吸收”匹配该模式的尽可能多的字符，这叫做贪婪匹配。问号要求正则表达式引擎去“偷懒”，如果可能，就在当前的正则表达式中尽可能少地匹配字符，留下尽可能多的字符给后面的模式（如果存在）

1.7 表示字符集的特殊字符

正则表达式模式	匹配的字符串
\w+-\d+	一个由字母数字组成的字符串和一串由一个连字符分隔的数字
[A-Za-z]\w*	第一个字符是字母；其余字符（如果存在）可以是字母或者数字（几乎等价于Python中的有效标识符）
\d{3}-\d{3}-\d{4}	美国电话号码的格式，前面是区号前缀，例如800-555-1212
\w+@\w+\.com	以[email protected]格式表示的简单电子邮件地址
与使用“0-9”这个范围表示十进制数相比，可以简单地使用d表示匹配任何十进制数字；\w能够用于表示全部字母数字的字符集，相当于[A-Za-z0-9_]的缩写形式；\s可以用来表示空格字符。这些字符的大写表示不匹配，如\D表示任何非十进制数（与[^0-9]相同）

1.8 使用圆括号指定分组

正则表达式模式	匹配的字符串
\d+(\.\d*)?	表示简单浮点数的字符串；也就是说，任何十进制数字，后面可以接一个小数点和零个或者多个十进制数字，例如0.004、2、75.
(Mr?s?\.)?[A-Z][a-z]*[A-Za-z-]+	名字和姓氏，以及对名字的限制（如果有，首字母必须大写，后续字母小写），全名前可以有可选的“Mr.”、“Mrs.”、“Ms.”或者“M.”作为称谓，以及灵活可选的姓氏，可以有多个单词、横线以及大写字母
使用圆括号，我们可以知道整个字符串是否匹配我们的标准，而且还能提取任何已经成功匹配的特定字符串或者子字符串。当使用正则表达式时，一对圆括号可以实现以下任意一个或俩个功能： ◉对正则表达式进行分组 ◉匹配子组对正则表达式分组的实例： 1、当有俩个不同的正则表达式而且想用它们来比较同一个字符串 2、对正则表达式进行分组可以在整个正则表达式中使用重复操作符（而不是一个单独的字符或者字符集）使用圆括号进行分组的一个副作用就是，匹配模式的子字符串可以保存起来供后续使用。这些子组能够被同一次的匹配或者搜索重复调用，或者提取出来用于后续处理

1.9 扩展表示法

正则表达式模式	匹配的字符串
(?:\w+\.)*	以句点作为结尾的字符串，例如“google.”、“twitter.”，但是这些匹配不会保存下来供后续的使用和数据检索
(?#comment)	此处并不做匹配，知识作为注释
(?=.com)	如果一个字符串后面跟着“.com”才做匹配操作，并不使用任何目标字符串
(?!.net)	如果一个字符串后面不是跟着“.net”才做匹配操作
(?<=800-)	如果字符串之前为“800-”才做匹配，假定为电话号码，同样，并不使用任何输入字符串
(?	如果一个字符串之前不是“192.168.”才做匹配操作，假定用于过滤掉一组C类IP地址
(?(1)y\|x)	如果一个匹配组1（\1）存在，就与y匹配；否则，就与x匹配
以问号开始（?...）通常用于在判断匹配之前提供标记，实现一个前视（或者后视）匹配，或者条件检查

二、正则表达式和Python语言

函数/方法	描述
仅仅是re模块函数
complie(pattern, flags)	使用任何可选的标记来编译正则表达式的模式，然后返回一个正则表达式对象
re模块函数和正则表达式对象的方法
match(pattern, string, flags)	尝试使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功，就返回匹配对象；如果失败，就返回None
search(pattern, string, flags)	使用可选标记搜索字符串中第一次出现的正则表达式模式。如果匹配成功，则返回匹配对象；如果失败，返回None
findall(pattern, string, flags)	查找字符串中所有（非重复）出现的正则表达式模式，并返回一个匹配列表
finditer(pattern, string, flags)	与findall()函数相同，但返回的不是一个列表，而是一个迭代器。对于每一次匹配，迭代器都返回一个匹配对象
split(pattern, string, maxsplit, flags)	根据正则表达式的模式分隔符，split函数将字符串分割为列表，然后返回成功匹配的列表，分隔最多操作max次（默认分割所有匹配成功的位置）
re模块函数和正则表达式对象方法
sub(pattern, repl, string, count, flags)	使用repl代替所有正则表达式的模式在字符串中出现的位置，除非定义count，否则就将替换所有出现的位置
purge()	清除隐式编译的正则表达式模式
常用的匹配对象方法
group(num = 0)	返回整个匹配对象，或者编号为num的特定子组
groups(default = None)	返回一个包含所有匹配子组的元组；如果没有成功匹配，则返回一个空元组
groupdict(default = None)	返回一个包含所有匹配的命名子组的字典，所有的子组名称作为字典的键；如果没有成功匹配，则返回一个空字典
常用的模块属性（用于大多数正则表达式函数的标记）
re.I、re.IGNORECASE	不区大小写的匹配
re.L、re.LOCALE	根据所使用的本地语言环境通过\w、\W、\b、\B、\s、\S实现匹配
re.M、re.MULTILINE	^和$分别匹配目标字符串中行的起始和结尾，而不是严格匹配整个字符串本身的起始和结尾
re.S、re.DOTALL	“.”通常匹配除了\n之外的所有单个字符；该标记表示“.”能够匹配全部字符
re.X、re.VERBOSE	通过反斜线转义，否则所有空格加上#（以及在该行中所有后续文字）都被忽略，除非在一个字符类中或者允许注释并且提高可读性

2.1 使用compile()函数编译正则表达式

import re
pattern = re.compile('[a-zA-Z0-9_]', re.S)
result = pattern.findall('5678jb@#$%/./"_')
print (result)

2.2 匹配对象以及group()和groups()方法

匹配成功调用match()或者search()返回的对象的俩个主要方法就是group()和groups().

pat = re.compile(r'www\.(.*)\.(.*)')       #用()表示1个组，2个组
m = pat.match('www.dxy.com')
m.group()                                  #默认为0，表示匹配整个字符串   
'www.dxy.com'
 
m.group(1)                                 #返回给定组1匹配的子字符串
'dxy'
 
m.group(2)
'com'

m.groups()
('dxy', 'com')

2.3 使用match()方法匹配字符串

import re

m1 = re.match('foo', 'foo')
m2 = re.match('foo', 'bar')
if m1 is not None:
    print(m1)              # 
    print(m1.group())      # foo
    
if m2 is not None:
    print(m2.group())

为了简洁起见，可省略if语句块，但在实际操作中避免该操作，否则引起AttributeError异常

2.4 使用search()在一个字符中查找模式（搜索与匹配的对比）

search()的工作方式与match()完全一致，不同之处在于search会用它的字符串参数，在任意位置对给定正则表达式模式搜索第一次出现的匹配情况。如果搜索到成功的匹配，就会返回一个匹配对象；否则，返回None。
举例：

import re

m1 = re.match('foo', 'seafood')  # 匹配失败
if m1 is not None:
    print(m1.group())

m2 = re.search('foo', 'seafood') # 搜索成功，但匹配失败
if m2 is not None:
    print(m2.group())

说明：
match()试图从字符串的起始部分开始匹配模式，模式中的“f”将匹配到字符串的首字母“s”上，这将匹配失败。所以我们需要search()函数，而不是尝试匹配。search()函数不但会搜索模式在字符串中第一次出现的位置，而且严格地对字符串从左到右搜索。

2.5 匹配多个字符串

import re

bt = 'bat|bet|bit'
m1 = re.match(bt, 'blt')  # 匹配失败
if m1 is not None: m1.group()

m2 = re.match(bt, 'He bit me!')  # 不能匹配字符串
if m2 is not None: m2.group()

m3 = re.search(bt, 'He bit me!')  # 通过搜索查找'bit'
if m3 is not None: m3.group()

2.6 匹配任何单个字符

句号(.)不能匹配一个换行符或者空字符串

import re

anyend = '.end'
m1 = re.match(anyend, 'bend')  # 点号匹配b
if m1 is not None:
    print(m1.group())

m2 = re.match(anyend, 'end') # 不匹配任何字符
if m2 is not None:
    print(m2.group())

m3 = re.match(anyend, '\nend') # 除了\n之外的任何字符
if m3 is not None:
    print(m3.group())

m4 = re.search(anyend, 'The end.') # 在搜索中匹配' '
if m4 is not None:
    print(m4.group())

如果要匹配小数点，我们可以使用反斜线来进行转义

import re

patt314 = '3.14'
pi_patt = '3\.14'

m1 = re.match(pi_patt, '3.14')  # 精确匹配
if m1 is not None:
    print(m1.group())

m2 = re.match(patt314, '3014')  # 点号匹配'0'
if m2 is not None:
    print(m2.group())

m3 = re.match(patt314, '3.14')  # 点号匹配'.'
if m3 is not None:
    print(m3.group())

2.7 匹配字符集

import re

bt = '[cr][23][dp][o2]'
m = re.match(bt, 'c3po')  # 匹配失败
if m is not None: print(m.group())

2.8 特殊字符以及分组

import re

patt = '\w+@(\w+\.)*\w+\.com'   # 允许任意数量的中间子域存在
re.match(patt, '[email protected]').group()

m = '(\w\w\w)-(\d\d\d)'
re.match(m, 'abc-123').group()

v1 = re.match('ab', 'ab')
print(v1.groups())    # ()

v2 = re.match('(ab)', 'ab')
print(v2.groups())    # ('ab',)

v3 = re.match('(a)(b)', 'ab')
print(v3.groups())    # ('a','b')

v4 = re.match('(a(b))', 'ab')
print(v4.groups())    # ('ab', 'b')

2.9 匹配字符串的起始和结尾以及单词边界

import re

m1 = re.search('^The', 'The end.')   # 匹配
if m1 is not None: print(m1.group())

m2 = re.search('^The', 'end. The')   # 不作为起始
if m2 is not None: print(m2.group())

m3 = re.search(r'\bthe', 'bite the dog')   # 在边界
if m3 is not None: print(m3.group())

m4 = re.search(r'\bthe', 'bitethe dog')    # 有边界
if m4 is not None: print(m4.group())

m5 = re.search(r'\Bthe', 'bitethe dog')    # 没有边界
if m5 is not None: print(m5.group())

^和\b操作符更多用于表示搜索而不是匹配，因为match()总是从字符串开始位置进行匹配。

2.10 使用findall()和finditer()查找每一次出现的位置

findall()查询字符串中某个正则表达式模式全部的非重复出现情况。这与search在执行字符串搜索时类似，但与match()和search()不同于，findall()总是返回一个列表。如果findall()没有找到匹配的部分，就返回一个空列表，但如果匹配成功，列表将包含所有成功的匹配部分(从左向右按出现顺序排列)

import re

print(re.findall('car', 'scary'))
print(re.findall('car', 'carry the barcardi to the car'))

finditer()函数与findall()函数类似但是更节省内存的变体。俩者之间以及和其他变体函数之间的差异（很明显不同于返回的时一个迭代器还是列表）在于，和返回的匹配字符串相比，finditer()在匹配对象中迭代。

import re

s = 'This and that.'
print(re.findall(r'(th\w+) and (th\w+)', s, re.I))     #  [('This', 'that')]

print(re.finditer(r'(th\w+) and (th\w+)', s, re.I).__next__().groups())       #  ('This', 'that')

print(re.finditer(r'(th\w+) and (th\w+)', s, re.I).__next__().group(1))       #  'This'

[print(g.groups()) for g in re.finditer(r'(th\w+) and (th\w+)', s, re.I)]     #  ('This', 'that')

print(re.findall(r'(th\w+)', s, re.I))     #  [('This', 'that')]

print(re.finditer(r'(th\w+)', s, re.I).__next__().groups())       #  ['This', 'that']

print(re.finditer(r'(th\w+)', s, re.I).__next__().group(1))       #  ('This',)

[print(g.groups(1)) for g in re.finditer(r'(th\w+)', s, re.I)]     #  ('that',)

注意，使用finditer()函数完成的所有额外工作都旨在获取它的输出来匹配findall()的输出。
findall()和finditer()方法的版本支持可选的pos和endpos参数，这俩个参数用于控制目标字符串的·搜索边界。

2.11 使用sub()和subn()搜索与替换

sub()和subn()都是将某字符串中所有匹配正则表达式的部分进行某种形式的替换，但sunbn()还返回一个表示替换的总数，替换后的字符串和表示替换总数的数字一起作为一个拥有两个元素的元组返回。

import re

print(re.sub('X', 'Mr.Smith', 'attn: X\n\nDear X,\n'))
'''
attn: Mr.Smith

Dear Mr.Smith,
'''

print(re.subn('X', 'Mr.Smith', 'attn: X\n\nDear X,\n'))   # ('attn: Mr.Smith\n\nDear Mr.Smith,\n', 2)

print(re.sub('[ae]', 'X', 'abcdef'))    # XbcdXf

print(re.subn('[ae]', 'X', 'abcdef'))   # ('XbcdXf', 2)

2.12 在限定模式上使用split()分隔字符串

import re

print(re.split(':', 'str1:str2:str3'))    # ['str1', 'str2', 'str3']

import re

DATA = {
    'Mountain View, CA 94040',
    'Sunnyvale, CA',
    'Los Altos, 94023',
    'Cupertino 95014',
    'Palo Alto CA',
}

for datum in DATA:
    print(re.split(', |(?= (?:\d{5}|[A-Z]{2})) ', datum))

2.13 扩展符号

re.I/re.IGNORECASE与re.M/MULTILINE实现多行混合

import re

print(re.findall(r'(?i)yes', 'yes? Yes. YES!'))   # ['yes', 'Yes', 'YES']

print(re.findall(r'(?im)(^th[\w ]+)',"""
This line is the first,
another line,
that line, it's the best
"""))                                             # ['This line is the first', 'that line']

re.S/DOTALL表明点好(.)能够用来表示\n符号（反之其通常用于表示除了\n之外的全部字符）

import re

print(re.findall(r'th.+','''
The first line
the second line
the third line
'''))                # ['the second line', 'the third line']                  

print(re.findall(r'(?s)th.+','''
The first line
the second line
the third line
''')）               # ['the second line\nthe third line\n']

re.X/VERBOSE允许用户通过抑制在正则表达式中使用空白符来创建更易读的正则表达式。

import re

print(re.search(r'''(?x)
\((\d{3})\)     
[ ]             
(\d{3})              
-                    
(\d{4})              
''', '(800) 555-1212').groups())

当不想保存今后永远不会使用的多余匹配时，我们可以使用(?:…)

import re

print(re.findall(r'http://(?:\w+\.)*(\w+\.com)', 'http://www.baidu.com http://baidu.com'))
# ['baidu.com', 'baidu.com']
print(re.search(r'\((?P\d{3})\) (?P\d{3})-(?:\d{4})', '(800) 555-1212').groupdict())
# {'areacode': '800', 'prefix': '555'}

我们可以一起使用(?P)和(?P=name)。前者通过使用一个名称标识符而不是使用从1开始增加到N的增量数字来保存匹配，如果使用数字来保存匹配结果，我们就可以通过\1,\2…,\N来检索。使用后者，可以在一个相同的正则表达式中重用模式，而不必稍后再次在（相同）正则表达式中指定相同的模式。

import re

print(re.sub(r'\((?P\d{3})\) (?P\d{3})-(?:\d{4})', '(\g) \g-xxxx', '(800) 555-1212'))
# (800) 555-xxxx

import re

print(bool(re.match(r'\((?P\d{3})\) (?P\d{3})-(?P\d{4}) (?P=areacode)-(?P=prefix)-(?P=number) 1(?P=areacode)(?P=prefix)(?P=number)',
                      '(800) 555-1212 800-555-1212 18005551212'))) 
# True
print(bool(re.match(r'''(?x)
\((?P\d{3})\) [ ] (?P\d{3})-(?P\d{4}) 
[ ] 
(?P=areacode)-(?P=prefix)-(?P=number)
[ ]
1(?P=areacode)(?P=prefix)(?P=number)
''','(800) 555-1212 800-555-1212 18005551212')))
# True

我们可以使用(?=…)和(?!..)在目标字符串中实现一个前视匹配，而不必实际上使用这些字符串。

import re

print(re.findall(r'\w+(?= van Rossum)',
                 '''
                 Guido van Rossum
                 Tim Peters
                 Alex Martelli
                 Just van Rossum
                 Raymond Hettinger
                 '''))
# ['Guido', 'Just']
print(re.findall(r'(?m)^\s+(?!noreply|postmaster)(\w+)',
                 '''
                 [email protected]
                 [email protected]
                 [email protected]
                 [email protected]
                 [email protected]
                 '''))
# ['sales', 'eng', 'admin']
print(['%[email protected]' % e.group(1) for e in \
       re.finditer(r'(?m)^\s+(?!noreply|postmaster)(\w+)',
                 '''
                 [email protected]
                 [email protected]
                 [email protected]
                 [email protected]
                 [email protected]
                 ''')])
# ['[email protected]', '[email protected]', '[email protected]']

以下示例展示了使用条件正则表达式匹配

import re

print(bool(re.sub(r'\((?P\d{3})\) (?P\d{3})-(?P\d{4})', '(\g) \g-xxxx', '(800) 555-1212')))
# True

三、正则表达式示例

whodata.txt文件中保存一些用户的登陆信息，如登录名、用户登陆终端类型、用户登录的时间和地点

wesley          console          Jun 20 20:33
wesley          pts/9              Jun 22 01:38    (192.168.0.6)
wesley          pts/1              Jun 20 20:33    (:0.0)
wesley          pts/2              Jun 20 20:33    (:0.0)
wesley          pts/4              Jun 20 20:33    (:0.0)
wesley          pts/3              Jun 20 20:33    (:0.0)
wesley          pts/5              Jun 20 20:33    (:0.0)
wesley          pts/6              Jun 20 20:33    (:0.0)
wesley          pts/7              Jun 20 20:33    (:0.0)
wesley          pts/8              Jun 20 20:33    (:0.0)

如果我们想使用split()方法并不高效，因为文本中的空白符既不稳定也不一致，而且在登录时间戳中间的月、日和时间之间有空格。如果我们需要保存连续的字段，可以首先考虑模式\s\s+（至少拥有俩个以上的空白符），运行代码结果如下：

import re

f = open('whodata.txt', 'r')
for eachline in f:
    print(re.split(r'\s\s+', eachline))
f.close()

['wesley', 'console', 'Jun 20 20:33\n']
['wesley', 'pts/9', 'Jun 22 01:38\t(192.168.0.6)\n']
['wesley', 'pts/1', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/2', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/4', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/3', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/5', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/6', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/7', 'Jun 20 20:33\t(:0.0)\n']
['wesley', 'pts/8', 'Jun 20 20:33\t(:0.0)']

但是我们不期望垂直制表符(ASCII\011)作为输出的部分，虽然它看起来像多个空白符；同时我们也不希望保存\n(ASCII\012)作为每一行的终止符。去掉尾部的\n可以使用str.strip()。

import re

f = open('whodata.txt', 'r')
for eachline in f:
    print(re.split(r'\s\s+|\t|\n', eachline.strip()))
f.close()

['wesley', 'console', 'Jun 20 20:33']
['wesley', 'pts/9', 'Jun 22 01:38', '(192.168.0.6)']
['wesley', 'pts/1', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/2', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/4', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/3', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/5', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/6', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/7', 'Jun 20 20:33', '(:0.0)']
['wesley', 'pts/8', 'Jun 20 20:33', '(:0.0)']

四、更长的正则表达式

from random import randrange, choice
from string import ascii_lowercase as lc
from time import ctime

tlds = ('com', 'edu', 'net', 'org', 'gov')

for i in range(randrange(5, 11)):
    dtint = randrange(2**32)                # pick date
    dtstr = ctime(dtint)                    # date string
    llen = randrange(4, 8)                  # login is shorter
    login = ''.join(choice(lc) for j in range(llen))
    dlen = randrange(llen, 13)              # domain is longer
    dom = ''.join(choice(lc) for j in range(dlen))
    print('%s::%s@%s.%s::%d-%d-%d' % (dtstr, login, dom, choice(tlds), dtint, llen, dlen))

Mon Jun 28 16:07:28 2027::[email protected]::1814170048-5-9
Mon Sep  3 01:27:46 2057::[email protected]::2766677266-5-6
Tue May 27 14:43:41 1975::[email protected]::170405021-5-6
Mon Apr 15 14:51:29 1985::[email protected]::482395889-4-4
Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7
Sat Oct 22 04:02:55 2101::[email protected]::4159368175-4-6
Sat Nov 21 01:44:57 1970::[email protected]::27971097-7-7
Tue Nov 16 00:31:29 2094::[email protected]::3940677089-5-6
Wed Feb 13 09:39:51 2058::[email protected]::2780789991-7-11
Thu Jan  4 20:39:14 2080::[email protected]::3471597554-5-10

第五行：
tlds是一组高级域名集合，当需要随机生成电子邮件地址时，就可以从中随机选出一个
第七到第九行：
对于每一行，我们选取所有可能范围（0~2^31-1）中的随机整数，然后使用time.ctime()函数将该整数转换为日期。Python中的系统时间和大多数基于POSIX的计算机一样，俩者都使用从"epoch"至今的秒数，epoch是指1970年1月1日格林威治时间的午夜。如果我们选择一个32位整数，那么该整数将表示从epoch到最大可能时间（即epoch后的2³²秒）之间的某个时刻
第十到十三行：
伪造邮件地址的登录名长度为4~7个字符，主域名长度不能多于12个字符，并将它们逐个连接成一个字符串。random.choice()函数的功能就是接受一个序列，然后返回该序列中的一个随机元素。string.ascii_lowercase是字母表中拥有26个小写字母的序列集合。
第十四行：
将所有随机数据放入输出行。

4.1 匹配字符串

提起时间戳中一周的星期

import re

data = 'Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7'
patt = '^(Mon|Tue|Wed|Thu|Fri|Sat|Sun)'
m = re.match(patt, data)
if m is not None:
    print(m.group())     # Tue
    print(m.group(1))    # Tue
    print(m.groups())    # ('Tue',)

4.2 搜索与匹配。。。还有贪婪

我们想要寻找三个由连字符分隔的整数，我们可以使用正则表达式\d±\d±\d.我们现在使用search()来测试该正则表达式

import re

data = 'Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7'
patt = '\d+-\d+-\d'
m = re.search(patt, data)
if m is not None:
    print(m.group())     # 2619795832-7-7

但是我们匹配失败了。因为匹配从字符串的起始部分开始，但我们被匹配的数值位于字符串的末尾。可以使用惰性匹配，即使用“.+”来表明字符集跟在我们真正感兴趣的部分之后。

import re

data = 'Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7'
patt = '.+\d+-\d+-\d'
m = re.match(patt, data)
if m is not None:
    print(m.group())     # Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7

遗憾的是我们只想要末尾的数字字段，而不是整个字符串，因此需要使用圆括号对想要的内容进行分组

import re

data = 'Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7'
patt = '.+(\d+-\d+-\d)'
m = re.match(patt, data)
if m is not None:
    print(m.group(1))     # 2-7-7

我们想要提取的是2619795832-7-7，但是获取的确是2-7-7，为什么？问题在于正则表达式本质上实现贪婪匹配。这意味着对于该通配符模式，将对正则表达式从左至右按顺序求值，而且试图获取匹配该模式的尽可能多的字符。

为了解决这个问题，其中一个方案是使用“非贪婪”操作符“?”。我们可以在*、+或者?之后使用该操作符。该操作符将要求正则表达式引擎匹配尽可能少的字符。

另一个方案就是把“::”作为字段分隔符。我们可以仅仅使用正则字符串strip(’::’)方法获取所有部分，然后使用strip(’-’)作为另一个横线分隔符，就能够获取最初想要查询的三个整数。

import re

data = 'Tue Jan  7 01:03:52 2053::[email protected]::2619795832-7-7'
patt = '-(\d+)-'
m = re.search(patt, data)
if m is not None:
    print(m.group())      # -7-
    print(m.group(1))     # 7

转载于:https://www.cnblogs.com/CSgarcia/p/9713633.html

你可能感兴趣的:(【python3的进阶之路一】正则表达式)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

【python3的进阶之路一】正则表达式

一、常见正则表达式符号和特殊字符

1.1 使用择一匹配符号匹配多个正则表达式

| 表示 从多个模式中选择其一

1.2 匹配任意单个字符

句号符号能匹配换行符\n以外的任何字符，但是Python正则表达式有一个编译标记[S或者DOTALL]能够推翻这个限制，使句号能够有匹配换行符