TonySure

正则表达式的入门用法及Python中的正则表达式

正则表达式的简单入门

Python中的正则表达式

正则表达式的简单入门

正则表达式(regular expression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

正则表达式是由普通字符（例如字符 a 到 z）以及特殊字符（称为"元字符"）组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

我尽量的在捋明白当下内容时不涉及还没学到的内容。当然我在写博客的时候已经稍微明白一些了，无法客观地站在一个完全的小白的角度来逐层分解。

普通字符

普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

非打印字符

字符	描述
\cx	匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
\f	匹配一个换页符。等价于 \x0c 和 \cL。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\r	匹配一个回车符。等价于 \x0d 和 \cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于 \x09 和 \cI。
\v	匹配一个垂直制表符。等价于 \x0b 和 \cK。

特殊字符

即在正则表达式中不能单纯作为普通字符，而拥有特定功能或者可以替代其他字符的某些字符

对于这些字符如果我们想取他们的字面意思应在其之前使用转义字符反斜杠“\”

特别字符	描述
$	匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身，请使用 \$。
( )	标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 $ 和 $。
*	匹配前面的子表达式零次或多次。要匹配 * 字符，请使用 \*。
+	匹配前面的子表达式一次或多次。要匹配 + 字符，请使用 \+。
.	匹配除换行符 \n 之外的任何单字符。要匹配 . ，请使用 \. 。
[	标记一个中括号表达式的开始。要匹配 [，请使用 \[。
?	匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配 ? 字符，请使用 \?。
\	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\"，而 '\(' 则匹配 "("。
^	在一个表达式开头中时，表示匹配输入字符串的开始位置；在方括号表达式中时，表示除了该方括号表达式中的字符集合，即“非”。要匹配 ^ 字符本身，请使用 \^。
{	标记限定符表达式的开始。要匹配 {，请使用 \{。
\|	指明两项之间的一个选择。要匹配 \|，请使用 \\|。

限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。

字符	描述
*	匹配前面的子表达式零次或多次。例如，'zo' （zo需至少出现0次）能匹配 "z"（因为"z"中出现了0次"zo"）以及 "zoo"。等价于{0,}。
+	匹配前面的子表达式一次或多次。例如，'zo+'（zo需至少出现一次）能匹配 "zo" 以及 "zoo"，但不能匹配 "z"，因为"z"中并没有出现至少一次 "zo"。+ 等价于 {1,}。
?	匹配前面的子表达式零次或一次。例如，'do(es)?'（匹配do后面出现一次es或出现0次es的字符串，即匹配do或does）可以匹配 "do" 、 "does" 中的 "does" 、 "doxy"（出现了do）中的 "do" 。? 等价于 {0,1}。
{n}	n 是一个非负整数。匹配确定的 n 次。例如，'o{2}' （匹配"oo"）不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。
{n,}	n 是一个非负整数。至少匹配n 次。例如，'o{2,}' （匹配至少出现两次"o"的字符串，如"oo"、"ooo"、"oooo"……）不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m}	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" （匹配"o"、"oo"、"ooo"）将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。

PS：关于小括号()、中括号[]、花括号{}做一下总结

() 一个子表达式，在该范围内单独表达某种字符串。表达式中有几个()就有几个相应的匹配子字符串。()本身不匹配任何东西，也不限制匹配任何东西，只是把括号内的内容作为同一个表达式来处理。

例如(ab){1,3}，就表示ab一起连续出现最少1次，最多3次。如果没有括号的话，ab{1,3},就表示a，后面紧跟的b出现最少1次，最多3次。

[]是定义匹配的字符范围。比如[abcde]匹配abcde中的任意一个，[abcdefghijklmnopqrstuvwxyz]匹配任意小写字母，等价于[a-z]，即"-"段横杠表示在某某范围内，[1-9]表示匹配数字1到9一次， [a-zA-Z0-9] 表示相应位置的字符要匹配一个英文字符或一个数字。特殊字符写在[]会被当成普通字符来匹配。例如[(a)]，会匹配(、a、)、这三个字符。

{}一般用来表示匹配的长度，比如 \s{3} 表示匹配三个空格，\s{1,3}表示匹配一到三个空格。

(0-9) 匹配 '0-9′ 本身。 [0-9]* 匹配数字（注意后面有 *，可以为空，即零个或多个）[0-9]+ 匹配数字（注意后面有 +，不可以为空，即至少出现一次）{1-9} 写法错误。

[0-9]{0,9} 表示长度为 0 到 9 的数字字符串。

一些例子：

[1-9][0-9]* //匹配一串数字，第一个数字不可以是0，即匹配大于1的所有整数 
[1-9][0-9]+ //匹配一串数字，至少是一个两位数，且开头第一个数字不可以是0，即匹配大于10的所有整数 
[1-9][0-9]？//匹配1~99的数字 
[1-9][0-9]{0,1} //匹配1~99的数字 
[0-9]{1,2} //匹配0~99的数字

关于贪婪匹配和非贪婪匹配

贪婪匹配：匹配尽可能多的内容

非贪婪匹配：只要出现第一个符合的内容即停止匹配

例子：

Chapter 1 - 介绍正则表达式

针对上面一行字符串，如果我们要匹配"<"和">"中的内容，则

贪婪匹配：“

Chapter 1 - 介绍正则表达式

”

非贪婪匹配：“

”

*、+ 限定符都是贪婪的，因为它们会尽可能多的匹配文字，在它们的后面加上一个?就可以实现非贪婪或最小匹配。

如同样一上面的字符串举例，匹配"<"">"之间内容的代码为

<.*> //此时为贪婪匹配，会得到Chapter 1 - 介绍正则表达式，因为会尽可能多的匹配所有符合条件的内容，即字面意思的贪婪

<.*?> //此时为非贪婪匹配，会得到，当第一次出现代表结束的符号">"时即停止匹配，因为已经满足条件了

" .* "： "."即匹配除换行符 \n 之外的任何单字符，

"*"即匹配前面的字符或子表达式零次或多次

所以".*"是以贪婪模式匹配任意多个除了换行符以外的字符。但".*？"是以非贪婪模式匹配任意多个除了换行符以外的字符。

Cats are smarter than dogs and humans
(.*) smarter (.*?) .*

上面的例子中（.*）是贪婪模式，而且后面有【空格】smarter【空格】……，所以他会一直匹配直到出现第一次【空格】smarter【空格】，然后后面是（.*?）【空格】.* ，此时（.*?）为非贪婪模式进行匹配，所以当她后面出现第一个【空格】时即停止匹配，所以（.*?）匹配了smarter【空格】后面的than，而再后面的【空格】dogs……由 .* 匹配。如果此时把表达式换为

(.*) smarter (.*) .*

则【空格】smarter【空格】后面的（.*）将匹配到最后一个空格之前的所有内容，即他将匹配than dogs and，因为and后面的空格是本句中最后一个空格。

定位符

定位符用来描述字符串或单词的边界，能够将正则表达式的查找目标固定到行首或行尾。

字符	描述
^	匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。
$	匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。
\b	匹配一个单词边界，即字与空格间的位置。
\B	非单词边界匹配。

注意！限定符和定位符不能一起使用，即不能将两者搭配。

关于上面定位符的使用实例：

^Chapter [1-9][0-9]{0,1}$ //查找以Chapter为开头，以1~99数字为结尾的字符串，中间有空格 
^Chapter$ //精确匹配，只匹配单词Chapter，就不匹配包含该单词的句子了，因为该句子中并不仅仅包含该单词

关于单词边界的描述：

单词的边界即每个“单词”（无论是不是一个完整的单词只要是一连串的无空格的字符串）与两边空格之间的位置；非单词边界即其他任意位置。

例如：

\bCha //可以匹配Cha开头的所有单词 
ter\b //可以匹配以ter为结尾的所有单词 
\Bapt //可以匹配不处在单词边界上的所有apt，比如chapter的apt，但无法匹配aptitude中的apt，因为他在边界上

运算符的优先级：

正则表达式从左到右进行计算，并遵循优先级顺序，这与算术表达式非常类似。

相同优先级的从左到右进行运算，不同优先级的运算先高后低。下表从最高到最低说明了各种正则表达式运算符的优先级顺序：

运算符	描述
\	转义符
(), (?:), (?=), []	圆括号和方括号
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \+任何元字符、任何字符	定位点和序列（即：位置和顺序）
\|	替换，"或"操作字符具有高于替换运算符的优先级，使得"m\|food"匹配"m"或"food"。若要匹配"mood"或"food"，请使用括号创建子表达式，从而产生"(m\|f)ood"。

匹配规则：

模式：是一组描述字符串特征的字符，是正则表达式最基本的元素，往往用特殊的字符表示一个范围内的字符、重复出现，或上下文。上面的匹配例子（大概）都是模式（吧？）

字符簇：（好像）就是一个中括号包括里面的东西

一些小例子：

字符簇	描述
^[^0-9][0-9]$	第一个字符不能是数字第二个字符必须是数字的两字符字符串
[^a-z]	除了小写字母以外的所有字符
[^\\\/\^]	除了(\)(/)(^)之外的所有字符，"\\"表示转义后的"\"，"\/"表示转义后的"/"，"\^"表示转义后的"^"
[^\"\']	除了双引号(")和单引号(')之外的所有字符
^[a-zA-Z_]$	所有的字母和下划线
^a$	字母a
^a{4}$	aaaa
^a{2,4}$	aa,aaa或aaaa
^a{1,3}$	a,aa或aaa
^a{2,}$	包含多于两个a的字符串
^a{2,}	如：aardvark和aaab，但apple不行
a{2,}	如：baad和aaa，但Nantucket不行
\t{2}	两个制表符
.{2}	任意的两个字符
^[a-zA-Z0-9_]{1,}$	所有包含一个以上的字母、数字或下划线的字符串
^[1-9][0-9]{0,}$	所有的正整数
^\-{0,1}[0-9]{1,}$	所有的整数

还有一个比较麻烦的例子：

^[-]?[0-9]+\.?[0-9]+$

表示所有浮点数。"^[-]?"表示开头出现一次或零次"-"负号（正数和负数），"[0-9]+"表示是匹配至少一次数字（小数点前面必须要有一位数字的，不然怎么是浮点数），"\.?"转义后的"."出现一次或零次（毕竟整数从某种意义上也算浮点数），"[0-9]+$"匹配小数点后面的任意位数字，并且以该任意个数字结尾。

PS：

"？"与{0，1}等价

"* "与{0，}等价

"+ "与{1，}等价

替换和分组：

所谓替换即“或”，具体表现是就是在两者中间匹配任意一个都可以，例如：

Chapter|Section //匹配 Chapter 或 Section

但是注意

^Chapter|Section [1-9][0-9]{0,1}$

并不会如大家所愿匹配成"Chapter [数字]"或"Session [数字]"，而是Chapter或Session [数字]，

如果要匹配成理想的亚子，应该这样写

^(Chapter|Section) [1-9][0-9]{0,1}$

所谓分组

@@@asd090***

1、@@@[a-z]{3}[0-9]{3}\*\*\*

2、(@@@)([a-z]{3})([0-9]{3})(\*\*\*)

上面两个表达式匹配的内容完全相同，只不过第二句多了几个括号将“@@@”、“字母”、“数字”、“***”分割开了但是小括号将匹配后的字符串进行了分组，每个小括号为一组，即上面有小括号那一次匹配中共有四组，而没有使用小括号的表达式没有分组情况。我个人觉得只有在后面需要用group、groups时这个分组的功能才有用。

(@@@)、(asd)、(090)、(***)

当然如果表达式是这样的，即只在最两边加了括号，则只有一个分组即它本身

(@@@[a-z]{3}[0-9]{3}\*\*\*)

此外，Python等语言还有自己的分组命名机制，可以对各个分组进行命名，后面会涉及。

其他例子：

正则表达式	描述
/\b([a-z]+) \1\b/gi	一个单词连续出现的位置。
/(\w+):\/\/([^/:]+)(:\d)?([^# ])/	将一个URL解析为协议、域、端口及相对路径。
/^(?:Chapter\|Section) [1-9][0-9]{0,1}$/	定位章节的位置。
/[-a-z]/	a至z共26个字母再加一个-号。
/ter\b/	可匹配chapter，而不能匹配terminal。
/\Bapt/	可匹配chapter，而不能匹配aptitude。
/Windows(?=95 \|98 \|NT )/	可匹配Windows95或Windows98或WindowsNT，当找到一个匹配后，从Windows后面开始进行下一次的检索匹配。
/^\s*$/	匹配空行。
/\d{2}-\d{5}/	验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。
/<\s(\S+)(\s[^>])?>[\s\S]<\s\/\1\s*>/	匹配 HTML 标记。

综上所述，无论是分析一个正则表达式要匹配什么内容还是写一个正则表达式，要点就是从浅到深由小到大，一层一层的分析或者写。

元字符

没啥可说的，看看就行，因为我觉得常用的在前面都介绍了，剩下的的瞄几眼就OK

字符	描述
\	将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。
^	匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配 '\n' 或 '\r' 之后的位置。
$	匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性，$ 也匹配 '\n' 或 '\r' 之前的位置。
*	匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
+	匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。
?	匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1}。
{n}	n 是一个非负整数。匹配确定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。
{n,}	n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m}	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。
?	当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如，对于字符串 "oooo"，'o+?' 将匹配单个 "o"，而 'o+' 将匹配所有 'o'。
.	匹配除换行符（\n、\r）之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用像"(.\|\n)"的模式。
(pattern)	匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合得到，在VBScript 中使用 SubMatches 集合，在JScript 中则使用 $0…$9 属性。要匹配圆括号字符，请使用 '$' 或 '$'。
(?:pattern)	匹配 pattern 但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用 "或" 字符 (\|) 来组合一个模式的各个部分是很有用。例如， 'industr(?:y\|ies) 就是一个比 'industry\|industries' 更简略的表达式。
(?=pattern)	正向肯定预查（look ahead positive assert），在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，"Windows(?=95\|98\|NT\|2000)"能匹配"Windows2000"中的"Windows"，但不能匹配"Windows3.1"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。
(?!pattern)	正向否定预查(negative assert)，在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如"Windows(?!95\|98\|NT\|2000)"能匹配"Windows3.1"中的"Windows"，但不能匹配"Windows2000"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。
(?<=pattern)	反向(look behind)肯定预查，与正向肯定预查类似，只是方向相反。例如，"(?<=95\|98\|NT\|2000)Windows"能匹配"2000Windows"中的"Windows"，但不能匹配"3.1Windows"中的"Windows"。
(?	反向否定预查，与正向否定预查类似，只是方向相反。例如"(?
x\|y	匹配 x 或 y。例如，'z\|food' 能匹配 "z" 或 "food"。'(z\|f)ood' 则匹配 "zood" 或 "food"。
[xyz]	字符集合。匹配所包含的任意一个字符。例如， '[abc]' 可以匹配 "plain" 中的 'a'。
[^xyz]	负值字符集合。匹配未包含的任意字符。例如， '[^abc]' 可以匹配 "plain" 中的'p'、'l'、'i'、'n'。
[a-z]	字符范围。匹配指定范围内的任意字符。例如，'[a-z]' 可以匹配 'a' 到 'z' 范围内的任意小写字母字符。
[^a-z]	负值字符范围。匹配任何不在指定范围内的任意字符。例如，'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范围内的任意字符。
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。
\B	匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。
\cx	匹配由 x 指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
\d	匹配一个数字字符。等价于 [0-9]。
\D	匹配一个非数字字符。等价于 [^0-9]。
\f	匹配一个换页符。等价于 \x0c 和 \cL。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\r	匹配一个回车符。等价于 \x0d 和 \cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于 \x09 和 \cI。
\v	匹配一个垂直制表符。等价于 \x0b 和 \cK。
\w	匹配字母、数字、下划线。等价于'[A-Za-z0-9_]'。
\W	匹配非字母、数字、下划线。等价于 '[^A-Za-z0-9_]'。
\xn	匹配 n，其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如，'\x41' 匹配 "A"。'\x041' 则等价于 '\x04' & "1"。正则表达式中可以使用 ASCII 编码。
\num	匹配 num，其中 num 是一个正整数。对所获取的匹配的引用。例如，'(.)\1' 匹配两个连续的相同字符。
\n	标识一个八进制转义值或一个向后引用。如果 \n 之前至少 n 个获取的子表达式，则 n 为向后引用。否则，如果 n 为八进制数字 (0-7)，则 n 为一个八进制转义值。
\nm	标识一个八进制转义值或一个向后引用。如果 \nm 之前至少有 nm 个获得子表达式，则 nm 为向后引用。如果 \nm 之前至少有 n 个获取，则 n 为一个后跟文字 m 的向后引用。如果前面的条件都不满足，若 n 和 m 均为八进制数字 (0-7)，则 \nm 将匹配八进制转义值 nm。
\nml	如果 n 为八进制数字 (0-3)，且 m 和 l 均为八进制数字 (0-7)，则匹配八进制转义值 nml。
\un	匹配 n，其中 n 是一个用四个十六进制数字表示的 Unicode 字符。例如， \u00A9 匹配版权符号 (?)。

Python中的正则表达式

上面的内容让门学会了正则表达式本身的用法和基本的匹配规则。我们可以在任何支持正则表达式的语言中使用。

我主要介绍一下Python中的基本用法。

Python自从1.5版本之后引入了正则表达式模块“re”，使用时需要先

import re

下面逐一介绍在python中常用的几种函数。

re.match函数

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none；如果在起始位置匹配成功，则返回_sre.SRE_Match object这样一个对象，其中包含所匹配字符串的起止位置和该目标字符串。

函数语法：

re.match(pattern, string, flags=0)

函数参数说明：

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。在最后一小节由详细介绍

匹配成功re.match方法返回一个匹配的对象，否则返回None。

例如：

text1 = "f123"
text2 = "123f"
print(re.match("[a-z]", text1)) # 匹配成功，打印 <_sre.SRE_Match object; span=(0, 1), match='f'>
print(re.match("[a-z]", text2)) # 匹配失败，打印 None。因为小写字母并不位于起始位置

对于match返回的匹配对象，span表示匹配到的定位（对于match永远是span=(0, *)，*为字符串长度），match表示匹配成功的字符是什么。

我们可以使用group(number) 或 groups() 来获取匹配成功后返回的对象中的内容。

匹配对象方法	描述
group(number)	如果正则表达式中使用了（）小括号则该方法中的number有效。该方法可以根据小括号获得分组，number中的数字表示取第几组。如果不填参数或填“0”，则返回整个匹配对象，此时表达式中有没有用小括号分组无所谓都可以使用。group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。
groups()	返回一个包含所有小组字符串的元组，从 1 到所含的小组号，即groups()=(group(1), group(2), group(3)……)。

匹配对象方法

描述

group(number)

如果正则表达式中使用了（）小括号则该方法中的number有效。该方法可以根据小括号获得分组，number中的数字表示取第几组。如果不填参数或填“0”，则返回整个匹配对象，此时表达式中有没有用小括号分组无所谓都可以使用。group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。

groups()

返回一个包含所有小组字符串的元组，从 1 到所含的小组号，即groups()=(group(1), group(2), group(3)……)。

js_def = "@@@asd090***"
print(re.match("@@@[a-z]{3}[0-9]{3}\*\*\*", js_def).group())
print(re.match("(@@@)([a-z]{3})([0-9]{3})(\*\*\*)", js_def).group())
print(re.match("(@@@)([a-z]{3})([0-9]{3})(\*\*\*)", js_def).group(1,2))
print(re.match("(@@@)([a-z]{3})([0-9]{3})(\*\*\*)", js_def).groups())

re.search方法

re.search 扫描整个字符串并返回第一个成功的匹配。

函数语法：

re.search(pattern, string, flags=0)

函数参数说明：

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。在最后一小节由详细介绍

匹配成功re.search方法返回一个匹配的对象，跟re.match一样都是_sre.SRE_Match object，否则返回None。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

匹配对象方法	描述
group(num=0)	匹配的整个表达式的字符串，group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。
groups()	返回一个包含所有小组字符串的元组，从 1 到所含的小组号。

换句话说就是用法和match方法几乎完全相同，只是match只能从字符串的起始位置匹配，search才是真正意义上我们平时理解的的在字符串中任意位置匹配。

例子：

1、

text = "Cats are smarter than dogs and humans"
print(re.search("are", text))

打印结果：

2、上面那个探索贪婪模式的例子（注意空格）

text = "Cats are smarter than dogs and humans"
print(re.search("(.*) smarter (.*) (.*)", text).groups())
print(re.search("(.*) smarter (.*?) (.*)", text).groups())

打印结果：

3、可以在匹配的结果后面直接调用span来查看匹配的长度。

print(re.search('www', 'www.runoob.com').span()) #(0, 3)
print(re.search('com', 'www.runoob.com').span()) #(11, 14)

接下来填一个之前留下的坑

Python命名分组机制

(?P正则表达式)  #name是一个合法的标识符

在一般的正则表达式中，一个括号内的内容作为一个小组。

([a-z]*)(23333)

可以通过下面的语句为其在python语言中命名并取出

(?P[a-z]*)(?P23333)
group("letter")
group("number")

看一个例子


s = "ip='230.192.168.78',version='1.0.0'"
print(re.search(r"ip='(?P\d+\.\d+\.\d+\.\d+).*", s).group('ip_address')) #'230.192.168.78'
 
phone = "123-719796895"
res=re.search(r"(?P\d+)-(?P\d+)", phone)
print(res.group('quhao')) #'123'
print(res.group('num')) #'719796895'

re.findall方法

re.findall 扫描整个字符串并以列表的形式返回所有匹配成功的子串。

函数语法：

re.findall(pattern, string, flags=0)

函数参数说明：

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。在最后一小节由详细介绍

匹配成功re.search方法返回一个list，其中包含了所有匹配成功的子串。但是，没有group可以用了。

还有另一种findall的用法后面学完compile再说

检索和替换

Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。

语法：

re.sub(pattern, repl, string, count=0, flags=0)

函数参数说明：

参数	描述
pattern	匹配的正则表达式
repl	替换的字符串，也可为一个函数
string	要匹配的字符串。
count	模式匹配后替换的最大次数，默认 0 表示替换所有的匹配

实例：

phone = "2004-959-559 # 这是一个国外电话号码"
 
# 删除字符串中的 Python注释 
num = re.sub("\#.*$", "", phone)
print(num) # 2004-959-559
 
# 删除非数字(-)的字符串 
num = re.sub('\D', "", phone)
print(num) # 2004959559

此处需要额外说一下参数pattern：

在正则表达式中反斜杠加数字（\N）对应着该表达式中使用小括号分好的组（我不知道在别的函数中是不是也可以这么用）
比如\6，表示匹配本表达式中的第6个group
意味着，pattern中，前面肯定是存在对应的，第6个group，然后你后面也才能去引用
比如，想要处理：

this is tonysure's blog and he is not a famous bloger.

现在要把is is tonysure's blog and he is not换成tonysure is

则就可以这样的re.sub实现替换：

text = "this is tonysure's blog and he is not a famous bloger."

replacedStr = re.sub(r"th(is)(.*)\1 not", "tonysure is", text )
#此句中 r 表示去掉反斜杠的转移机制
print (replacedStr) #tonysure is a famous bloger.

表达式pattern中使用小括号分了两组，第一组是（is），第二组是第一个is到not的所有内容，\1取了第一组的内容，也就是说如果不适用\1，则句子变为

replacedStr = re.sub(r"th(is)(.*)(is) not", "tonysure is", text )

同样如果换为

replacedStr = re.sub(r"(th)(is)(.*)\2 not", "tonysure is", text )

与原句表达相同。

参数repl：

如果repl是字符串的话，其中的任何反斜杠转义字符，都会被处理的。

即：

\n：会被处理为对应的换行符；

\r：会被处理为回车符；

其他不能识别的转移字符，则只是被识别为普通的字符。比如\j，会被处理为j这个字母本身；

双反斜杠\\加数字表示默认分组（也可以在前面加r，只用单反斜杠就够了）；

反斜杠加g以及尖括号<>内一个名字，即：\g，匹配命了名的组，

text = "this is tonysure's blog and he is not a famous bloger."

replacedStr = re.sub(r"th(is)(.*)\1 not", "\\1", text )
replacedStr = re.sub(r"th(is)(.*)\1 not", r"\1", text )
replacedStr = re.sub(r"th(?Pis)(.*)\1 not", "\g", text )
#全都打印 is a famous bloger.
print (replacedStr) #

如果被匹配的是个函数：

# 将匹配的数字乘以 2
def double(matched):
    value = int(matched.group('value'))
    return str(value * 2)
 
s = 'A23G4HFD567'
print(re.sub('(?P\d+)', double, s))

#A46G8HFD1134

这是菜鸟上给的例子，确实可以跑，但是之前不知道(?P\d+)可以一次性把句子中所有的数字匹配出来而且统一分组命名为value

re.compile 函数

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。

语法格式为：

re.compile(pattern[, flags])

函数参数说明：

参数	描述
pattern	匹配的正则表达式
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。在最后一小节由详细介绍

将上面使用过的大部分例子使用compile函数进行改写

patter = re.compile("(@@@)([a-z]{3})([0-9]{3})(\*\*\*)")
print(patter.match("@@@asd090***").groups())

patter = re.compile("(.*) smarter (.*) (.*)")
print(patter.match("Cats are smarter than dogs and humans").groups())

patter = re.compile("(.*) smarter (.*?) (.*)")
print(patter.match("Cats are smarter than dogs and humans").groups())

patter = re.compile("\#.*$")
number1 = patter.sub("" ,"2004-959-559 # 这是一个国外电话号码")
print(number1)

patter = re.compile('\D')
number2 = patter.sub("", str(number1))
print(number2)

inputStr = "hello crifan, nihao crifan"
patter = re.compile(r"([a-z].*) (\w+), nihao \2")
replacedStr = patter.sub("crifanli", inputStr)
print (replacedStr) #crifanli

text = "this is tonysure's blog and he is not a famous bloger."
patter = re.compile(r"th(?Pis)(.*)\1 not",)
replacedStr = patter.sub("\g", text )
#此句中 r 表示去掉反斜杠的转移机制
print (replacedStr) #

patter = re.compile('(?P\d+)')
s = 'A23G4HFD567'
print(patter.sub(double, s))

打印结果如下：

re.compile.findall函数：

回来填之前埋下的另一个坑，findall的另一个版本。其实使用效果差不多。

语法格式为：

findall(string[, pos[, endpos]])

函数参数说明：

参数	描述
string	待匹配的字符串。
pos	可选参数，指定字符串的起始位置，默认为 0。
endpos	可选参数，指定字符串的结束位置，默认为字符串的长度。

直接贴例子吧我觉得到现在应该算挺简单的了

pattern = re.compile(r'\d+')   # 查找数字
result1 = pattern.findall('runoob 123 google 456')
result2 = pattern.findall('run88oob123google456', 0, 10)
 
print(result1)
print(result2)
#['123', '456']
#['88', '12']

re.finditer

和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。

re.finditer(pattern, string, flags=0)

函数参数说明：

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。在最后一小节由详细介绍

it = re.finditer(r"\d+","12a32bc43jf3") 
for match in it: 
    print (match.group() )
#12 
#32 
#43 
#3

re.split

split 方法按照能够匹配的子串将字符串分割后返回列表，它的使用形式如下：

re.split(pattern, string[, maxsplit=0, flags=0])

参数：

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
maxsplit	分隔次数，maxsplit=1 分隔一次，默认为 0，不限制次数。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。在最后一小节由详细介绍

正则表达式修饰符 - 可选标志

就是之前说的flag标志位，正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志：

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

我把我需要学的东西写的差不多了，可能不是很全可能很浅薄不深刻，但是希望对看完的你有所帮助。感谢阅读。

你可能感兴趣的:(毕设日志)

感赏日志133 马姐读书
图片发自App感赏自己今天买个扫地机，以后可以解放出来多看点书，让这个智能小机器人替我工作了。感赏孩子最近进步很大，每天按时上学，认真听课，认真背书，主动认真完成老师布置的作业。感赏自己明白自己容易受到某人的影响，心情不好，每当此刻我就会舒缓，感赏，让自己尽快抽离，想好的一面。感赏儿子今天在我提醒他事情时，告诉我谢谢妈妈对我的提醒我明白了，而不是说我啰嗦，管事情，孩子更懂事了，懂得感恩了。投射父母
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
log4j配置 yy爱yy
#log4j.rootLogger配置的是大于等于当前级别的日志信息的输出#log4j.rootLogger用法:（注意appenderName可以是一个或多个）#log4j.rootLogger=日志级别,appenderName1,appenderName2,....#log4j.appender.appenderName2定义的是日志的输出方式，有两种：一种是命令行输出或者叫控制台输出，另一
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
openssl+keepalived安装部署 _小亦_ 项目部署 keepalived openssl
文章目录OpenSSL安装下载地址编译安装修改系统配置版本Keepalived安装下载地址安装遇到问题安装完成配置文件keepalived运行检查运行状态查看系统日志修改服务service重新加载systemd检查配置文件语法错误OpenSSL安装下载地址考虑到后面设备可能没法连接到外网，所以采用安装包的方式进行部署，下载地址：https://www.openssl.org/source/old/
《感恩日志》第八天祖乐
1.感恩武老师给姑娘朋友的宝宝起了名字。2.感恩张淑珍老师及时发的红包让我和杜姐能按时听课学习。3.感恩今天所有的遇见
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
2022-1-12晨间日记云卷云舒_a1b9
起床：6：20就寝：23：00天气：阴心情：还好纪念日：法考主观体出分的日子叫我起床的不是闹钟是梦想年度目标及关键点：备考初级会计师；坚持运动，减重，阅读，学习本月重要成果：报名今日三只青蛙/番茄钟学习听课；瑜伽课；记账盘点成功日志-记录三五件有收获的事务1.收到鲜花2.早起做早餐3.引导孩子做计划财务检视支出严重超预算，检视一月的预算是否合理人际的投入同学联系；开卷有益-学习/读书/听书听初级课
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
济宁高新区“路长制”8月28日工作日志 JNSGAJGXQFJ
【工作日志】一、洸河路“路长制”工作每日战报【早高峰巡逻】凯赛中队与高新区特警早高峰巡逻【平峰治理】凯赛中队与高新区特警平峰巡逻【晚高峰巡逻】凯赛中队与高新区特警在商检岗集合晚高峰巡逻二、吴泰闸路“路长制”工作每日战报【早高峰巡逻】圣地岗和贵和岗巡逻劝导非机动车走机动车道等重点违法行为，在重点路段疏导交通。【平峰巡逻】吴泰闸中队治理乱停乱放【晚高峰巡逻】圣地岗和贵和岗巡逻劝导非机动车走机动车道等重
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
网关gateway学习总结猪猪365 学习总结学习总结
一微服务概述:微服务网关就是一个系统!通过暴露该微服务的网关系统,方便我们进行相关的鉴权,安全控制,日志的统一处理,易于监控的相关功能!实现微服务网关技术都有哪些呢?1nginx:nginx是一个高性能的http和反向代理web的服务器,同事也提供了IMAP/POP3/SMTP服务.他可以支撑5万并发链接,并且cpu,内存等资源消耗非常的低,运行非常的稳定!2Zuul:Zuul是Netflix公司
MySQL事务隔离级别和MVCC 简书徐小耳
MySQL事务隔离级别和MVCC参考：https://mp.weixin.qq.com/s/Jeg8656gGtkPteYWrG5_Nw1.MVCC只对读已提交和可重复的读有效果，而未提交读和串行则无意义。2.每条记录都会有trx_id(事务修改记录的id）和roll_pointer是一个指针指向旧版本的undo日志链表（row_id不是必必要的，如果有主键存在就不需要了）3.版本链的头结点就是记
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台网顺技术团队成品程序项目 java vue.js 汽车课程设计 spring boot
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录基
2022-8-16晨间日记飞扬的雪ing
今天是什么日子起床：7：30就寝：11：20天气：晴热心情：悲伤逆流成河纪念日：被恶意锁文第三天叫我起床的不是闹钟是梦想年度目标及关键点：好好吃饭好好睡觉好好学习，忘记所有悲伤本月重要成果：1.完成暑期各类学习任务2.减肥减肥减肥3.督促孩子们好好训练节目成功日志-记录三五件有收获的事务1.《疫情.怡情》依然被恶意锁文，幼儿级“晨间日记”则不会被锁，可悲可叹!敷衍至极的文章收获上百个赞，可喜可贺!
2020-08-08日更152 今日xianyang大雨积水，开启看海模式西北小妖在路上
微妮8月8日周六每日复盘打卡121/200晴（记录8月7日周五的发生）一、感恩日志1、感恩父母养育了我；2、感恩我所在的地方风调雨顺；3、感恩小区物业还给老G打电话说由于大雨导致积水成灾，我家的车需要挪动。我们的车已经开到单位来了，弟弟的车也在长岭地铁站，所以不太担心了。4、感恩姐姐在医院照顾老妈住院，才有我们在这里的闲适；5、感恩单位的自然条件不错，环境优美，让我每天行走其中就是享受；6、感恩宿
静态常量（static const）|| 日志记录器课堂随想 moveit2 机器人
//AllsourcefilesthatuseROSloggingshoulddefineafile-specific//staticconstrclcpp::LoggernamedLOGGER,locatedatthetopofthefile//andinsidethenamespacewiththenarrowestscope(ifthereisone)staticconstrclcpp::L
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
MySQL日志沉着冷静2024 MySQL mysql 数据库
MySQL日志文章目录MySQL日志MySQL三大日志binlog的三种格式redolog和binlog的区别和应用场景为什么崩溃恢复不用binlog而用redolog？redolog如何实现持久化redolog还能做什么？redolog的三种刷盘策略两阶段提交什么是？为什么？两阶段提交过程MySQL三大日志1.undologundolog是InnoDB存储引擎层的日志，实现了事务的原子性，主要用
2021-2-25晨间日记野老说史
今天是什么日子起床：6：12就寝：9：30天气：阴心情：好纪念日：叫我起床的不是闹钟是梦想年度目标及关键点：老有所为老有所依老有所养，老有所乐本月重要成果：网上授课今日三只青蛙/番茄钟成功日志-记录三五件有收获的事务继续上网课阅读背单词财务检视人际的投入开卷有益-学习/读书/听书人只有享不了的福，没有受不了的罪善养生者，先饥而食，先渴而饮，先困而眠健康与饮食今日步数：19063今日锻炼：10000
Tomcat 中 catalina.out、catalina.log、localhost.log 和 access_log 的区别金色888
打开Tomcat安装目录中的log文件夹，我们可以看到很多日志文件，这篇文章就来介绍下这些日记文件的具体区别。catalina.out日志#catalina.out日志文件是Tomcat的标准输出（stdout）和标准出错（stderr）输出的“目的地”。我们在应用里使用System.out打印的内容都会输出到这个日志文件中。另外，如果我们在应用里使用其他的日志框架，配置了向Console输出日志
2019-11-29晨间日记麦新
今天是什么日子起床：6:00就寝：23:30天气：晴朗心情：平静纪念日：第二场比赛叫我起床的不是闹钟是梦想年度目标及关键点：国考考研本月重要成果：学习今日三只青蛙/番茄钟点评作业出镜点评夜班成功日志-记录三五件有收获的事务出镜点评点评作业夜班财务检视-1人际的投入来回跑～开卷有益-学习/读书/听书《孔子》健康与饮食今日步数：8000+好习惯打卡早晚打卡阅读打卡听书打卡社群打卡
计算机毕设Node.js+Vue校园易购二手交易平台（程序+LW+部署） Node程序源码强子 vue.js 课程设计 node.js
项目运行环境配置：Node.js最新版+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
5-【JavaWeb】JUnit 单元测试及JUL 日志系统 weixin_44329069 JavaWeb junit 单元测试
1.使用JUnit进行单元测试JUnit是Java中非常流行的单元测试框架，MyBatis与JUnit可以很好地结合，来测试持久层代码的正确性。1.1添加JUnit依赖在使用JUnit之前，需要在pom.xml中引入JUnit依赖。junitjunit4.13.2test1.2单元测试基本结构假设我们要测试UserMapper中的getUserById方法，测试代码如下：importorg.apa
20220505成就感日志125/365 kidII
奋斗是人生的底色，你会经历很多人事物，学会更多的东西。从学习上掌握技能，从学习上享受生活，即便是辛苦也没有关系，生活没有不辛苦的，但是要辛苦的有意义。与其说平凡的过一辈子，不如吃苦耐劳，选择自己喜欢的生活，一点点的付出，积累很多的经验，未来才会有希望。虽然我们渴望成就感，但也需要平衡生活，让自己越来越幸福。1.【日思】：今日最重要的一件事情。调整（训练4h，4.2k+卡片笔记写作法5h+粥左罗直播
二零一五年二月二十二日踏雪寻春
二零一五年二月二十二日，农历正月初四想写日志很长时间了，一直没有机会，一梦又一梦也中止了，有的时候根本就记不住，有的时候记住了没有机会写，其实还是没有那么坚定的信念，一个假期就这样要过去了，每个假期都是这样，想着要干这个要干那个，一到放假的时候就不那么重视了，也不知道是什么打乱了正常的计划。过年也越来越没意思了，不知道是年变了，还是人变了，感觉没有原来那么热闹了，也没有原来那么喜庆了，所有的年味不
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f