我自纵横2023

正则表达式

1 正则表达式到底是什么东西？

在编写处理字符串的程序或网页时，经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说，正则表达式就是记录文本规则的代码。

很可能你使用过Windows/Dos下用于文件查找的通配符(wildcard)，也就是 * 和 ? 。如果你想查找某个目录下的所有的Word文档的话，你会搜索 *.doc。在这里，* 会被解释成任意的字符串。

和通配符类似，正则表达式也是用来进行文本匹配的工具，只不过比起通配符，它能更精确地描述你的需求——当然，代价就是更复杂——比如你可以编写一个正则表达式，用来查找所有以0开头，后面跟着2-3个数字，然后是一个连字号 "-"，最后是7或8位数字的字符串(像010-12345678或0376-7654321)。

2 从几个例子开始

学习正则表达式的最好方法是从例子开始，理解例子之后再自己对例子进行修改，实验。

例一：在一篇英文小说里查找 hi，你可以使用正则表达式 hi。

这几乎是最简单的正则表达式了，它可以精确匹配这样的字符串：由两个字符组成，前一个字符是h，后一个是 i。通常，处理正则表达式的工具会提供一个忽略大小写的选项，如果选中了这个选项，它可以匹配 hi,HI,Hi,hI这四种情况中的任意一种。

不幸的是，很多单词里包含 hi 这两个连续的字符，比如him,history,high等等。用 hi 来查找的话，这里边的 hi 也会被找出来。如果要精确地查找hi这个单词的话，我们应该使用 \bhi\b。

\b 是正则表达式规定的一个特殊代码（好吧，某些人叫它元字符，metacharacter），代表着单词的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格、标点符号或者换行来分隔的，但是 \b 并不匹配这些单词分隔字符中的任何一个，它只匹配一个位置。

例二：假如你要找的是 hi 后面不远处跟着的一个Lucy，你应该用 \bhi\b.*\bLucy\b。

这里，' . '是另一个元字符，匹配除了换行符以外的任意字符。' * '同样是元字符，不过它代表的不是字符，也不是位置，而是数量——它指定' * '前边的内容可以连续重复使用任意次以使整个表达式得到匹配。因此，' .* '连在一起就意味着任意数量的不包含换行的字符。现在 \bhi\b.*\bLucy\b 的意思就很明显了：先是一个单词hi,然后是任意个任意字符(但不能是换行)，最后是Lucy这个单词。

如果同时使用其它元字符，我们就能构造出功能更强大的正则表达式。

例三：0\d\d\d-\d\d\d\d\d\d\d 匹配这样的字符串

import re

r = r'0\d\d\d-\d\d\d\d\d\d\d'
m = re.search(r,'秦栏小学的电话号码是：0550-7811354，请联系。')
print(m)

# 结果：

以0开头，然后是三个数字，然后是一个连字号"-"，最后是7个数字(也就是中国的电话号码。当然，这个例子只能匹配区号为4位的情形)。

这里的 \d 是个新的元字符，匹配一位数字(0~9)。- 不是元字符，只匹配它本身——连字符(或者减号，或者中横线，或者随你怎么称呼它)。

为了避免那么多烦人的重复，我们也可以这样写这个表达式：0\d{3}-\d{7}。这里\d后面的{3}({7})的意思是前面\d必须连续重复匹配3次(7次)。

3 测试正则表达式

正则表达式的语法很令人头疼，即使对经常使用它的人来说也是如此。由于难于读写，容易出错，所以找一种工具对正则表达式进行测试是很有必要的。

不同的环境下正则表达式的一些细节是不相同的，这里介绍两种可用的测试工具：

RegexBuddy
Javascript正则表达式在线测试工具

4 元字符

现在你已经知道几个很有用的元字符了，如 ' \b'， ' . '，' * ' 还有 ' \d '。正则表达式里还有更多的元字符，比如 ' \s '匹配任意的空白符，包括空格，制表符(Tab)，换行符，中文全角空格等。' \w ' 匹配字母或数字或下划线或汉字等。

例一：\ba\w*\b 匹配以字母a开头的单词

先是某个单词开始处(\b)，然后是字母a,然后是任意数量的字母或数字(\w*)，最后是单词结束处(\b)。

例二：\d+ 匹配1个或更多连续的数字

这里的 + 是和 * 类似的元字符，不同的是 * 匹配重复任意次(可能是0次)，而 + 则匹配重复1次或更多次。

例三：\b\w{6}\b 匹配刚好6个字符的单词。

**表1.常用的元字符**
代码	说明
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线或汉字
\s	匹配任意的空白符
\d	匹配数字
\b	匹配单词的开始或结束
^	匹配字符串的开始
$	匹配字符串的结束

5 字符转义

如果你想查找元字符本身的话，比如你查找' . '，或者' * '，就出现了问题：你没办法指定它们，因为它们会被解释成别的意思。这时你就得使用 \ 来取消这些字符的特殊意义。因此，你应该使用 \.和 \*。当然，要查找 \ 本身，你也得用 \\ 。

例如：deerchao\.net匹配deerchao.net，C:\\Windows匹配C:\Windows。

6 重复

你已经看过了前面的 * , + , {2} , {5,12} 这几个匹配重复的方式了。下面是正则表达式中所有的限定符(指定数量的代码)：

表2.常用的限定符
代码/语法	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

7 字符类

要想查找数字，字母或数字，空白是很简单的，因为已经有了对应这些字符集合的元字符，但是如果你想匹配没有预定义元字符的字符集合，应该怎么办？

例一：如匹配元音字母a,e,i,o,u

很简单，你只需要在方括号里列出它们就行了，像[aeiou]就匹配任何一个英文元音字母。

例二：匹配标点符号( . 或 ? 或 ! )

与上面的方法相同，像[.?!]就可以匹配标点符号( . 或 ? 或 ! )

例三：指定一个字符范围

像[0-9]代表的含意与 \d 就是完全一致的：一位数字；

同理[a-z 0-9 A-Z _ ]也完全等同于\w（如果只考虑英文的话）。

例四：\(?0\d{2}[) -]?\d{8}

注意：" ( " 、" ) "也是元字符，后面的分组节里会提到，所以在这里需要使用转义。

这个表达式可以匹配几种格式的电话号码，像(010)88886666，或022-22334455，或02912345678等。

我们对它进行一些分析吧：首先是一个转义字符\(，它能出现0次或1次(?)，然后是一个0，后面跟着2个数字(\d{2})，然后是 ) 或 - 或空格中的一个，它出现1次或不出现(?)，最后是8个数字 (\d{8})。

8 分枝条件

不幸的是，刚才那个表达式也能匹配010)12345678或(022-87654321这样的"不正确"的格式。要解决这个问题，我们需要用到分枝条件。

正则表达式里的分枝条件指的是有几种规则，如果满足其中任意一种规则都应该当成匹配，具体方法是用 | 把不同的规则分隔开。听不明白？没关系，看例子：

例一：0\d{2}-\d{8}|0\d{3}-\d{7}

这个表达式能匹配两种以连字号分隔的电话号码：一种是三位区号，8位本地号(如010-12345678)，一种是4位区号，7位本地号(0376-2233445)。

例二：$?0\d{2}$?[- ]?\d{8}|0\d{2}[- ]?\d{8}

这个表达式匹配3位区号的电话号码，其中区号可以用小括号括起来，也可以不用，区号与本地号间可以用连字号或空格间隔，也可以没有间隔。你可以试试用分枝条件把这个表达式扩展成也支持4位区号的（$?0\d{2}$?[- ]?\d{8}|0\d{2}[- ]?\d{8}|$?0\d{3}$?[- ]?\d{7}|0\d{3}[- ]?\d{7}）。

例三：\d{5}-\d{4}|\d{5}

这个表达式用于匹配美国的邮政编码。美国邮编的规则是5位数字，或者用连字号间隔的9位数字。之所以要给出这个例子是因为它能说明一个问题：使用分枝条件时，要注意各个条件的顺序。如果你把它改成\d{5}|\d{5}-\d{4}的话，那么就只会匹配5位的邮编(以及9位邮编的前5位)。原因是匹配分枝条件时，将会从左到右地测试每个条件，如果满足了某个分枝的话，就不会去再管其它的条件了。

9 分组

我们已经提到了怎么重复单个字符（直接在字符后面加上限定符就行了）；但如果想要重复多个字符又该怎么办？你可以用小括号来指定子表达式(也叫做分组)，然后你就可以指定这个子表达式的重复次数了，你也可以对子表达式进行其它一些操作(后面会有介绍)。

例一：简单的IP地址匹配表达式 (\d{1,3}\.){3}\d{1,3}（有问题的）

要理解这个表达式，请按下列顺序分析它：\d{1,3}匹配1到3位的数字，(\d{1,3}\.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次，最后再加上一个一到三位的数字(\d{1,3})。

注：IP地址中每个数字都不能大于255. 经常有人问我, 01.02.03.04 这样前面带有0的数字, 是不是正确的IP地址呢? 答案是: 是的, IP 地址里的数字可以包含有前导 0 (leading zeroes).

例二：((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

不幸的是，例一的表达式也将匹配256.300.888.999这种不可能存在的IP地址。如果能使用算术比较的话，或许能简单地解决这个问题，但是正则表达式中并不提供关于数学的任何功能，所以只能使用冗长的分组，选择，字符类来描述一个正确的IP地址：((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)。

理解这个表达式的关键是理解2[0-4]\d|25[0-5]|[01]?\d\d?，这里我就不细说了，你自己应该能分析得出来它的意义。

10 反义

有时需要查找不属于某个能简单定义的字符类的字符。比如想查找除了数字以外，其它任意字符都行的情况，这时需要用到反义：

表3.常用的反义代码
代码/语法	说明
\W	匹配任意不是字母，数字，下划线，汉字的字符
\S	匹配任意不是空白符的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开头或结束的位置
[^x]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

例一：\S+ 匹配不包含空白符的字符串。

例二：]+> 匹配用尖括号括起来的以a开头的字符串。

11 后向引用

使用小括号指定一个子表达式后，匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下，每个分组会自动拥有一个组号，规则是：从左向右，以分组的左括号为标志，第一个出现的分组的组号为1，第二个为2，以此类推。

呃......其实，组号分配还不像我刚说得那么简单：

分组0对应整个正则表达式
实际上组号分配过程是要从左向右扫描两遍的：第一遍只给未命名组分配，第二遍只给命名组分配。因此所有命名组的组号都大于未命名的组号
你可以使用(?:exp)这样的语法来剥夺一个分组对组号分配的参与权

后向引用用于重复搜索前面某个分组匹配的文本。例如，\1代表分组1匹配的文本。难以理解？请看示例：

例一：\b(\w+)\b\s+\1\b

这个表达式可以用来匹配重复的单词，像go go, 或者kitty kitty。

这个表达式首先是一个单词，也就是单词开始处和结束处之间的多于一个的字母或数字(\b(\w+)\b)，这个单词会被捕获到编号为1的分组中，然后是1个或几个空白符(\s+)，最后是分组1中捕获的内容（也就是前面匹配的那个单词）(\1)。

例二：自己指定子表达式的组名

要指定一个子表达式的组名，请使用这样的语法：(?\w+)(或者把尖括号换成 ' 也行：(?'Word'\w+))，这样就把\w+的组名指定为Word了。

要反向引用这个分组捕获的内容，你可以使用\k,所以上一个例子也可以写成这样：\b(?\w+)\b\s+\k\b。

使用小括号的时候，还有很多特定用途的语法。下面列出了最常用的一些：

表4.常用分组语法
分类	代码/语法	说明
捕获	(exp)	匹配exp,并捕获文本到自动命名的组里
	(?exp)	匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
	(?:exp)	匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言	(?=exp)	匹配exp前面的位置
	(?<=exp)	匹配exp后面的位置
	(?!exp)	匹配后面跟的不是exp的位置
	(?	匹配前面不是exp的位置
注释	(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读

我们已经讨论了前两种语法。第三个(?:exp)不会改变正则表达式的处理方式，只是这样的组匹配的内容不会像前两种那样被捕获到某个组里面，也不会拥有组号。"我为什么会想要这样做？"——好问题，你觉得为什么呢？

12 零宽断言

接下来的四个用于查找在某些内容(但并不包括这些内容)之前或之后的东西，也就是说它们像\b,^,$那样用于指定一个位置，这个位置应该满足一定的条件（即断言），因此它们也被称为零宽断言。最好还是拿例子来说明吧：

注：断言用来声明一个应该为真的事实。正则表达式中只有当断言为真时才会继续进行匹配。

12.1 (?=exp) 零宽度正预测先行断言

它断言自身出现的位置的后面能匹配表达式exp。

比如: \b\w+(?=ing\b)，匹配以ing结尾的单词的前面部分(除了ing以外的部分)，如查找I'm singing while you're dancing.时，它会匹配sing和danc。

12.2 (?<=exp) 零宽度正回顾后发断言

它断言自身出现的位置的前面能匹配表达式exp。即表示匹配的内容必须紧接在exp指定的模式之后，但exp本身不会被包含在匹配结果中。这种断言被称为“后发”断言，因为它是在目标位置之后查找模式。

例一：查找以re开头的单词的后半部分(除了re以外的部分)

import re

r = r'(?<=\bre)\w+\b'
m = re.search(r,'reading a book')
print(m)

# 结果：

例二：查找需要在前面和里面添加逗号的部分

假如你想要给一个很长的数字中每三位间加一个逗号(当然是从右边加起了)，你可以这样查找需要在前面和里面添加逗号的部分：((?<=\d)\d{3})+\b，用它对1234567890进行查找时结果是234567890。

import re

r = r'((?<=\d)\d{3})+\b'
m = re.search(r, '1234567890')
print(m)

# 结果：

例三：查找以空白符间隔的数字

import re

r = r'(?<=\s)\d+(?=\s)'
m = re.search(r, 'The price is 42 dollars.')
print(m)

# 结果：

这个例子中的正则表达式 (?<=\s)\d+(?=\s) 使用了两种断言：正向后视断言 (?<=\s) 和正向前视断言 (?=\s)。这两种断言都是零宽断言，它们不匹配字符，而是用于检查是否存在（或不存在）某种先前（或后续）的字符或模式，但不包括这些字符或模式在匹配结果中。

(?<=\s): 这是一个正向后视断言，它要求匹配的字符串前面必须有一个空白符（\s）。但是，这个空白符不会被包含在匹配结果中。
\d+: 这部分匹配一个或多个数字字符。
(?=\s): 这是一个正向前视断言，它要求匹配的字符串后面必须有一个空白符（\s）。同样，这个空白符也不会被包含在匹配结果中。

综合起来，这个正则表达式会匹配任何被空白符包围的数字序列，但匹配结果中仅包含数字，不包含空白符。

13 负向零宽断言

前面我们提到过怎么查找不是某个字符或不在某个字符类里的字符的方法(反义)。但是如果我们只是想要确保某个字符没有出现，但并不想去匹配它时怎么办？

例一：如果我们想查找这样的单词--它里面出现了字母q,但是q后面跟的不是字母u

尝试1：\b\w*q[^u]\w*\b 匹配包含字母q后面不是字母u的单词

import re

r = r'\b\w*q[^u]\w*\b'
m = re.search(r,'aqlify')
print(m)

# 结果：

但是如果多做测试(或者你思维足够敏锐，直接就观察出来了)，你会发现，如果q出现在单词的结尾的话，像Iraq fighting，这个表达式就会出错。

import re

r = r'\b\w*q[^u]\w*\b'
m = re.search(r,'Iraq fighting')
print(m)

# 结果：

这是因为 [^u] 总要匹配一个字符，所以如果q是单词的最后一个字符的话，后面的[^u]将会匹配q后面的单词分隔符(可能是空格，或者是句号或其它的什么)，后面的\w*\b将会匹配下一个单词，于是\b\w*q[^u]\w*\b就能匹配整个Iraq fighting。负向零宽断言能解决这样的问题，因为它只匹配一个位置，并不消费任何字符。现在，我们可以这样来解决这个问题：\b\w*q(?!u)\w*\b。

尝试2：\b\w*q(?!u)\w*\b

import re

r = r'\b\w*q(?!u)\w*\b'
m = re.search(r,'Iraq fighting')
print(m)

# 结果：

13.1 (?!exp) 零宽度负预测先行断言

断言此位置的后面不能匹配表达式exp。这意味着它会尝试匹配其后面的字符序列，但并不会消费任何字符；它只是做一个前瞻性的检查。如果这个前瞻性检查失败（即 exp 表达式不匹配），则整个正则表达式匹配可以继续进行。如果前瞻性检查成功（即找到了匹配 exp 的内容），则整个正则表达式匹配将失败，即使其他部分本来可以匹配成功。

这个断言非常有用，因为它允许你指定某些条件，这些条件必须为假（即不匹配）才能使整个正则表达式匹配成功。

例一：

尝试1：\b\w*q[^u]\w*\b
尝试2：\b\w*q(?!u)\w*\b

这两个正则表达式的目标都是匹配包含字母 "q" 但 "q" 后面不是字母 "u" 的单词。然而，它们在处理这个问题时采用了不同的策略，并且有一个关键的区别。

尝试1：\b\w*q[^u]\w*\b

这个正则表达式使用 [^u] 来确保 "q" 后面的字符不是 "u"。但是，这里有一个潜在的问题：如果 "q" 是单词的最后一个字符，[^u] 将会匹配单词后面的任何字符，这通常是一个分隔符（如空格、逗号、句号等）。然后，\w*\b 可能会匹配下一个单词，导致整个表达式匹配多个单词而不是单个单词。

例如，在字符串 "Iraq is a country" 中，这个正则表达式会错误地匹配 "Iraq is" 而不是仅仅匹配 "Iraq"。

尝试2：\b\w*q(?!u)\w*\b

这个正则表达式使用了否定前瞻断言 (?!u)。这个断言检查 "q" 后面的字符是否不是 "u"，但它不消费任何字符。这意味着它只检查一个条件而不实际匹配字符。因此，即使 "q" 是单词的最后一个字符，这个表达式也不会错误地匹配到下一个单词。

在同样的例子 "Iraq is a country" 中，这个正则表达式将正确地只匹配 "Iraq"。

总结

尝试1使用 [^u] 来排除 "u"，但可能会在 "q" 是单词末尾时出错。
尝试2使用否定前瞻断言 (?!u) 来确保 "q" 后面不是 "u"，这种方法在处理单词边界时更加准确。因此，尝试2通常是更好的选择，因为它更准确地实现了所需的功能。

例二：\d{3}(?!\d) 匹配三位数字，而且这三位数字的后面不能是数字

import re
# 正则表达式模式
pattern = r'\d{3}(?!\d)'
# 要搜索的字符串
text = "Here are some numbers: 123, 1234, 567, and 8901."
# 使用findall方法找到所有匹配项
matches = re.findall(pattern, text)

# 结果：['123', '234', '567', '901']

在这个例子中，re.findall()方法返回了一个包含所有匹配项的列表。

字符串"123"、"234"、"567"、"901"都被匹配到了，因为它们都是三位数字，并且后面没有紧跟着其他数字

import re

# 正则表达式模式
pattern = r'\b\d{3}(?!\d)'
# 要搜索的字符串
text = "Here are some numbers: 123, 1234, 567, and 8901."
# 使用findall方法找到所有匹配项
matches = re.findall(pattern, text)

# 结果：['123', '567']

上面的代码使用了适当的正则表达式来匹配恰好为三位数且其后不是数字的数字序列。正则表达式 \b\d{3}(?!\d) 中的 \b 是一个单词边界符，它确保匹配的三位数是一个完整的单词（在这里是指数字），而不是一个更长数字的一部分。

例三：\b(?!\w*abc\w*)\w+\b 匹配不包含连续字符串abc的单词。

import re

# 要搜索的字符串
text = "example words abcdef xyabc noabc 123abc456 boxere"

# 使用正则表达式匹配不包含 "abc" 的单词
pattern = r'\b(?!\w*abc\w*)\w+\b'

# 使用findall方法找到所有匹配项
matches = re.findall(pattern, text)

# 输出匹配结果
print(matches)  # 结果：['example', 'words', 'boxere']

13.2 (?

例一：(?

import re text = "There are 1234567 apples and 8901234 oranges, but only a1234567 is the code." pattern = r'(?
运行这段代码后，matches 应该包含两个字符串：'1234567' 和 '8901234'。这两个字符串都是前面没有小写字母的七位数字，符合我们的正则表达式模式。而尽管 a1234567 是一个七位数字，但由于它前面紧跟着小写字母 a，因此它不会被匹配。例二：(?<=<(\w+)>).*(?=<\/\1>) 匹配不包含属性的简单HTML标签内里的内容。这个正则表达式 (?<=<(\w+)>).*(?=<\/\1>) 的设计目的是要匹配不包含属性的简单HTML标签内部的内容。但是，这个正则表达式有几个问题和潜在的不足之处，不过在深入分析之前，我们先解释一下这个表达式各部分的含义。 (?<=<(\w+)>)：这是一个正向后视断言（positive lookbehind assertion），用于匹配后面跟随特定内容的字符串，但不包括这些内容本身。在这里，它尝试匹配一个左尖括号 <，后面跟着一个或多个单词字符（\w+，等价于 [a-zA-Z0-9_]），再后面是一个右尖括号 >。(\w+) 是一个捕获组，用于捕获标签名，以便稍后可以在表达式中引用它。然而，这里有一个问题：正向后视断言中的模式必须是固定宽度的，而 \w+ 的长度是可变的。因此，这个正则表达式在大多数正则表达式引擎中都会引发错误，因为可变宽度的正向后视断言通常是不支持的。 .*：这部分匹配任意数量的任意字符（换行符除外，除非使用了 re.DOTALL 或 re.S 标志）。这是用来捕获HTML标签内部的内容的。 (?=<\/\1>)：这是一个正向前视断言（positive lookahead assertion），用于匹配前面有特定内容的字符串，但不包括这些内容本身。在这里，它尝试匹配一个字符串，该字符串前面是一个左尖括号 <，后面跟着一个斜杠 /，再后面是第一个捕获组中捕获的标签名（通过 \1 引用），最后是一个右尖括号 >。这是用来确保我们匹配的内容确实是在一个HTML标签内部的。然而，由于可变宽度的正向后视断言的问题，这个正则表达式实际上是无法正常工作的。不过，如果我们只是想要一个简单的正则表达式来匹配不包含属性的简单HTML标签内部的内容，并且我们可以假设HTML是格式良好的（即没有嵌套的同名标签），我们可以尝试以下方法之一： import re text = "This is some text. This is another text." pattern = r"<(\w+)>(.*?)<\/\1>" matches = re.findall(pattern, text, re.DOTALL) for tag, content in matches: print(f"Tag: {tag}, Content: {content}") 这里我们使用了 .*? 来进行非贪婪匹配，以确保只匹配到最近的闭合标签。我们还使用了 re.DOTALL 标志来确保 . 可以匹配包括换行符在内的任意字符。但是请注意，这个正则表达式仍然无法正确处理嵌套的同名标签或包含属性的标签。对于更复杂的HTML处理，强烈建议使用专门的HTML解析库。 14 注释小括号的另一种用途是通过语法(?#comment)来包含注释。例如：2[0-4]\d(?#200-249)|25[0-5](?#250-255)|[01]?\d\d?(?#0-199)。要包含注释的话，最好是启用"忽略模式里的空白符"选项，这样在编写表达式时能任意的添加空格，Tab，换行，而实际使用时这些都将被忽略。启用这个选项后，在#后面到这一行结束的所有文本都将被当成注释忽略掉。例如，我们可以将前面的一个表达式写成这样： (?<= # 断言要匹配的文本的前缀 <(\w+)> # 查找尖括号括起来的字母或数字(即HTML/XML标签) ) # 前缀结束 .* # 匹配任意文本 (?= # 断言要匹配的文本的后缀 <\/\1> # 查找尖括号括起来的内容：前面是一个"/"，后面是先前捕获的标签 ) # 后缀结束 15 贪婪与懒惰 15.1 贪婪匹配当正则表达式中包含能接受重复的限定符时，通常的行为是（在使整个表达式能得到匹配的前提下）匹配尽可能多的字符。以这个表达式为例：a.*b，它将会匹配最长的以a开始，以b结束的字符串。如果用它来搜索aabab的话，它会匹配整个字符串aabab。这被称为贪婪匹配。 import re text = 'aabab' r = r'a.*b' m = re.findall(r,text) print(m) # 结果：['aabab'] 15.2 懒惰匹配有时，我们更需要懒惰匹配，也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式，只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧： import re text = 'aabab' r = r'a.*?b' m = re.findall(r,text) print(m) # 结果：['aab', 'ab'] a.*?b匹配最短的，以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab（第一到第三个字符）和ab（第四到第五个字符）。注：为什么第一个匹配是aab（第一到第三个字符）而不是ab（第二到第三个字符）？简单地说，因为正则表达式有另一条规则，比懒惰／贪婪规则的优先级更高：最先开始的匹配拥有最高的优先权——The match that begins earliest wins。表5.懒惰限定符代码/语法说明 *? 重复任意次，但尽可能少重复 +? 重复1次或更多次，但尽可能少重复 ?? 重复0次或1次，但尽可能少重复 {n,m}? 重复n到m次，但尽可能少重复 {n,}? 重复n次以上，但尽可能少重复 16 还有些什么东西没提到上边已经描述了构造正则表达式的大量元素，但是还有很多没有提到的东西。下面是一些未提到的元素的列表，包含语法和简单的说明。表7.尚未详细讨论的语法代码/语法说明 \a 报警字符(打印它的效果是电脑嘀一声) \b 通常是单词分界位置，但如果在字符类里使用代表退格 \t 制表符，Tab \r 回车 \v 竖向制表符 \f 换页符 \n 换行符 \e Escape \0nn ASCII代码中八进制代码为nn的字符 \xnn ASCII代码中十六进制代码为nn的字符 \unnnn Unicode代码中十六进制代码为nnnn的字符 \cN ASCII控制字符。比如\cC代表Ctrl+C \A 字符串开头(类似^，但不受处理多行选项的影响) \Z 字符串结尾或行尾(不受处理多行选项的影响) \z 字符串结尾(类似$，但不受处理多行选项的影响) \G 当前搜索的开头 \p{name} Unicode中命名为name的字符类，例如\p{IsGreek} (?>exp) 贪婪子表达式 (?-exp) 平衡组 (?im-nsx:exp) 在子表达式exp中改变处理选项 (?im-nsx) 为表达式后面的部分改变处理选项 (?(exp)yes|no) 把exp当作零宽正向先行断言，如果在这个位置能匹配，使用yes作为此组的表达式；否则使用no (?(exp)yes) 同上，只是使用空表达式作为no (?(name)yes|no) 如果命名为name的组捕获到了内容，使用yes作为表达式；否则使用no (?(name)yes) 同上，只是使用空表达式作为no

表5.懒惰限定符
代码/语法	说明
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复

表7.尚未详细讨论的语法
代码/语法	说明
\a	报警字符(打印它的效果是电脑嘀一声)
\b	通常是单词分界位置，但如果在字符类里使用代表退格
\t	制表符，Tab
\r	回车
\v	竖向制表符
\f	换页符
\n	换行符
\e	Escape
\0nn	ASCII代码中八进制代码为nn的字符
\xnn	ASCII代码中十六进制代码为nn的字符
\unnnn	Unicode代码中十六进制代码为nnnn的字符
\cN	ASCII控制字符。比如\cC代表Ctrl+C
\A	字符串开头(类似^，但不受处理多行选项的影响)
\Z	字符串结尾或行尾(不受处理多行选项的影响)
\z	字符串结尾(类似$，但不受处理多行选项的影响)
\G	当前搜索的开头
\p{name}	Unicode中命名为name的字符类，例如\p{IsGreek}
(?>exp)	贪婪子表达式
(?-exp)	平衡组
(?im-nsx:exp)	在子表达式exp中改变处理选项
(?im-nsx)	为表达式后面的部分改变处理选项
(?(exp)yes\|no)	把exp当作零宽正向先行断言，如果在这个位置能匹配，使用yes作为此组的表达式；否则使用no
(?(exp)yes)	同上，只是使用空表达式作为no
(?(name)yes\|no)	如果命名为name的组捕获到了内容，使用yes作为表达式；否则使用no
(?(name)yes)	同上，只是使用空表达式作为no

正则表达式概述出门撞大运正则表达式
在编程中，处理字符串是一项常见且重要的任务。而正则表达式，作为一种强大的字符串匹配工具，能帮助我们高效地完成各种复杂的字符串处理需求。无论是数据验证、文本搜索与替换，还是日志分析等场景，正则表达式都能大显身手。今天，我们就来全面了解一下正则表达式。一、什么是正则表达式正则表达式，又称正规表示法、常规表示法（英语：RegularExpression，在代码中常简写为regex、regexp或RE），
运维打铁: Shell 脚本自动化任务编写与优化懂搬砖运维打铁原力计划运维 ruby 自动化
文章目录思维导图一、基础编写1.变量与数据类型2.控制结构if-else语句for循环3.函数定义二、高级特性1.正则表达式2.文件处理3.远程操作三、性能优化1.代码结构优化2.资源管理3.并发处理总结思维导图Shell脚本自动化任务编写与优化基础编写高级特性性能优化变量与数据类型控制结构函数定义正则表达式文件处理远程操作代码结构优化资源管理并发处理一、基础编写1.变量与数据类型在Shell脚本
【LeetCode 3136. 有效单词】解析
目录LeetCode中国站原文原始题目题目描述示例1：示例2：示例3：提示：讲解化繁为简：如何优雅地“盘”逻辑判断题第一部分：算法思想——“清单核对”与“一票否决”第二部分：代码实现——清晰的逻辑翻译实现一：常规判断逻辑实现二：使用正则表达式（一行代码的“炫技”）第三部分：总结LeetCode中国站原文https://leetcode.cn/problems/valid-word/原始题目题目描述
selenium后续！！ paid槮 selenium 测试工具
小项目案例:实现批量下载网页中的资源根据15.3.2小节中的返回网页内容可知,用户只有获取了网页中的图片url才可以将图片下载到*在使用selenium库渲染网页后,可直接通过正则表达式过滤出指定的网页图片，从而实现批量下载接下来以此为思路来实现一个小项目案例。项目任务实现批量下载人民邮电出版社官网中与Python相关的图书封面图片。项目实步骤步骤1，获取人民邮电出版社官网中与Python相关的图
SpringBoot日志脱敏：敏感信息保护全面指南 Clf丶忆笙 spring boot 后端 java 日志脱敏
文章目录一、日志脱敏概述与核心概念1.1什么是日志脱敏1.2为什么需要日志脱敏1.3常见需要脱敏的敏感信息类型1.4脱敏技术核心原理二、SpringBoot基础日志脱敏实现2.1基于正则表达式的简单脱敏2.2在SpringBoot中集成基础脱敏2.3基础实现的优缺点分析三、基于注解的高级脱敏方案3.1自定义脱敏注解3.2实现自定义JSON序列化器3.3在实体类中应用脱敏注解3.4测试与验证四、Sp
【Python练习】035. 编写一个函数，实现简单的文本搜索功能视睿从零开始学习机器人 python 开发语言机器人算法人工智能
035.编写一个函数，实现简单的文本搜索功能035.编写一个函数，实现简单的文本搜索功能示例代码代码解释测试结果注意事项多种实现方法方法一：使用字符串内置方法方法二：使用正则表达式方法三：使用列表推导式方法四：使用KMP算法方法五：使用第三方库035.编写一个函数，实现简单的文本搜索功能示例代码importredefsimple_text_search(text,pattern):"""在文本中搜
数据安全审计平台的三大关键技术：日志分析、行为监测与智能告警 KKKlucifer 安全算法
在数字化浪潮中，数据安全审计是企业守护核心资产的“瞭望塔”。通过日志分析、行为监测、智能告警三大技术，数据安全审计平台构建起“全流程监控-异常识别-快速响应”的闭环，为数据安全筑牢防线。以下从技术原理、实践价值与行业应用展开解析。日志分析：数据安全的“DNA图谱”1.多源日志融合技术实现：通过Agent采集操作系统、数据库、网络设备等200+日志源，利用正则表达式、NLP技术解析非结构化日志（如“
LeetCode Top100特训九筒- LeetCode 算法力扣
更新中……两数相加盛水最多的容器电话号码的字母组合删除链表的倒数第N个结点字母异位词分组寻找两个正序数组的中位数合并区间不同路径（与最小路径和类似）正则表达式匹配颜色分类单词搜索只出现一次的数字合并K个升序链表接雨水移除元素最长有效括号不同的二叉搜索树验证二叉搜索树对称二叉树从前序与中序遍历序列构造二叉树最长连续序列排序链表乘积最大子数组编辑距离最小栈最小覆盖子串计算右侧小于当前元素的个数柱状图中
Python正则表达式实战指南 Monkey的自我迭代 mysql 数据库 java python
一正则表达式库正则表达式是文本处理中不可或缺的强大工具，Python通过re模块提供了完整的正则表达式支持。本文将详细介绍re模块中最常用的match()、search()和findall()函数，以及贪婪模式与非贪婪模式的区别，帮助读者掌握Python中正则表达式的核心用法。1.re.match()函数：从字符串开头匹配re.match()是正则表达式最基本的函数之一，它尝试从字符串的起始位置匹
C语言正则表达式使用详解
标准的C和C++都不支持正则表达式，但有正则表达式的函数库提供这功能.C语言处理正则表达式常用的函数有regcomp()、regexec()、regfree()和regerror()。使用正则表达式步骤：1)编译正则表达式regcomp()2)匹配正则表达式regexec()3)释放正则表达式regfree()4)获取regcomp或者regexec产生错误，获取包含错误信息的字符串函数声明如下：
正则表达式基本用法（notepad++）丨封尘绝念斩丨正则表达式
1.启动Notepad++并打开一个文本文件。点击菜单栏的"搜索"，然后选择"查找"或"替换"。2.学习基本的匹配字符："."表示匹配任意字符。"\d"表示匹配数字字符。"\w"表示匹配字母、数字和下划线字符。"\s"表示匹配空白字符。"[abc]"表示匹配字符"a"、"b"或"c"中的任意一个。3.学习特殊字符和量词："^"表示匹配字符串的开头。"$"表示匹配字符串的结尾。"*"表示匹配前面的字
正则表达式-元字符及描述 dianaixun1635 java scala javascript ViewUI
元字符描述\将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如，“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。^匹配输入字行首。如果设置了RegExp对象的Multiline属性，^也匹配“\n”或“\r”之后的位置。$匹配输入行尾。如果设置了RegExp对象的Multiline属性，$也匹配“\n”
notepad++正则表达式痞子IT 嵌入式开发语言 xml c语言
notepad++正则表达式使用笔记：1.查找空行：^\s*\r\n2.排除以（开头的行：^(?!（).*$3.查找第二行以A-D开头的情况：(\r\n)(^[A-D])4.查找不含有helloworld的行：^(?!.*helloworld).*$5.查找不以com结尾的字符串：^.*?(?|"']|"[^"]*"|'[^']*')*?(?:/>|>.*?)11.查找非换行空白：(\s)(?)及
爬虫-数据解析打酱油的； python自动化+爬虫爬虫
1.解析概述特性re(正则表达式)bs4(BeautifulSoup)xpath(lxml)pyquery本质文本模式匹配HTML/XML解析器(DOM树操作)XML路径语言(节点导航)jQuery式CSS选择器(封装lxml)学习曲线陡峭中等中等简单(熟悉jQuery/CSS)灵活性极高(处理任意文本)高(容错好，DOM操作)高(路径、轴、谓词)高(jQuery语法)可读性差(模式复杂时难懂)好
爬虫-正则表达式打酱油的； python自动化+爬虫爬虫 python
在线正则表达式测试OSCHINA.NET在线工具,ostools为开发设计人员提供在线工具，提供jsbin在线CSS、JS调试，在线JavaAPI文档,在线PHPAPI文档,在线Node.jsAPI文档,LessCSS编译器，MarkDown编译器等其他在线工具https://tool.oschina.net/regex/
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD 哪吒搬砖工逆袭Java架构师华为od 算法华为OD机试 2025B卷 java
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、正则表达式第6天、深度优先搜索dfs第7天、深度优先搜索dfs六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605
字符串的模糊匹配方法介绍超级土豆粉前端 javascript typescript html
字符串的模糊匹配方法介绍目录字符串的模糊匹配方法介绍一、编辑距离（LevenshteinDistance）复杂度分析二、Jaro-Winkler距离复杂度分析三、最长公共子序列（LCS）复杂度分析四、模糊搜索（FuzzySearch）复杂度分析五、正则表达式复杂度分析六、第三方库复杂度分析总结在日常开发和数据处理中，我们经常会遇到需要判断两个字符串是否“相似”或“接近”的场景，这时就需要用到字符串
Python词法分析器：从概念到实践凡狗蛋
本文还有配套的精品资源，点击获取简介：Python词法分析器是编程语言处理的关键环节，负责将源代码解析为有意义的标记或符号序列。本简介详细介绍了词法分析、正则表达式、分词、词法规则、词法分析器生成器以及编译原理等核心概念，并展示了如何使用Python内置的re模块和第三方库ply实现词法分析器，为进一步理解编程语言的工作原理和构建自定义编程语言打下基础。1.词法分析器的作用与目的词法分析器是编译器
如何记住js的正则表达式 HebyH_ javascript 正则表达式数据库
正则表达式（RegularExpressions）是处理字符串的强大工具，但确实需要一些记忆和练习才能掌握。以下是一些帮助你记忆JavaScript正则表达式的方法和常用模式：1.基础结构记忆法记住正则表达式的基本结构：/pattern/flags-斜杠包围模式，后面可跟标志例如：/hello/gi-匹配"hello"，全局且不区分大小写2.常用元字符记忆口诀"点星加问，花括号量".匹配任意单个字
正则表达式虎皮辣椒小怪兽 Linux 正则表达式
文章目录一、什么是正则表达式二、第一类正则三、第二类正则一、什么是正则表达式正则表达式（RegularExpression）是用于匹配字符串模式的工具。它可以高效地实现字符串的搜索、替换、验证等操作二、第一类正则元字符：指那些在正则表达式中具有特殊意义的专用字符，如：点(.)星(*)问号(?)等。前导字符：即位于元字符前面的字符abc*或aooo.1、.任意单个字符，除了换行符[root@loca
python爬虫正则表达式使用说明 yuwinter Python python 爬虫正则表达式
Python爬虫和正则表达式是自动化网络数据提取中常用的两种技术。本文将详细介绍如何使用Python编写爬虫，结合正则表达式提取网页中的数据。一、基础知识点1.安装必要库爬虫通常需要使用库来处理HTTP请求和解析网页，常用库有：requests：用于发送HTTP请求，获取网页内容。re：Python自带的正则表达式库，用于模式匹配和提取数据。BeautifulSoup（可选）：如果你需要更高级的网
python：正则表达式符号初于青丝mc终于白发 python相关正则表达式 python pycharm
本次给大家带来的是python中的正则表达式符号的复习呀，还记得清楚嘛^^？匹配零次或一次前面的分组*匹配零次或多次前面的分组+匹配一次或多次前面的分组{n}匹配n次前面的分组{n，}匹配n次或更多次前面的分组{，m}匹配零次或m次前面的分组{n，m}匹配至少n次，至多m次前面的分组{n，m}？、*？、+？对前面的分组进行非贪心匹配^spam意味着字符串必须以spam开始spam$意味着字符串必须
Python：正则表达式慕婉0307 python基础知识点正则表达式
正则表达式是处理文本数据的强大工具，Python通过re模块提供了完整的正则表达式功能。本文将详细介绍Python正则表达式的使用方法，包括基础语法、高级技巧和re模块API的详细解析。一、正则表达式基础1.1什么是正则表达式正则表达式(RegularExpression)是一种用于匹配字符串中字符组合的模式，可以用于搜索、替换和验证文本数据。1.2Python中的re模块Python通过内置的r
正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
深入理解 grep 命令：从基础匹配到正则表达式的全面指南线条1 正则表达式 java 数据库
一、grep命令概述在Linux系统中，grep（GlobalRegularExpressionPrint）是一个强大的文本搜索工具，它能够使用正则表达式在文本文件中查找匹配的行，并将这些行输出。从系统管理员到开发人员，grep都是日常工作中不可或缺的工具，广泛应用于日志分析、代码搜索、数据过滤等场景。二、grep基础匹配用法1.普通文本匹配命令格式：grep"pattern"filename示例
Python网络数据采集的方法蚂蚁ai Python零基础 Python python 开发语言
听说还有很多小伙伴还不知道网络数据采集的方法，让我来看看都有谁，不说话我就点名了。我把教程分享在下面了，需要的小伙伴自己领取。（https://jq.qq.com/?_wv=1027&k=kYtMeTfp）一般情况下以下四种方式都是可以匹配到结果的，只是复杂程度不一致，根据情况进行选择。◾正则re的使用◾bs4的使用◾xpath◾PyQuery①Re（RegularExpression正则表达式）
python 海象运算符_python := 海象运算符伶邪 python 海象运算符
最近在做算法题越来越发现python写法真的挺好用的记下来map(lambdax:sum(x))中lambda代表匿名函数re.findall(r'0+|1+',s)是正则表达式:=海象运算符转if(n:=len(a))>10:print(f"Lististoolong({n}elements,expected10:print(f"Lististolong({len(a)}elements,exp
python := 海象运算符 challenge-linge it it
参考视频教程:**体系课-Go+Python双语言混合开发盯紧技术先机抓紧高薪机遇**最近在做算法题越来越发现python写法真的挺好用的记下来map(lambdax:sum(x))中lambda代表匿名函数re.findall(r’0+|1+’,s)是正则表达式:=海象运算符转背景：python3.8正式版最近更新了，其中PEP572中的海象运算符获得正式python版本的支持.我看了官网的文档
正则表达式
运用正则表达式进行爬虫就是把想要得到的信息爬取出来贪婪爬取和非贪婪爬取replace(正则表达式,新的内容)符合正则表达式的被替换成新的内容(返回值是String)split(正则表达式)按照正则表达式规则切割字符串(返回值是String[]),遍历数组就可以得到了分组其实就是把内容分组,然后用组号代替内容复制,这样就不用多写几遍练习:其实正则表达式不用背,以后要用的时候直接右键选择插件下载的选择
Java 正则表达式你都会上树？ Java java 正则表达式
基本语法元字符转义号\\限定符符号含义*指定前面内容可以出现0次及以上+指定前面内容可以出现1次及以上。至少会出现一次?指定前面内容可以出现0次或一次{n}指定前面的内容只能出现n次{n,}指定前面内容至少出现n次{n,m}指定前面内容至少出现n次但不多于m次选择匹配符符号解释|逻辑或的含义，符号两边内容有一个成立即可|分组组合和反向引用符分组常用分组构造形式说明(pattern)非命名捕获。捕获
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p