dz45693

.NET正则基础之——平衡组

1 概述

平衡组是微软在 .NET 中提出的一个概念，主要是结合几种正则语法规则，提供对配对出现的嵌套结构的匹配。 .NET 是目前对正则支持最完备、功能最强大的语言平台之一，而平衡组正是其强大功能的外在表现，也是比较实用的文本处理功能，目前只有 .NET 支持，相信后续其它语言会提供支持。

平衡组可以有狭义和广义两种定义，狭义平衡组指 .NET 中定义的 (?<Close-Open>Expression) 语法，广义平衡组并不是固定的语法规则，而是几种语法规则的综合运用，我们平时所说的平衡组通常指的是广义平衡组。本文中如无特殊说明，平衡组这种简写指的是广义平衡组。

正是由于平衡组功能的强大，所以带来了一些神秘色彩，其实平衡组并不难掌握。下面就平衡组的匹配原理、应用场景以及性能调优展开讨论。

2 平衡组匹配原理

2.1 预备知识

平衡组通常是由量词，分支结构，命名捕获组，狭义平衡组，条件判断结构组成的，量词和分支结构这里不做介绍，这里只对命名捕获组，狭义平衡组和条件判断结构做下说明。

2.1.1 命名捕获组

语法： (?<name>Expression)

(?’name’Expression)

以上两种写法在 .NET 中是等价的，都是将“ Expression ”子表达式匹配到的内容，保存到以“ name ”命名的组里，以供后续引用。

对于命名捕获组的应用，这里不做重点介绍，只是需要澄清一点，平时使用捕获组时，一般反向引用或 Group 对象使用得比较多，可能会有一种误解，那就是捕获组只保留一个匹配结果，即使一个捕获组可以先后匹配多个子串，也只保留最后一个匹配到的子串。但事实是这样吗？

举例来说：

源字符串： abcdefghijkl

正则表达式： (?<chars>[a-z]{2})+

命名捕获组 chars 最终捕获的是什么？

string test = "abcdefghijkl" ;

Regex reg = new Regex (@"(?<chars>[a-z]{2})+" );

Match m = reg.Match(test);

if (m.Success)

{

richTextBox2.Text += " 匹配结果：" + m.Value + "/n" ;

richTextBox2.Text += "Group ：" + m.Groups["chars" ].Value + "/n" ;

}

/*-------- 输出--------

匹配结果：abcdefghijkl

Group ：kl

从 m.Groups["chars"].Value 的输出上看，似乎确实是只保留了一个匹配内容，但却忽略了一个事实， Group 实际上是 Capture 的一个集合

string test = "abcdefghijkl" ;

Regex reg = new Regex (@"(?<chars>[a-z]{2})+" );

Match m = reg.Match(test);

if (m.Success)

{

richTextBox2.Text += " 匹配结果：" + m.Value + "/n" ;

richTextBox2.Text += "Group ：" + m.Groups["chars" ].Value + "/n--------------/n" ;

foreach (Capture c in m.Groups["chars" ].Captures)

{

richTextBox2.Text += "Capture ：" + c + "/n" ;

}

/*-------- 输出--------

匹配结果：abcdefghijkl

Group ：kl

--------------

Capture ：ab

Capture ：cd

Capture ：ef

Capture ：gh

Capture ：ij

Capture ：kl

平时应用时可能会忽略这一点，因为很少遇到一个捕获组先后匹配多个子串的情况，而在一个捕获组只匹配一个子串时， Group 集合中就只有一个 Capture 元素，所以内容是一样的。

string test = "abcdefghijkl" ;

Regex reg = new Regex (@"(?<chars>[a-z]{2})" );

Match m = reg.Match(test);

if (m.Success)

{

richTextBox2.Text += " 匹配结果：" + m.Value + "/n" ;

richTextBox2.Text += "Group ：" + m.Groups["chars" ].Value + "/n--------------/n" ;

foreach (Capture c in m.Groups["chars" ].Captures)

{

richTextBox2.Text += "Capture ：" + c + "/n" ;

}

/*-------- 输出--------

匹配结果：ab

Group ：ab

--------------

Capture ：ab

捕获组保存的是一个集合，而不只是一个元素，这一知识点对于理解平衡组的匹配原理是有帮助的。

2.1.2 狭义平衡组

语法： (?<Close-Open>Expression)

其中“ Close ”是命名捕获组的组名，也就是“ (?<name>Expression) ”中的“ name ”，可以省略，通常应用时并不关注，所以一般都是省略的，写作“ (?<-Open>Expression) ”。作用就是当此处的“ Expression ”子表达式匹配成功时，则将最近匹配成功到的命名为“ Open ”组出栈，如果此前不存在匹配成功的“ Open ”组，那么就报告“ (?<-Open>Expression) ”匹配失败，整个表达式在这一位置也是匹配失败的。

2.1.3 条件判断结构

语法： (?(Expression)yes|no)

(?(name)yes|no)

对于“ (?(Expression)yes|no) ”，它是“ (?(?=Expression)yes|no) ”的简写形式，相当于三元运算符

(?=Expression) ? yes : no

表示如果子表达式“ (?=Expression) ”匹配成功，则匹配“ yes ”子表达式，否则匹配“ no ”子表达式。如果“ Expression ”与可能出现的命名捕获组的组名相同，为避免混淆，可以采用“ (?(?=Expression)yes|no) ”方式显示声明“ Expression ”为子表达式，而不是捕获组名。

“ (?=Expression) ”验证当前位置右侧是否能够匹配“ Expression ”，属于顺序环视结构，是零宽度的，所以它只参与判断，即使匹配成功，也不会占有字符。

举例来说：

源字符串： abc

正则表达式： (?(?=a)/w{2}|/w)

当前位置右侧如果是字符“ a ” ，则匹配两个“ /w ”，否则匹配一个“ /w ”。

string test = "abc" ;

Regex reg = new Regex (@"(?(?=a)/w{2}|/w)" );

MatchCollection mc = reg.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

对于“ (?(name)yes|no) ”，如果命名捕获组“ name ”有捕获，则匹配“ yes ”子表达式，否则匹配“ no ”子表达式。这一语法最典型的一种应用是平衡组。

当然，以上两种语法中，“ yes ”和“ no 都是可以省略的，但同一时间只能省略一个，不能一起省略。平衡组的应用中就是省略了“ no ”子表达式。

2.2 平衡组的匹配原理

平衡组的匹配原理可以用堆栈来解释，先举个例子，再根据例子进行解释。

源字符串： a+(b*(c+d))/e+f-(g/(h-i))*j

正则表达式： /(((?<Open>/()|(?<-Open>/))|[^()])*(?(Open)(?!))/)

需求说明：匹配成对出现的 () 中的内容

string test = "a+(b*(c+d))/e+f-(g/(h-i))*j" ;

Regex reg = new Regex (@"/(((?<Open>/()|(?<-Open>/))|[^()])*(?(Open)(?!))/)" );

MatchCollection mc = reg.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

(b*(c+d))

(g/(h-i))

下面来考察一下这个正则，为了阅读方便，写成宽松模式。

Regex reg = new Regex (@"/( # 普通字符 “ ( ”

( # 分组构造，用来限定量词 “ * ” 修饰范围

(?<Open>/() # 命名捕获组，遇到开括弧 ’ Open ’ 计数加1

| # 分支结构

(?<-Open>/)) # 狭义平衡组，遇到闭括弧 ’ Open ’ 计数减1

| # 分支结构

[^()]+ # 非括弧的其它任意字符

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有 ’ Open ’ ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace);

对于一个嵌套结构而言，开始和结束标记都是确定的，对于本例开始为“ ( ”，结束为“ ) ”，那么接下来就是考察中间的结构，中间的字符可以划分为三类，一类是“ ( ”，一类是“ ) ”，其余的就是除这两个字符以外的任意字符。

那么平衡组的匹配原理就是这样的：

1. 先找到第一个“ ( ”，作为匹配的开始

2. 在第 1 步以后，每匹配到一个“ ( ”，就入栈一个 Open 捕获组，计数加 1

3. 在第 1 步以后，每匹配到一个“ ) ”，就出栈最近入栈的 Open 捕获组，计数减 1

4. 后面的 (?(Open)(?!)) 用来保证堆栈中 Open 捕获组计数是否为 0 ，也就是“ ( ”和“ ) ”是配对出现的

5. 最后的“ ) ”，作为匹配的结束

匹配过程（以下匹配过程，如果觉得难以理解，可以暂时跳过，先学会如何使用，再研究为什么可以这样用吧）

首先匹配第一个“ ( ”，然后一直匹配，直到出现以下两种情况之一：

a) 堆栈中 Open 计数已为 0 ，此时再遇到“ ) ”

b) 匹配到字符串结束符

这时控制权交给 (?(Open)(?!)) ，判断 Open 是否有匹配，由于此时计数为 0 ，没有匹配，那么就匹配“ no ”分支，由于这个条件判断结构中没有“ no ”分支，所以什么都不做，把控制权交给接下来的“ /) ”

如果上面遇到的是情况 a) ，那么此时“ /) ”可以匹配接下来的“ /) ”，匹配成功；如果上面遇到的是情况 b) ，那么此时会进行回溯，直到“ /) ”匹配成功为止，否则报告整个表达式匹配失败。

由于 .NET 中的狭义平衡组“ (?<Close-Open>Expression) ”结构，可以动态的对堆栈中捕获组进行计数，匹配到一个开始标记，入栈，计数加 1 ，匹配到一个结束标记，出栈，计数减 1 ，最后再判断堆栈中是否还有 Open ，有则说明开始和结束标记不配对出现，不匹配，进行回溯或报告匹配失败；如果没有，则说明开始和结束标记配对出现，继续进行后面子表达式的匹配。

需要对“ (?!) ”进行一下说明，它属于顺序否定环视，完整的语法是“ (?!Expression) ”。由于这里的“ Expression ”不存在，表示这里不是一个位置，所以试图尝试匹配总是失败的，作用就是在 Open 不配对出现时，报告匹配失败。

3 平衡组的应用及优化

平衡组提供了嵌套结构的匹配功能，这一创新是很让人兴奋的，因为此前正则对于嵌套结构的匹配是无能为力的。然而功能的强大，自然也带来了实现的复杂，正则书写得不好，可能会存在效率陷阱，甚至导致程序崩溃，这里介绍一些基本的优化方法。

3.1 单字符嵌套结构平衡组优化

单字符的嵌套结构指的是开始和结束标记都单个字符的嵌套结构，这种嵌套相对来说比较简单，优化起来也比较容易。先从上面提到的例子开始。

3.1.1 贪婪与非贪婪模式

上面给的例子是一种做了部分优化的常规写法，算作是版本 1 吧，它做了哪些优化呢，先来看下完全没有做过优化的版本 0 吧。

string test = "a+(b*(c+d))/e+f-(g/(h-i))*j" ;

Regex reg0 = new Regex (@"/( # 普通字符“(”

( # 分组构造，用来限定量词“*” 修饰范围

(?<Open>/() # 命名捕获组，遇到开括弧Open 计数加1

| # 分支结构

(?<-Open>/)) # 狭义平衡组，遇到闭括弧Open 计数减1

| # 分支结构

. # 任意字符

)*? # 以上子串出现0 次或任意多次，非贪婪模式

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace);

MatchCollection mc = reg0.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

(b*(c+d))

(g/(h-i))

接下来对比一下版本1 。

Regex reg1 = new Regex (@"/( # 普通字符“(”

( # 分组构造，用来限定量词“*” 修饰范围

(?<Open>/() # 命名捕获组，遇到开括弧’Open’ 计数加1

| # 分支结构

(?<-Open>/)) # 狭义平衡组，遇到闭括弧’Open’ 计数减1

| # 分支结构

[^()]+ # 非括弧的其它任意字符

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有’Open’ ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace);

看到区别了吗？版本 1 对版本 0 的改进主要有两个地方，一个是用“ [^()]+ ”来代替“ . ”，另一个是用“ * ”来代替“ *? ”，也就是用贪婪模式来代替非贪婪模式。

如果使用了小数点“ . ”，那么为什么不能在分组内使用“ .+ ”，后面又为什么不能用“ * ”呢？只要在上面的正则中使用并运行一下代码就可以知道了，匹配的结果是

(b*(c+d))/e+f-(g/(h-i))

而不是

(b*(c+d))

(g/(h-i))

因为无论是分组内使用“ .+ ”还是后面使用“ * ”，都是贪婪模式，所以小数点会一直匹配下去，直到匹配到字符串的结束符才会停止，然后进行回溯匹配。为了取得正确结果，必须使用非贪婪模式“ *? ”。

这就类似于用“ /(.+/) ”去匹配“ (abc)def(ghi) ”一样，得到的结果是“ (abc)def(ghi) ”，而不是通常我们希望的“ (abc) ”和“ (ghi) ”。这时要用非贪婪模式“ /(.+?/) ”来得到正确的结果。

贪婪模式和非贪婪模式在匹配失败时，回溯的次数基本上是一样的，效率上没有多大区别，但是在匹配成功时，贪婪模式比非贪婪模式回溯的次数要少得多，效率要高得多。

对于“ /(.+/) ”如果既要得到正确的匹配结果，又要提高匹配效率，可以使用排除型捕获组 + 贪婪模式的方式，即“ /([^()]+/) ”。

版本 0 的平衡组也是一样，可以使用排除字符组“ [^()]+ ”和贪婪模式“ * ”结合的方式，提高匹配效率，得到的就是版本 1 的平衡组。

相对于版本 0 ，或许你会认为版本 1 的写法是很自然的，但是如果不了解这样一个演进过程，那么在字符序列嵌套结构平衡组优化时，就不会是那么自然的一件事了。

3.1.2 分支结构

接下来就是分支结构的优化。

语法： (Exp1|Exp2|Exp3)

因为分支结构的匹配规则是，从左向右尝试匹配，当左侧分支匹配成功时，就不再向右尝试。所以使用分支结构时，可以根据以下两条规则进行优化：

1. 尽量抽象出每个分支中的公共的部分，使最后的表达式中，每个分支共公部分尽可能的少，比如 (this|that) 的匹配效率是没有 th(is|at) 高的。

2. 在不影响匹配结果的情况下，把出现概率高的分支放在左侧，出现概率低的分支放右侧。

对于本例中的分支结构，已经没有公共部分，符合第一条规则，再看下第二条规则，开始标记“ ( ”和结束标记“ ) ”出现的概率基本上是一样的，而除“ ( ”和“ ) ”之外的字符出现的概率是比“ ( ”和“ ) ”出现的概率高的，所以应该把“ [^()]+ ”分支放在左侧。

版本 1 由于采用了排除型捕获组，所以这三个分支没有包含关系，左右顺序对结果不会造成影响，可以调整顺序。因为这是已经经过优化的了，而如果是版本 0 ，由“ . ”对“ ( ”和“ ) ”有包含关系，就不能调整顺序了。

在版本 1 基础上对分支结构进行优化后，就得到版本 2 。

string test = "a+(b*(c+d))/e+f-(g/(h-i))*j" ;

Regex reg2 = new Regex (@"/( # 普通字符“(”

( # 分组构造，用来限定量词“*” 修饰范围

[^()]+ # 非括弧的其它任意字符

| # 分支结构

(?<Open>/() # 命名捕获组，遇到开括弧Open 计数加1

| # 分支结构

(?<-Open>/)) # 狭义平衡组，遇到闭括弧Open 计数减1

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace);

MatchCollection mc = reg2.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

(b*(c+d))

(g/(h-i))

3.1.3 捕获组

这里面主要涉及到了两个捕获组“ (?<Open>/() ”和“ (?<-Open>/)) ”，而在平衡组的应用中，我是只关心它是否匹配了，而对于匹配到的内容是不关心的。对于这样一种需求，可以用以下方式实现

/( (?<Open>)

/)(?<-Open>)

“ (?<Open>) ”和“ (?<-Open>) ”这两种方式只是使用了命名捕获组，捕获的是一个位置，它总是能够匹配成功的，而匹配的内容是空的，分配的内存空间是固定的，可以有效的节省资源，这在单字符嵌套结构中并不明显，但是在字符序列嵌套结构中就比较明显了。

由于捕获组是直接跟在开始或结束标记之后的，所以只要开始或结束标记匹配成功，命名捕获组自然就会匹配成功，对于功能是没有任何影响的。

那么把标记和捕获组调整一下顺序是否可以呢？从功能上来讲，是可以的，但是匹配的流程上会有所不同，先是捕获组匹配成功，入栈，然后再匹配标记，成功则继续匹配，不成功则该分支匹配失败，进行回溯，出栈，继续尝试下一分支。这样将增加许多入栈和出栈的操作，对匹配效率是有影响的，所以这种方式并不可取。

在版本 2 基础上对捕获组进行优化后，就得到版本 3 。

string test = "a+(b*(c+d))/e+f-(g/(h-i))*j" ;

Regex reg3 = new Regex (@"/( # 普通字符“(”

( # 分组构造，用来限定量词“*” 修饰范围

[^()]+ # 非括弧的其它任意字符

| # 分支结构

/( (?<Open>) # 命名捕获组，遇到开括弧Open 计数加1

| # 分支结构

/) (?<-Open>) # 狭义平衡组，遇到闭括弧Open 计数减1

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace);

MatchCollection mc = reg3.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

(b*(c+d))

(g/(h-i))

3.1.4 固化分组

看到有些人使用平衡组时用到了固化分组，但并不是所有人都明白固化分组的作用。

语法： (?>Expression)

用“ /([^()]+/) ”去匹配“ (abc) ”是可以匹配成功的，因为不用回溯，相对于“ /(.+?/) ”这种非贪婪模式，效率上有所提升，但是对于匹配失败的情况又如何呢？

源字符串： (abc

正则表达式： /([^()]+/)

匹配中间过程这里不再详述，可以参考 NFA 引擎匹配原理。

当“ [^()]+ ”匹配到结束位置时，控制权交给“ /) ”，匹配失败，进行回溯，而由于前面使用了“ [^()]+ ”这种排除型字符组，所以可供回溯的位置，不会存在可以匹配“ /) ”的情况，这时候的回溯是完全没有意义的，只会浪费时间，但是由于传统 NFA 引擎的特点，必须回溯所有可能之后才会报告匹配失败。

这时可以用固化分组来进行优化，一旦占有字符，就不再释放。也就是一旦占有，就不再记录可供回溯的可能。通常是与排除型字符组或顺序否定环视一起使用的。

优化后的正则表达式： /((?>[^()]+)/)

需要说明的一点，固化分组要作用于量词修饰的子表达式才有意义，对于“ (?>abc) ”由于内容是固定的，根本就不会产生回溯，所以使用固化分组是没有意义的。

对于平衡组的应用也是一样，如果分组构造中没有量词，那么使用固化分组就是没有意义的，比如版本 0

Regex reg = new Regex (@"/((?>(?<Open>/()|(?<-Open>/))|.)*?(?(Open)(?!))/)" );

这种场景下使用固化分组就是没有意义的。

在版本 3 基础上对捕获组进行优化后，就得到版本 4 。

string test = "a+(b*(c+d))/e+f-(g/(h-i))*j" ;

Regex reg4 = new Regex (@"/( # 普通字符“(”

(?> # 分组构造，用来限定量词“*” 修饰范围

[^()]+ # 非括弧的其它任意字符

| # 分支结构

/( (?<Open>) # 命名捕获组，遇到开括弧Open 计数加1

| # 分支结构

/) (?<-Open>) # 狭义平衡组，遇到闭括弧Open 计数减1

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace);

MatchCollection mc = reg4.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

(b*(c+d))

(g/(h-i))

那么对于分组构造外层的“ * ”修饰的子表达式是否可以使用固化分组呢？答案是否定的，因为平衡组通常是要进行回溯才能最终匹配成功的，所以如果使用固化分组，不记录回溯可能的话，将无法得到正确结果。

3.1.5 进一步优化讨论

那么现在是不是已经完成优化了呢？是的，通常可以这么认为。在一般应用当中，这已经是从正则层面上来说，最优方案了。

但是在有些场景下，由于 Compiled 模式可以有效提高分支结构的匹配效率，所以对于源字符串比较复杂的情况，牺牲一些编译时间和内存，还是可以有效提高匹配效率的。

Regex reg5 = new Regex (@"/( # 普通字符“(”

(?> # 分组构造，用来限定量词“*” 修饰范围

[^()]+ # 非括弧的其它任意字符

| # 分支结构

/( (?<Open>) # 命名捕获组，遇到开括弧Open 计数加1

| # 分支结构

/) (?<-Open>) # 狭义平衡组，遇到闭括弧Open 计数减1

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

/) # 普通闭括弧

" , RegexOptions .IgnorePatternWhitespace | RegexOptions. Compiled ) ;

MatchCollection mc = reg5.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n" ;

}

/*-------- 输出--------

(b*(c+d))

(g/(h-i))

并不是所有应用场景都适合使用 Compiled 模式，比如上面这个例子里的源字符串如果是“ a+(b*(c+d))/e+f-(g/(h-i))*j ”，本身是非常简单的，使用 Compiled 模式将是得不偿失的。什么时候使用，要根据具体问题具体分析。

3.2 字符序列嵌套结构平衡组应用

字符序列嵌套结构的匹配，典型的应用就是 html 标签的提取。由于上面详细说明了单字符嵌套结构的优化过程，这里主要讲应用场景，个别涉及到优化的地方再讨论。

字符序列嵌套结构的匹配，举例来说，取 div 标签。源字符串如下：

< div id ="0">

</ div >

< div id ="1">

< div id ="2">

</ div >

3.2.1 提取最外层嵌套结构

提取最外层 div 标签，分析过程及构造方式与单字符嵌套结构差不多，只是捕获组等内容稍稍复杂点，先给出实现，再进行解释。

string test = @"<div id=""0"">

</div>

</div>

</div>" ;

Regex reg = new Regex (@"(?isx) # 匹配模式，忽略大小写，“. ”匹配任意字符

<div[^>]*> # 开始标记“<div...>”

(?> # 分组构造，用来限定量词“*” 修饰范围

<div[^>]*> (?<Open>) # 命名捕获组，遇到开始标记，入栈，Open 计数加1

| # 分支结构

</div> (?<-Open>) # 狭义平衡组，遇到结束标记，出栈，Open 计数减1

| # 分支结构

(?:(?!</?div/b).)* # 右侧不为开始或结束标记的任意字符

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

</div> # 结束标记“</div>”

" );

MatchCollection mc = reg.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n--------------------/n" ;

}

/*-------- 输出--------

</div>

--------------------

</div>

--------------------

在单字符嵌套结构中，使用排除型字符组“ [^()]+ ”，与分组构造外的匹配优先量词“ * ” 达到贪婪模式匹配效果。在字符序列嵌套结构中，要排除的是一个子串，而不是简单的几个无序字符，所以不能使用排除型字符组，此时需要用到顺序否定环视来达到这一目的。“ (?:(?!</?div/b).)* ”表示的是所在位置右侧不是“ <div…> ”或“ </div> ”的字符，这样的字符重复 0 次或任意多次。关于环视的细节，可以参考正则基础之——环视。

而由于这种否定环视包含两种状态，所以在与固化分组结合使用时，会与后面的开始或结束标记形成包含关系，所以与固化分组一起使用时，不能放在左侧，只能放在右侧。

3.2.2 根据 id 提取 div 嵌套标签

根据 id 提取 div 时，改变的只是最外层 div 的结构，对内分组构造内部结构没有影响。但是因为 id 是变化的，所以正则需要动态生成。下面给出实现，源字符串和输出结果由于比较影响篇幅，就不再给出了。

string id = Regex .Escape(textBox1.Text); // 动态获取id

Regex reg = new Regex (@"(?isx)

<div(?:(?!id=).)*id=(['""]?)" + id + @"/1[^>]*> # 开始标记“<div...>”

(?> # 分组构造，用来限定量词“*” 修饰范围

<div[^>]*> (?<Open>) # 命名捕获组，遇到开始标记，入栈，Open 计数加1

| # 分支结构

</div> (?<-Open>) # 狭义平衡组，遇到结束标记，出栈，Open 计数减1

| # 分支结构

(?:(?!</?div/b).)* # 右侧不为开始或结束标记的任意字符

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

</div> # 结束标记“</div>”

" );

MatchCollection mc = reg.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n--------------------/n" ;

}

在动态生成正则表达式时，由于输入的字符串中可能存在正则中有特殊意义的元字符，如果不进行转义的话，正则解析时会抛出异常。所以用 Regex .Escape(string str) 来对动态输入的字符串进行转义处理，确保不会因动态输入的内容而抛异常。比如上面的例子，如果 id 不进行转义处理时，输入“ abc(def ”就会抛“ ) 不足”这样的异常。

3.2.3 根据 id 提取任意嵌套标签

再扩展一下，根据 id 属性取任意嵌套标签。实现如下，具体实现细节和讨论参考就是通过 id 获得一个 html 标签块。以下正则相对于帖子对个别细节做了调整。

string html = @"

<html>

<body>

<tr>

<td>

</td>

</tr>

</table>

</div>

</div>

</body>

</html>" ;

Console .WriteLine(html);

string [] idList = { "div1" , "div2" , "div3" , "div4" , "table1" , "div5" , "abc(def" };

string pattern = @"<([a-z]+)(?:(?!/bid/b)[^<>])*id=([""']?){0}/2[^>]*>(?></1[^>]*>(?<o>)|<//1>(?<-o>)|(?:(?!</?/1).)*)*(?(o)(?!))<//1>" ;

foreach (string id in idList)

{

Match match = Regex .Match(html, string .Format(pattern, Regex .Escape(id)),

RegexOptions .Singleline | RegexOptions .IgnoreCase);

Console .WriteLine("--------begin {0}--------" , id);

if (match.Success)

Console .WriteLine(match.Value);

else

Console .WriteLine("o( ╯ □ ╰ )o" );

Console .WriteLine("--------end {0}--------" , id);

}

Console .ReadLine();

3.2.4 根据标签取外层嵌套结构

根据动态输入的 tag ，取相应的最外层的嵌套标签，实现如下。

string html = @"

<html>

<body>

<tr>

<td>

</td>

</tr>

</table>

</div>

</div>

</body>

</html>" ;

Console .WriteLine(html);

string [] tagList = { "html" , "body" , "div" , "table" , "abc(def" };

string pattern = @"(?isx)

<({0})/b[^>]*> # 开始标记“<tag...>”

(?> # 分组构造，用来限定量词“*” 修饰范围

</1[^>]*> (?<Open>) # 命名捕获组，遇到开始标记，入栈，Open 计数加1

| # 分支结构

<//1> (?<-Open>) # 狭义平衡组，遇到结束标记，出栈，Open 计数减1

| # 分支结构

(?:(?!</?/1/b).)* # 右侧不为开始或结束标记的任意字符

)* # 以上子串出现0 次或任意多次

(?(Open)(?!)) # 判断是否还有'OPEN' ，有则说明不配对，什么都不匹配

<//1> # 结束标记“</tag>”

" ;

foreach (string tag in tagList)

{

Match match = Regex .Match(html, string .Format(pattern, Regex .Escape(tag)));

Console .WriteLine("--------begin {0}--------" , tag);

if (match.Success)

Console .WriteLine(match.Value);

else

Console .WriteLine("o( ╯ □ ╰ )o" );

Console .WriteLine("--------end {0}--------" , tag);

}

Console .ReadLine();

3.2.5 条件判断结构扩展应用

条件判断结构的作用不只限于验证开始和结束标记是否配对，根据需求的不同，还可以有其它一些应用。比如在匹配 div 标签时，只取内部“存在”嵌套的外层标签。

string test = @"<div id=""0"">

</div>

</div>

</div>" ;

Regex reg = new Regex (@"(?isx) # 匹配模式，忽略大小写，“.” 匹配任意字符

<div[^>]*> # 开始标记“<div...>”

(?> # 分组构造，用来限定量词“*” 修饰范围

<div[^>]*> (?<Open>)(?<Mask>) # 遇到开始标记，入栈，Open 和Mask 计数各加1

| # 分支结构

</div> (?<-Open>) # 遇到结束标记，出栈，Open 计数减1

| # 分支结构

(?:(?!</?div/b).)* # 右侧不为开始或结束标记的任意字符

)* # 以上子串出现0 次或任意多次

(?(Open)(?!))(?(Mask)|(?!)) #'OPEN' 保证标记配对，'Mask' 保证内部有嵌套

</div> # 结束标记“</div>”

" );

MatchCollection mc = reg.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n--------------------/n" ;

}

/*-------- 输出--------

</div>

--------------------

命名捕获组“ (?<Mask>) ”只入栈不出栈，如果内部有嵌套，则“ (?<Mask>) ”一定有匹配，此时匹配“ (?(Mask)yes|no) ”中的“ yes ”子表达式，也就是什么都不做；如果内部没有嵌套，则“ (?<Mask>) ”没有匹配，此时匹配“ (?(Mask)yes|no) ”中的“ no ”子表达式，也就是报告匹配失败。这里省略的是“ (?(Mask)yes|no) ”中的“ yes ”子表达式。

对于匹配内部没有嵌套的标签，也就是最内层标签，可以使用上面的正则表达式，将“ (?(Mask)yes|no) ”中的“ yes ”子表达式设为“ (?!) ”，将“ yes ”子表达式省略。不过这样做有些浪费，完全可以用顺序否定环视来实现这一需求。

string test = @"<div id=""0"">

</div>

</div>

</div>" ;

Regex reg = new Regex (@"(?is)<div[^>]*>(?:(?!</?div/b).)*</div>" );

MatchCollection mc = reg.Matches(test);

foreach (Match m in mc)

{

richTextBox2.Text += m.Value + "/n--------------------/n" ;

}

/*-------- 输出--------

</div>

--------------------

</div>

--------------------

4 平衡组应用范围探讨

平衡组可以用来匹配嵌套结构，这是一个很大的创新，但是否就认为平衡组适合用来解决任何嵌套问题呢？事实当然不会是这样。

比如下面这个需求， ( 参考请问一个正则表达式 ) ：

源字符串： 1+Sum(1,Sum(2, Sum(3), 4), 5)*4+5+Sum(9,Sum(8, Sum(7), 6), 5)*6+7

要求输出：

Sum(1,Sum(2, Sum(3), 4), 5)

Sum(2, Sum(3), 4)

Sum(3)

Sum(9,Sum(8, Sum(7), 6), 5)

Sum(8, Sum(7), 6)

Sum(7)

这种需求使用平衡组 + 递归的方式可以实现，实现代码如下：

// 递归方法

private void getNesting(string src, Regex reg, List <string > list)

{

MatchCollection mc = reg.Matches(src);

foreach (Match m in mc)

{

list.Add(m.Value);

src = m.Value.Remove(m.Value.Length-1, 1);

if (reg.IsMatch(src))

{

getNesting(src, reg, list);

}

// 调用

string test = "1+Sum(1,Sum(2, Sum(3), 4), 5)*4+5+Sum(9,Sum(8, Sum(7), 6), 5)*6+7" ;

List <string > list = new List <string >();

Regex reg = new Regex (@"(?i)Sum/((?>[^()]+|/((?<o>)|/)(?<-o>))*(?(o)(?!))/)" , RegexOptions .Compiled);

getNesting(test, reg, list);

foreach (string s in list)

{

richTextBox2.Text += s + "/n" ;

}

平衡组虽然可以实现要求，但除非你对效率没有要求，否则这一类需求通常是不适合用正则来实现的。因为平衡组并不是为这一功能而设计的，在实现过程中做了很多额外的尝试。效率上自然要大打折扣。

类似这样的需求，可以自己写有穷自动机来实现，毕竟正则也只不过是一种有穷自动机的实现而已。

string test = @"1+Sum(1,Sum(2, Sum(3), 4), 5)*4+5+Sum(9,Sum(8, Sum(7), 6), 5)*6+7 " ;

StringBuilder nesting = new StringBuilder (64);

List <StringBuilder > list = new List <StringBuilder >();

List <string > groups = new List <string >();

int level = 0;

int state = 0;

foreach (char c in test)

{

if ((c == 'S' || c == 's' ) && state == 0)

{

state = 1;

nesting.Append(c);

}

else if ((c == 'U' || c == 'u' ) && state == 1)

{

state = 2;

nesting.Append(c);

}

else if ((c == 'M' || c == 'm' ) && state == 2)

{

state = 3;

nesting.Append(c);

}

else if (c == '(' && state == 3)

{

state = 0;

level++;

}

else

{

state = 0;

nesting = new StringBuilder (64);

}

if (c == ')' )

{

if (level > 0)

{

level--;

groups.Add(list[level].ToString() + c);

list.Remove(list[level]);

}

if (level > 0)

{

while (list.Count < level)

{

list.Add(nesting);

}

for (int i = 0; i < level; i++)

{

list[i].Append(c);

}

foreach (string s in groups)

{

Console .WriteLine(s);

}

Console .ReadLine();

5 其它声明

到此为止，平衡组的基本应用场景和性能调优都已讨论完了，本文对于平衡组匹配原理讲得相对比较少，以应用场景分析为主。主要是因为能够使用平衡组来解决问题的人，通常已经对正则的基本语法有了一定程度的理解。而如果事实确实如此，那么对于平衡组的理解，也是水到渠成的了。

以上正则实现中，采用的多是宽松排列模式，主要是为了加注释，使得阅读清晰。而宽松排列模式通常用于教学目的，实际使用过程中，如果不是为了可读性的考虑，可以去掉这些注释和宽松排列模式参数。

上面给出了很多平衡组的应用，这里需要说明的是，我提供的只是一些方法和思路，从来不推荐把正则当作模板来用，虽然有些时候，它确实可以当作模板来用，但我还是希望你能真正的掌握这些语法规则之后，再去应用平衡组。当然，如果你认为能用就行，不需要知道为什么可以这样用，只是把它当作模板来套，我也无话可说。

你可能感兴趣的:(.NET正则基础之——平衡组)

蓝桥杯班级活动 wuqingshun314159 十四届蓝桥杯C/C++B组蓝桥杯蓝桥杯职场和发展算法数据结构 c++
问题描述小明的老师准备组织一次班级活动。班上一共有n名同学（n为偶数），老师想把所有同学进行分组，每两名同学一组。为了公平，老师给每名同学随机分配了一个n以内的正整数作为id，第i名同学的id为a_i。老师希望通过更改若干名同学的id，使得对于任意一名同学i，有且仅有另一名同学j的id与其相同（即a_i=a_j）。请问老师最少需要更改多少名同学的id？输入格式共2行：第1行：一个正整数n（偶数）。
从以太网 II 到 VLAN 和 Jumbo Frame：数据帧格式解读光路科技网络
以太网数据帧是计算机网络通信的基本单位，在不同的应用场景中，它的格式有所不同。根据协议标准和用途，以太网数据帧主要包括以太网II帧、IEEE802.3帧、IEEE802.1QVLAN帧等七种主要类型。为了更好地理解以太网的通信机制，我们来了解这些数据帧的特点和应用。以太网II（EthernetII）帧以太网II帧是目前最广泛使用的帧格式，特别是在TCP/IP网络中占据主导地位。它最显著的特点是包含
第二重·纵横篇：Kubernetes御剑术与云原生护体罡气程序猿chen 【后端修炼·九阳真经】云原生 kubernetes 容器 java 后端 git 程序人生
【楔子】剑阁千仞起惊澜"报——剑冢结界出现裂缝！"青衣弟子踉跄跪倒，手中破损的Docker镜像泛着诡异绿光。龙渊剑主拂袖震碎魔气，石壁上《九阳真经》突然金光大盛："云原生三重天·第二境：万剑归宗御真意，千山暮雪锁魔踪须得Kubernetes御剑术配以RBAC擒龙功，方可破此劫！"剑主双目如电："传令！开启剑冢防御大阵，今日便让尔等见识真正的云原生护体罡气！"霎时间，十万容器如星辰列阵，千道Serv
如何使用K8S快速部署测试环境 Feng.Lee 漫谈测试 kubernetes 容器云原生测试工具可用性测试
目录一、Windows系统使用RancherDesktop二、Linux系统集群使用Ansible一键部署三、Linux系统使用kubeadm快速搭建单节点集群四、Kubernetes(K8S)快速部署测试环境4.1准备K8S集群4.2部署测试应用4.3访问测试服务4.4持久化存储（可选）4.5配置管理（ConfigMap/Secret）4.6.快速清理环境4.7.自动化脚本示例4.8注意事项对于
计算机网络（13）以太网 co0t 计算机网络计算机网络 arm开发
以太网详解以太网（Ethernet）是一种常见的局域网（LAN）技术，广泛用于企业网络、家庭网络以及数据中心。它定义了有线通信的物理层和数据链路层技术标准，提供了高效、可靠的通信机制。1.以太网的起源和发展诞生：以太网最初由罗伯特·梅特卡夫（RobertMetcalfe）于1973年提出，用于连接一组计算机。标准化：1983年，IEEE802.3标准正式将以太网定义为局域网通信协议。发展历程：10
EGA边缘引导注意力：有效保留高频边缘信息，提升分割精度，助力高效涨点一只小小的土拨鼠解构前沿：文献精读 pytorch 人工智能 python YOLO 深度学习
MEGANet:Multi-ScaleEdge-GuidedAttentionNetworkforWeakBoundaryPolypSegmentation论文地址：https://arxiv.org/abs/2309.03329代码地址：https://github.com/UARK-AICV/MEGANet本文提出了一种名为多尺度边缘引导注意力网络（MEGANet）的新方法，用于结肠镜图像中的
信息学奥赛一本通 1262：【例9.6】挖地雷 | 洛谷 P2196 [NOIP1996 提高组] 挖地雷君义_noip 信息学奥赛一本通题解洛谷题解动态规划 c++信息学奥赛算法
【题目链接】ybt1262：【例9.6】挖地雷洛谷P2196[NOIP1996提高组]挖地雷注：以上两题输入格式不同【题目考点】1.图论：拓扑排序，有向无环图动规【解题思路】根据题意，每个地窖是一个顶点，每条路径是一条有向边，每个地窖的地雷数是该顶点的权值（简称点权），这是个有向无环图。该题可抽象为：求有向无环图上，点权加和最大的路径，可以用动态规划的方法来求解。顶点编号从小到大，只存在小编号顶点
洛谷每日1题-------Day31__P1534 不高兴的津津（升级版） __雨夜星辰__ 洛谷每日1题算法 c++数据结构学习笔记
题目描述津津上初中了。妈妈认为津津应该更加用功学习，所以津津除了上学之外，还要参加妈妈为她报名的各科复习班。另外每天妈妈还会送她去学习朗诵、舞蹈和钢琴。但是津津如果一天上课超过八个小时就会不高兴，而且上得越久就会越不高兴。这次与NOIp2004普及组第一题不同的是：假设津津不会因为其它事不高兴，但是她的不高兴会（当然高兴也会）持续到第二天。请你帮忙检查一下津津以后n天的日程安排，看看以后n天她会不
IP-PBX（IP专用交换机） Dream Algorithm tcp/ip 网络协议网络
IP-PBX（InternetProtocolPrivateBranchExchange）是一种基于IP网络的现代企业电话系统，它融合了传统PBX功能和互联网协议技术。IP-PBX核心特点VoIP技术：通过IP网络传输语音数据传统功能保留：保留转接、语音信箱、自动总机等传统PBX功能网络融合：与现有数据网络共享基础设施弹性扩容：比传统PBX更容易扩展分机数量成本优势：建设和维护成本低于传统PBX主
Android系统编译 niepengpeng333 android系统编译 android makefile shell command build include
摘自：http://blog.csdn.net/chen_chun_guang/article/details/6078314Android编译系统分析之返璞归真自Android开源以来，引起了嵌入式行业一股热潮，很多嵌入式开发者表示对Android有很强的兴趣，并下载Android源码进行编译和移植。Android源码的巨大（repo下来，大概2G）给人以Android相当复杂的错觉。本文从An
硬件独立性你一身傲骨怎能输安卓操作系统系统架构
硬件独立性与HAL的作用硬件抽象层（HAL）定义：HAL是Android操作系统中的一个关键组件，它提供了一组标准接口，使得应用程序能够与底层硬件进行交互，而不需要了解硬件的具体实现细节。HAL将硬件功能抽象为统一的接口，简化了应用程序的开发过程。设备兼容性：由于HAL提供了硬件独立性，开发者可以编写一次应用程序代码，然后在不同的Android设备上运行，而无需针对每种设备进行特定的调整。这种兼容
ZMap 项目安装与配置指南萧星盼
ZMap项目安装与配置指南zmapZMapisafastsinglepacketnetworkscannerdesignedforInternet-widenetworksurveys.项目地址:https://gitcode.com/gh_mirrors/zm/zmap1.项目基础介绍和主要编程语言ZMap是一个快速、无状态的单数据包网络扫描工具，专门设计用于互联网范围内的网络调查。它能够在单个
ZMap：互联网范围的快速扫描工具韩蔓媛Rhett
ZMap：互联网范围的快速扫描工具zmapZMapisafastsinglepacketnetworkscannerdesignedforInternet-widenetworksurveys.项目地址:https://gitcode.com/gh_mirrors/zm/zmap项目基础介绍及编程语言ZMap是一个设计用于进行大规模互联网范围网络调查的高性能无状态单包网络扫描器。它由C语言编写，并
深入探讨Dotnet洋葱架构实践 ExogFix 架构
软件开发领域中的架构设计是一项至关重要的任务，它直接影响到应用程序的可扩展性、可维护性和可测试性。Dotnet洋葱架构是一种常用的架构模式，它提供了一种组织和管理应用程序代码的方法。本文将详细介绍Dotnet洋葱架构的实践，并提供相应的源代码示例。Dotnet洋葱架构是基于依赖反转原则（DependencyInversionPrinciple）和依赖注入（DependencyInjection）的
如何直观理解交叉熵及其优势？ Zebul博
以下对数符号有误，见原文链接：https://blog.csdn.net/cherrylvlei/article/details/53038603导语在统计学中，损失函数是一种衡量系统错误程度的函数。而在有监督学习模型里，损失函数则是衡量模型对样本预测值与样本真实标签之间差异程度的方法。最近用到了交叉熵，觉得有必要弄明白交叉熵到底是什么原理及优势，因此查了查资料，并结合个人理解在这里做一下讲解，如
【2.2】SPI gouxf_0219 stm32学习单片机
CPOL极性，表示当SCLK空闲idle的时候，其电平的值是低电平0还是高电平1CPHA相位，表示数据采样是在第几个边沿（edge），CPHA=0是第一个边沿，CPHA=1是第二个边沿SPI接线：CS接单片机PB0，SCK-PA5，MISO-PA6，MOSI-PA7。使用的是单片机的SPI1接口先新建一个spi.c和spi.h文件，并加入工程组中spi.h文件#ifndef_SPI_H#defin
ElementUI的＜el-image＞组件引用网络图片加载失败又迷茫了框架使用 elementui 前端 javascript
1.验证图片URL是否有效直接访问图片链接，确保URL正确且可公开访问如果浏览器无法加载图片，可能是图片服务器限制了外链或已失效。解决方法：更换为可用的图片URL。2.检查浏览器开发者工具打开浏览器开发者工具（F12），查看以下信息：Network标签：检查图片请求的状态码。状态码403：服务器拒绝访问（常见于防盗链）。状态码404：图片路径错误。Console标签：查看是否有跨域错误（如CORS
ElementUI的＜el-image＞组件引用网络图片加载失败-解决办法又迷茫了框架使用大数据 vue
1.验证图片URL是否有效直接访问图片链接，确保URL正确且可公开访问如果浏览器无法加载图片，可能是图片服务器限制了外链或已失效。解决方法：更换为可用的图片URL。2.检查浏览器开发者工具打开浏览器开发者工具（F12），查看以下信息：Network标签：检查图片请求的状态码。状态码403：服务器拒绝访问（常见于防盗链）。状态码404：图片路径错误。Console标签：查看是否有跨域错误（如CORS
kubernetes》》k8s》》 kubeadm、kubectl、kubelet Ares-Wang k8s
kubeadm、kubectl、kubeletkubeadm、kubectl和kubelet是Kubernetes中不可或缺的三个组件。kubeadm负责集群的快速构建和初始化，为后续的容器部署和管理提供基础；kubectl作为命令行工具，提供了与Kubernetes集群交互的便捷方式；而kubelet则作为节点上的运行时，负责启动和管理容器。三者共同协作，使得Kubernetes集群的部署、管理
动态规划——编辑距离皮蛋瘦肉没有肉经典算法动态规划算法
参考博客：https://blog.csdn.net/ghsau/article/details/78903076题目编辑距离又称Leveinshtein距离，是由俄罗斯科学家VladimirLevenshtein在1965年提出。编辑距离是计算两个文本相似度的算法之一，以字符串为例，字符串a和字符串b的编辑距离是将a转换成b的最小操作次数，这里的操作包括三种：插入一个字符删除一个字符替换一个字符
FPGA学习记录第一天 Hanying_5 fpga开发 vscode
为了锐捷网络杯B组赛题，进行FPGA的学习，并最终完成基于FPGA的温控风扇的实现。第一天首先是vscode中verilog开发环境的搭建：环境配置下载：https://pan.baidu.com/s/14GYb4Cm1revUFfAR3OHdPw提取码：3ler搭建开发环境参考b站教程（BV1S541147GB）然后进行FPGA开发的学习参考b站野火_firege的教程（BV17z411i7er
Unity ECS架构深度解析：从传统OOP到数据驱动的范式革命晴空了无痕 ECS unity 架构
一、ECS架构的本质解构在Unity引擎的发展历程中，ECS（Entity-Component-System）架构的引入标志着游戏开发范式的重要转折。这种数据导向的设计模式突破了传统OOP的局限性，其核心架构由三个关键要素构成：Entity（实体）：作为纯粹的标识符存在，通过GUID实现全局唯一性。不同于GameObject，Entity不包含任何行为逻辑，其本质是组件容器。Component（组
C# 语言特性深度解析：从设计哲学到现代编程实践晴空了无痕 C#语言底层 c#开发语言
引言C#自2000年诞生以来，始终以“简洁、安全、高性能”为核心设计目标。作为一门多范式编程语言，它在面向对象、函数式编程、元编程和跨平台领域不断演进。本文将从语言设计哲学、核心特性和现代编程实践三个维度，深入探讨C#如何通过独特的语言特性解决工程难题，并推动开发者构建健壮的软件系统。一、C#的设计哲学：平衡与演进C#的成功源于其对开发者体验和运行时效率的平衡。其设计哲学可概括为：渐进式增强：向后
普通人如何用 AI 工具开启副业之路？ SuperMale-zxq AI写作 AI作画 AI编程人工智能人工智能
(注意工具只是借鉴，eg现如今写作推理模型最好1DeepSeekR1,2DeepClaude3got4o4Claude3.5Sonnet)普通人如何用AI工具开启副业之路？哈喽大家好！我是你们的AI知识博主，一个全网少数能把重点、Why（为什么）、How（怎么做）讲清楚的少数派！今天我们聊聊一个所有普通人都能用得上的主题：如何利用AI工具开启自己的副业之路，轻松赚到第一桶金？这篇文章非常适合：想要
鸿蒙Next-一次开发多端部署-基于栅格布局Grid 试水年华 harmonyos 华为鸿蒙 Ark-TS语言
栅格组件的本质是：将组件划分为有规律的多列，通过调整【不同断点】下的【栅格组件的列数】，及【子组件所占列数】实现不同布局核心用法：//行GridRow(属性){//列GridCol(属性){}}使同一组件在不同的宽度下，例如手机，平板，电脑占不同的份数（可以理解为不同的像素点），使其布局排版更加合理和美观完整示例代码如下：@Entry@ComponentstructDemo12{@Statecur
基于Python气溶胶数据处理与反演分析泛微华南大区业务运营中心 python 开发语言
在当前全球气候变化和环境污染问题日益突出的背景下，气溶胶研究显得尤为重要。气溶胶在大气中由直径范围在0.01微米至10微米固体和液体颗粒构成，直接或间接影响地球辐射平衡、气候变化和空气质量。尤其在“碳中和”目标的驱动下，研究气溶胶对“碳中和”的气候影响及其环境效应，不仅对科学研究具有重大意义，同时也为政策制定提供了重要依据。Python作为一种强大且易于学习的编程语言，已广泛应用于数据科学和大气科
《动手学深度学习》之卷积神经网络 QxwOnly 人工智能深度学习神经网络深度学习
文章目录从全连接层到卷积不变性限制多层感知机平移不变性局部性卷积通道图像卷积互相关运算特征映射和感受野填充和步幅填充步幅多输入多输出通道多输入通道1×11\times11×1卷积层汇聚层最大汇聚层和平均汇聚层卷积神经网络（LeNet）LeNet总结从全连接层到卷积卷积神经网络（convolutionalneuralnetworks，CNN）是机器学习利用自然图像中一些已知结构的创造性方法。不变性计
深度解析：为什么大厂更青睐 Go 语言？从微软 TypeScript 转译器重构说起 tekin Go 语言攻坚营 golang microsoft typescript
深度解析：为什么大厂更青睐Go语言？从微软TypeScript转译器重构说起文章目录深度解析：为什么大厂更青睐Go语言？从微软TypeScript转译器重构说起一、现象背后的技术革命二、Go语言的核心优势1.底层性能与开发效率的完美平衡2.范式适配的天然契合三、微软的战略考量1."吃狗粮"传统的局限性2.开发者生态的信任危机四、行业趋势与语言选择逻辑1.云原生时代的技术标准2.编程语言的价值维度五
android kernel-6.6编译ko驱动逐梦云间 c语言 android
https://download.csdn.net/download/weixin_47982517/90546147
JAVA(SpringBoot)集成Netty实现(TCP、Websocket)服务端与客户端。 cccl. Java java spring boot 开发语言
SpringBoot集成Netty。一、Netty简介二、Netty功能1.网络通信支持2.高性能与低资源消耗3.易于使用和定制4.内存管理5.安全性三、POM依赖四、TCP1、服务端1.1创建一个Netty服务端类，NettyTcpServer1.2创建一个NettyTcpServerHandler继承自ChannelInboundHandlerAdapter，主要负责处理NettyTCP服务端
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>