weixin_30411239

浅析正则表达式—（原理篇）

前言：

　　其实这篇文章很久之前就应该发出来，由于种种原因没有发出来，如果这篇文章中有错误，还请大家指出，小弟并改正之，没有学不会的东西，只有不想学的东西，只要功夫深，铁杵磨成针，我的至理名言：吾生也有涯而知也无涯，以有涯随无涯，殆矣。我们只要坚持将其看完，相信大家的正则表达式会有一个提升空间！本文属于.NET正则表达式里面的内容，由于不同语言正则表达式有所不同。

首先先讲解下正则表达式的基础知识：

　　1.字符串的组成

　　对于字符串”123“而言，包括三个字符四个位置。如下图所示：

　　2.占有字符和零宽度

　　正则表达式匹配过程中，如果子表达式匹配到东西，而并非是一个位置，并最终保存到匹配的结果当中。这样的就称为占有字符，而只匹配一个位置，或者是匹配的内容并不保存到匹配结果中，这种就称作零宽度，后续会讲到的零宽度断言等。占有字符是互斥的，零宽度是非互斥的。也就是一个字符，同一时间只能由一个子表达式匹配，而一个位置，却可以同时由多个零宽度的子表达式匹配。

　　3.控制权和传动

　　正则表达式由左到右依次进行匹配，通常情况下是由一个表达式取得控制权，从字符串的的某个位置进行匹配，一个子表达式开始尝试匹配的位置，是从前一子表达匹配成功的结束位置开始的（例如：（表达式一）（表达式二）意思就是表达式一匹配完成后才能匹配表达式二，而匹配表达式二的位置是从表达式一的位置匹配结束后的位置开始）。如果表达式一是零宽度，那表达式一匹配完成后，表达式二匹配的位置还是原来表达式以匹配的位置。也就是说它匹配开始和结束的位置是同一个。

　　举一个简单的例子进行说明：正则表达式：123

　　源数据：123

　　讲解：首先正则表达式是从最左侧开始进行匹配，也就是位置0处进行匹配，首先得到控制权的是正则表达式中的“1”，而不是源数据中的“1”，匹配源数据中的“1”，匹配成功，将源数据的“1”进行保存到匹配的结果当中，这就表明它占有了一个字符，接下来就将控制权传给正则表达式中的“2”，匹配的位置变成了位置1，匹配源数据中的“2”，匹配成功，将控制权又传动给了正则表达式的“3”，这时候匹配的位置变成了位置2，这时候就会将源数据中的“3”进行匹配。又有正则表达式“3”进行传动控制权，发现已经到了正则表达式的末尾，正则表达式结束。

一、元字符

限定符	描述	模式
.	匹配出换行符以外的任意字符	\d*\.\d
\w	匹配字母数字或下划线或者汉字或者下划线	"be+"
\s	匹配任意空白符	"rai?n"
\d	匹配数字	",\d{3}"
\b	匹配单词开始或结束，它只是匹配一个位置	"\d{2,}"
^	匹配字符串开始	"\d{3,5}"
$	匹配字符串结束	"\d{3,5}"

二、转义字符

如果你想要得到元字符本身的话需要使用“\”来取消这些元字符的特殊意义

三、字符类

　　首先字符类使用“[]”包起来的，例如以下这个例子：(大小写要区分)

　　①[aeiou]则表示匹配任意一个英文元音字母(这个仅仅是匹配一个，也就是说你如果匹配了a这个整个正则表达式就已经结束了，这里面的逻辑表示的是“或”的意思)，再看这个例子[.!?]表示匹配.或者?或者！

　　②[a-zA-Z0-9]这个正则表达式表示的是匹配a到z的任意一个小写字母，或者是A到Z的任意一个字母，或者是数字0到9任意一个.

四．重复（MSDN上称作是限定符）

代码/语法	说明
*	重复0次或多次
+	重复一次或多次
?	重复零次或1次
{n}	重复n次
{n,}	重复至少n次
{n,m}	重复至少n次，但不多于m次

五．分支条件

　　其实正则表达式中的分支条件，就指的是有几种规则：用“|”把不同的规则分开

　　来看下例子：

　　①0\d{2}-\d{8}|0\d{3}-\d{7}:匹配两种以连字号分隔的电话号码；一种是三位区号8位本地号（例如：010-12345678），另外一种规则则是4位区号7位本地号（例　　　如：0315-8834524）

　　②\d{5}-\d{4}|\d{5}:需要注意的是使用分支条件是一定要注意分支条件的顺序，如果改成\d{5}|\d{5}-\d{4}这个样子的话，那么只会匹配五位数字而不会匹配后面的四位数字（例如：我们利用第二个匹配12345-1234，它只会匹配12345，原因是：正则表达式是从左到右依次匹配，如果满足了某个分支的话它就不会再管其他分支了）

六．分组

　　你可以使用小括号（）来指定字表达式

　　①(\d{1,3}){3}\d{3}:这个正则表达式的意思就是把我们分组的小括号里面的东西重复三次，也就是说我们至少匹配3个最多匹配9个数字，后面再加上三个数字

　　我们可以看图，最后一个是1234567891 123也就是说前面是十个数字按照我们的常理来分析的话就应该匹配应该最多的是9个所以匹配之后的数到2就匹配成功了。

　　OK我们讲到分组不知道你们对上面这幅图有没有什么想法？对，没错就是为啥还有0,1之分呢？想知道答案跟我继续看下去，保证你有意外收获哦！

　　也许大家会问为什么这里的写的1里面匹配的是这些数字，我们稍后我们会为你解析这是为什么会是这些数字！

七．反义字符

代码/语法	说明
\W	匹配任意一个不是字母或数字下划线或汉字的字符
\S	匹配任意一个不是空白符的字符
\D	匹配不是数字的字符
\B	匹配不是单词开头或者结尾的位置
[^X]	匹配除了X以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

八．反向引用

　　使用小括号指定一个子表达式后，匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下，每个分组会自动拥有一个组号，规则是：从左向右，以分组的左括号为标志，第一个出现的分组的组号为1，第二个为2，以此类推。但是其实分组号不是这么简单：

　　•分组0对应整个正则表达式

　　•实际上组号分配过程是要从左向右扫描两遍的：第一遍只给未命名组分配，第二遍只给命名组分配－－因此所有命名组的组号都大于未命名的组号

　　•你可以使用(?:exp)这样的语法来剥夺一个分组对组号分配的参与权．

　　通过上面三条讲述我们可以清楚地知道分组的方式是怎样的，其实意思就是首先我们先对没有为组进行命名的组进行分配组号（从左到右依次次分配），然后再对分配组号的组进行分配组号（使用(?<组名>)方式显示分配组名称），如果你想剥夺某一个组的组号可以采用(?:exp)这种方式进行剥夺，也就是不给他分配组号，可以理解为跳过此组。看一下例子：

　　正则表达式：(?3)(1)(2)(?565)

　　匹配文本：312565

　　匹配结果表明首先0号组的是匹配的整个表达式，匹配1号组名的则是1，匹配2号组的是2，匹配3号组的就是命名为work组名的3，匹配4号组的则是匹配命名为SmallDing组名的565，显然可以看到分配组号就是按照以上的规则来分配。

说到了反向引用我们来看一下反向引用是什么概念，我们前面已经详细讲解了组号的分配，那么反向引用则用于重复搜索前面某个分组匹配的文本，例如\1代表分组1匹配的文本

请看下面的例子：

　　正则表达式：(1)(2)(3)\2则表示匹配123且在此匹配组号为2的内容也就是再次匹配2

　　匹配文本:1232

　　匹配结果如下图所示：

　　而至于想知道怎样取消分组号那就跟着我的脚步走，来看看下面的内容吧！

　　正则表达式：(?333)(?222)(?:\d{3})该正则表达式代表的是显示为匹配333的组分配组名为work，显示为匹配222结果的组分配组名为222，但是如果匹配3位数字这个组已经取消了组号，所以该组号是没有的，也就是整个正则表达式是第一个组号为0，首先将所有未命名的组进行分配组号，而只有一个(?:\d{3})这个没有分配组名，但是它却将组号进行取消了，所以组号不会给它分配。

　　源文本为：333222123

　　匹配结果为：如下图所示:

那现在我们就来讲一下零宽断言和负零宽断言

常见的几种分组方法

分类	代表/语法	说明
捕获	（exp）	匹配exp，并捕获文本到自动命名的组里
	(?exp)	匹配exp，并捕获文本到名称为name的组里，也可以写成(?’name’exp)
	(?:exp)	匹配exp，不捕获匹配文本，也不给分组分配组号
断言	(?=exp)	匹配exp前面位置，但是不匹配exp
	(?	匹配exp后面位置，但是不匹配exp
	(?!exp)	匹配后面的不是exp的位置，但是不匹配exp
	(?	匹配前面不是exp的位置，但是不匹配exp
注释	(?#comment)	注释

　　零宽度断言

　　1.(?=exp):也叫零宽度正预测先行断言，它匹配自身出现的位置后面能匹配表达式exp

　　例如：\b\w+(?=ing\b)则这个正则表达式就是匹配一ing结尾的单词，但是不包含ing，这个零宽度正预测先行断言可以这样理解，我们就以上面的正则表达式作为例来进行讲解，首先我们肯定是匹配源文本为doing它会先匹配d的时候它会瞻仰一下后面跟的是不是ing，如果不是就会继续往下走，匹配到第二个字符o它会预测（或瞻仰）下后面是不是ing如果是整个表达式就结束了，并且不匹配ing。而这个可以总结一句话就是匹配exp前面的东西

　　2.(?<=exp):也叫零宽度正回顾断言，它匹配自身出现位置的前面匹配表达式exp，这句话听着很绕口，其实零宽度正回顾断言中解释说是自身出现位置这个自身出现位置是表示它匹配的文本，就比如说(?<=Ding)\d{3}这个正则表达式，这里的自身出现的位置仅仅是从开始匹配文本的时候也就是\d{3}也就是主动权在这个\d{3}的时候才是自身匹配的位置。举例说明源文本，比如匹配Din123，按照我们的常理理解的是数字123是自身匹配的位置，但是前面不是Ding所以匹配不成功，我们可以讲这个表达式理解为就是以exp为开始的正则表达式但是不包含exp，意思就是匹配exp后面的东西。

　　负向零宽断言：（可以和上面的进行对比来学哦！这个表达式的是否定的）

　　1.(?!exp):也叫零宽度负预测先行断言，断言此位置的后面跟的不能匹配表达式exp，

　　例如：\d{3}(?!123):正则表达式的含义表达了前面匹配的是三个数字，匹配的位置就是当前匹配的这三个数字后面跟的不能是123。

　　2.(?

　　九．平衡组

　　接下来我来讲一下平衡租的原理，在上面我们做下了铺垫，也就是说我们在第六节的时候提出来了一系列问题，是不是感觉一头雾水，没关系的，到了这一节终于守得云开见月明了，听过本章节的学习我相信你们会对上面的问题进行一个详细合理的回答！OK，Come On Baby！懂你们迫不及待心情，一定会说你咋这多废话呢，好，闲话少说，继续....

说到平衡组有些人就会想到分组，没错他们之间是有联系的，也就是我们前面所讲的分配组号的问题，那下面呢我们先引出语法，详细见下表

语法	说明
(?’group’)	把捕获的内容命名为group，并压入堆栈
(?’-group’)	从堆栈上弹出最后压入堆栈名为group的捕获内容，如果堆栈为空则本组匹配失败
(?(group)yes\|no)	如果堆栈上存在名为group的捕获内容的话，继续匹配yes部分的表达式，否则匹配no的表达式
(?!)	零宽度负先行断言，由于没有后缀表达式，试图匹配总是失败

　　也许大家看到这些语法都不知道是什么概念，也不知道这个平衡组到底用在什么地方合适，接下来我们我们就来说一个场景分析它用在什么位置比较合适，有时我们需要匹配像( 100 * ( 50 + 15 ) )这样的可嵌套的层次性结构，这时简单地使用$.+$则只会匹配到最左边的左括号和最右边的右括号之间的内容(这里我们讨论的是贪婪模式，懒惰模式也有下面的问题)。假如原来的字符串里的左括号和右括号出现的次数不相等，比如( 5 / ( 3 + 2 ) ) )，那我们的匹配结果里两者的个数也不会相等。有没有办法在这样的字符串里匹配到最长的，配对的括号之间的内容呢？为了避免(和\(把你的大脑彻底搞糊涂，我们还是用尖括号代替圆括号吧。现在我们的问题变成了如何把xx aa> yy这样的字符串里，最长的配对的尖括号内的内容捕获出来？

　　接下来我们对这些语法进行分析，怎么样一个平衡法，大家都见过第一个语法，语法的内容讲解的就是为一个组分配组名，这里我们为什么还强调一下分配组名的问题么？前面不是提到过这些问题了么！那现在让我们解析一下平衡法以及用这些语法去构建一个平衡。

　　我们先以一个例子开始，正则表达式：(?'Group'123)(?'Group'456)看这个正则表达式，你会发现一些问题，恩？怎么给两个组分配了一个组名，这样返回的Group组名获取的到底是个什么东东呢？大家来猜一下（匹配文本：123456）会是个什么结果？

先看一下测试结果：

我们可以看到0组当人不让的是整个表达式的，而Group组里面获取的是456，而不是123，这是为什么呢？那么我们就来分析一下他的原理，一张图搞懂原理

　　OK，我们来讲一下组其实内部是一个堆栈，也就是我们分别往组名为Group的堆栈中放入了两个内容，第一个压入栈的是123，而第二压入栈的是456，Group组获取的文本是堆栈的top，也就是栈顶的数据，所以Group获取的数据是456，而不是123，那么有些人说了我不想要456，我就想要123怎么实现？这样也好办啊！我们就弹出栈顶数据不就行了么！

　　看下面的实例：(?'Group'123)(?'Group'456)(?’-Group’)这里的表达式(?’-Group’)就是压出堆栈栈顶的数据也就是如下图所示的：

　　那么现在栈顶的数据就是123了，那么我们就来看一下匹配的结果是不是我们想的这样：

　　那么我们就可以想到分组名的是这样没有分组名的组也是这样的匹配原理那么我们回到第六章就可以将答案找出来，为什么这个组里的数据会是这个了！剩下还有(?(group)yes|no)深入讲解下这个表达式是什么意思，我们前面已经讲到了分组是一个堆栈，可以压入和弹出，但是再弹出的时候我们不知道它有没有弹完用什么办法来可以检测它是不是已经到了栈底了呢？那么用这个正则表达式就可以检测到！它说的意思就是如果我们已经将数据全部都弹出去了就会执行一个表达式在No的位置，“|”表示分割两种不同情况，如果还存咱数据就说明还没有到栈底，就会执行yes的表达式。那么我们就开始举例说明：正则表达式：(?’group’123)(?’group’456)(?’-group’)(?(group)1|2):这个表达式含义就是如果堆栈中还有数据就匹配1，否则就匹配2，看下面测试结果表明堆栈中还有数据。

十、贪婪与非贪婪

　　首先先说一下关于贪婪匹配和非贪婪匹配的一些基本概念，贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为，贪婪模式在整个表达式匹配成功的前提下，尽可能多的匹配，而非贪婪模式在整个表达式匹配成功的前提下，尽可能少的匹配。

　　下面是一些限定符（限定符指定在输入字符串中必须存在上一个元素（可以是字符、组或字符类）的多少个实例才能出现匹配项）

　　贪婪匹配的限定符如下表所示：

限定符	描述	模式	匹配
*	匹配上一个元素零次或多次	\d*\.\d	".0","19.9"和"219.9"
+	匹配上一个元素一次或多次	"be+"	"been"和"bee","bent"和"be"
？	匹配前面的元素零次或一次	"rai?n"	"ran"和"rain"
{n}	匹配上一个元素恰好n次	",\d{3}"	"1.043.6"中的.043
{n,}	匹配上一个元素至少n次	"\d{2,}"	"166"，"29"和"1930"
{n,m}	匹配上一个元素至少n次，但不多于m次	"\d{3,5}"	"166","16546","132654"中的13265

　　非贪婪是在贪婪限定符后面多加一个“？”，如下表所示：

限定符	描述	模式	匹配
*？	匹配上一个元素零次或多次，但次数尽可能少	\d*?\.\d	".0","19.9"和"219.9"
+？	匹配上一个元素一次或多次，但次数尽可能少	"be+?"	"been中的"be",bent"中的"be"
？？	匹配上一个元素零次或一次，但次数尽可能少	"rai??n"	"ran"和"rain"
{n}？	匹配前导元素恰好 n 次	",\d{3}?"	"1.043.6"中的.043
{n,}？	匹配上一个元素至少 n 次，但次数尽可能少	"\d{2,}?"	"166"，"29"和"1930"
{n,m}？	匹配上一个元素的次数介于 n 和 m 之间，但次数尽可能少	"\d{3,5}?"	"166","16546","132654"中的"132","654"

十一、贪婪匹配和非贪婪匹配原理

　　这是最后一章节，也是最难理解的一章节了，希望大家跟进脚步学习下！其实这节贪婪匹配与懒惰匹配应该放在重复后面讲，因为这个和重复有关系，那么下面详细介绍什么是贪婪匹配什么是非贪婪匹配，贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为，贪婪模式在整个表达式匹配成功的前提下，尽可能多的匹配，而非贪婪模式在整个表达式匹配成功的前提下，尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。

　　从原理角度分析一下贪婪匹配与懒惰匹配，接下来我们将以一个例子分析

　　匹配两个正则表达式，正则表达式一为：.*

　　正则表达式二是：.*?

　　源文本是：“Regex”

　　（1）.贪婪

　　注：为了能够看清晰匹配过程，上面的空隙留得较大，实际源字符串为“"Regex"”，下同。

　　来看一下匹配过程。首先将控制权交给“"”，由它来匹配第一个字符"匹配成功，将控制权转交给“.*”,这时候控制权掌握在了“.*”的手上，由于“*”是优先词量，在可匹配与不可匹配的情况下，优先尝试匹配，他就会尝试匹配第一字符R，匹配成功就会继续往下匹配，匹配第二字符e，匹配成功，继续向右匹配，直到匹配到结尾的“"”，匹配成功，再向后匹配时发现已经到结尾了，“.*”结束匹配将控制权转交给""","""发现已经到了源字符串的结尾，看有没有可供回溯的状态，将控制权给了“.*”，“.*”还回一个字符“x”，然后将控制权转交给“"”，来匹配后面的字符“"”，匹配成功正则表达式结束。这句表达式只进行了一次回溯。

　　（2）.懒惰

　　源字符串："Regex"

　　正则表达式：".*?"

　　看一下非贪婪模式的匹配过程。首先由第一个“"”取得控制权，匹配位置0位的“"”，匹配成功，控制权交给“.*?”。“.*?”取得控制权后，由于“*?”是忽略优先量词，在可匹配可不匹配的情况下，优先尝试不匹配，由于“*”等价于“{0,}”，所以在忽略优先的情况下，可以不匹配任何内容。从位置1处尝试忽略匹配，也就是不匹配任何内容，将控制权交给正则表达式最后的“””。

　　“"”取得控制权后，从位置1处尝试匹配，由“"”匹配位置1处的“R”，匹配失败，向前查找可供回溯的状态，控制权交给“.*?”，由“.*?”吃进一个字符，匹配位置1处的“R”，再把控制权交给正则表达式最后的“"”。

　　“"”取得控制权后，从位置2处尝试匹配，由“"”匹配位置1处的“e”，匹配失败，向前查找可供回溯的状态，重复以上过程，直到由“.*?”匹配到“x”为止，再把控制权交给正则表达式最后的“"”。

　　“"”取得控制权后，从位置6处尝试匹配，由“"”匹配字符串最后的“"”，匹配成功。

　　此时整个正则表达式匹配成功，其中“.*?”匹配的内容为“Regex”，匹配过程中进行了五次回溯。

　　写的很认真但是难免会有错误，希望大家多多包涵，多多指出，时刻保持学习的身段，正所谓三人行必有我师焉。人外有人天外有天，只有保持不断学习的精神，才能达到我们的目标。我会将其更新并且改正。

　　这篇文章为了方便大家传阅将其写成word文档，可以进行下载，下载地址如下：

　　百度网盘：http://pan.baidu.com/s/1kTKB3Zx 提取密码：l6q4

　　其中有我在公司的技术分享视频，由于是第一次录制可能有些细节没有讲得很清楚。也在上面百度网盘中。

　　参考文章：

　　图片是从下面文章中找到的：

　 http://www.jb51.net/article/31491.htm

　　http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html#mission

　　测试工具也在里面：

　　http://deerchao.net/tutorials/regex/common.htm

　　谢谢各位的提的意见，从你们的意见中将这篇文章尽自己最大努力完善，这篇文章写得不完美，需要大家的努力。

　接下篇对令宽度进行详细讲解：

　浅析正则表达式——柳暗花明又一村篇

　如果有了基础之后可以进行下面的文章的学习：

　　浅析正则表达式-应用篇

　转载请注明出处，版权归本人所属！

转载于:https://www.cnblogs.com/dwlsxj/p/Regex.html

你可能感兴趣的:(浅析正则表达式—（原理篇）)

内存保护学习（一）：tc27x的内存保护MPU设置浅析（个人理解）剑从东方起链接文件及功能安全开发语言 c语言
目录一、背景二、Tc27x相关寄存器1、注意点2、注意几个强相关寄存器1）、数据保护范围寄存器2）、代码保护范围寄存器3）、保护集启用寄存器命名约定4）、PSW（每个核都有一个）5）、SYSCON三、使用方法1、内存方面2、在ECUM里面初始化MPU3、OS回调CBK检查4、机理5、补充点一、背景根据低ASIL等级开发的软件组件可能会错误地访问具有较高ASIL等级的软件组件的内存区域，从而产生干扰
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
Regular Expression 正则表达式 Aimyon_36 Data Development 正则表达式 redis 数据库
RegularExpression前言1.基本匹配2.元字符2.1点运算符.2.2字符集2.2.1否定字符集2.3重复次数2.3.1*号2.3.2+号2.3.3?号2.4{}号2.5(...)特征标群2.6|或运算符2.7转码特殊字符2.8锚点2.8.1^号2.8.2$号3.简写字符集4.零宽度断言（前后预查）4.1?=...正先行断言4.2?!...负先行断言4.3?Thefatcatsaton
Nginx从入门到实践(三) 听你讲故事啊
动静分离动静分离是将网站静态资源（JavaScript，CSS，img等文件）与后台应用分开部署，提高用户访问静态代码的速度，降低对后台应用访问。动静分离的一种做法是将静态资源部署在nginx上，后台项目部署到应用服务器上，根据一定规则静态资源的请求全部请求nginx服务器，达到动静分离的目标。rewrite规则Rewrite规则常见正则表达式Rewrite主要的功能就是实现URL的重写，Ngin
Scanpy源码浅析之pp.normalize_total 何物昂
版本导入Scanpy,其版本为'1.9.1'，如果你看到的源码和下文有差异，其可能是由于版本差异。importscanpyasscsc.__version__#'1.9.1'例子函数pp.normalize_total用于Normalizecountspercell，其源代码在scanpy/preprocessing/_normalization.py我们通过一个简单例子来了解该函数主要功能:将一
爬虫技术抓取网站数据 Bearjumpingcandy 爬虫
爬虫技术是一种自动化获取网站数据的技术，它可以模拟人类浏览器的行为，访问网页并提取所需的信息。以下是爬虫技术抓取网站数据的一般步骤：发起HTTP请求：爬虫首先会发送HTTP请求到目标网站，获取网页的内容。解析HTML：获取到网页内容后，爬虫会使用HTML解析器解析HTML代码，提取出需要的数据。数据提取：通过使用XPath、CSS选择器或正则表达式等工具，爬虫可以从HTML中提取出所需的数据，如文
互联网 Java 工程师面试题（Java 面试题四）苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
下面列出这份Java面试问题列表包含的主题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java集合框架数组字符串GOF设计模式SOLID抽象类与接口Java基础，如equals和hashcode泛型与枚举JavaIO与NIO常用网络协议Java中的数据结构和算法正则表达式JVM底层Java最佳实JDBCDate,Time与CalendarJava处理XMLJUnit编程现在是时候给
【无标题】正则表达式笔记 qis_qis 正则表达式笔记
作用查找特殊规则的字符串编写一个正则表达式，用来查找所有以0开头，后面跟着2-3个数字，然后是一个连字号“-”，最后是7或8位数字的字符串(像010-12345678或0376-7654321)。0\d{2,3}-\d{7,8}基本匹配区分大小写cat会匹配"cat"CAt会匹配"CAt"元字符元字符是正则表达式的基本组成元素。元字符在这里跟它通常表达的意思不一样，而是以某种特殊的含义去解释。有些
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
Linux三剑客之grep命令详解 promise524 Linux linux 服务器 python shell bash 后端运维
grep是Linux中最常用的文本搜索工具，用于在文件或文本输出中查找与指定模式匹配的行。它支持基本正则表达式、扩展正则表达式、多文件搜索、递归搜索等多种功能，非常适合过滤、搜索和提取文本内容。1.grep的基本语法grep[选项]模式[文件...]模式：搜索的文本模式，可以是普通字符串或正则表达式。[文件...]：要搜索的文件。如果没有指定文件，grep会从标准输入中读取数据。2.常用选项-i：
浅析IM即时通讯开发中TCP协议层KeepAlive保活机制 wecloud1314 tcp/ip 网络服务器
对于IM这种应用而言，应用层的网络保活的最直接办法就是心跳机制，比如主流的IM里有微信、QQ、钉钉、易信等等，可能代码实现细节有所差异，但理论上无一例外都是这样实现。（PS：没错，当初微信跟运营商间的“信令危机”就是跟这个有关）所谓的网络心跳，通常是客户端每隔一小段时间向服务器发送一个数据包（即心跳包），通知服务器自己仍然在线（心跳包中同时可能传输一些必要的数据）。发送心跳包，从通信层面来说就是为
Linux三剑客与管道使用许琳珊
一、管道1、什么是管道linux提供管道符“|”将两个命令隔开，管道符左边命令的输出就会作为管道符右边命令的输入2、例子echo"hello123"|grep"hello"二、正则1、什么是正则正则表达式就是记录文本规则的代码2、正则的用法常用元字符代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白符\d匹配数字\b匹配单词的开始或结束^匹配字符串的开始$匹配字
Java 正则表达式详解艾伦~耶格尔 Java初级 java 正则表达式开发语言学习
正则表达式(RegularExpression，简称regex)是一种强大的文本处理工具，可以用来匹配、搜索和替换文本中的特定模式。在Java中，正则表达式由java.util.regex包提供支持。1.理解正则表达式语法正则表达式使用特殊的字符和符号来定义匹配模式。一些常用的元字符如下：.:匹配任意单个字符*:匹配前面的字符零次或多次+:匹配前面的字符一次或多次?:匹配前面的字符零次或一次[]:
Linux三剑客-sed krb___ linux 运维服务器
前言：sed是StreamEditor（字符流）的缩写，简称流编辑器。sed是操作、过滤和转换问吧内容的强大工具。sed是一次读取一行数据常用功能包括结合正则表达式对文件实现快速增删改查，其中查询的功能中最常用的两大功能是过滤（过滤指定字符串），取行（取出指定行）sed命令语法：sed[选项][sed内置命令字符][输入文件]选项参数解释-n取消默认sed的输出，常与sed内置命令p一起使用-i直
浅析MYSQL的事务和锁胡萝卜、 mysql 数据库 java
1.MySQL的事务和锁1.1事务的介绍：概念：事务指逻辑上的一组操作，组成这个操作的单元，要么全部成功执行，要么全部执行失败个人理解：某个业务执行更新语句，整个业务下得sql语句（单指更新）全部成功执行，或者执行全部失败常见的mysql执行命令：starttransaction开启事务rollback回滚事务commit提交事务showvariableslike'%commit';查询是否为自动
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
Java中的数组和字符串 RenX000 Java SE java
文章目录数组一维数组创立默认值转型多维数组可变长参数基本格式应用字符串String类StringBuilder类裁剪正则表达式检测数组数组类型本身也是类，即使是基本类型的数组也是以对象形式存在的，并不是基本数据类型一维数组int[]array=newint[10];//创建数组时需要指定长度创立类型[]变量名称=new类型[数组大小];类型变量名称[]=new类型[数组大小];//支持C语言样式，
Linux如何使用sed命令进行文本替换 yang295242361 linux 运维服务器
在Linux中，sed（StreamEditor）是一个用于处理文本流的命令行工具，它非常适合用于执行基本的文本转换。sed可以读取输入的文本文件，根据指定的指令对文本进行处理，并将结果输出到标准输出设备。以下是如何使用sed命令进行文本替换的详细说明：1.基本语法sed命令的基本语法如下：sed's/regexp/replacement/flags'fileregexp：正则表达式，用于匹配要替
浅析‖医疗行业数据安全等保星视界
最近小编接触到了医疗行业，猛然发觉信息化技术当前真的是深入应用到了医院的日常经营发展中，医院整体的管理运营全都面向系统化，让医院的管理效率、质量都纷纷得以提升。这也使得信息安全管理工作占据了更加重要的位置。小编总结了下医院信息安全管理的主要工作大概包括这几点：l信息系统网络安全l备份信息记录安全l计算机设备病毒防治l医院信息管理系统平台安全等想必大家也都有所了解，医疗记录包含大量敏感信息：如病患的
2020-01-28 ab96a7f92f71
中西医对病毒性肺病诊治差别（浅析1）ab96a7f92f71字数289·阅读02020-01-2814:05西医除了追溯疾病症状与体征之外，更多借助于各种化验、检测手段和影像学，尤其是血常规和胸部高清CT影像加以诊断，还必须做咽拭子或下呼吸道分泌物寻找出病原体，例如有针对病毒核酸检测或培养测序和抗体滴度测试等。当然还进行全面身体测试数据发现以往的基础病或体质状态。中医主要运用望闻问切传统手段来辨别
Linux 运维三剑客：grep、sed 和 awk 实战案例与命令参数详解 Lyle_Tu Linux 云计算运维运维 linux chrome 云计算服务器
在Linux运维中，grep、sed和awk是三个非常强大的文本处理工具，它们在处理文本数据时发挥着重要作用。本文将通过一些实战案例，展示这三个工具的使用方法和强大功能，并对它们的命令参数进行详解。grep：文本搜索利器grep是一个强大的文本搜索工具，它使用正则表达式来匹配文本模式。以下是grep的一些常用命令参数：-i：忽略大小写进行匹配。-v：反向查找，只打印不匹配的行。-n：显示匹配行的行
python核心编程课后习题答案--第一章 NewForMe
正则表达式1-1[bh][aiu]t;1-2\w+\w+;1-3\w+,\s\w+;1-4[A-Za-z_]+[\w_]+python有效标识符的定义：1.python中的标识符是区分大小写的。2.标示符以字母或下划线开头，可包括字母，下划线和数字。3.以下划线开头的标识符是有特殊意义的。1-5\d+(\s\w+)+1-6(1)^w{3}://.+com/?$(2)^\w+://.+?\.\w{3
Spring源码浅析の循环依赖西岭千秋雪_ 源码分析 spring java 后端 spring boot
AbstractBeanFactory#doGetBean:尝试获取bean如果bean是单例的：if(mbd.isSingleton()){//尝试获取beansharedInstance=getSingleton(beanName,()->{try{//获取不到就创建returncreateBean(beanName,mbd,args);}catch(BeansExceptionex){//E
从中国小说叙述学的角度浅析《酒国》叙述结构花里胡哨_0ac9
“长篇小说的结构是长篇小说艺术的重要组成部分，是作家丰沛想象力的表现。好的结构，能够凸现故事的意义，也能够改编故事的单一意义。好的结构，可以超越故事，也可以解构故事”一、结构突破的合理性莫言曾提到：“结构就是政治”，证明他在长篇小说的谋篇布局方面下了很大的工夫，这一点在《酒国》里面体现得尤为突出。本文试图运用赵毅衡先生提出的叙述学观点与方法，对《酒国》做一个较浅略的分析。在这个层面上，我们仅对叙述
Java 正则表达式南风_001
正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表达式并不仅限于某一种语言，但是在每种语言中有细微的差别。正则表达式实例一个字符串其实就是一个简单的正则表达式，例如HelloWorld正则表达式匹配"HelloWorld"字符串。.（点号）也是一个正则表达式，它匹配任何一个字符如："a"或"1"。下表列出了一些正则表达式的实例及描述：正则表达式描述thisistext匹配
Linux shell sed 命令详解 BugBear1989
详细的sed命令详解，请参考https://my.oschina.net/u/3908182/blog/1921761一、sed命令工作机制：每次读取一行文本至“模式空间(patternspace)”中，在模式空间中完成处理；将处理结果输出至标准输出设备；语法：sed[OPTION]...{script}[input-file]...参数说明-r支持扩展正则表达式-n静默模式-escript1-e
用正则表达式过滤logcat中的多个tag的日志 fc82bb084ee7
在AndroidStudio中,在过滤器的byLogTag选项中配置.我配置了2个tagfilter方便开发,1.multi-tag-filter2.ignore-multi-tag-filter.过滤出指定tag的日志信息^(?:Watchdog|InputReader|ahking)Watchdog忽略指定tag的日志信息^(?!WifiMonitor|WifiHW)有些tag的无用log非常
Python实现对哈利波特小说单词统计胜天半月子 Python基础及应用 python 字符串列表正则表达式
文章目录要求一、打开文件正则表达式spilt()函数实例二、词频统计三、单词排序四、输出或写入文件python文件写入要求对HarryPotter5.txt英文小说进行词频统计，统计出前二十个频率最高的单词，并打印输出或写入文件一、打开文件打开文件并将单词中非单词字符用空格代替代码：#读取小说内容fp=open('HarryPotter5.txt')content=fp.read()#所有标点符号
javase笔记3----正则表达式芝奥小婷笔记
正则表达式简介正则表达式（RegularExpressions），是一个特殊的字符串，可以对普通的字符串进行校验检测等工作，校验一个字符串是否满足预设的规则。基本语法字符集合[]:表示匹配括号里的任意一个字符。[abc]:匹配a或者b或者c[^abc]:匹配任意一个字符，只要不是a,或b,或c就表示匹配成功[a-z]:表示匹配所有的小写字母的任意一个。[A-Za-z]:表示匹配所有的小写字母和大写
搜索结果关键字标红 — 正则月亮消失了.974 servlet html javascript
str是你的内容，key是关键字正则表达式匹配模式支持的三个标志（newregexp的第二个参数）g:global全文搜索，不添加则搜索到第一个匹配停止；i:ignorecase忽略大小写，默认大小写敏感；m:multiplelines多行搜索highlight(str,key){ varreg=newRegExp(`(${key})`,'gi'); v
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟