E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
正则基础之
Python爬虫之re模块 笔记
文章目录正则基础正则常用元字符
正则基础之
——捕获组(capturegroup)爬虫最常用的两种匹配模式懒惰匹配贪婪匹配正则基础正则常用元字符字符描述\将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用
jokertiger
·
2023-08-02 17:50
python
爬虫
正则表达式
前端好文
TCP详解
正则基础之
——反向引用30秒就能理解的JavaScript代码片段(30secondsofcode)webpack系列之loader的基本使用简单透彻理解JSONP原理及使用JavaScript
BigDaddy2333
·
2020-09-12 00:50
正则基础之
——捕获组(capture group)
1概述1.1什么是捕获组捕获组就是把正则表达式中子表达式匹配的内容,保存到内存中以数字编号或显式命名的组里,方便后面引用。当然,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部。捕获组有两种形式,一种是普通捕获组,另一种是命名捕获组,通常所说的捕获组指的是普通捕获组。语法如下:普通捕获组:(Expression)命名捕获组:(?Expression)普通捕获组在大多数支持正则表达式的语言
klarclm
·
2020-07-30 19:08
正则基础之
——\b 单词边界
1概述“\b”匹配单词边界,不匹配任何字符。“\b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。基本上所有的资料里都会说“\b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,正则表达式中所谓的“单词”,就是由“\w”所定义的字符所组成的子串。“\b”表示所在位置的一侧为单词字符,另一侧为非单词字符、字符串的开始或
xyz2011
·
2020-07-28 04:22
正则表达式
正则基础之
——\b 单词边界
1概述“\b”匹配单词边界,不匹配任何字符。“\b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。基本上所有的资料里都会说“\b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,正则表达式中所谓的“单词”,就是由“\w”所定义的字符所组成的子串。“\b”表示所在位置的一侧为单词字符,另一侧为非单词字符、字符串的开始或
-过客-
·
2020-07-28 03:15
正则基础
正则基础之
"\b"单词边界
一、概述“\b”匹配单词边界,不匹配任何字符。“\b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。基本上所有的资料里都会说“\b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,正则表达式中所谓的“单词”,就是由“\w”所定义的字符所组成的子串。“\b”表示所在位置的一侧为单词字符,另一侧为非单词字符、字符串的开始
iteye_18630
·
2020-07-28 00:13
正则基础之
--/b 单词边界
1概述“/b”匹配单词边界,不匹配任何字符。“/b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“/b”是零宽度的。基本上所有的资料里都会说“/b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,正则表达式中所谓的“单词”,就是由“/w”所定义的字符所组成的子串。“/b”表示所在位置的一侧为单词字符,另一侧为非单词字符、字符串的开始或
daiyueqiang2045
·
2020-07-27 21:32
正则基础
正则之反向引用
要了解反向引用,首先要了解捕获组,关于捕获组,参考
正则基础之
——捕获组(capturegroup)。反向引用的作用通常是用来查找或限定重复、查找或限定指定标识配对出现等等。
萧炎
·
2020-06-30 20:30
c#
正则基础之
——非捕获组
说到非捕获组,首先要了解什么是捕获组,详细内容参考
正则基础之
——捕获组(capturegroup)。
weixin_34399060
·
2020-06-28 18:55
.NET
正则基础之
——正则委托
1概述一般的正则替换,只能对匹配的子串做简单的处理,且只能是做string类型的处理之后,作为替换文本替换匹配子串,可以实现的功能比较有限。.NET的Replace()方法中的replacement参数,不仅可以是字符串,还可以是委托(delegate),在每次匹配成功时,都会调用委托方法,对匹配的子串进行处理之后,再作为替换文本返回,匹配子串使用委托方法,可以做任意复杂的处理,因此这种替换功能非
weixin_34232363
·
2020-06-28 14:59
正则基础之
——贪婪与非贪婪模式
1概述贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。属于贪婪模式的量词,也叫做匹配优先量词,包括:“{m,n}”、“{m,}”、“?”、“*”和“+”。在一些使用NFA引擎的语言中,在匹配优先量词后加上“?”,即变成属于非贪婪模式的量词,也叫
weixin_34128501
·
2020-06-28 12:22
正则基础之
——贪婪与非贪婪模式
1概述贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。属于贪婪模式的量词,也叫做匹配优先量词,包括:“{m,n}”、“{m,}”、“?”、“*”和“+”。在一些使用NFA引擎的语言中,在匹配优先量词后加上“?”,即变成属于非贪婪模式的量词,也叫
-过客-
·
2020-06-24 10:53
正则基础
正则基础之
——反向引用
要了解反向引用,首先要了解捕获组,关于捕获组,参考
正则基础之
——捕获组(capturegroup)。反向引用的作用通常是用来查找或限定重复、查找或限定指定标识配对出现等等。
-过客-
·
2020-06-24 10:22
正则表达式
regex
string
javascript
html
语言
.NET
正则基础之
——正则委托
1概述一般的正则替换,只能对匹配的子串做简单的处理,且只能是做string类型的处理之后,作为替换文本替换匹配子串,可以实现的功能比较有限。.NET的Replace()方法中的replacement参数,不仅可以是字符串,还可以是委托(delegate),在每次匹配成功时,都会调用委托方法,对匹配的子串进行处理之后,再作为替换文本返回,匹配子串使用委托方法,可以做任意复杂的处理,因此这种替换功能非
-过客-
·
2020-06-24 10:22
.NET正则
正则基础之
——NFA引擎匹配原理
NFA引擎匹配原理1为什么要了解引擎匹配原理一个个音符杂乱无章的组合在一起,弹奏出的或许就是噪音,同样的音符经过作曲家的手,就可以谱出非常动听的乐曲,一个演奏者同样可以照着乐谱奏出动听的乐曲,但他/她或许不知道该如何去改变音符的组合,使得乐曲更动听。作为正则的使用者也一样,不懂正则引擎原理的情况下,同样可以写出满足需求的正则,但是不知道原理,却很难写出高效且没有隐患的正则。所以对于经常使用正则,或
-过客-
·
2020-06-24 10:21
正则基础
.NET
正则基础之
——.NET正则匹配模式
1概述匹配模式指的是一些可以改变正则表达式匹配行为的选项或修饰符。不同的语言支持的匹配模式不同,使用的方式也不同。一般可分为全局和内联两种。下面主要介绍.NET中的匹配模式,其它语言的匹配模式,后续视情况补充。2匹配模式2.1全局匹配模式和内联匹配模式概述.NET中的全局匹配模式是通过RegexOptions枚举值指定的,可以按位“或”进行组合,全局匹配模式只能作用于整个正则表达式。全局匹配模式提
-过客-
·
2020-06-24 10:21
.NET正则
.NET
正则基础之
——平衡组
1概述平衡组是微软在.NET中提出的一个概念,主要是结合几种正则语法规则,提供对配对出现的嵌套结构的匹配。.NET是目前对正则支持最完备、功能最强大的语言平台之一,而平衡组正是其强大功能的外在表现,也是比较实用的文本处理功能,目前只有.NET支持,相信后续其它语言会提供支持。平衡组可以有狭义和广义两种定义,狭义平衡组指.NET中定义的(?Expression)语法,广义平衡组并不是固定的语法规则,
-过客-
·
2020-06-24 10:21
.NET正则
正则基础之
——捕获组(capture group)
1概述1.1什么是捕获组捕获组就是把正则表达式中子表达式匹配的内容,保存到内存中以数字编号或显式命名的组里,方便后面引用。当然,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部。捕获组有两种形式,一种是普通捕获组,另一种是命名捕获组,通常所说的捕获组指的是普通捕获组。语法如下:普通捕获组:(Expression)命名捕获组:(?Expression)普通捕获组在大多数支持正则表达式的语言
-过客-
·
2020-06-24 10:20
正则基础
正则基础之
——小数点
正则基础之
——小数点小数点可以匹配除了换行符“/n”以外的任意一个字符,如要匹配小数点本身,用“/”进行转义“/.”。
daiyueqiang2045
·
2020-06-23 02:25
正则表达式
regex
引擎
测试
浏览器
string
正则基础之
——神奇的转义
1概述这或许会是一个让人迷惑,甚至感到混乱的话题,但也正因为如此,才有了讨论的必要。在正则中,一些具有特殊意义的字符,或是字符序列,被称作元字符,如“?”表示被修饰的子表达式匹配0次或1次,“(?i)”表示忽略大小写的匹配模式等等。而当这些元字符被要求匹配其本身时,就要进行转义处理了。不同的语言或应用场景下,正则定义方式、元字符出现的位置不同,转义的方式也是林林总总,不一而同。2.NET正则中的字
weixin_34266504
·
2020-06-21 11:08
.NET
正则基础之
——平衡组
1概述平衡组是微软在.NET中提出的一个概念,主要是结合几种正则语法规则,提供对配对出现的嵌套结构的匹配。.NET是目前对正则支持最完备、功能最强大的语言平台之一,而平衡组正是其强大功能的外在表现,也是比较实用的文本处理功能,目前只有.NET支持,相信后续其它语言会提供支持。平衡组可以有狭义和广义两种定义,狭义平衡组指.NET中定义的(?Expression)语法,广义平衡组并不是固定的语法规则,
weixin_33915554
·
2020-06-21 11:52
正则基础之
——环视(Lookaround)
1环视基础 环视只进行子表达式的匹配,不占有字符,匹配到的内容不保存到最终的匹配结果,是零宽度的。环视匹配的最终结果就是一个位置。 环视的作用相当于对所在位置加了一个附加条件,只有满足这个条件,环视子表达式才能匹配成功。 环视按照方向划分有顺序和逆序两种,按照是否匹配有肯定和否定两种,组合起来就有四种环视。顺序环视相当于在当前位置右侧附加一个条件,而逆序环视相当于在当前位置左侧附加一个条
zww0815
·
2016-04-28 16:00
正则基础之
环视 Lookaround
1 环视基础 环视只进行子表达式的匹配,不占有字符,匹配到的内容不保存到最终的匹配结果,是零宽度的。环视匹配的最终结果就是一个位置。 环视的作用相当于对所在位置加了一个附加条件,只有满足这个条件,环视子表达式才能匹配成功。 环视按照方向划分有顺序和逆序两种,按照是否匹配有肯定和否定两种,组合起来就有四种环视。顺序环视相当于在当前位置右侧附加一个条件,而逆序环视 相当于在当前位置左侧附加一个条
·
2015-11-13 16:24
round
正则基础之
——神奇的转义
义方式、元字符出现的位置不同,转义的方式也是林林总总,不一而同。 2 .NET 正则中的字符转义 2.1 .NET 正则中的转义符 绝大多数语言中,“ / ”都被作为转义符,用来转义一些具有特殊意义的字符或字符序列,比如“ /n
·
2015-11-13 14:01
正则基础之
.NET
正则基础之
——正则委托
原地址: http://blog.csdn.net/lxcnn/archive/2009/10/22/4711491.aspx 1 概述 一般的正则替换,只能对匹配的子串做简单的处理,且只能是做string类型的处理之后,作为替换文本替换匹配子串,可以实现的功能比较有限。.NET的Replace()方法中的replacement参数,不仅可以是字符串,还可以是委托
·
2015-11-12 19:58
.NET正则基础
正则基础之
——\b 单词边界
1 概述 “\b”匹配单词边界,不匹配任何字符。 “\b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。 基本上所有的资料里都会说“\b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,正则表达式中所谓的“单词”,就是由“\w”
·
2015-11-11 01:13
正则基础之
.NET
正则基础之
——平衡组
1 概述 平衡组是微软在.NET中提出的一个概念,主要是结合几种正则语法规则,提供对配对出现的嵌套结构的匹配。.NET是目前对正则支持最完备、功能最强大的语言平台之一,而平衡组正是其强大功能的外在表现,也是比较实用的文本处理功能,目前只有.NET支持,相信后续其它语言会提供支持。 平衡组可以有狭义和广义两种定义
·
2015-11-11 01:11
.NET正则基础
正则基础之
——非捕获组
说到非捕获组,首先要了解什么是捕获组,详细内容参考
正则基础之
——捕获组(capture group)。
·
2015-11-11 01:10
正则基础之
正则基础之
——反向引用
要了解反向引用,首先要了解捕获组,关于捕获组,参考
正则基础之
——捕获组(capture group)。 反向引用的作用通常是用来查找或限定重复、查找或限定指定标识配对出现等等。
·
2015-11-11 01:09
正则基础之
正则基础之
——贪婪与非贪婪模式
1 概述 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。 属于贪婪模式的量词,也叫做匹配优先量词,包括: “{m,n}”、“{m,}”、“?”、“*”和
·
2015-11-11 01:08
正则基础之
.NET
正则基础之
——正则委托
1 概述 一般的正则替换,只能对匹配的子串做简单的处理,且只能是做string类型的处理之后,作为替换文本替换匹配子串,可以实现的功能比较有限。.NET的Replace()方法中的replacement参数,不仅可以是字符串,还可以是委托(delegate),在每次匹配成功时,都会调用委托方法,对匹配的子串进行处
·
2015-11-11 01:08
.NET正则基础
正则基础之
——神奇的转义
1 概述 这或许会是一个让人迷惑,甚至感到混乱的话题,但也正因为如此,才有了讨论的必要。 在正则中,一些具有特殊意义的字符,或是字符序列,被称作元字符,如“?”表示被修饰的子表达式匹配0次或1次,“(?i)”表示忽略大小写的匹配模式等等。而当这些元字符被要求匹配其本身时,就要进行转义处理了。 不同的语言或应用
·
2015-11-11 01:06
正则基础之
正则基础之
——环视(Lookaround)
1 环视基础 环视只进行子表达式的匹配,不占有字符,匹配到的内容不保存到最终的匹配结果,是零宽度的。环视匹配的最终结果就是一个位置。 环视的作用相当于对所在位置加了一个附加条件,只有满足这个条件,环视子表达式才能匹配成功。 环视按照方向划分有顺序和逆序两种,按照是否匹配有肯定和否定两种,组合起来就有四种环视。顺序环视相当于在当前位置右侧附加一个条件,而逆序环视相当于在当前位置
·
2015-11-09 14:51
round
正则基础之
——贪婪与非贪婪模式
源地址 1 概述 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。 属于贪婪模式的量词,也叫做匹配优先量词,包括: “{
·
2015-11-03 21:44
正则基础之
正则基础之
——环视
源地址 环视(Lookaround) 1 环视基础 环视只进行子表达式的匹配,不占有字符,匹配到的内容不保存到最终的匹配结果,是零宽度的。环视匹配的最终结果就是一个位置。 环视的作用相当于对所在位置加了一个附加条件,只有满足这个条件,环视子表达式才能匹配成功。 环视按照方向划分有顺序和逆序两种,按照是
·
2015-11-03 21:43
正则基础之
正则基础之
——NFA引擎匹配原理
源地址 NFA引擎匹配原理 1 为什么要了解引擎匹配原理 一个个音符杂乱无章的组合在一起,弹奏出的或许就是噪音,同样的音符经过作曲家的手,就可以谱出非常动听的乐曲,一个演奏者同样可以照着乐谱奏出动听的乐曲,但他/她或许不知道该如何去改变音符的组合,使得乐曲更动听。 作为正则的使用者也一样,不懂正则引擎原
·
2015-11-03 21:42
正则基础之
正则基础之
——神奇的转义
源地址 1 概述 这或许会是一个让人迷惑,甚至感到混乱的话题,但也正因为如此,才有了讨论的必要。 在正则中,一些具有特殊意义的字符,或是字符序列,被称作元字符,如“?”表示被修饰的子表达式匹配0次或1次,“(?i)”表示忽略大小写的匹配模式等等。而当这些元字符被要求匹配其本身时
·
2015-10-31 13:52
正则基础之
.NET
正则基础之
——正则委托
源地址 1 概述 一般的正则替换,只能对匹配的子串做简单的处理,且只能是做string类型的处理之后,作为替换文本替换匹配子串,可以实现的功能比较有限。.NET的Replace()方法中的replacement参数,不仅可以是字符串,还可以是委托(delegate),在每次匹配成
·
2015-10-31 13:52
.NET正则基础
正则基础之
——反向引用
要了解反向引用,首先要了解捕获组,关于捕获组,参考
正则基础之
——捕获组(capture group)。 反向引用的作用通常是用来查找或限定重
·
2015-10-31 13:50
正则基础之
.NET
正则基础之
——平衡组
源地址 1 概述 平衡组是微软在.NET中提出的一个概念,主要是结合几种正则语法规则,提供对配对出现的嵌套结构的匹配。.NET是目前对正则支持最完备、功能最强大的语言平台之一,而平衡组正是其强大功能的外在表现,也是比较实用的文本处理功能,目前只有.NET支持,相信后续其它语言会提
·
2015-10-31 13:49
.NET正则基础
.NET
正则基础之
——.NET正则匹配模式
源地址 1 概述 匹配模式指的是一些可以改变正则表达式匹配行为的选项或修饰符。不同的语言支持的匹配模式不同,使用的方式也不同。 一般可分为全局和内联两种。下面主要介绍.NET中的匹配模式,其它语言的匹配模式,后续视情况补充。 2 &
·
2015-10-31 13:48
.NET正则基础
正则基础之
——非捕获组
说到非捕获组,首先要了解什么是捕获组,详细内容参考
正则基础之
——捕获组(capture group)。 1、为什么要有非捕获组 一旦使用了“()”,就会默认为是普通捕获组,从而将
·
2015-10-31 13:48
正则基础之
正则基础之
——/b 单词边界
源地址 1 概述 “\b”匹配单词边界,不匹配任何字符。 “\b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。 基本上所有的资料里都会说“\b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,
·
2015-10-31 13:46
正则基础之
正则基础之
——小数点
源地址 小数点可以匹配除了换行符“\n”以外的任意一个字符 一些细节 对于使用传统NFA引擎的大多数语言,如Java,.NET来说,“.”的匹配范围是这样的。 但是对于JavaScript来说有些特殊,由于各浏览器的解析引擎不同,“.”的匹配范围也有所不同,对于Trident内核的浏览器,如IE来说,“.”同样是匹配除了换行符“\n”以外的任意一个字符,但是
·
2015-10-31 13:45
正则基础之
『』
正则基础之
——\b 单词边界
1 概述“\b”匹配单词边界,不匹配任何字符。 “\b”匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”是零宽度的。 基本上所有的资料里都会说“\b”是单词边界,但是关于“单词”的范围却是少有提及。通常情况下,正则表达式中所谓的“单词”,就是由“\w”所定
·
2015-10-31 11:09
正则基础之
.NET
正则基础之
——平衡组
1 概述 平衡组是微软在.NET中提出的一个概念,主要是结合几种正则语法规则,提供对配对出现的嵌套结构 的匹配。.NET是目前对正则支持最完备、功能最强大的语言平台之一,而平衡组正是其强大功能的外在表现,也是比较实用的文本处理功能,目前只有.NET 支持,相信后续其它语言会提供支持。 平衡组可以有狭义和广义两种定义,狭义平衡组指.N
·
2015-10-31 09:05
.NET正则基础
正则基础之
——环视
环视(Lookaround)http://blog.csdn.net/lxcnn/article/details/43047541 环视基础环视只进行子表达式的匹配,不占有字符,匹配到的内容不保存到最终的匹配结果,是零宽度的。环视匹配的最终结果就是一个位置。环视的作用相当于对所在位置加了一个附加条件,只有满足这个条件,环视子表达式才能匹配成功。环视按照方向划分有顺序和逆序两种,按照是否匹
zhanghui_hn
·
2014-02-09 20:00
正则表达式
expression
环视
regular
正则基础之
——NFA引擎匹配原理
NFA引擎匹配原理1 为什么要了解引擎匹配原理一个个音符杂乱无章的组合在一起,弹奏出的或许就是噪音,同样的音符经过作曲家的手,就可以谱出非常动听的乐曲,一个演奏者同样可以照着乐谱奏出动听的乐曲,但他/她或许不知道该如何去改变音符的组合,使得乐曲更动听。作为正则的使用者也一样,不懂正则引擎原理的情况下,同样可以写出满足需求的正则,但是不知道原理,却很难写出高效且没有隐患的正则。所以对于经
marb
·
2014-01-12 20:00
正则基础之
正则基础之
[ ] 字符组(Character Classes)
[]能够匹配所包含的一系列字符中的任意一个。需要注意的是,[]虽然能匹配其中的任意一个字符,但匹配的结果只能是一个字符,不是多个。 例如[abc]表示字符“a”或“b”或“c”。 []支持用连字符“-”连接两个字符,来表示一个字符范围。需要注意的是,“-”前后的两个字符是
marb
·
2014-01-12 20:00
character
正则基础之
——捕获组(capture group)
1 概述1.1 什么是捕获组捕获组就是把正则表达式中子表达式匹配的内容,保存到内存中以数字编号或显式命名的组里,方便后面引用。当然,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部。捕获组有两种形式,一种是普通捕获组,另一种是命名捕获组,通常所说的捕获组指的是普通捕获组。语法如下:普通捕获组:(Expression)命名捕获组:(?Expression)普通捕获组在
marb
·
2014-01-12 20:00
group
上一页
1
2
3
4
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他