正则表达式之三：用正则表达式处理文本

前面学习的是模式匹配的规则，现在要学习的是如何利用模式匹配来处理文本。干活是时候到了！

1、s///替换

将制定变量合乎模式的那个部分替换为另一个部分内容

$_="He's out bowling with Barney toneght."; s/Barney/Fred/; #把Barney替换为Fred print "$_\n";

批注：如果匹配失败，不发生任何事，原变量也保持不变。现在的输出为“ He's out bowling with Fred tonight .”

$_="He's out bowling with Barney toneght.";

s/with (\w+)/against $1's team/;

	print "$_\n";

批注：输出的是“

He's out bowling against Barney's team tonight.”

$_="green scaly dinosaur";

s/(\w+) (\w+)/$2, $1/;  #替换后为"scaly,green dinosaur"

s/^/huge, /;  #替换后为"huge, scaly, green dinosaur"

s/,.*een//;    #huge dinosaur

s/green/red/;  #匹配失败，此时仍为huge dinosaur

s/\w+$/(`$)$&/   #替换后为"huge (huge !)dinosaur"

s/s+(!\W+)/$1 /  #替换后为"huge (huge!) dinosaur"

s/huge/gigantic/    #替换后为"gigantic (huge!) dinosaur"

s///返回的是布尔值，替换成功时为真，否则为假，如下：

$_="fred flintstone"

if(s/fren/wilma/){

    print "Successfully replaced fred with wilma!\n";}

注意：在前面的例子，可以看到即使有其它可以替换的部分，

s///也只会进行一次替换。当然，这只是默认的行为而已。/g修饰符可让s///进行所有可能的，不重复的替换，如下例：

$_="home, sweet home!";

s/home/cave/g;

	print "$_\n";   #输出"cave, sweet cave!"

替换运算中也可以使用我们常在模式匹配中使用的/i /x /s修饰符。先后顺序无影响。

s#wilma#Wilma#gi; #将所有的WiLmA或者WILMA等一律替换为Wilma

s{_END_.*}{}S;  #将_END_标记和其后所有的内容都截掉

一个相当常见的全局替换是缩减空白，也就是讲任何连续的空白转换成单一空格：

$_="Input data\t may have    extra whitespace.";

s/\s+/ /g; #现在它变成了"Input date may have extra whitespace."

删除开头和结尾的空白：

s/^\s+//;	#删除开头的空白字符

s/\s+$//;	#删除结尾的空白字符

s/^\s+|\s$//g;	#去除开头和结尾的空白字符

s///也可以用其它的定界符，对于没有左右之分（非成对）字符，用法跟使用斜线一样，只要重复三次即可。如使用#作为定界符：

s#^https://#http://#;

如果使用左右之分的成对字符，就必须使用两对：一对圈引模式，一对圈引替换字符串，如下：

s{fred}{barney};=s[fren](barney);=s<fred>#barney#;

可以用绑定操作符为s///选择不同的目标

$file_name=~s#^.*/##s; #将$file_name中所有Unix风格的路径全部去除

2、大小写转换

在替换运算中，常常需要把单词全部改成大写（或是小写）。在Perl中使用某些反斜线转义字符就行了。\U转义字符会将其后所有的字符转换成大写：

$_="I saw Barney with Fred.";

s/(fred|barney)/\U$1/gi;  #$_现在变成了"I saw BARNEY with FRED."

s/(fred|barney)/\L$1/gi;  #$_现在变成了"I saw barney with fred."

默认情况下，它们会影响之后全部的替换字符串。可以用\E结束大小写转换的影响：

s/(\w+) with (\w+)/\U$2\E with $1/i;  #$_替换为"I saw FRED with barney."

使用小写形式的\l和\u时，它们只会影响之后的第一个字符：

s/(fred|barney)/\u$1/ig;   #$_替换后为"I saw FRED with Barney."

也可以将它们并用。同时使用\u与\L来表示全部转小写，但首字母大写，且此时\L与\u的先后顺序没有影响：

s/(fred|barney)/\u\L$1/ig; #$_现在成了"I saw Fred with Barney."

现在虽然介绍的是替换时的大小写转换，但它们也使用于任何双引号内的字符串：

print "Hello, \L\u$name\E, would you like to play a game?\n";

3、split操作符

它会根据分隔符拆开一个字符串，这对于处理被制表符、冒号、空白或任意符号分隔的数据相当有用。只要能将分隔符写成模式（通常是很简单的正则表达式），就可以使用split提取数据。它的用法如下：

@fields = split /separator/, $string;

例：@fields = split /:/, "abc:def:g:h";   #得到（"abc", "def", "g", "h"）

如果两个分隔符连载一起，就会产生空字段：

例：@fields = split /:/, "abc:def::g:h";  #得到（"abc", "def", "", "g", "h"）

split会保留开头处的空字段，并省略结尾处的空字段。

例：@fields = split /:/, ":::a:b:c:::";   #得到（"", "", "", "a", "b", "c"）

利用/\s+/模式进行空白分隔也是常见的做法。在此模式下，所有的空白会被当成一个空格来处理：

my $some_input = "This is a \t       test.\n";

my $args = split /\s+/, $some_input;  #("This", "is", "a", "test.")

split默认会以空白字符分隔$_:

例：my @fields = split; #等效于split /\s+/, $_;

批注：这几乎就等于以/\s+/为模式，只是它会省略开头的空字段。所以，即使该行以空白开头，也不会在返回列表的开头处看到空字段。

请避免在split模式里用到捕获圆括号，因为这会启动所谓的“分隔保留模式”。在split里使用费捕捉圆括号（?:）的写法，就可以安全地进行分组。

4、join函数

join函数不会使用模式，它的功能与split恰好相反：split会将字符串分解为数个片段（子字符串），而join则会吧这些片段联合成一个字符串，它的用法如下所示：

my $result = join $glue, @pieces;

例：my $x = join ":", 4,6,8,10,12;  #$x为"4:6:8:10:12"

列表至少要有两个元素，否则胶水无法涂进去：

例：my $y = join "foo", "bar";   #只有一个"bar"，这里不会起作用

例：my $empty;   #空数组

my $empty = join"baz", @empty;  #没有元素，所以得到一个空的字符串

使用上面的$x，我们可以先分解字符串，在用不同的定界符将它接起来:

例：my @values = split /:/, $x; #@values为（4,6,8,10,12）

my $z = join "-", @value; #$z为“4-6-8-10-12”

注意：join的第一个参数是字符串，而不是模式。

5、列表上下文中的m//

在列表上下文中使用模式匹配操作符(m//)时，如果模式匹配成功，那么返回的是所有捕获变量的列表；如果匹配失败，则会返回空列表：

$_ = "Hello there, neighbor!"; my($first, $second, $third) = /(\S+) (\S+), (\S+)/; print "$second is my $third\n";

批注：如此就能给那些（可在下一次模式匹配后访问的）匹配变量起既好听又动听的名字。另外因为程序代码中并未使用到=~绑定操作符，所以该模式匹配是针对$_进行的。

/g修饰符也可以用在这里，其效果就是让模式能够匹配到字符串中的许多地方。

my $text = "Fred dropped a 5 ton granite block on Mr.Slate"; my @words = ($text =~ /(a-z)/ig); print "Result: @words\n"; #输出：Fred dropped a 5 ton granite block on Mr.Slate

批注：此例中具有一对圆括号的模式，它会在每次匹配成功时返回一个捕获串。这就好像自己动手实现了 split 的功能。不过并非指定想要去除的部分，反而是指定想要流下的部分。如果模式中有多对圆括号，那么每次匹配就能捕获多个串

假设，我们想把一个字符串变成哈希，就可以这样做：

my $data = "Barney Rubble Fred Flinstone Wilma Flintstone"; my %last_name = ($data = ~ /(\w+)\s+(\w+)/g);

批注：每次模式匹配成功，就会返回一对被捕获出来的值。这一对值正好称为新哈希的键/值对。

6、贪婪量词与非贪婪量词

+、？、*这些贪婪量词在其后加上？后就变成了非贪婪量词了，即匹配的越短越好。

如要去掉下面这段话中的<BOLD>和</BOLD>可以这样：

I'm talking about the cartooon with Fred and <BOLD>Wilma</BOLD>! s#<BOLD>(.*)</BOLD>#$1#g;

但这种方式对于下面这句话就不适用了：

I thought you said Fred and <BOLD>Velma</BOLD>, not <BOLD> Wilma</BOLD>!

批注：现在就不能使用上面那种贪婪量词写法了，会把中间的内容都去掉，必须用下面这种非贪婪量词:

s#<BOLD>(.*？)</BOLD>#$1#g;

非贪婪量词花括号的表示法：{5,10}?或者{8，}?。??这种非贪婪的写法还是会匹配一次或零次，但会优先考虑零次的情况。

7、跨行的模式匹配

处理多行文本，与处理单行文本并无差异。当然，先得有表达式可以表示多行文本才行。

$_ = "I'm much better\nthan Barney is \nat bowling,\Wilma.\n";

^和$通常是用来匹配整个字符串的开始和结束的。但是当模式加上/m修饰符之后，就可以让它们也匹配串内的换行符。这样一来，它们所代表的位置就不再是整个字符串的头尾，而是每行的开头跟结尾。因此，下面的模式就成立了：

print "Found 'wilma' at start of line\n" if /^wilma\b/im;

同样，也可以对多行文本逐个进行替换。下面的程序会先把整个文件读进一个变量，然后把文件名前置于每一行的开头：

open FILE，$filename

    or die "Can't open '$filename': $!" ;

my $lines = join '', <FILE>;

$lines =~ s/^/$filename: /gm;

8、一次更新多个文件

程序化的更新文件内容时，最常见的做法计是先打开一个新文件，然后把跟旧文件想通的内容写进去，并且在需要的位置进行改写。后面会看到，这样做和直接更新文件的做法效果大致相同，只是有些附带的好处。举例来说，我们现在有几百个格式类似的文件。其中一个叫做fred03.dat，里面都是如下几行的内容：

Program name: granite

Author: Gilert Bates

Company: RockSoft

Department:R&D

Phone: +1 503 555-0095

Date: Tues March 9, 2004

Version:2.1

Size: 21k

Status: Final beta

我们必须修改这个文件，让它有一些新的信息。下面就是应该改成的样子：

Program name: granite

Author: Randal L. Schwartz

Company: RockSoft

Department:R&D

Phone: +1 503 555-0095

Date: June 12, 2008 6:38 pm

Version:2.1

Size: 21k

Status: Final beta

简单的说，三项改动：Author字段的姓名要改，Date要改成今天的日期，而Phone则要删除。另外几百个文件也都要进行这些改动。

要在Perl中直接修改文件内容可以使用钻石操作符(<>)。下面的程序可以完成上述的要求;

#!/usr/bin/perl -w

use strict;

chomp(my $date = `date`);

$^I = ".bak";

while(<>){

s/^Author: .*/Author: Randal L. Schwartz/;

s/^Phone: .*\n//;

s/^Date: .*/Date: $date/;

print;}

因为我们需要今天的日期，所以这个程序一开始就使用了系统的date命令。另外一个比较好的做法就是在标量上下文中使用Perl自己的localtime函数（但两者的格式稍有差异）：my $date = localtime;下一行则是对$^I变量赋值。

钻石操作符会读取命令行参数直指定的那些文件。程序的主循环一次会读取，更新及输出一行。钻石操作符：自动帮打开许多文件，而且如果没有指定文件，它就会从标准输入读进数据。但如果$^I中是个字符串，该字符串就会变成备份文件的扩展名。

工作过程：先假设钻石操作符正好打开了文件fred03.dat。除了像以前一样代开文件之外，它还会把文件名改成fred03.dat.bak。虽然打开的是同一个文件，但是它在磁盘上的文件名已经不同了。接着，钻石操作符会打开一个新文件并将它取名为fred03.dat。这么做并不会有任何问题，因为我们已经没有同名文件了。现在钻石操作符会把默认的输出设定为这个新打开的文件，所以输出来的所有内容都会被新进这个文件。这样while循环会从旧文件读进一步输入，做了一些改动之后把新的内容写进新文件。在普通的机器上，这样的程序可以在几秒内修改上百个文件。Perl并没有编辑任何文件，它只是创建了一个修改过的新拷贝。

有些人会把$^I的值设为~这个字符，因为emacs在处理备份文件的文件名时也是这么做。而如果把$^I设为空字符串，就会直接修改文件的内容，但不会留下任何备份。只要模式中不小心打错了一个字，就可能会把整份数据全班清空，所以如果你真的想看看备份磁带质量如何，就尽情的用空字符串吧！全部确认无误后再把备份文件删除是轻而易举的事。如果做错了，则需要把已备份的文件还原回来，Perl可以做到这件事。

9、从命令行进行在线编辑

如果在上例中的上百个文件中的拼错的Randall，改成Randal。可以用上节那样的程序来完成此事。或者，你也可以在命令行上使用下面的单行程序做到：

$ perl -p -i.bak -w -e 's/Randall/Randal/g' fred*.dat

以perl开头的命令的作用如同在文件的开头加上#!/usr/bin/perl:表示以perl程序来处理随后的脚本。

-p选项则可以让perl自动生成一小段程序，看起来类似如下的片段：

while(<>){

print;}

如果不需要这么多的功能，还可以用-n选项，这样就可以把自动执行的print去掉，所以你可以自行决定什么内容需要print。这点细微差别对大程序来说无关轻重。

-i.bak的作用就是在程序开始运行之前把$^I设为.bak。如果不想做备份，请直接写出-i，不要加扩展名。

-w的作用是打开警告。

-e用来告诉perl后面跟着的是程序代码。也就是说，s/Randall/Randal/g这个字符串会被直接当成perl程序代码。因为目前我们已经有个while循环了（来自-p选项），所以这段程序代码会被放到循环中的print前面的位置。用-e选项指定的程序中可以省略末尾的分号。如果你制定了多个-e选项，就会有多段程序代码，此时只有最后一段程序末尾的分号可以省略。

最后一个命令行参数是fred*.dat，表示@ARGV的值应该是匹配此文件名模式的所有文件名。

把以上的所有片段全都组合在一起，就好像写了下面这个程序，并且用fred*.dat这个参数调用它一样：

#!/usr/bin/perl -w

$^I = ".bak";

while(<>){

s/Randall/Randal/g;

print;}

这个程序与我们上一节使用的程序相比，就会发现这两者十分相似。这些命令行选项还是挺管用的。

python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
Regular Expression 正则表达式 Aimyon_36 Data Development 正则表达式 redis 数据库
RegularExpression前言1.基本匹配2.元字符2.1点运算符.2.2字符集2.2.1否定字符集2.3重复次数2.3.1*号2.3.2+号2.3.3?号2.4{}号2.5(...)特征标群2.6|或运算符2.7转码特殊字符2.8锚点2.8.1^号2.8.2$号3.简写字符集4.零宽度断言（前后预查）4.1?=...正先行断言4.2?!...负先行断言4.3?Thefatcatsaton
Nginx从入门到实践(三) 听你讲故事啊
动静分离动静分离是将网站静态资源（JavaScript，CSS，img等文件）与后台应用分开部署，提高用户访问静态代码的速度，降低对后台应用访问。动静分离的一种做法是将静态资源部署在nginx上，后台项目部署到应用服务器上，根据一定规则静态资源的请求全部请求nginx服务器，达到动静分离的目标。rewrite规则Rewrite规则常见正则表达式Rewrite主要的功能就是实现URL的重写，Ngin
爬虫技术抓取网站数据 Bearjumpingcandy 爬虫
爬虫技术是一种自动化获取网站数据的技术，它可以模拟人类浏览器的行为，访问网页并提取所需的信息。以下是爬虫技术抓取网站数据的一般步骤：发起HTTP请求：爬虫首先会发送HTTP请求到目标网站，获取网页的内容。解析HTML：获取到网页内容后，爬虫会使用HTML解析器解析HTML代码，提取出需要的数据。数据提取：通过使用XPath、CSS选择器或正则表达式等工具，爬虫可以从HTML中提取出所需的数据，如文
互联网 Java 工程师面试题（Java 面试题四）苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
下面列出这份Java面试问题列表包含的主题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java集合框架数组字符串GOF设计模式SOLID抽象类与接口Java基础，如equals和hashcode泛型与枚举JavaIO与NIO常用网络协议Java中的数据结构和算法正则表达式JVM底层Java最佳实JDBCDate,Time与CalendarJava处理XMLJUnit编程现在是时候给
【无标题】正则表达式笔记 qis_qis 正则表达式笔记
作用查找特殊规则的字符串编写一个正则表达式，用来查找所有以0开头，后面跟着2-3个数字，然后是一个连字号“-”，最后是7或8位数字的字符串(像010-12345678或0376-7654321)。0\d{2,3}-\d{7,8}基本匹配区分大小写cat会匹配"cat"CAt会匹配"CAt"元字符元字符是正则表达式的基本组成元素。元字符在这里跟它通常表达的意思不一样，而是以某种特殊的含义去解释。有些
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
Linux三剑客之grep命令详解 promise524 Linux linux 服务器 python shell bash 后端运维
grep是Linux中最常用的文本搜索工具，用于在文件或文本输出中查找与指定模式匹配的行。它支持基本正则表达式、扩展正则表达式、多文件搜索、递归搜索等多种功能，非常适合过滤、搜索和提取文本内容。1.grep的基本语法grep[选项]模式[文件...]模式：搜索的文本模式，可以是普通字符串或正则表达式。[文件...]：要搜索的文件。如果没有指定文件，grep会从标准输入中读取数据。2.常用选项-i：
Linux三剑客与管道使用许琳珊
一、管道1、什么是管道linux提供管道符“|”将两个命令隔开，管道符左边命令的输出就会作为管道符右边命令的输入2、例子echo"hello123"|grep"hello"二、正则1、什么是正则正则表达式就是记录文本规则的代码2、正则的用法常用元字符代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白符\d匹配数字\b匹配单词的开始或结束^匹配字符串的开始$匹配字
Java 正则表达式详解艾伦~耶格尔 Java初级 java 正则表达式开发语言学习
正则表达式(RegularExpression，简称regex)是一种强大的文本处理工具，可以用来匹配、搜索和替换文本中的特定模式。在Java中，正则表达式由java.util.regex包提供支持。1.理解正则表达式语法正则表达式使用特殊的字符和符号来定义匹配模式。一些常用的元字符如下：.:匹配任意单个字符*:匹配前面的字符零次或多次+:匹配前面的字符一次或多次?:匹配前面的字符零次或一次[]:
Linux三剑客-sed krb___ linux 运维服务器
前言：sed是StreamEditor（字符流）的缩写，简称流编辑器。sed是操作、过滤和转换问吧内容的强大工具。sed是一次读取一行数据常用功能包括结合正则表达式对文件实现快速增删改查，其中查询的功能中最常用的两大功能是过滤（过滤指定字符串），取行（取出指定行）sed命令语法：sed[选项][sed内置命令字符][输入文件]选项参数解释-n取消默认sed的输出，常与sed内置命令p一起使用-i直
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
Java中的数组和字符串 RenX000 Java SE java
文章目录数组一维数组创立默认值转型多维数组可变长参数基本格式应用字符串String类StringBuilder类裁剪正则表达式检测数组数组类型本身也是类，即使是基本类型的数组也是以对象形式存在的，并不是基本数据类型一维数组int[]array=newint[10];//创建数组时需要指定长度创立类型[]变量名称=new类型[数组大小];类型变量名称[]=new类型[数组大小];//支持C语言样式，
Linux如何使用sed命令进行文本替换 yang295242361 linux 运维服务器
在Linux中，sed（StreamEditor）是一个用于处理文本流的命令行工具，它非常适合用于执行基本的文本转换。sed可以读取输入的文本文件，根据指定的指令对文本进行处理，并将结果输出到标准输出设备。以下是如何使用sed命令进行文本替换的详细说明：1.基本语法sed命令的基本语法如下：sed's/regexp/replacement/flags'fileregexp：正则表达式，用于匹配要替
Linux 运维三剑客：grep、sed 和 awk 实战案例与命令参数详解 Lyle_Tu Linux 云计算运维运维 linux chrome 云计算服务器
在Linux运维中，grep、sed和awk是三个非常强大的文本处理工具，它们在处理文本数据时发挥着重要作用。本文将通过一些实战案例，展示这三个工具的使用方法和强大功能，并对它们的命令参数进行详解。grep：文本搜索利器grep是一个强大的文本搜索工具，它使用正则表达式来匹配文本模式。以下是grep的一些常用命令参数：-i：忽略大小写进行匹配。-v：反向查找，只打印不匹配的行。-n：显示匹配行的行
python核心编程课后习题答案--第一章 NewForMe
正则表达式1-1[bh][aiu]t;1-2\w+\w+;1-3\w+,\s\w+;1-4[A-Za-z_]+[\w_]+python有效标识符的定义：1.python中的标识符是区分大小写的。2.标示符以字母或下划线开头，可包括字母，下划线和数字。3.以下划线开头的标识符是有特殊意义的。1-5\d+(\s\w+)+1-6(1)^w{3}://.+com/?$(2)^\w+://.+?\.\w{3
Java 正则表达式南风_001
正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表达式并不仅限于某一种语言，但是在每种语言中有细微的差别。正则表达式实例一个字符串其实就是一个简单的正则表达式，例如HelloWorld正则表达式匹配"HelloWorld"字符串。.（点号）也是一个正则表达式，它匹配任何一个字符如："a"或"1"。下表列出了一些正则表达式的实例及描述：正则表达式描述thisistext匹配
Linux shell sed 命令详解 BugBear1989
详细的sed命令详解，请参考https://my.oschina.net/u/3908182/blog/1921761一、sed命令工作机制：每次读取一行文本至“模式空间(patternspace)”中，在模式空间中完成处理；将处理结果输出至标准输出设备；语法：sed[OPTION]...{script}[input-file]...参数说明-r支持扩展正则表达式-n静默模式-escript1-e
用正则表达式过滤logcat中的多个tag的日志 fc82bb084ee7
在AndroidStudio中,在过滤器的byLogTag选项中配置.我配置了2个tagfilter方便开发,1.multi-tag-filter2.ignore-multi-tag-filter.过滤出指定tag的日志信息^(?:Watchdog|InputReader|ahking)Watchdog忽略指定tag的日志信息^(?!WifiMonitor|WifiHW)有些tag的无用log非常
Python实现对哈利波特小说单词统计胜天半月子 Python基础及应用 python 字符串列表正则表达式
文章目录要求一、打开文件正则表达式spilt()函数实例二、词频统计三、单词排序四、输出或写入文件python文件写入要求对HarryPotter5.txt英文小说进行词频统计，统计出前二十个频率最高的单词，并打印输出或写入文件一、打开文件打开文件并将单词中非单词字符用空格代替代码：#读取小说内容fp=open('HarryPotter5.txt')content=fp.read()#所有标点符号
javase笔记3----正则表达式芝奥小婷笔记
正则表达式简介正则表达式（RegularExpressions），是一个特殊的字符串，可以对普通的字符串进行校验检测等工作，校验一个字符串是否满足预设的规则。基本语法字符集合[]:表示匹配括号里的任意一个字符。[abc]:匹配a或者b或者c[^abc]:匹配任意一个字符，只要不是a,或b,或c就表示匹配成功[a-z]:表示匹配所有的小写字母的任意一个。[A-Za-z]:表示匹配所有的小写字母和大写
搜索结果关键字标红 — 正则月亮消失了.974 servlet html javascript
str是你的内容，key是关键字正则表达式匹配模式支持的三个标志（newregexp的第二个参数）g:global全文搜索，不添加则搜索到第一个匹配停止；i:ignorecase忽略大小写，默认大小写敏感；m:multiplelines多行搜索highlight(str,key){ varreg=newRegExp(`(${key})`,'gi'); v
正则表达式语法、运算符优先级 weixin_54668000 mvc
正则表达式(regularexpression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。例如：runoo+b，可以匹配runoob、runooob、runoooooob
shell脚本——正则表达式诚诚k 正则表达式
概述正则表达式是你所定义的模式模板，Linux工具可以用它来过滤文本。Linux工具（比如sed编辑器或gawk程序）能够在处理数据时使用正则表达式对数据进行模式匹配。如果数据匹配模式，它就会被接受并进一步处理；如果数据不匹配模式，它就会被滤掉。数据流--正则表达式---（1）匹配的数据（2）滤掉的数据正则表达式（或称RegularExpression，简称RE），是用于描述字符排列和匹配模式的一
正则表达式-运算符优先级一只小棉花正则表达式正则表达式-优先级
转自：http://www.runoob.com/regexp/regexp-operator.html
【Python】正则表达式丕羽 python 正则表达式 mysql
正则表达式正则表达式,全称是RegularExpression,正则表达式,即:正确的,符合特定规则的式子.用来校验和匹配数据,正则不独属于任意的一门语言,Java,Python…都支持,且:正则规则都是一样的,不同的是写法不一样.python中正则使用步骤:#1.导包importre#2.正则校验.re.match()re.search()re.compile().sub()#3.获取匹配结果.
re模块匿隱
defmain():""""""#1.compile(正则表达式)->将正则表达式转换成正则对象"""编译后可以直接通过对象调用相关的对象方法"""re_object=re.compile(r'\d{3}')re_object.fullmatch('432')#2.fullmatch(正则表达式,字符串)->让字符串和正则表达式完全匹配，匹配成功返回匹配对象，匹配失败返回None"""应用：检测字
Python 标准库一马归一码 Python python
目录1.一些常见的标准库：2.os模块的导入和使用3.re模块的导入与调用4.math模块的导入与调用5.datetime模块的导入与调用标准库：Python本身带着的一些标准的模块库，这些模块被直接构建在解析器里，虽然不是语言内置的功能，但可以高效地调用，甚至是系统级调用也可以。1.一些常见的标准库：os模块：提供了很多与操作系统相关联的函数re模块：为高级字符串处理提供了正则表达式工具，对于复
正则表达式他@ 正则表达式 php 数据库
一：正则表达式grep-a不要忽略二进制数据。-A除了显示符合范本样式的那一行之外，并显示该行之后的内容。-b在显示符合范本样式的那一行之外，并显示该行之前的内容。-c计算符合范本样式的列数。-C或-除了显示符合范本样式的那一列之外，并显示该列之前后的内容。-d当指定要查找的是目录而非文件时，必须使用这项参数，否则grep命令将回报信息并停止动作。-e指定字符串作为查找文件内容的范本样式。-E将范
14.JS-正则表达式的反向引用 WahFung_ js笔记正则表达式 js
选择字符：|com|cn|edu---选择其中一个(含有其中一个就能匹配成功)子表达式：用()包围的就是子表达式str="((/d)(/w))"第一个子表达式：((\d)(\w))第二个子表达式：(\d)第三个子表达式：(\w)子表达式：以第一个出现的(为第一个表达式捕获：将匹配到的子表达式保存在RegExp对象中RegExp.$1：保存第一个子表达式RegExp.$2：保存第二个子表达式RegE
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

正则表达式之三：用正则表达式处理文本

你可能感兴趣的:(正则表达式)