ultraedit 正则表达式

UltraEdit(后简称UE),是我经常使用的文本编辑软件,其功能的强大,令我由衷地爱上了它。每天不用就全身不爽。从最开始的9。0到现在的 12。10a(本人只用到这个版本),UE都是系统重装后必安之物。UE本身除了普通的文本编辑功能以外,对十六进制文件的编辑能力也是十分了得,由于工 作原因它十六制下的魅力我体会不大,希望有了解的XDJM们不惜文字,共享一下。不多说,下面是UE中沿用几代的正则表达式语法。

首先,在UE中需要用户按键到“高级”-“配置”-“搜索”-“正则表达式引擎”中进行使用哪一种正则表达式的选择。如图

 

如果你选中“UltraEdit风格正则表达式”,在以后的搜索和替换功能中就将使用“UltraEdit风格正则表达式”的语法规则来进行操作,其它同理。

现在的版本里面,还加入了“Perl 兼容正则表达式”,在以后的文章中还有提到。

UltraEdit风格正则表达式语法

1、%

功能说明: 匹配一行的开始位置。这个符号表示所寻找的字符在每一行的开始的位置,不包括每一行其上一行的结束字符。

2、$

功能说明:匹配一行的结束位置。这个符号表示所寻找的字符在每一行的结束的位置。这个$和上面说的“行头”恰恰相反,它是“行尾”。

3、?

功能说明:匹配每一个字符,除了“换行符”以外。

4、*

功能说明:匹配任意个数的任何字符,除了“换行符”以外。

5、+

功能说明:匹配一个或多个所提到的字符或是表达式,至少要出现一次。不匹配重复的“换行符”。

6、++

功能说明:匹配零次或是很多次所提到的字符或表达式,不匹配重复的“换行符”。

7、^b

功能说明:匹配分页符。

8、^p

功能说明:匹配DOS文件中的换行符。

9、^r

功能说明:匹配MAC文件中的换行符。

10、^n

功能说明:匹配UNIX文件中的换行符。

11、^t

功能说明:匹配一个Tab符。

12、[ ]

功能说明:匹配在方括号里面的任何单个字符,可以用范围来表示。

13、^{A^}^{B^}

功能说明:匹配表达式A或表达式B

14、^

功能说明:后面的正则表达式无效。

注意:现在使用当中也可以表示指定行的开头。

15、^(…^)

功能说明: 匹配第1个到第9个指定的表达式,并且可以用其序号来变换位置

例如:“hello world”满足表达式“^(h*o^) ^(w*d^)”,而表达式“^2 ^1”就可以把“hello world”替换为“world hello”。

下面我举一些很简单的例子,让大家看看:

m?n 匹配“man”,“men”,“min”但是不能匹配“moon”。

t*t匹配“test”,“tonight”和“tea time”但是不能匹配“tea time”(换行符在“tea ”和“time”之间)。

Te+st匹配“test”,“teest”,“teeeest”等等,但是不能匹配“tst”。

[aeiou] 匹配任一个属于aeiou的字母

[,。?]匹配“,”、“。”和“?”中的任意一个

[0-9a-z] 匹配任何一个1-9的数字a到z的小写字母

[~0-9] 匹配任何一个字符除了数字以外(~符号的意思是表示“非”)

这里只介绍了UE中“传统正则表达式”的语法,很简单几个,但是它们却能满足您批量文本处理的要求。如能活用,那更是其乐无穷,让你体会到电脑给工作带来的魅力。

小知识: 正则表达式英文REGULAR EXPRESSIONS,其精髓就是两个字――“统配”。在文本编辑软件中用途之广,“变体”之多,都足以证明其地位。现在的ULTRAEDIT版本中除 了传统的正则表达式和UNIX风格的正则表达式以外还加入了与PERL兼容的正则表达式语法,可以说使ULTRAEDIT更加完美。

 

 

昨天,小拇指有些酸痛,因为Ctrl+C,Ctrl+V的操作频繁了些。今天用UltraEdit的正则表达式,减少了麻烦。

   包含很多关键词的文本文档,每个关键词占一行。现在要查看这些词的百度搜索结果。

用UltraEdit打开文本文档,Ctrl+R,弹出“替换”窗口,“查找内容”中输入“%^(*^)$”(不包含双引号),“替换为”输入“<A href="http://www.baidu.com/s?wd=^1" target=_blank>^1</A>^p”,保存,然后把文本文档的后缀名改为“html”,打开。OK,现在直接点击即弹出百度搜索结果。

 

  UltraEdit的正则表达式功能很有用,转贴两篇文章:

 在UltraEdit中使用正则表达式

删除空行:  替换 %[ ^t]++^p 为  空串 

删除行尾空格: 替换 [ ^t]+$ 为  空串 

删除行首空格: 替换 %[ ^t]+ 为  空串 

每行设置为固定的4个空格开头: 替换 %[ ^t]++^([~ ^t^p]^) 为 "    ^1" 

每段设置为固定的4个空格开头: 替换 %[ ^t]+ 为 "    " 

(如果一行是以空格开始的,则视之为一段的开始行) 

将一段合并为一行: 替换 [ ^t]++^p^([~ ^t^p]^) 为 ^1 

(注意: 此处假定文本是以DOS方式回车换行 -  CR/LF) 

去掉HTML TAG:  替换 ^{<*>^}^{<*^p*>^} 为 空串 

删除HTML中的所有<A>: 替换 <[ ]++a *[ ]++href[ ]++=*> 为 空串 

删除文本中指定的前2列字符: 替换 %?? 为  空串 

在第4列后插入2列空白字符: 替换 %^(????^)^(?^) 为 "^1  ^2" 

查找所有的数字: [0-9]+[.]++[0-9]+ 

查找所有的单词: [a-z]+ 

查找所有的网址: http://[a-z0-9^~`_./^-^?=&]+

 

简单实用的UltraEdit的正则表达式手册

UltraEdit 允许在搜索菜单下面列出了的许多搜索和替换功能中使用正则表达式。正则表达式能让更多的复杂的搜索和替换功能变成简单的操作。(中文版界面上显示为“正规表达式”)

有两个可使用的语法集合。下面的第一表显示出在 UltraEdit 的更早的版本被使用的原来的 UltraEdit 句法。第二表给出了可选的"Unix"类型的正则表达式。这可以从配置单元启用。

符号  功能

%     匹配行的开始 - 显示搜索字符串必须在行的开始,但是在所选择的结果字符串中不包括任何行终止字符。

$     匹配行尾 - 显示搜索字符串必须在行尾,但是在所选择的结果字符串中不包括任何行终止字符。

?     除了换行符以外匹配任何单个的字符

*     除了换行符匹配任何数量的字符和数字

+     前一字符匹配一个或多个,但至少要出现一个

++    前一字符匹配零个或多个,但至少要出现一个

^b    匹配一个分页

^p    匹配一个换行符(CR/LF)(段)(DOS文件)

^r    匹配一个换行符(CR 仅仅)(段)(MAC 文件)

^n    匹配一个换行符 ( LF 仅仅 )( 段 )( UNIX 文件 )

^t    匹配一个标签字符TAB 

[]    匹配任何单个的字符,或在方括号中的范围

^{A^}^{ B^} 匹配表达式A或 B 

^     重载其后的正规表达式字符 

^(^)  括或标注为用于替换命令的表达式。

一个正则表达式最多可以有9个标注表达式, 按正规表达式的需要而定。 

相应的替换表达式是 ^x , 替换范围x是1-9。例如:

If ^(h*o^) ^(f*s^) matches "hello folks", 

^2 ^1 would replace it with "folks hello".

(hello folks 将被替换成 folks hello。)

注: ^ 是实际字符 ^不是Ctl + 键值。

 

你可能感兴趣的:(正则表达式,ultraEdit)