转自:http://www.west263.com/info/html/wangzhanyunying/jianzhanjingyan/20080417/69181.html
vi 中的正则表达式 (Regular Expression)
===================================
.1. 定义和例子
============
正则表达式只是个字符模板,用来在搜索中匹配相同的字符.
在大多数的程式中,正则表达式是括在正斜杠中间的.
例如, /love/就是个以正斜杠为分隔符的正则表达式,其中的
模板love 将用在搜索任何行中和他匹配的字符. 更为有趣的是
正则表达式能够被特别的元字符控制.让我们通过下面的例子来进
一步了解这个概念.
有文本如下:
Hi tom,
I think I failed my anatomy test yesterday. I
had a terrible stomach ache. I ate too many
fried green tomatoes.
Anyway, Tom, Ineed your help. I'd like to make
the test up tomorrow, but don't know where to
begin studying. Do you think you could help me?
After work, about 7 PM, come to my place and I'll
treat you to pizza in return for your help.
Thanks.
Your pal,
guy@phantom
假设您发觉Tom 并没有参加考试,而是David 参加的考试.同时还
发现, 在贺信中Tom的T用的是小写.于是您决定做一个全文替换,把tom
替换为Tom.
在vi命令行模式下输入:
:1, $s/tom/David/g
^ ^ ^ ^ ^
| | | | |---- global 对全文有效
| | | |
| | |--------- 将tom 替换为 David , 使用正则表达式.
| |------- 替换单词
|------ 从文档的第一行到文档的最后一行.
替换后的文本如下:
Hi David,
I think I failed my anaDavidy test yesterday, I
had terible sDavidach ache. I ate too many
fried green Davidatoes.
Anyway, David, I need your help. I'd like to make
the test up Davidorrow, but don't know where to
begin studying. Do you think you could help me?
After work, about ? PM, come to my place and
I'll treat you to pizza in return for your help.
Thanks.
Your pal,
guy@phanDavid
我们发现有些单词中含有tom的的也被替换了.
这是因为我们没有使用正则表达式的元字符来界定一个模板从而控制
字符的替换动作.
使用:
:1, $s/\<[Tt]om\>/David/g
就能够得到我们想要的结果了,即只替换单词tom而不是含有tom字符的
单词.
.2. 正则表达式的元字符
==================
正则表达式的元字符是一些特别的字符,他们允许您以某种方式界定一个
模板来控制什么样的替换将发生.有的元字符锚定一个单词在行首或行尾.
有的元字符允许您指定一个字符范围或一些字符, 来找到大写字母, 小写字母
数字或非数字等.
有两套正则表达式字符集, 一套是基本元字符集, 另一套是扩展元字符集.
另外, POSIX (Portable Operating System Interface for Computer Environment)
标准还提供了一套元字符集.下表提供了能够在任何版本的vi, grep, egrep, sed and gawk
中使用的基本元字符集.
表:
----------------------------------------------------------------------------------------------
元字符 | 功能 | 例子 | 匹配什么
----------------------------------------------------------------------------------------------
^ | 锚定行的开始 | /^love/ | 匹配任何以love开头的行.
----------------------------------------------------------------------------------------------
$ | 锚定行的结束 | /love$/ | 匹配任何以love结束的行.
----------------------------------------------------------------------------------------------
. | 匹配一个字符 | /l..e/ | 匹配这样的行, 这些行包含这样的字符,
| | |第一个字符是 l,紧跟着两个字符,然后是e.
-----------------------------------------------------------------------------------------------
* | 代表0个或多个先前字符 | /*love/ | 匹配这样的行, 有0个或多个空格,空格
| | |候跟着love
-----------------------------------------------------------------------------------------------
[] | 匹配字符组中的一个字符 | /[lL]ove/ | 匹配任何包含love or Love 的行
-----------------------------------------------------------------------------------------------
[x-y] | 匹配以字符范围组成的组中的一个字符 | /[A-Z]ove | 匹配任何这样的行, 这些行包含如下字符
| | |第一个字符是从A到Z 中间的一个, 后面跟
| | |着ove
-----------------------------------------------------------------------------------------------
[^] | 匹配一个不在范围内的字符 | /[^A-Z]ove/ | 匹配任何这样的行, 这些行包含如下字符
| | |第一个字符不是从A到Z 中间的一个, 后面
| | |跟着ove
-----------------------------------------------------------------------------------------------
\ | 用来转义一个字符 | /love\./ | 匹配任何这样的行, 这些行包含如下字符
| | |love 后面跟着一个点, 通常点是表示任何
| | |字符的通配符.
-----------------------------------------------------------------------------------------------
\< | 锚定单词的开始 | /\<love/ | 匹配任何这样的行, 这些行包含以love
| | |开头的单词 (vi & grep 都支持这个功能)
-----------------------------------------------------------------------------------------------
\> | 锚定单词的结束 | /<love\> | ... ^ ... 以love结束的单词 ... ^
-----------------------------------------------------------------------------------------------
\(..\) | 标记后面用到的匹配字符 | /\(love\)a\1b | 最多能够使用9个标签. 第一个标签是模板
| | |最左边的部分. 在这例子中, 模板love
| | |保存为标签1, 后面的\1指的就是love;
| | |本例子搜索的是这样的行, 这些行包含这样
| | |的字符,在lovea 后面跟着loveb.
------------------------------------------------------------------------------------------------
[NOTE: 各种版本的Unix 连同模板匹配 (pattern-matching) 实用程式并不都是可信赖的, 通常我们使用 vi & grep]
假设您熟悉 vi 是怎样工作的, 每一个元字符都在 vi 搜索字符串的术语中有周详描述.
下面的例子中, 被加重的字符就是 vi 将找到的匹配字符.
文本如下:
I had a lovely time on our little picnic.
Lovers were all around us. It is springtime. Oh
Love, how much I adore you. Do you know
the extent of my love? Oh, by the way, I think
I lost my gloves somewhere out in that field of
clover. Did you see them? I can only hope love
is forever. I live for you. It's hard to get back
in the groove.
~
~
~
/love/
结果如下:
I had a lovely time on our little picnic.
^
Lovers were all around us. It is springtime. Oh
^
Love, how much I adore you. Do you know
^
the extent of my love? Oh, by the way, I think
^
I lost my gloves somewhere out in that field of
^
clover. Did you see them? I can only hope love
^ ^
is forever. I live for you. It's hard to get back
in the groove.
//
更有一些测试命令如下:
/^love/
/love$/
/l.ve/
/[lL]ove/
/ove[a-z]/
/ove[^a-zA-Z0-9]/