正则表达式:是通过一些特殊字符的排列,用以搜索/替换/删除一行或多行字符串。简而言之i正则表达式是用在字符串处理中的“表示式”
正则表达式对于系统管理员来说很重要,系统管理员可以通过正则表达式的功能将重要的信息选出来,产生便于查看的报表,简化管理流程。
基础正则表达式
grep: 全面搜索正则表达式并显示
grep(最常用), egrep (prep -E = egrep) (扩展grep), fgrep
用法:grep [options] 'PATTERN(模式)'或"" file...
参数:
-i 不区别大小写
-v 跟默认的动作正好相反
-n 显示匹配的行在文中所处的位置
-A n(数字
) 显示后几行
-B n 前几行
-C n 前后几行
--color 高亮显示匹配字符串
模式
:: 由正则表达式组成
^ 脱字符行首定位符
$ 行尾匹配符加在字符串后
. 匹配任意单个字符
* 次数匹配前字符可出现
0次或任意次 ? 0或1次
[] 匹配一组字符中任意一个
\ 转意原字符
\< 词首定位符
\> 词尾定位符字符串后
x\{m,n\)x最少
m,最多n {m\}-x精确n次
{m,\}至少一次
\(...\)匹配稍后将要使用的字符的标签
例: \(love\)able\1able 匹配的是loveableloveable字符串
例: \(love\)able\1able 匹配的是loveableloveable字符串
扩展的正则表达式
egrep
新增的元字符
(元字符是一个或一组代替个或多个字符的字符 例
: *?[] re)
1. + 匹配一个或多个加号前的字符 eg:‘[a-z]+ove'匹配一个或多个小写
字母后跟ove的字符串
2. ? 匹配另个或一个前导字符,即它前面的那个字符可有可无
3. a|b 匹配a或b eg :’love|hate‘ 匹配love或hate
1. + 匹配一个或多个加号前的字符 eg:‘[a-z]+ove'匹配一个或多个小写
字母后跟ove的字符串
2. ? 匹配另个或一个前导字符,即它前面的那个字符可有可无
3. a|b 匹配a或b eg :’love|hate‘ 匹配love或hate
4.() 字符组
eg:love(able|ly)匹配loveable或lovely
Sed可以分析标准输入(STDIN)的数据,然后将数据经过处理后,再将它输出到标准输出(STDOUT)。它有替换、删除、新增、选取特定等处理功能。
sed简介 : stream editor, 即行编辑器
sed的用法
一般命令格式:
sed [OPTION] /PATTERN(模式)/COMMAND files
sed [OPTION] ADDR1(地址1),ADDR2(地址2)/COMMAND files
<
a\
在当前行后面加入一行文本。
一般命令格式:
sed [OPTION] /PATTERN(模式)/COMMAND files
sed [OPTION] ADDR1(地址1),ADDR2(地址2)/COMMAND files
<
a\
在当前行后面加入一行文本。
b lable
分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
c\
用新的文本改变本行的文本。
用新的文本改变本行的文本。
d
从模板块(Pattern space)位置删除行。
从模板块(Pattern space)位置删除行。
D
删除模板块的第一行。
删除模板块的第一行。
i\
在当前行上面插入文本。
在当前行上面插入文本。
h
拷贝模板块的内容到内存中的缓冲区。
拷贝模板块的内容到内存中的缓冲区。
H
追加模板块的内容到内存中的缓冲区
追加模板块的内容到内存中的缓冲区
g
获得内存缓冲区的内容,并替代当前模板块中的文本。
获得内存缓冲区的内容,并替代当前模板块中的文本。
G
获得内存缓冲区的内容,并追加到当前模板块文本的后面。
获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l
列表不能打印字符的清单。
列表不能打印字符的清单。
n
读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N
追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p
打印模板块的行。
打印模板块的行。
P(大写)
打印模板块的第一行。
打印模板块的第一行。
q
退出Sed。
退出Sed。
r file
从file中读行。
从file中读行。
t label
if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label
错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
w file
写并追加模板块到file末尾。
写并追加模板块到file末尾。
W file
写并追加模板块的第一行到file末尾。
写并追加模板块的第一行到file末尾。
!
表示后面的命令对所有没有被选定的行发生作用。
表示后面的命令对所有没有被选定的行发生作用。
s/re/string
用string替换正则表达式re。
用string替换正则表达式re。
=
打印当前行号码。
打印当前行号码。
#
把注释扩展到下一个换行符以前。
把注释扩展到下一个换行符以前。
以下的是替换标记
g表示行内全面替换。
p表示打印行。
w表示把行写入一个文件。
x表示互换模板块中的文本和缓冲区中的文本。
y表示把一个字符翻译为另外的字符(但是不用于正则表达式)
4. 选项
<
-e command, --expression=command
允许多台编辑。
-h, --help
打印帮助,并显示bug列表的地址。
打印帮助,并显示bug列表的地址。
-n, --quiet, --silent
取消默认输出。
取消默认输出。
-f, --filer=script-file
引导sed脚本文件名。
引导sed脚本文件名。
-V, --version
打印版本和版权信息。
打印版本和版权信息。
5. 元字符集
<
^
锚定行的开始 如:/^sed/匹配所有以sed开头的行。
$
锚定行的结束 如:/sed$/匹配所有以sed结尾的行。
锚定行的结束 如:/sed$/匹配所有以sed结尾的行。
.
匹配一个非换行符的字符 如:/s.d/匹配s后接一个任意字符,然后是d。
匹配一个非换行符的字符 如:/s.d/匹配s后接一个任意字符,然后是d。
*
匹配零或多个字符 如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。
匹配零或多个字符 如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。
[]
匹配一个指定范围内的字符,如/[Ss]ed/匹配sed和Sed。
匹配一个指定范围内的字符,如/[Ss]ed/匹配sed和Sed。
[^]
匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。
匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。
\(..\)
保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。
保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。
&
保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。
保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。
\<
锚定单词的开始,如:/\
锚定单词的开始,如:/\
\>
锚定单词的结束,如/love\>/匹配包含以love结尾的单词的行。
锚定单词的结束,如/love\>/匹配包含以love结尾的单词的行。
x\{m\}
重复字符x,m次,如:/0\{5\}/匹配包含5个o的行。
重复字符x,m次,如:/0\{5\}/匹配包含5个o的行。
x\{m,\}
重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的行。
重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的行。
x\{m,n\}
重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的行。
重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的行。