本文编辑整理自: http://apps.hi.baidu.com/share/detail/35034009
一、简介
sed是一种在线编辑器,它一次处理一行内容。处理时sed会把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用命令脚本处理缓冲区中的内容,处理完成后把缓冲区的内容输出到屏幕,继续处理下一行,这样不断重复直到文件末尾。这一过程中文件内容并没有改变,除非你使用重定向存储输出,或者使用GNU sed命令的 -i 选项(PS:即inline edit,行内编辑)。
本文介绍的是Gnu版本的
Sed 4.2.1
。
二、语法
Usage:
sed [OPTION]... {script-only-if-no-other-script} [input-file]...
-n, --quiet, --silent
suppress automatic printing of pattern space
-e script, --expression=script
add the script to the commands to be executed
-f script-file, --file=script-file
add the contents of script-file to the commands to be executed
--follow-symlinks
follow symlinks when processing in place
-i[SUFFIX], --in-place[=SUFFIX]
edit files in place (makes backup if extension supplied)
-l N, --line-length=N
specify the desired line-wrap length for the `l' command
--posix
disable all GNU extensions.
-r, --regexp-extended
use extended regular expressions in the script.
-s, --separate
consider files as separate rather than as a single continuous
long stream.
-u, --unbuffered
load minimal amounts of data from the input files and flush
the output buffers more often
--help
display this help and exit
--version
output version information and exit
If no
-e,
--expression
,
-f
, or --file option is given, then the first
non-option argument is taken as the sed script to interpret. All
remaining arguments are names of input files; if no input files are
specified, then the standard input is read.
选项-n
该选项等同于--quiet和--silent选项。该选项就让sed用命令脚本处理缓冲区中的内容后,默认设置不把缓冲区的内容输出到屏幕。
选项-e
该选项用于指定一条要执行的
sed命令脚本
。如果我们不使用该选项的话,就只能执行一条
sed命令脚本
。
-e script
等同于
--expression=script
选项-f
该选项用于指定一个要执行的
sed命令脚本文件
选项--help
打印sed的帮助信息
选项--version
打印当前sed的版本号
三、命令脚本
sed
一次处理一行内容。处理时
sed
会把当前处理的行存储在临时缓冲区中,接着用命令脚本处理缓冲区中的内容,处理完成后把缓冲区的内容输出到屏幕,继续处理下一行,这样不断重复直到文件末尾。
命令脚本
包括
命令
,
命令参数
,
替换标记
,
元字符集
。命令和命令参数直接用"
/
"进行分割,同时命令参数之间也用"
/
"进行分割。
3.1、确定编辑范围
默认情况下,
sed
会对文件所有的行都进行处理,但是我们可以在
命令脚本
中指定要处理的
行的范围
。可以直接通过行号来指定你要编辑的行的范围
;
用
逗号分隔
的两个行号表示以这两行为起止的行的范围(包括行数表示的那两行)。如
1,3
表示
1,2,3
行,
美元符号($)表示最后一行
。另外,还可以通过
元字符集
,
正则表达式
或者二者结合的方式确定要编辑的行的范围 。
3.2、基本命令
如果基本命令不是在命令脚本之首的话,需要在其前面加上“/”以表明其是命令。
a\
在当前行后面加入一行文本。
b lable
分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
c\
用新的文本改变本行的文本。
d
从模板块(Pattern space)位置删除行。
D
删除模板块的第一行。
i\
在当前行上面插入文本。
h
拷贝模板块的内容到内存中的缓冲区。
H
追加模板块的内容到内存中的缓冲区
g
获得内存缓冲区的内容,并替代当前模板块中的文本。
G
获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l
列表不能打印字符的清单。
n
读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N
追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p
打印模板块的行。
P
打印模板块的第一行。
q
退出Sed。
r file
从file中读行。
w file
写并追加模板块到file末尾。
W file
写并追加模板块的第一行到file末尾。
t label
if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label
错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
!
表示后面的命令对所有没有被选定的行发生作用。
s/re/string
用string替换正则表达式re。
=
打印当前行号码。
#
把注释扩展到下一个换行符以前。
3.3、替换标记
以下的是替换标记:
g
表示行内全面替换。默认的是只替换第一个。
p
表示打印行。
w
表示把行写入一个文件。
x
表示互换模板块中的文本和缓冲区中的文本。
y
表示把一个字符翻译为另外的字符(但是不用于正则表达式)
3.4、元字符集
元字符集主要用于行匹配和字符匹配。
^
锚定行的开始 如:/^sed/表示所有以sed开头的
行
。
$
锚定行的结束 如:/sed$/匹配所有以sed结尾的
行
。
.
匹配一个非换行符的字符 如:/s.d/表示s后接一个任意字符(非换行符),然后是d。
*
匹配零或多个字符 如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。
[]
匹配一个指定范围内的字符,如/[Ss]ed/匹配sed和Sed。
[^]
匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的
行
。
\(..\)
保存匹配的字符,如s/
\(love\)
able/
\1
rs,
loveable
被替换成
lovers
。
&
保存搜索字符用来替换其他字符,如s/love/**&**/,love被替换成**love**。
\<
锚定单词的开始,如:/\<love/匹配包含以love开头的单词的
行
。
\>
锚定单词的结束,如/love\>/匹配包含以love结尾的单词的
行
。
x\{m\}
重复字符x,m次,如:/0\{5\}/匹配包含5个o的
行
。
x\{m,\}
重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的
行
。
x\{m,n\}
重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的
行
。