sed命令详解(上)

本文编辑整理自: http://apps.hi.baidu.com/share/detail/35034009
一、简介
sed是一种在线编辑器,它一次处理一行内容。处理时sed会把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用命令脚本处理缓冲区中的内容,处理完成后把缓冲区的内容输出到屏幕,继续处理下一行,这样不断重复直到文件末尾。这一过程中文件内容并没有改变,除非你使用重定向存储输出,或者使用GNU sed命令的 -i 选项(PS:即inline edit,行内编辑)。
本文介绍的是Gnu版本的 Sed 4.2.1
二、语法
Usage:  sed [OPTION]... {script-only-if-no-other-script} [input-file]...
  -n, --quiet, --silent
                 suppress automatic printing of pattern space
    -e script, --expression=script
                 add the script to the commands to be executed
   -f script-file, --file=script-file
                 add the contents of script-file to the commands to be executed
   --follow-symlinks
                 follow symlinks when processing in place
   -i[SUFFIX], --in-place[=SUFFIX]
                 edit files in place (makes backup if extension supplied)
   -l N, --line-length=N
                 specify the desired line-wrap length for the `l' command
   --posix
                 disable all GNU extensions.
   -r, --regexp-extended
                 use extended regular expressions in the script.
   -s, --separate
                 consider files as separate rather than as a single continuous
                 long stream.
  -u, --unbuffered
                 load minimal amounts of data from the input files and flush
                 the output buffers more often
       --help      display this help and exit
       --version   output version information and exit

If no  -e,   --expression -f , or --file option is given, then the first
non-option argument is taken as the sed script to interpret.  All
remaining arguments are names of input files; if no input files are
specified, then the standard input is read.
选项-n
该选项等同于--quiet和--silent选项。该选项就让sed用命令脚本处理缓冲区中的内容后,默认设置不把缓冲区的内容输出到屏幕。
选项-e
该选项用于指定一条要执行的 sed命令脚本 。如果我们不使用该选项的话,就只能执行一条 sed命令脚本 -e script 等同于 --expression=script
选项-f
该选项用于指定一个要执行的 sed命令脚本文件
选项--help
打印sed的帮助信息
选项--version
打印当前sed的版本号
三、命令脚本
sed 一次处理一行内容。处理时 sed 会把当前处理的行存储在临时缓冲区中,接着用命令脚本处理缓冲区中的内容,处理完成后把缓冲区的内容输出到屏幕,继续处理下一行,这样不断重复直到文件末尾。 命令脚本 包括 命令 命令参数 替换标记 元字符集 。命令和命令参数直接用" / "进行分割,同时命令参数之间也用" / "进行分割。
3.1、确定编辑范围
默认情况下, sed 会对文件所有的行都进行处理,但是我们可以在 命令脚本 中指定要处理的 行的范围 。可以直接通过行号来指定你要编辑的行的范围 ; 逗号分隔 的两个行号表示以这两行为起止的行的范围(包括行数表示的那两行)。如 1,3 表示 1,2,3 行, 美元符号($)表示最后一行 。另外,还可以通过 元字符集 正则表达式 或者二者结合的方式确定要编辑的行的范围 。
3.2、基本命令
如果基本命令不是在命令脚本之首的话,需要在其前面加上“/”以表明其是命令。
a\         在当前行后面加入一行文本。
b lable    分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
c\         用新的文本改变本行的文本。
        从模板块(Pattern space)位置删除行。
D          删除模板块的第一行。
i\         在当前行上面插入文本。
h          拷贝模板块的内容到内存中的缓冲区。
H          追加模板块的内容到内存中的缓冲区
g          获得内存缓冲区的内容,并替代当前模板块中的文本。
G          获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l          列表不能打印字符的清单。
n          读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N          追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p          打印模板块的行。
P          打印模板块的第一行。
q           退出Sed。
r file          从file中读行。
w file         写并追加模板块到file末尾。
W file        写并追加模板块的第一行到file末尾。
t label        if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label      错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
!                      表示后面的命令对所有没有被选定的行发生作用。
s/re/string        用string替换正则表达式re。
=                      打印当前行号码。
                     把注释扩展到下一个换行符以前。
3.3、替换标记
以下的是替换标记:
g             表示行内全面替换。默认的是只替换第一个。
p             表示打印行。
           表示把行写入一个文件。
x             表示互换模板块中的文本和缓冲区中的文本。
y             表示把一个字符翻译为另外的字符(但是不用于正则表达式)
3.4、元字符集
元字符集主要用于行匹配和字符匹配。
^             锚定行的开始 如:/^sed/表示所有以sed开头的 。 
$           锚定行的结束 如:/sed$/匹配所有以sed结尾的 。 
          匹配一个非换行符的字符 如:/s.d/表示s后接一个任意字符(非换行符),然后是d。 
*            匹配零或多个字符 如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。 
[]           匹配一个指定范围内的字符,如/[Ss]ed/匹配sed和Sed。 
[^]          匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的 。 
\(..\)       保存匹配的字符,如s/ \(love\) able/ \1 rs, loveable 被替换成 lovers 。 
&           保存搜索字符用来替换其他字符,如s/love/**&**/,love被替换成**love**。 
\<          锚定单词的开始,如:/\<love/匹配包含以love开头的单词的 。 
\>          锚定单词的结束,如/love\>/匹配包含以love结尾的单词的 。 
x\{m\}     重复字符x,m次,如:/0\{5\}/匹配包含5个o的 。 
x\{m,\}    重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的 。 
x\{m,n\}   重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的

你可能感兴趣的:(正则表达式,File,脚本,input,extension,printing)