sed命令是一个很强大的文本编辑器,可以对来自文件、以及标准输入的文本进行编辑。
执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。
所以sed命令处理时只会改变缓冲区中文本的副本,如果想要直接编辑原文件,可以使用-i选项或者将结果重定向到新的文件中。
sed命令的基本语法如下:
sed [options] commands [inputfile...]
options表示sed命令的一些选项,常见的选项如下表:
选项名 | 作用 |
---|---|
-n | 取消默认输出 |
-e | 多点编辑,可以执行多个子命令 |
-f | 从脚本文件中读取命令(sed操作可以事先写入脚本,然后通过-f读取并执行) |
-i | 直接编辑原文件 |
-l | 指定行的长度 |
-r | 在脚本中使用扩展表达式 |
[root@www ~]# sed [-nefr] [动作]
选项与参数:
-n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e :直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
-r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
-i :直接修改读取的文件内容,而不是输出到终端。
动作说明: [n1[,n2]]function
n1, n2 :不见得会存在,一般代表『选择进行动作的行数』,举例来说,如果我的动作是需要在 10 到 20 行之间进行的,则『 10,20[动作行为] 』
function:
a :新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d :删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i :插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
s :取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示法!例如 1,20s/old/new/g 就是啦!
sed命令比较适用于大的文本文件,用普通文本编辑器难以胜任的情况。下面分别介绍直接打印、插入、删除、替换等编辑操作。
实验用文件内容
#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566
(1)行打印,输出缓冲区内容,使用sed的p子命令
sed '1,3 p' test1.txt
echo "====================="
sed -n '1,3 p' test1.txt
#输出结果
letitia
letitia
mail
mail
uuencode
uuencode
1003605091
01566
=====================
letitia
mail
uuencode
p子命令代表print,可以打印出sed缓冲区内的内容。
sed命令中,直接采用数字代表某个特定的文本行:'1 p'
代表打印第一行;'1,3 p'
代表打印1到3行;特别的,最后一行的行号为$。
观察输出结果,不使用-n选项时,sed命令把1到3行输出了两次。这是因为不使用-n时,sed首先读取一行,并默认将缓冲区内的文本输出出来,之后p子命令再次输出。使用-n时,默认输出取消,只有p子命令的输出结果。
sed -n '/^ma/,5 p' test1.txt
#输出结果
mail
uuencode
1003605091
01566
sed命令支持正则表达式定位。语法为/re/
,re表示正则表达式。
本例表示打印出从匹配正则表达式的地方到第5行,也就是从匹配以ma开头的文本行处开始。
sed -n '1~2 p' test1.txt
#输出结果
letitia
uuencode
01566
1~2
表示从第一行开始,行号递增2输出,即输出奇数行。语法格式为first~step
。
(2)插入文本行,追加文本行
这两种情况很类似。插入文本使用i子命令
,表示在指定位置前面插入文本;追加文本使用a子命令
,表示在指定位置之后插入文本。观察一下两个的区别:
sed -n -e '2 i insert' -e '1,4 p' test1.txt
#-e选项表示多个子命令,本例执行i子命令之后执行了p子命令
#输出结果
letitia
insert
mail
uuencode
1003605091
sed -n -e '2 a insert' -e '1,4 p' test1.txt
#输出结果
letitia
mail
insert
uuencode
1003605091
(3)删除文本行,使用d子命令
sed -n -e '2 d' -e '1,$ p' test1.txt
#输出结果
letitia
uuencode
1003605091
01566
(4)替换文本行,使用c子命令
sed -n -e '2 c newmail' -e '1,$ p' test1.txt
#输出结果
letitia
newmail
uuencode
1003605091
01566
【注】以上均未使用-i选项,所以更改的只是副本。
(5)替换指定文本,使用s子命令
这一个命令实用性很广,并且灵活。语法也比之上面特别一些:
sed '位置参数 s/pattern/replaced/[flag]'
pattern为要替换的文本,支持正则表达式,replaced表示用来替换的一般字符串(不支持正则表达式)。
flag是替换标志,用来影响匹配替换的规则:
flag | 用法 |
---|---|
g | 全局匹配,会替换文本行中所有匹配的字符串 |
十进制n | 替换文本行中第n个匹配的字符串 |
p | 替换第一个匹配的字符串,并且将缓冲区输出到标准输出 |
w | 替换第一个匹配的字符串,并且将改动的行输出到磁盘文件中 |
缺省 | 替换第一个匹配的字符串 |
sed -n -e 's/[0-9]\{10\}/miss letitia/g' -e '1,$ p' test1.txt
#{}要转义,因为此处使用的不是扩展正则表达式
#输出结果
letitia
mail
uuencode
miss letitia
01566
sed -n -e '1,/^ma/ s/l/L/g' -e '1,$ p' test1.txt
#输出结果
Letitia
maiL
uuencode
miss letitia
01566
#可以看到,本例将前两行里的l替换为L。
sed -n '1,3{
s/l/L/g
s/e/E/g
2 i tyrone
p
}' test1.txt
#输出结果
LEtitia
tyrone
maiL
uuEncodE
最后这个例子比较复杂。使用大括号,表示对1到3行做了一组操作。
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
#将grep的结果作为输入,注意要用反引号括起来,将括号内部分解释为linux命令
作者:tyrone_li
链接:https://www.jianshu.com/p/89163e927a2c
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。