LINUX sed命令的使用

LINUX sed命令的使用

  • 命令格式
sed [options] 'command' file(s) 
sed [options] -f scriptfile file(s)
  • sed常用命令
a\ 在当前⾏下⾯插⼊⽂本。 
i\ 在当前⾏上⾯插⼊⽂本。 
c\ 把选定的⾏改为新的⽂本。 
d 删除,删除选择的⾏。 
D 删除模板块的第⼀⾏。 
s 替换指定字符  
l 列表不能打印字符的清单。 
n 读取下⼀个输⼊⾏,⽤下⼀个命令处理新的⾏⽽不是⽤第⼀个命令。 
N 追加下⼀个输⼊⾏到模板块后⾯并在⼆者间嵌⼊⼀个新⾏,改变当前⾏号码。 
p 打印模板块的⾏。 
P(⼤写) 打印模板块的第⼀⾏。 
q 退出Sed。  
w file 写并追加模板块到file末尾。   
W file 写并追加模板块的第⼀⾏到file末尾。   
  • sed替换标记
g 表⽰⾏内全⾯替换。   
p 表⽰打印⾏。   
w 表⽰把⾏写⼊⼀个⽂件。   
x 表⽰互换模板块中的⽂本和缓冲区中的⽂本。   
y 表⽰把⼀个字符翻译为另外的字符(但是不⽤于正则表达式) 
\1 ⼦串匹配标记 
& 已匹配字符串标记
  • sed元字符集
^ 匹配⾏开始,如:/^sed/匹配所有以sed开头的⾏。 
$ 匹配⾏结束,如:/sed$/匹配所有以sed结尾的⾏。 
. 匹配⼀个⾮换⾏符的任意字符,如:/s.d/匹配s后接⼀个任意字符,最后是d。 
* 匹配0个或多个字符,如:/*sed/匹配所有模板是0个或多个空格后紧跟sed的⾏。 
[] 匹配⼀个指定范围内的字符,如/[sS]ed/匹配sed和Sed。   

[^] 匹配⼀个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的⼀个字⺟开头,紧跟ed的⾏。 

\(..\) 匹配⼦串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。

& 保存搜索字符⽤来替换其他字符,如s/love/**&**/,love这成**love**。 
\< 匹配单词的开始,如:/\ 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的⾏。 
x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的⾏。 
x\{m,\} 重复字符x,⾄少m次,如:/0\{5,\}/匹配⾄少有5个0的⾏。 
x\{m,n\} 重复字符x,⾄少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的⾏。
  • 已匹配字符串标记&
正则表达式 \w\+ 匹配每⼀个单词,使⽤ [&] 替换它,& 对应于之前所匹配到的单词:
echo this is a test line | sed 's/\w\+/[&]/g' 
[this] [is] [a] [test] [line]
所有以192.168.0.1开头的⾏都会被替换成它⾃已加localhost:
sed 's/^192.168.0.1/&localhost/' file 
192.168.0.1localhost
  • ⼦串匹配标记\1
匹配给定样式的其中⼀部分:
echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/' 
this is 7 in a number
命令中 digit 7,被替换成了 7。样式匹配到的⼦串是 7,\(..\) ⽤于匹配⼦串,对于匹配到的第⼀个⼦串就标记为 \1,依此类
推匹配到的第⼆个结果就是 \2,例如:
echo aaa BBB | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/' 
BBB aaa
  • 选定⾏的范围:,(逗号)
所有在模板test和check所确定的范围内的⾏都被打印:
sed -n '/test/,/check/p' file
打印从第5⾏开始到第⼀个包含以test开始的⾏之间的所有⾏:
sed -n '5,/^test/p' file
对于模板test和west之间的⾏,每⾏的末尾⽤字符串aaa bbb替换:
sed '/test/,/west/s/$/aaa bbb/' file
  • 多点编辑:e命令
-e选项允许在同⼀⾏⾥执⾏多条命令:
sed -e '1,5d' -e 's/test/check/' file
上⾯sed表达式的第⼀条命令删除1⾄5⾏,第⼆条命令⽤check替换test。命令的执⾏顺序对结果有影响。如果两个命令都是替换
命令,那么第⼀个替换命令将影响第⼆个替换命令的结果。
和 -e 等价的命令是 --expression:
sed --expression='s/test/check/' --expression='/love/d' file
  • 示例
>gi|1002620271|ref|NC_029525.1| Coturnix japonica isolate 7356 chromosome 10, Coturnix japonica 2.0, whole genome shotgun sequence
TACTCCCCAAGAA
通过sed命令,将其更改为
>NC_029525.1
TACTCCCCAAGAA
命令如下:
sed 's/^[^ ]*[|]\([^|]*\)[|].*$/>\1/' original.fasta > updated.fasta
命令拆解:
该命令通过贪婪匹配匹配倒数第二个|,为了保险采用[|],[|]限定匹配内容,最后\1调用匹配行的子串
贪婪匹配符:"." "+" "*"
非贪婪匹配:"?"

http://man.linuxde.net/sed

你可能感兴趣的:(LINUX sed命令的使用)