Linux文本处理三剑客之--- sed的使用教程

sed

3.1 认识sed

sed 是一种流编辑器,它一次处理一内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(patternspace ),接着用sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如‘D’ 的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出或-i

功能:主要用来自动编辑一个或多个文件, 简化对文件的反复操作

3.2 使用sed

3.2.1 命令格式

sed [options] '[地址定界] command' file``(s)

3.2.2 常用选项options

  • -n:不输出模式空间内容到屏幕,即不自动打印,只打印匹配到的行
  • -e:多点编辑,对每行处理时,可以有多个Script
  • -f:把Script写到文件当中,在执行sed时-f 指定文件路径,如果是多个Script,换行写
  • -r:支持扩展的正则表达式
  • -i:直接将处理的结果写入文件
  • -i.bak:在将处理的结果写入文件之前备份一份

3.2.3 地址定界

  • 不给地址:对全文进行处理
  • 单地址:
    • #: 指定的行
    • /pattern/:被此处模式所能够匹配到的每一行
  • 地址范围:
    • #,#
    • #,+#
    • /pat1/,/pat2/
    • #,/pat1/
  • ~:步进
    • sed -n '1~2p' 只打印奇数行 (1~2 从第1行,一次加2行)
    • sed -n '2~2p' 只打印偶数行

3.2.4 编辑命令command

  • d:删除模式空间匹配的行,并立即启用下一轮循环
  • p:打印当前模式空间内容,追加到默认输出之后
  • a:在指定行后面追加文本,支持使用\n实现多行追加
  • i:在行前面插入文本,支持使用\n实现多行追加
  • c替换行为单行或多行文本,支持使用\n实现多行追加
  • w:保存模式匹配的行至指定文件
  • r:读取指定文件的文本至模式空间中匹配到的行后
  • =:为模式空间中的行打印行号
  • !:模式空间中匹配行取反处理
  • s///查找替换,支持使用其它分隔符,如:s@@@,s###;
    • 加g表示行内全局替换;
    • 在替换时,可以加一下命令,实现大小写转换
    • \l:把下个字符转换成小写。
    • \L:把replacement字母转换成小写,直到\U或\E出现。
    • \u:把下个字符转换成大写。
    • \U:把replacement字母转换成大写,直到\L或\E出现。
    • \E:停止以\L或\U开始的大小写转换

3.3 sed用法演示

3.3.1 常用选项options演示

qinwj 14:42:14 R290-1: /mnt/X500/farmers/qinwj
$ cat demo 
aaa
bbbb
AABBCCDD
  • p:打印当前模式空间内容,追加到默认输出之后:匹配到的行会打印一遍,不匹配的行也会打印
$ sed /aa/p demo 
aaa
aaa
bbbb
AABBCCDD
  • -n 不显示没有匹配到的行
$ sed -n /aa/p demo 
aaa
  • -e 类似于多匹配; sed -e "s/a/A/ demo 表示将demo 文件里面的a,变成A, 且只替换遇到的第一个
$ sed -e "s/a/A/" -e "s/b/B/" demo
Aaa
Bbbb
AABBCCDD
  • -f 使用文件来处理
$ cat sedscirpts 

s/A/a/g
$ sed -f sedscirpts demo 
aaa
bbbb
aaBBCCDD
  • -i 直接对文件进行处理
$ sed -i.bak "s/A/a/g" demo
$ cat demo
aaa
bbbb
aaBBCCDD

并且会自动生成改动前的.bak的备份文件

$ cat demo.bak 
aaa
bbbb
AABBCCDD

3.3.2 地址界定演示

$ cat demo
aaa
bbbb
AABBCCDD
aaaAAAbbbBBBcc

  • 将第二行的b全部替换成B
$ sed "2s/b/B/g" demo
aaa
BBBB
AABBCCDD
aaaAAAbbbBBBcc
  • 只打印匹配aaa模式的行
$ sed -n "/aaa/p" demo
aaa
aaaAAAbbbBBBcc
  • 只打印前两行
$ sed -n "1,2p" demo
aaa
bbbb
  • 打印第2行到匹配DD行的
$ sed -n "2,/DD/p" demo
bbbb
AABBCCDD
  • 将字段里面的所有A或者a都替换成E
$ sed "1~2s/[aA]/E/g" demo
EEE
bbbb
EEBBCCDD
aaaAAAbbbBBBcc

3.3.3 编辑命令command演示

$ cat demo
aaa
bbbb
AABBCCDD
aaaAAAbbbBBBcc
  • d表示删除模式空间匹配的行
$ sed "2d" demo # 删除第二行
aaa
AABBCCDD
aaaAAAbbbBBBcc
  • p打印当前模式空间内容,追加到默认输出之后, -n:不输出模式空间内容到屏幕,即不自动打印,只打印匹配到的行
$ sed -n "2p" demo
bbbb
  • a:在指定行后面追加文本,支持使用\n实现多行追加
$ sed "2a123" demo
aaa
bbbb
123
AABBCCDD
aaaAAAbbbBBBcc
  • i:在行前面插入文本,支持使用\n实现多行追加
$ sed "1i123" demo
123
aaa
bbbb
AABBCCDD
aaaAAAbbbBBBcc
  • c替换行为单行或多行文本,支持使用\n实现多行追加
$ sed "3c123\n456" demo #将第三行的内容替换成123\n456
aaa
bbbb
123
456
aaaAAAbbbBBBcc
  • =:为模式空间中的行打印行号
$ sed -n "=" demo
1
2
3
4
  • !:模式空间中匹配行取反处理
$ sed -n '2!p' demo #打印除了第2行的内容
aaa
AABBCCDD
aaaAAAbbbBBBcc

将文本内容中的大写都转换成小写

$ sed "s/[a-z]/\u&/g" demo
AAA
BBBB
AABBCCDD
AAAAAABBBBBBCC

这行命令同等于:

$ sed 's@[a-z]@\u&@g' demo
AAA
BBBB
AABBCCDD
AAAAAABBBBBBCC

3.4 sed高级编辑命令

(1)格式

  • h:把模式空间中的内容覆盖至保持空间中
  • H:把模式空间中的内容追加至保持空间中
  • g:从保持空间取出数据覆盖至模式空间
  • G:从保持空间取出内容追加至模式空间
  • x:把模式空间中的内容与保持空间中的内容进行互换
  • n:读取匹配到的行的下一行覆盖 至模式空间
  • N:读取匹配到的行的下一行追加 至模式空间
  • d:删除模式空间中的行
  • D:删除 当前模式空间开端至\n 的内容(不再传 至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

(2)一个案例+示意图演示

① 案例:倒序输出文本内容

$ cat num.txt 
One
Two
Three
$ sed '1!G;h;$!d' num.txt
Three
Two
One

② 总结模式空间与保持空间关系:

保持空间是模式空间一个临时存放数据的缓冲区,协助模式空间进行数据处理

你可能感兴趣的:(Linux文本处理三剑客之--- sed的使用教程)