文本处理工具sed

    Stream EDitor, 行编辑器 
    sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时 缓冲区中,称为“模式空间”(pattern space),
        接着用sed命令处理缓冲区中的 内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。 如果没有使
        诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清 空保留空间。这样不断重复,直到文件末尾。文件内容并
        没有改变,除非你使用重 定向存储输出。 
    功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等 
    参考: http://www.gnu.org/software/sed/manual/sed.html 

    用法:  
        sed [option]... 'script' inputfile... 
    常用选项:  
        -n:不输出模式空间内容到屏幕,即不自动打印  
        -e: 多点编辑  
        -f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本  
        -r: 支持使用扩展正则表达式  
        -i.bak: 备份文件并原处编辑 
        script:   '地址命令'

    地址定界:  
        (1) 不给地址:对全文进行处理  
        (2) 单地址:   
            #: 指定的行,$:最后一行   
            /pattern/:被此处模式所能够匹配到的每一行  
        (3) 地址范围:   
            #,#   
            #,+#   
            /pat1/,/pat2/   
            #,/pat1/  
        (4) ~:步进   
            1~2 奇数行   
            2~2 偶数行

    编辑命令:  
        d: 删除模式空间匹配的行,并立即启用下一轮循环  
        p:打印当前模式空间内容,追加到默认输出之后  
        a [\]text:在指定行后面追加文本    
            支持使用\n实现多行追加  
        i [\]text:在行前面插入文本  
        c [\]text:替换行为单行或多行文本  
        w /path/somefile: 保存模式匹配的行至指定文件  
        r /path/somefile:读取指定文件的文本至模式空间中     
                            匹配到的行后  
        =: 为模式空间中的行打印行号  
        !:模式空间中匹配行取反处理      

    s///:查找替换,支持使用其它分隔符,s@@@,s### 
        替换标记:  
            g: 行内全局替换  
            p: 显示替换成功的行  
            w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中 

    示例:
        sed ‘2p’  /etc/passwd 
        sed –n ‘2p’ /etc/passwd 
        sed –n ‘1,4p’ /etc/passwd 
        sed –n ‘/root/p’  /etc/passwd 
        sed –n ‘2,/root/p’  /etc/passwd 从2行开始 
        sed  -n ‘/^$/=’  file 显示空行行号 
        sed –n –e ‘/^$/p’ –e ‘/^$/=’  file 
        ed   ‘/root/a\superman’  /etc/passwd行后 
        sed ‘/root/i\superman’ /etc/passwd 行前 
        sed ‘/root/c\superman’ /etc/passwd 代替行 
        sed ‘/^$/d’ file 
        sed ‘1,10d’   file 
        nl /etc/passwd | sed ‘2,5d’ 
        nl /etc/passwd | sed ‘2a tea’ 
        sed 's/test/mytest/g' example 
        sed –n ‘s/root/&superman/p’ /etc/passwd 单词后 
        sed –n ‘s/root/superman&/p’ /etc/passwd 单词前 
        sed -e ‘s/dog/cat/’ -e ‘s/hi/lo/’ pets   
        sed –i.bak  ‘s/dog/cat/g’ pets

练习
1、删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符

#删除的是行首的所有空白字符
cat /etc/grub2.cfg | sed -r 's/(^[[:space:]]+)//' 

sed的基本用法_第1张图片

#删除行首的一个空格
cat /etc/grub2.cfg | sed -r 's/(^[[:space:]])//' 

sed的基本用法_第2张图片
2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的# 和空白字符

cat /etc/fstab | sed -r 's/^#[[:space:]]//'

sed的基本用法_第3张图片
3、在centos6系统/root/install.log每一行行首增加#号

cat install.log | sed -r 's/^.*/#&/'

sed的基本用法_第4张图片
4、在/etc/fstab文件中不以#开头的行的行首增加#号

cat /etc/fstab | sed -r 's/^[^#]+/#&/'

sed的基本用法_第5张图片
5、处理/etc/fstab路径,使用sed命令取出其目录名和基名

#相对路径或者路径结尾带/都可以正常取出
echo "./etc/fstab/" | sed -r 's/(^.*\/)([^/].*[^/])\/?$/dir:\1\nfile:\2/'

sed的基本用法_第6张图片
6、利用sed 取出ifconfig命令中本机的IPv4地址

ifconfig | sed -r -n '/inet /s/^[[:space:]]+inet (.*) net.*$/\1/p'

sed的基本用法_第7张图片
7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个 字段的重复次数

ls | sed -n -r '/rpm$/s/(.*\.)(.*.)\.rpm/\2/p' | sort | uniq -c

sed的基本用法_第8张图片
8、统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和 sed两种方法分别实现)

#数据太多只显示了前10行
cat /etc/init.d/functions | grep -E -o "\<[[:alpha:]]+\>" | sort | uniq -c | head

sed的基本用法_第9张图片

cat /etc/init.d/functions | sed -r 's/[^[:alpha:]]+/\n/g' | sort | uniq -c | head

sed的基本用法_第10张图片