文本处理工具sed
Stream EDitor, 行编辑器
sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时 缓冲区中,称为“模式空间”(pattern space),
接着用sed命令处理缓冲区中的 内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。 如果没有使
诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清 空保留空间。这样不断重复,直到文件末尾。文件内容并
没有改变,除非你使用重 定向存储输出。
功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等
参考: http://www.gnu.org/software/sed/manual/sed.html
用法:
sed [option]... 'script' inputfile...
常用选项:
-n:不输出模式空间内容到屏幕,即不自动打印
-e: 多点编辑
-f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本
-r: 支持使用扩展正则表达式
-i.bak: 备份文件并原处编辑
script: '地址命令'
地址定界:
(1) 不给地址:对全文进行处理
(2) 单地址:
#: 指定的行,$:最后一行
/pattern/:被此处模式所能够匹配到的每一行
(3) 地址范围:
#,#
#,+#
/pat1/,/pat2/
#,/pat1/
(4) ~:步进
1~2 奇数行
2~2 偶数行
编辑命令:
d: 删除模式空间匹配的行,并立即启用下一轮循环
p:打印当前模式空间内容,追加到默认输出之后
a [\]text:在指定行后面追加文本
支持使用\n实现多行追加
i [\]text:在行前面插入文本
c [\]text:替换行为单行或多行文本
w /path/somefile: 保存模式匹配的行至指定文件
r /path/somefile:读取指定文件的文本至模式空间中
匹配到的行后
=: 为模式空间中的行打印行号
!:模式空间中匹配行取反处理
s///:查找替换,支持使用其它分隔符,s@@@,s###
替换标记:
g: 行内全局替换
p: 显示替换成功的行
w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
示例:
sed ‘2p’ /etc/passwd
sed –n ‘2p’ /etc/passwd
sed –n ‘1,4p’ /etc/passwd
sed –n ‘/root/p’ /etc/passwd
sed –n ‘2,/root/p’ /etc/passwd 从2行开始
sed -n ‘/^$/=’ file 显示空行行号
sed –n –e ‘/^$/p’ –e ‘/^$/=’ file
ed ‘/root/a\superman’ /etc/passwd行后
sed ‘/root/i\superman’ /etc/passwd 行前
sed ‘/root/c\superman’ /etc/passwd 代替行
sed ‘/^$/d’ file
sed ‘1,10d’ file
nl /etc/passwd | sed ‘2,5d’
nl /etc/passwd | sed ‘2a tea’
sed 's/test/mytest/g' example
sed –n ‘s/root/&superman/p’ /etc/passwd 单词后
sed –n ‘s/root/superman&/p’ /etc/passwd 单词前
sed -e ‘s/dog/cat/’ -e ‘s/hi/lo/’ pets
sed –i.bak ‘s/dog/cat/g’ pets
练习
1、删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符
#删除的是行首的所有空白字符
cat /etc/grub2.cfg | sed -r 's/(^[[:space:]]+)//'
#删除行首的一个空格
cat /etc/grub2.cfg | sed -r 's/(^[[:space:]])//'
2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的# 和空白字符
cat /etc/fstab | sed -r 's/^#[[:space:]]//'
3、在centos6系统/root/install.log每一行行首增加#号
cat install.log | sed -r 's/^.*/#&/'
4、在/etc/fstab文件中不以#开头的行的行首增加#号
cat /etc/fstab | sed -r 's/^[^#]+/#&/'
5、处理/etc/fstab路径,使用sed命令取出其目录名和基名
#相对路径或者路径结尾带/都可以正常取出
echo "./etc/fstab/" | sed -r 's/(^.*\/)([^/].*[^/])\/?$/dir:\1\nfile:\2/'
6、利用sed 取出ifconfig命令中本机的IPv4地址
ifconfig | sed -r -n '/inet /s/^[[:space:]]+inet (.*) net.*$/\1/p'
7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个 字段的重复次数
ls | sed -n -r '/rpm$/s/(.*\.)(.*.)\.rpm/\2/p' | sort | uniq -c
8、统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和 sed两种方法分别实现)
#数据太多只显示了前10行
cat /etc/init.d/functions | grep -E -o "\<[[:alpha:]]+\>" | sort | uniq -c | head
cat /etc/init.d/functions | sed -r 's/[^[:alpha:]]+/\n/g' | sort | uniq -c | head