Linux中文本处理的3把瑞士军刀sed,awk和grep,在我看来grep偏向于偏向于对匹配到的内容进行提取统计,awk偏向于对匹配到的内容进行格式化,而sed偏向于对匹配到的内容进行编辑。
本文档主要介绍sed命令的常用简单用法,高级用法需要深入理解sed的实现原理,本文不深入,即学即用。学习sed命令要求开发者首先要了解正则表达式,sed在实际应用中常常结合正则表达式使用。sed常用于shell脚本的编写,实现文本自动化变更。
常用sed参数 | |
---|---|
-i | 修改文件内容,匹配后修改目标文件内容 |
-n | 取消默认输出,匹配后操作不会打印到终端 |
常用sed功能选项 | |
---|---|
a | 追加内容到指定行后 |
i | 插入内容到指定行前 |
s | 对每一行第一次匹配到的内容进行替换,配合标志g可以将一行中所有匹配到的内容进行替换 |
常用sed高级命令 | |
---|---|
g | g代表全局替换,如果后面不带g,只替换每行第一个 |
d | 删除匹配内容所在行 |
p | 输出指定内容,默认会输出2次匹配到的内容(默认输出打印一次,p命令打印一次) |
&代表的实际是前面进行匹配的“匹配内容”,sed执行如果没加参数,则默认打印“变更后内容”
匹配所有以ABC开头的行,然后不做操作
sed 's/^ABC/&/' $file_path
匹配所有以ABC结尾的行,然后不做操作
sed 's/ABC$/&/' $file_path
匹配所有含有ABC的行,然后不做操作
sed 's/ABC/&/' $file_path
因为在sed 命令中 / ( ) 是特殊符号,如果需要在sed的’//'内使用正则表达式,为了避免误判,要在这些符号前加上\
\(..\) 表示匹配任意2个字符
\(....\) 表示匹配任意4个字符
匹配所有以ABC开头的ABC后面的4个字符,然后不做操作
sed 's/^ABC\(....\)/&/' $file_path
.* 表示匹配任意个字符
\(.*\)" 表示第一个引号前的内容
"\(.*\)" 表示两引号之间的内容
"\(.*\) 表示引号后的内容
“=”输出匹配项所在行行号,如输出“ABC”所在行行号
sed -n '/ABC/=' $file_path
对匹配结果数目进行统计用grep命令,“-c”参数,如统计在文件中“ABC”出现的个数
grep -c 'ABC' $file_path
sed -i 's/指定的字符/替换字符/' $file_path
sed -i 's/指定的字符/替换字符/g' $file_path
把文本文件中所有ABC都替换成CDF
sed -i 's/ABC/CDF/g' $file_path
sed -i 's/指定的字符/需要添加的字符&/' $file_path
在文件中,所有ABC前面都加上CDF
sed -i 's/ABC/CDF&/' $file_path
sed -i 's/指定的字符/&需要添加的字符/' $file_path
sed 's/\(.*\):\(.*\)/\1/g' $file_path
“\1”、“\2”:分别表示第一、二对括号里面的内容,
括号里的表达式匹配的内容,可以用\1,\2等进行引用,第n个括号对内的内容,就用\n引用。
文本:ABCDE
sed 's/\(.*\)C\(.*\)/\1/g' $file_path #输出AB
sed 's/\(.*\)C\(.*\)/\2/g' $file_path #输出DE
在匹配项的上一行新增一行,内容为“新行内容”
sed -i 's/指定的字符/i\新行内容/' $file_path
在匹配项的下一行新增一行,内容为“新行内容”
sed -i 's/指定的字符/a\新行内容/' $file_path
sed -i 's/指定的字符/d' $file_path