文字处理

Linux 下进行字符串操作最常用的三个命令:

  1. awk (检索)
  2. sed (编辑)
  3. grep (匹配)

awk

语法:

$ awk [-F fs] [-v var=value] [-f progfile | 'prog'] [file ...]

代码结构:

BEGIN { FS=":"; RS=";" } # 可选
{ print 'Processing: ' $1 } # 必选
END { print 'End: ' } # 可选

设置变量:

$ awk -v a='hello' -v b='world' 'BEGIN {print a ", " b}'
hello, world

指定字段分隔符:

$ echo "1:2:3" | awk -F: '{ print $1 "-" $2 "-" $3 }'
$ echo "1:2:3" | awk -v FS=':' '{ print $1 "-" $2 "-" $3 }'
$ echo "1:2:3" | awk 'BEGIN { FS=":" } { print $1 "-" $2 "-" $3 }'
1-2-3

指定过滤条件:

# 行匹配(/reg/)
$ awk -F: '/^r/ {print $0}' /etc/passwd
# 列匹配($k ~ /reg/)
$ awk -F: '$1 ~ /^r/ {print $0}' /etc/passwd

输出控制:

# 所有列
$ awk -F: '/^r/ {print $0}' /etc/passwd
# 第 k 列
$ awk -F: '/^r/ {print $1}' /etc/passwd
# 最后一列
$ awk -F: '/^r/ {print $NF}' /etc/passwd
# 倒数第 k 列
$ awk -F: '/^r/ {print $(NF-1)}' /etc/passwd
# 编号
$ awk -F: '/^r/ {print FNR $0}' /etc/passwd

sed

语法:

$ sed [-nefi] '[begin , end] s/regex/complex/'

替换:

# 每行第一次匹配
$ sed 's/r/R/' /etc/passwd
# 每行所有匹配
$ sed 's/r/R/g' /etc/passwd
# 多组替换
$ sed 's/r/R/; s/o/O/' /etc/passwd
$ sed -e 's/r/R/' -e 's/o/O/' /etc/passwd

插入:

$ sed '1a BOF' file.txt
$ sed '$a EOF' file.txt

删除:

$ sed '5, $d' /etc/passwd
$ sed '/^root/d' /etc/passwd

输出控制:

# 输出第 5 - 10 行
$ sed '5, 10' /etc/passwd
# 输出第 5 - EOF 行
$ sed '5, $' /etc/passwd
# 只显示被编辑的行
$ sed -n 's/r/R/p' /etc/passwd

直接修改文件:

$ sed -i 's/hello/HELLO/' hello.txt

grep


语法:

$ grep 'pattern' [file ...]

综上

查找文件内容:

$ awk '/^root/ {print $0}' /etc/passwd # $0 或 {...} 都可以省略
$ sed -n '/^root/p' /etc/passwd
$ grep '^root' /etc/passwd

提取 IP 地址:

$ ifconfig en0 | awk '/inet / {print $2}'

你可能感兴趣的:(文字处理)