看图猜诗,你有任何想法都可以在评论区留言哦~
摘要:Sed(Stream Editor)作为 Linux 三剑客之一,凭借其流式处理与正则表达式能力,成为运维场景中文本批处理的核心工具。本文聚焦生产环境高频需求,涵盖日志清洗、K8s 配置管理、数据格式化等 12 大核心场景,通过代码演示与原理剖析,提供可直接复用的 Sed 实战模板。
-i
参数直接修改源文件(需谨慎使用)。工具 | Sed | Awk | Perl |
---|---|---|---|
定位 | 行级处理 | 列/字段级处理 | 复杂文本与逻辑处理 |
语法 | 简洁,专注文本流转换 | 支持变量、数组、条件判断 | 完整的脚本语言 |
性能 | 极高(纯流处理) | 较高 | 中等(功能越复杂越慢) |
适用场景 | 简单替换、删除、插入 | 结构化数据提取与报表生成 | 复杂文本解析与正则操作 |
总结:Sed在简单文本流处理场景中性能与简洁性优势突出,适合日志清洗、配置批量修改等任务。
brew install gnu-sed
# 使用gsed调用
# GNU版本显示"GNU sed"
linux01@linux01:~/data/sed$ sed --version
sed (GNU sed) 4.9
Packaged by Debian
Copyright (C) 2022 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <https://gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
sed [选项] '地址范围/模式 命令' 文件
常用选项:
-n
:抑制默认输出,仅显示处理后的行。-i[后缀]
:原地编辑文件(建议备份,如-i.bak
),重点:如需修改立即生效则设置该选项
。-e
:连接多个命令(如sed -e 'cmd1' -e 'cmd2'
)。常用正则:
^
:匹配行首。$
:匹配行尾。.*
:匹配任意字符(通配符)。替换操作(s命令):
语法:s/模式/替换内容/修饰符
# 替换每行首个"apple"为"orange"
sed 's/apple/orange/' file.txt
# 替换所有"apple"为"orange"
sed 's/apple/orange/g' file.txt
#
、|
),处理含斜杠内容:# 替换所有"apple"为"orange"
sed 's#/path/to/old#/new/path#g' config.conf
删除操作(d命令):
# 以空开头,以空结尾,表示为空行
sed '/^$/d' file.txt
# 删除第5行
sed '5d' file.txt
# 删除10到20行
sed '10,20d' file.txt
插入与追加(i/a命令):
# 在第3行前插入"Hello World"
sed '3i Hello World' file.txt
# 在匹配"error"的行后追加"Check log"
sed '/error/a Check log' file.txt
多命令组合:
# 删除空行并替换"test"为"prod"
sed -e '/^$/d' -e 's/test/prod/g' file.txt
需求:清理Nginx日志中的调试信息(含DEBUG
的行)并替换时间格式。
原始日志片段:
2023-10-01 12:00:00 [DEBUG] Client 192.168.1.1 connected
2023-10-01 12:00:01 [INFO] Request /api/users handled
处理脚本:
sed -e '/\[DEBUG\]/d' \ # 删除DEBUG行
-e 's/\([0-9]\{4\}-[0-9]\{2\}-[0-9]\{2\}\) \([0-9:\{8\}\]\)/\1T\2Z/' \ # 时间格式标准化
access.log > cleaned.log
输出结果:
2023-10-01T12:00:01Z [INFO] Request /api/users handled
需求:将多台服务器的/etc/ssh/sshd_config
中Port 22
改为Port 2222
,并备份原文件。
操作命令:
# 精准定位
sed -i.bak 's/^Port 22$/Port 2222/' /etc/ssh/sshd_config
# 验证修改
grep '^Port 2222$' /etc/ssh/sshd_config
关键点:
^
匹配以 Port 开头,如未打开注释的 # Port 则不匹配。$
匹配 22 结尾的行,如 Port 2211 则不匹配。需求:将日志中的时间戳从 Oct 1 12:00:00
转换为 ISO 8601 格式 2023-10-01T12:00:00Z
。
日志片段:
Oct 1 12:00:00 server1 nginx: Started
Oct 1 12:00:01 server2 app: Connected to DB
Sed 命令:
sed -E 's/([A-Za-z]{3}) ([0-9]{1,2}) ([0-9]{2}:){2}[0-9]{2}/2023-\1-\2T\3Z/' \
-e 's/\bOct\b/10/g' access.log
关键点:
-E
启用扩展正则表达式,简化分组捕获。Oct
)需二次替换为数字。需求:清理日志中的 password=***
字段。
日志片段:
user=admin password=123456 action=login
Sed 命令:
sed 's/password=[^ ]*//g' secure.log
输出:
user=admin action=login
说明:[^ ]*
匹配非空格字符,直到下一个空格或行尾。
需求:将 Deployment YAML 中的镜像 nginx:1.18
升级至 nginx:1.25
。
YAML 片段:
containers:
- name: nginx
image: nginx:1.18
Sed 命令:
sed -i.bak '/image: nginx/s/:1.18/:1.25/' deployment.yaml
安全建议:
-i.bak
生成备份文件,防止误操作。需求:提取 Java 异常日志的完整堆栈跟踪(含匹配行及其后 5 行)。
Sed 命令:
sed -n '/Caused by:/{p; :loop n; p; /^$/q; b loop}' app.log
解析:
:loop
定义标签,n
读取下一行,/^$/q
遇到空行退出。需求:将逗号分隔的 CSV 转换为制表符分隔的 TSV。
Sed 命令:
sed 's/,/\t/g' data.csv > data.tsv
注意:需确保字段内不含逗号(否则需更复杂的 CSV 解析器)。
需求:替换 ConfigMap 中 debug: "true"
为 debug: "false"
。
YAML 片段:
data:
config.ini: |
[runtime]
debug=true
Sed 命令:
sed -i '/debug=/s/true/false/' configmap.yaml
说明:限定在含 debug=
的行内替换,避免误改其他字段。
需求:提取时间范围 12:00:00
至 12:05:00
的日志。
Sed 命令:
sed -n '/12:00:00/,/12:05:00/p' syslog
扩展:结合 awk
处理更复杂的时间范围。
需求:移除 JSON 中的 internal_debug
字段。
日志片段:
{"timestamp": "2023-10-01", "level": "error", "internal_debug": "x123", "msg": "failed"}
Sed 命令:
sed 's/"internal_debug":[^,]*,//' app.json
输出:
{"timestamp": "2023-10-01", "level": "error", "msg": "failed"}
需求:实时监控 Pod 日志中的 OOMKilled
事件。
命令组合:
kubectl logs -f pod/app | sed -n '/OOMKilled/{s/^/[OOM] /; p;}'
作用:在匹配行前添加 [OOM]
标记并输出。
需求:在 Nginx 配置目录中注释所有 listen 80
行。
Sed 命令:
find /etc/nginx/ -type f -name "*.conf" -exec sed -i.bak '/listen 80/s/^/#/' {} +
解析:
find
定位所有 .conf
文件,-exec
批量执行 Sed。问题:替换含斜杠/
或&
的内容时格式错误。
解决:
sed 's#/old/path#/new/path#g' file.txt
sed 's/&/\&/g' file.txt # 转义XML中的&符号
问题:误用-i
未备份导致数据无法恢复。
预防:
-i.bak
生成备份文件。-i
,确认无误后再执行修改。问题:预期匹配的行未被处理。
调试方法:
p
命令打印匹配行:sed -n '/pattern/p' file.txt
Sed凭借其极简语法与高效流处理能力,成为Unix哲学中“小而美”工具的典范。掌握其核心命令与正则表达式技巧,可大幅提升文本处理效率,尤其在日志清洗、配置管理等场景中表现卓越。对于更复杂的文本操作,可结合Awk或Perl实现,但Sed始终是快速解决问题的首选利器。