sed

全称：steam editor

单引号 & 双引号 & 反引号

单引号

单引号内的字符都是普通字符，不会有任何特殊意义。包括转义字符。所以会原样输出所有字符

双引号

双引号内的字符，$,\,` 这三种字符是有特殊意义的。其中$代表了引用变量的值，` 代表了引用的命令。反斜杠是用于转义这两个字符以及双引号本身的。

如果想打印出这几个特殊字符，就需要用转议，否则会失败

# 直接打印，会错误
[root@hadoop usr]# echo "`"
> ^C

#

反引号

反引号括起来的字符串会被识别为命令。其等价于$()，推荐使用后者，因为反引号容易和单引号混淆。

总结

当要匹配的字符串或用于替换的字符串中有单引号时，只能使用双引号包围。
当要匹配的或用于替换的含双引号的时候，可以用单引号包围，或用双引号进行包围并使用‘’进行转义
在sed 命令中，引号的解析是shell进行的，sed命令只是获取shell解析后的结果。而不同的shell解析的方式也可能不同。所以最安全的做法是写在文件中，通过 sed -f执行，避免了引号的使用。

#错误用法--双引号下会把 $s 解析成一个变量。所以会报错。
sed "1,3s/my/your/g; 3,$s/This/That/g" my.txt

#正确用法--使用单引号，不会做任何解析
sed '1,3s/my/your/g; 3,$s/This/That/g' my.txt
#正确用法--转义 $ 符号
sed "1,3s/my/your/g; 3,\$s/This/That/g" my.txt

匹配行

只替换每一行的第一个s：

$ sed 's/s/S/1' my.txt

只替换每一行的第二个s：

$ sed 's/s/S/2' my.txt

只替换第一行的第3个以后的s：

$ sed '1s/s/S/3g' my.txt

特殊符号和命令

1. &

&用于表示匹配到的结果。

2.圆括号

使用圆括号匹配的示例：（圆括号括起来的正则表达式所匹配的字符串会可以当成变量来使用，sed中使用的是1,2…）

$ sed 's/This is my \([^,&]*\),.*is \(.*\)/\1:\2/g' my.txt

3. BRE & ERE

基本正则表达式 和 扩展正则表达式

反斜杠用于对字符串中特殊字符的转义。在使用圆括号时发现了一点疑问，网上给出的例子都需要对圆括号用\进行转义，而这不就是匹配圆括号本身吗？但是在实践中发现，确实当不用转义时会直接匹配字符，只有转义后才会体现括号的作用。

如下面的例子：

# 
$ echo "()" | sed 's/()/a/g'
a

# 
$ echo "abc" | sed 's/\(b\)/\1\1/g'
abbc

而在之前学正则表达式的时候，是当需要匹配括号本身时才需要转义的。而这就是 基本正则表达式 和 扩展正则表达式的区别了。

linux的文本处理命令中，grep和sed都只支持基本正则，而egrep和awk则支持扩展正则。但是grep和sed也可以分别通过-E 和-r参数来支持扩展正则

基本正则

基本正则的元字符有以下：

1. ^
2. $
3. .
4. *
5. []
6. \<
7. \>
8. \(\)
9. \?
10.\+

网上很多博客把?和+归为扩展正则，但是注意在基本正则中，是有这两个符号的，只是要通过转义来使用

在linux中测试可以发现这两个元字符都是可以正常使用的。
也有博客说|是扩展正则才有的

$ echo "ABC" | sed "s/A\+BC/DDD/"
DDD

$ echo "ABC" | sed "s/A\?BC/DDD/"
DDD

扩展正则

扩展正则只是把一些常用的元字符去掉了转义，并且加了少量新的元字符。

1. +
2. ?
3. ()

所以就明白了为什么在sed中的括号要进行转义了。因为sed使用的是基本正则，所以要想不用反斜杠直接使用括号，那么加上命令参数-r来让sed支持扩展正则就可以啦。对于grep是一样的道理，可以使用egrep或grep -E

Linux学习笔记

sed