devalone

Linux shell 脚本编程-高级篇（三）

继 Linux shell 脚本编程-高级篇（二）

3. 初识sed和gawk

目前为止， shell 脚本最常见的一个用途就是处理文本文件。检查日志文件、读取配置文件、处理数据元素，shell 脚本可以帮助我们将文本文件中各种数据的日常处理任务自动化。但仅靠 shell 脚本命令来处理文本文件的内容有点勉为其难。如果想在 shell 脚本中处理任何类型的数据，需要熟悉Linux中的 sed 和 gawk 工具。这两个工具能够极大简化需要进行的数据处理任务。

3.1 文本处理

有时候，需要自动处理文本文件，可又不想动用交互式文本编辑器。在这种情况下，能够轻松实现自动格式化、插入、修改或删除文本元素的简单命令行
编辑器就方便多了。

Linux 系统提供了两个常见的具备上述功能的工具，Linux 世界中最广泛使用的两个命令行编辑器：sed 和 gawk。

3.1.1 sed 编辑器
-----------------------------------------------------------------------------------------------------------------------------------------
sed 编辑器被称作流编辑器（stream editor），和普通的交互式文本编辑器恰好相反。在交互式文本编辑器中（比如vim），可以用键盘命令来交互式地
插入、删除或替换数据中的文本。流编辑器则会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。

sed 编辑器可以根据命令来处理数据流中的数据，这些命令要么从命令行中输入，要么存储在一个命令文本文件中。sed 编辑器会执行下列操作：

   (1) 一次从输入中读取一行数据。
   (2) 根据所提供的编辑器命令匹配数据。
   (3) 按照命令修改流中的数据。
   (4) 将新的数据输出到 STDOUT。

在流编辑器将所有命令与一行数据匹配完毕后，它会读取下一行数据并重复这个过程。在流编辑器处理完流中的所有数据行后，它就会终止。

由于命令是按顺序逐行给出的，sed 编辑器只需对数据流进行一遍处理就可以完成编辑操作。这使得 sed 编辑器要比交互式编辑器快得多，可以快速完成对
数据的自动修改。

sed 命令的格式如下：

sed options script file

选项允许修改 sed 命令的行为，可以使用的选项列于下表：

   sed 命令选项
   +-----------+------------------------------------------------------------------
   | 选项       | 描述
   +-----------+------------------------------------------------------------------
   | -e script   | 在处理输入时，将 script 中指定的命令添加到已有的命令中
   +-----------+------------------------------------------------------------------
   | -f file   | 在处理输入时，将file中指定的命令添加到已有的命令中
   +-----------+------------------------------------------------------------------
   | -n       | 不产生命令输出，使用print命令来完成输出
   +-----------+------------------------------------------------------------------

script 参数指定了应用于流数据上的单个命令。如果需要用多个命令，要么使用 -e 选项在命令行中指定，要么使用 -f 选项在单独的文件中指定。有大量
的命令可用来处理数据

■ 在命令行定义编辑器命令
-----------------------------------------------------------------------------------------------------------------------------------------
默认情况下，sed 编辑器会将指定的命令应用到 STDIN 输入流上。这样可以直接将数据通过管道输入给 sed 编辑器处理。

示例：
[devalone@devalone 19]$ echo "This is a test" | sed 's/test/big test/'
This is a big test

这个例子在 sed 编辑器中使用了 s 命令。s 命令会用斜线间指定的第二个文本字符串来替换第一个文本字符串模式。在本例中是 big test 替换了 test。

在运行这个例子时，结果应该立即就会显示出来。这就是使用sed编辑器的强大之处。可以同时对数据做出多处修改，而所消耗的时间却很少。就算编辑整个
文件，处理速度也相差无几。

   [devalone@devalone 19]$ sed 's/dog/cat/' data1.txt
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy cat.

sed 命令几乎瞬间就执行完并返回数据。在处理每行数据的同时，结果也显示出来了。可以在 sed 编辑器处理完整个文件之前就开始观察结果。

重要的是，要记住，sed 编辑器并不会修改文本文件的数据。它只会将修改后的数据发送到 STDOUT。如果查看原来的文本文件，它仍然保留着原始数据。

■ 在命令行使用多个编辑器命令
-----------------------------------------------------------------------------------------------------------------------------------------
要在 sed 命令行上执行多个命令时，只要用 -e 选项就可以了。

示例：
   [devalone@devalone 19]$ sed -e 's/brown/green/; s/dog/cat/' data1.txt
   This quick green fox jumps over the lazy cat.
   This quick green fox jumps over the lazy cat.
   This quick green fox jumps over the lazy cat.
   This quick green fox jumps over the lazy cat.

两个命令都作用到文件中的每行数据上。命令之间必须用分号隔开，并且在命令末尾和分号之间不能有空格。

如果不想用分号，也可以用 bash shell 中的次提示符来分隔命令。只要输入第一个单引号标示出 sed 程序脚本的起始（sed编辑器命令列表），bash 会
继续提示输入更多命令，直到输入了标示结束的单引号。

示例：
   [devalone@devalone 19]$ sed -e '
   > s/brown/green/
   > s/fox/elephant/
   > s/dog/cat/' data1.txt
   This quick green elephant jumps over the lazy cat.
   This quick green elephant jumps over the lazy cat.
   This quick green elephant jumps over the lazy cat.
   This quick green elephant jumps over the lazy cat.

必须记住，要在封尾单引号所在行结束命令。bash shell 一旦发现了封尾的单引号，就会执行命令。开始后，sed 命令就会将指定的每条命令应用到文本
文件中的每一行上。

■ 从文件中读取编辑器命令
-----------------------------------------------------------------------------------------------------------------------------------------
如果有大量要处理的 sed 命令，那么将它们放进一个单独的文件中通常会更方便一些。可以在 sed 命令中用 -f 选项来指定文件。

示例：
   [devalone@devalone 19]$ cat script.sed
   s/brown/green/
   s/fox/elephant/
   s/dog/cat/

   [devalone@devalone 19]$ sed -f script.sed data1.txt
   This quick green elephant jumps over the lazy cat.
   This quick green elephant jumps over the lazy cat.
   This quick green elephant jumps over the lazy cat.
   This quick green elephant jumps over the lazy cat.

在这种情况下，不用在每条命令后面放一个分号。sed 编辑器知道每行都是一条单独的命令。跟在命令行输入命令一样，sed 编辑器会从指定文件中读取
命令，并将它们应用到数据文件中的每一行上。

   NOTE:
   -------------------------------------------------------------------------------------------------------------------------------------
   很容易把 sed 编辑器脚本文件与 bash shell 脚本文件搞混。为了避免这种情况，可以使用 .sed 作为 sed脚本文件的扩展名。

3.1.2 gawk 程序
-----------------------------------------------------------------------------------------------------------------------------------------
虽然 sed 编辑器是非常方便自动修改文本文件的工具，但其也有自身的限制。通常需要一个用来处理文件中的数据的更高级工具，它能提供一个类编程环境
来修改和重新组织文件中的数据。这正是 gawk 能够做到的。

   NOTE:
   -------------------------------------------------------------------------------------------------------------------------------------
   在所有的发行版中都没有默认安装 gawk 程序，需要根据自己系统包管理器安装 gawk。下面是 Fedora 24 安装指令：

       [devalone@devalone 19]$ sudo dnf install gawk


gawk 程序是 Unix中的原始 awk 程序的 GNU版本。gawk程序让流编辑迈上了一个新的台阶，它提供了一种编程语言而不只是编辑器命令。在 gawk 编程语言
中，可以做下面的事情：

   □ 定义变量来保存数据；
   □ 使用算术和字符串操作符来处理数据；
   □ 使用结构化编程概念（比如if-then语句和循环）来为数据处理增加处理逻辑；
   □ 通过提取数据文件中的数据元素，将其重新排列或格式化，生成格式化报告。

gawk 程序的报告生成能力通常用来从大文本文件中提取数据元素，并将它们格式化成可读的报告。其中最完美的例子是格式化日志文件。在日志文件中找出
错误行会很难，gawk 程序可以从日志文件中过滤出需要的数据元素，然后可以将其格式化，使得重要的数据更易于阅读。

■ gawk 命令格式
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 程序的基本格式如下：

gawk options program file

下表显示了gawk程序的可用选项：

   gawk 选项
   +---------------+---------------------------------------------------------------------
   | 选项           | 描述
   +---------------+---------------------------------------------------------------------
   | -F fs           | 指定行中划分数据字段的字段分隔符
   +---------------+---------------------------------------------------------------------
   | -f file       | 从指定的文件中读取程序
   +---------------+---------------------------------------------------------------------
   | -v var=value   | 定义 gawk 程序中的一个变量及其默认值
   +---------------+---------------------------------------------------------------------
   | -mf N           | 指定要处理的数据文件中的最大字段数
   +---------------+---------------------------------------------------------------------
   | -mr N           | 指定数据文件中的最大数据行数
   +---------------+---------------------------------------------------------------------
   | -W keyword   | 指定 gawk 的兼容模式或警告等级
   +---------------+---------------------------------------------------------------------

gawk 的强大之处在于程序脚本。可以写脚本来读取文本行的数据，然后处理并显示数据，创建任何类型的输出报告。

■ 从命令行读取程序脚本
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 程序脚本用一对花括号来定义。必须将脚本命令放到两个花括号（{}）中。如果错误地使用了圆括号来包含 gawk 脚本，就会得到一条类似于下面的
错误提示：

   [devalone@devalone 19]$ gawk '(print "Hello World!")'
   gawk: cmd. line:1: (print "Hello World!")
   gawk: cmd. line:1: ^ syntax error
   gawk: cmd. line:2: (print "Hello World!")
   gawk: cmd. line:2:                       ^ unexpected newline or end of string

由于 gawk 命令行假定脚本是单个文本字符串，还必须将脚本放到单引号中。

示例：

[devalone@devalone 19]$ gawk '{print "Hello World!"}'

这个程序脚本定义了一个命令：print 命令。这个命令会将文本打印到 STDOUT。

如果尝试运行这个命令，什么都不会发生。原因在于没有在命令行上指定文件名，所以 gawk 程序会从 STDIN 接收数据。在运行这个程序时，它会一直等待
从 STDIN 输入的文本。

如果输入一行文本并按下回车键，gawk 会对这行文本运行一遍程序脚本。

跟sed编辑器一样，gawk 程序会针对数据流中的每行文本执行程序脚本。由于程序脚本被设为显示一行固定的文本字符串，因此不管在数据流中输入什么
文本，都会得到同样的文本输出。

示例：
   [devalone@devalone 19]$ gawk '{print "Hello World!"}'
   This is a test
   Hello World!
   a test
   Hello World!

要终止这个 gawk 程序，必须表明数据流已经结束了。bash shell 提供了一个组合键来生成 EOF（End-of-File）字符。Ctrl+D 组合键会在 bash中产生一个
EOF 字符。这个组合键能够终止该 gawk 程序并返回到命令行界面提示符下。

■ 使用数据字段变量
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 的主要特性之一是其处理文本文件中数据的能力。它会自动给一行中的每个数据元素分配一个变量。默认情况下，gawk 会将如下变量分配给它在文本行
中发现的数据字段：

   $0 代表整个文本行；
   $1 代表文本行中的第1个数据字段；
   $2 代表文本行中的第2个数据字段；
   $n 代表文本行中的第n个数据字段。

在文本行中，每个数据字段都是通过字段分隔符划分的。gawk 在读取一行文本时，会用预定义的字段分隔符划分每个数据字段。gawk 中默认的字段分隔符是
任意的空白字符（例如空格或制表符）。

在下面的例子中，gawk 程序读取文本文件，只显示第 1 个数据字段的值：

示例：
   [devalone@devalone 19]$ cat data2.txt
   one line of test text
   two line of test text
   three line of test text

   [devalone@devalone 19]$ gawk '{print $1}' data2.txt
   one
   two
   three

如果要读取采用了其他字段分隔符的文件，可以用 -F 选项指定。

示例：
   [devalone@devalone 19]$ gawk -F: '{print $1}' /etc/passwd
   root
   bin
   daemon
   adm
   lp
   sync
   shutdown
   halt
   mail
   ...

这个简短的程序显示了系统中密码文件的第 1 个数据字段。由于 /etc/passwd 文件用冒号来分隔数字字段，因而如果要划分开每个数据元素，则必须在
gawk 选项中将冒号指定为字段分隔符。

■ 在程序脚本中使用多个命令
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言允许将多条命令组合成一个正常的程序。要在命令行上的程序脚本中使用多条命令，只要在命令之间放个分号即可。

示例：
[devalone@devalone 19]$ echo "My name is Rich" | gawk '{$4="Christine"; print $0}'
My name is Christine

第一条命令会给字段变量 $4 赋值。第二条命令会打印整个数据字段。注意， gawk 程序在输出中已经将原文本中的第四个数据字段替换成了新值。

也可以用次提示符一次一行地输入程序脚本命令。

示例：
   [devalone@devalone 19]$ gawk '{
   > $4="Christine"
   > print $0}'
   My name is deva
   My name is Christine

在用了表示起始的单引号后，bash shell 会使用次提示符来提示用户输入更多数据。可以每次在每行加一条命令，直到输入了结尾的单引号。因为没有在
命令行中指定文件名，gawk 程序会从 STDIN 中获得数据。当运行这个程序的时候，它会等着读取来自 STDIN 的文本。要退出程序，按下 Ctrl+D 组合键
来表明数据结束。

■ 从文件中读取程序
-----------------------------------------------------------------------------------------------------------------------------------------
跟 sed 编辑器一样，gawk 编辑器允许将程序存储到文件中，然后再在命令行中引用。

示例：
   [devalone@devalone 19]$ cat script2.gawk
   {print $1 "'s home directory is " $6}

   [devalone@devalone 19]$ gawk -F: -f script2.gawk /etc/passwd
   root's home directory is /root
   bin's home directory is /bin
   daemon's home directory is /sbin
   adm's home directory is /var/adm
   lp's home directory is /var/spool/lpd
   sync's home directory is /sbin
   shutdown's home directory is /sbin
   ...
   devalone's home directory is /home/devalone

script2.gawk 程序脚本会使用 print 命令打印 /etc/passwd 文件的主目录数据字段（字段变量 $6），以及 userid数据字段（字段变量$1）。

可以在程序文件中指定多条命令。只要一条命令放一行即可，不需要用分号。

示例：
   [devalone@devalone 19]$ cat script3.gawk
   {
       text= "'s home directory is "
       print $1 text $6
   }
   [devalone@devalone 19]$ gawk -F: -f script3.gawk /etc/passwd
   root's home directory is /root
   bin's home directory is /bin
   daemon's home directory is /sbin
   adm's home directory is /var/adm
   lp's home directory is /var/spool/lpd
   sync's home directory is /sbin
   shutdown's home directory is /sbin
   ...
   devalone's home directory is /home/devalone

script3.gawk 程序脚本定义了一个变量来保存print命令中用到的文本字符串。注意，gawk 程序在引用变量值时并未像 shell 脚本一样使用美元符($)。

■ 在处理数据前运行脚本
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 还允许指定程序脚本何时运行。默认情况下，gawk 会从输入中读取一行文本，然后针对该行的数据执行程序脚本。有时可能需要在处理数据前运行脚本，
比如为报告创建标题。BEGIN 关键字就是用来做这个的。它会强制 gawk 在读取数据前执行 BEGIN 关键字后指定的程序脚本。

示例：

   [devalone@devalone 19]$ gawk 'BEGIN {print "Hello World!"}'
   Hello World!
   [devalone@devalone 19]$

这次 print 命令会在读取数据前显示文本。但在它显示了文本后，它会快速退出，不等待任何数据。如果想使用正常的程序脚本中处理数据，必须用另一个
脚本区域来定义程序。

示例：
   [devalone@devalone 19]$ cat data3.txt
   Line 1
   Line 2
   Line 3

   [devalone@devalone 19]$ gawk 'BEGIN {print "The data3 File Contents:"}
   > {print $0}' data3.txt
   The data3 File Contents:
   Line 1
   Line 2
   Line 3

在 gawk 执行了 BEGIN 脚本后，它会用第二段脚本来处理文件数据。这么做时要小心，两段脚本仍然被认为是 gawk 命令行中的一个文本字符串。需要相应
地加上单引号。

■ 在处理数据后运行脚本
-----------------------------------------------------------------------------------------------------------------------------------------
与 BEGIN 关键字类似，END 关键字允许指定一个程序脚本，gawk 会在读完数据后执行它。

示例：
   [devalone@devalone 19]$ gawk 'BEGIN {print "The data3 File Contents:"}
   > {print $0}
   > END {print "End of File"}' data3.txt
   The data3 File Contents:
   Line 1
   Line 2
   Line 3
   End of File

当 awk 程序打印完文件内容后，它会执行 END 脚本中的命令。这是在处理完所有正常数据后给报告添加页脚的最佳方法。

可以将所有这些内容放到一起组成一个漂亮的小程序脚本文件，用它从一个简单的数据文件中创建一份完整的报告。

示例：
   [devalone@devalone 19]$ cat script4.gawk
   BEGIN {
   print "The latest list of users and shells"
   print " UserID\t Shell"
   print"----------\t--------------"
   FS=":"
   }

   {
   print $1 "       \t "    $7
   }

   END {
   print "This concludes the listing"
   }

这个脚本用 BEGIN 脚本来为报告创建标题。它还定义了一个叫作 FS 的特殊变量。这是定义字段分隔符的另一种方法。这样就不用依靠脚本用户在命令行
选项中定义字段分隔符了。

下面是这个 gawk 程序脚本的输出：

   The latest list of users and shells
   UserID Shell
   ----------      --------------
   root             /bin/bash
   bin              /sbin/nologin
   daemon           /sbin/nologin
   adm              /sbin/nologin
   lp               /sbin/nologin
   sync             /bin/sync
   shutdown         /sbin/shutdown
   halt             /sbin/halt
   mail             /sbin/nologin

...

   devalone         /bin/bash
   saned            /sbin/nologin
   systemd-coredump         /sbin/nologin
   hudson           /bin/false
   ntp              /sbin/nologin
   This concludes the listing

BEGIN 脚本创建了标题，程序脚本处理特定数据文件（/etc/passwd）中的信息，END 脚本生成页脚。

3.2 sed 编辑器基础
-----------------------------------------------------------------------------------------------------------------------------------------
成功使用 sed 编辑器的关键在于掌握其各式各样的命令和格式，它们能够帮助定制文本编辑行为。

3.2.1 更多的替换选项
-----------------------------------------------------------------------------------------------------------------------------------------
已经看过了 s 命令（substitute）在行中替换文本。这个命令还有另外一些选项能让事情变得更为简单。

■ 替换标记
-----------------------------------------------------------------------------------------------------------------------------------------
关于替换命令如何替换字符串中所匹配的模式需要注意一点，看看下面这个例子中会出现什么情况：

   [devalone@devalone 19]$ cat data4.txt
   This is a test of the test script
   This is the second test of the test script

   [devalone@devalone 19]$ sed 's/test/trial/' data4.txt
   This is a trial of the test script
   This is the second trial of the test script

替换命令在替换多行中的文本时能正常工作，但默认情况下它只替换每行中出现的第一处。

要让替换命令能够替换一行中不同地方出现的文本必须使用替换标记（substitution flag）。替换标记会在替换命令字符串之后设置：

s/pattern/replacement/flags

有 4 种可用的替换标记：

   □ 数字，表明新文本将替换第几处模式匹配的地方；
   □ g，表明新文本将会替换所有匹配的文本；
   □ p，表明原先行的内容要打印出来；
   □ w file，将替换的结果写到文件中。

在第一类替换中，可以指定 sed 编辑器用新文本替换第几处模式匹配的地方。

示例：
   [devalone@devalone 19]$ sed 's/test/trial/2' data4.txt
   This is a test of the trial script
   This is the second test of the trial script

将替换标记指定为 2 的结果就是：sed 编辑器只替换每行中第二次出现的匹配模式。g 替换标记能替换文本中匹配模式所匹配的每处地方。

示例：
   [devalone@devalone 19]$ sed 's/test/trial/g' data4.txt
   This is a trial of the trial script
   This is the second trial of the trial script

p 替换标记会打印与替换命令中指定的模式匹配的行。这通常会和 sed 的 -n 选项一起使用。

示例：
   [devalone@devalone 19]$ cat data5.txt
   This is a test line
   This is a different line

   [devalone@devalone 19]$ sed -n 's/test/trial/p' data5.txt
   This is a trial line

-n 选项将禁止 sed 编辑器输出。但 p 替换标记会输出修改过的行。将二者配合使用的效果就是只输出被替换命令修改过的行。

w 替换标记会产生同样的输出，不过会将输出保存到指定文件中。

示例：
   [devalone@devalone 19]$ sed 's/test/trial/w test.txt' data5.txt
   This is a trial line
   This is a different line

[devalone@devalone 19]$ cat test.txt
This is a trial line

sed 编辑器的正常输出是在 STDOUT 中，而只有那些包含匹配模式的行才会保存在指定的输出文件中。

■ 替换字符
-----------------------------------------------------------------------------------------------------------------------------------------
有时会在文本字符串中遇到一些不太方便在替换模式中使用的字符。Linux 中一个常见的例子就是正斜线（/）。

替换文件中的路径名会比较麻烦。比如，如果想用 C shell替换 /etc/passwd 文件中的 bash shell，必须这么做：

示例：
   [devalone@devalone 19]$ sed 's/\/bin\/bash/\/bin\/csh/' /etc/passwd
   root:x:0:0:root:/root:/bin/csh
   bin:x:1:1:bin:/bin:/sbin/nologin
   daemon:x:2:2:daemon:/sbin:/sbin/nologin
   adm:x:3:4:adm:/var/adm:/sbin/nologin
   ...

devalone:x:1000:1000:MichaelY.:/home/devalone:/bin/csh

由于正斜线通常用作字符串分隔符，因而如果它出现在了模式文本中的话，必须用反斜线来转义。这通常会带来一些困惑和错误。

要解决这个问题，sed 编辑器允许选择其他字符来作为替换命令中的字符串分隔符：

sed 's!/bin/bash!/bin/csh!' /etc/passwd

这个例子中，感叹号被用作字符串分隔符，这样路径名就更容易阅读和理解了。

3.2.2 使用地址
-----------------------------------------------------------------------------------------------------------------------------------------
默认情况下，在 sed 编辑器中使用的命令会作用于文本数据的所有行。如果只想将命令作用于特定行或某些行，则必须用行寻址（line addressing）。

在 sed 编辑器中有两种形式的行寻址：

□ 以数字形式表示行区间
□ 用文本模式来过滤出行

两种形式都使用相同的格式来指定地址：

[address]command

也可以将特定地址的多个命令分组：

   address {
       command1
       command2
       command3
   }

sed 编辑器会将指定的每条命令作用到匹配指定地址的行上。

■ 数字方式的行寻址
-----------------------------------------------------------------------------------------------------------------------------------------
当使用数字方式的行寻址时，可以用行在文本流中的行位置来引用。sed 编辑器会将文本流中的第一行编号为 1，然后继续按顺序为接下来的行分配行号。

在命令中指定的地址可以是单个行号，或是用起始行号、逗号以及结尾行号指定的一定区间范围内的行。

示例：
   [devalone@devalone 19]$ sed '2s/dog/cat/' data1.txt
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy dog.

sed 编辑器只修改地址指定的第二行的文本。

示例：
   [devalone@devalone 19]$ sed '2,3s/dog/cat/' data1.txt
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy dog.

这次使用了行地址区间。

将命令作用到文本中从某行开始的所有行，可以用特殊地址——美元符 ($)。

示例：
   [devalone@devalone 19]$ sed '2,$s/dog/cat/' data1.txt
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy cat.
   This quick brown fox jumps over the lazy cat.

■ 使用文本模式过滤器
-----------------------------------------------------------------------------------------------------------------------------------------
sed 编辑器允许指定文本模式来过滤出命令要作用的行。格式如下：

/pattern/command

必须用正斜线将要指定的 pattern 封起来。sed 编辑器会将该命令作用到包含指定文本模式的行上。

示例：
   [devalone@devalone ~]$ sed '/devalone/s/bash/csh/' /etc/passwd
   root:x:0:0:root:/root:/bin/bash
   bin:x:1:1:bin:/bin:/sbin/nologin
   daemon:x:2:2:daemon:/sbin:/sbin/nologin
   adm:x:3:4:adm:/var/adm:/sbin/nologin
   lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

...
devalone:x:1000:1000:MichaelY.:/home/devalone:/bin/csh

该命令只作用到匹配文本模式的行上。虽然使用固定文本模式能过滤出特定的值，就跟上面这个用户名的例子一样，但其作用很有限。sed 编辑器在文本
模式中采用了正则表达式（regular expression）的特性来帮助创建匹配效果更好的模式。

正则表达式允许创建高级文本模式匹配表达式来匹配各种数据。这些表达式结合了一系列通配符、特殊字符以及固定文本字符来生成能够匹配几乎任何形式
文本的简练模式(后续章节介绍)。

■ 命令组合
-----------------------------------------------------------------------------------------------------------------------------------------
如果需要在单行上执行多条命令，可以用花括号将多条命令组合在一起。sed 编辑器会处理地址行处列出的每条命令。

示例：
   [devalone@devalone 19]$ sed '2{
   s/fox/elephant/
   s/dog/cat/
   }' data1.txt
   This quick brown fox jumps over the lazy dog.
   This quick brown elephant jumps over the lazy cat.
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy dog.

两条命令都会作用到该地址上。当然，也可以在一组命令前指定一个地址区间。

示例：
   [devalone@devalone 19]$ sed '3,${
   s/brown/green/
   s/lazy/active/
   }' data1.txt
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy dog.
   This quick green fox jumps over the active dog.
   This quick green fox jumps over the active dog.

sed 编辑器会将所有命令作用到该地址区间内的所有行上。

3.2.3 删除行
-----------------------------------------------------------------------------------------------------------------------------------------
文本替换命令不是 sed 编辑器唯一的命令。如果需要删除文本流中的特定行，可以用删除命令。

删除命令 d 会删除匹配指定寻址模式的所有行。使用该命令时要特别小心，如果忘记加入寻址模式的话，流中的所有文本行都会被删除。

当和指定地址一起使用时，删除命令显然能发挥出最大的功用。可以从数据流中删除特定的文本行，通过行号指定：

   [devalone@devalone 19]$ cat data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   [devalone@devalone 19]$ sed '3d' data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 4.

或者通过特定行区间指定：

   [devalone@devalone 19]$ sed '2,3d' data6.txt
   This is line number 1.
   This is line number 4.

或者通过特殊的文件结尾字符：

   [devalone@devalone 19]$ sed '3,$d' data6.txt
   This is line number 1.
   This is line number 2.
   [devalone@devalone 19]$

sed 编辑器的模式匹配特性也适用于删除命令：

   [devalone@devalone 19]$ sed '/number 1/d' data6.txt
   This is line number 2.
   This is line number 3.
   This is line number 4.
   [devalone@devalone 19]$

sed 编辑器会删掉包含匹配指定模式的行。

   NOTE:
   -------------------------------------------------------------------------------------------------------------------------------------
   sed 编辑器不会修改原始文件。删除的行只是从 sed 编辑器的输出中消失了。原始文件仍然包含那些“删掉的”行。

也可以使用两个文本模式来删除某个区间内的行，但这么做时要小心。指定的第一个模式会“打开”行删除功能，第二个模式会“关闭”行删除功能。sed 编辑器
会删除两个指定行之间的所有行（包括指定的行）。

示例：
   [devalone@devalone 19]$ sed '/1/,/3/d' data6.txt
   This is line number 4.
   [devalone@devalone 19]$

除此之外，要特别小心，因为只要 sed 编辑器在数据流中匹配到了开始模式，删除功能就会打开。这可能会导致意外的结果。

示例：
   [devalone@devalone 19]$ cat data7.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   This is line number 1 again.
   This is text you want to keep.
   This is the last line in the file.

   [devalone@devalone 19]$ sed '/1/,/3/d' data7.txt
   This is line number 4.
   [devalone@devalone 19]$

第二个出现数字“1”的行再次触发了删除命令，因为没有找到停止模式，所以就将数据流中的剩余行全部删除了。当然，如果指定了一个从未在文本中出现的
停止模式，显然会出现另外一个问题：

[devalone@devalone 19]$ sed '/1/,/5/d' data7.txt
[devalone@devalone 19]$

因为删除功能在匹配到第一个模式的时候打开了，但一直没匹配到结束模式，所以整个数据流都被删掉了。

3.2.4 插入和附加文本
-----------------------------------------------------------------------------------------------------------------------------------------
跟其他编辑器类似，sed 编辑器允许向数据流插入和附加文本行。

□ 插入（insert）命令（i）会在指定行前增加一个新行；
□ 附加（append）命令（a）会在指定行后增加一个新行。

这两条命令的费解之处在于它们的格式。它们不能在单个命令行上使用。必须在命令之后，在一个单独的新行上指定插入或附加行的内容。格式如下：

sed '[address]command\
new line'

new line 中的文本将会出现在 sed 编辑器输出中指定的位置。当使用插入命令时，文本会出现在数据流文本的前面。

示例：
   [devalone@devalone 19]$ echo "Test Line 2" | sed 'i\Test Line 1'
   Test Line 1
   Test Line 2

当使用附加命令时，文本会出现在数据流文本的后面。

示例：
   [devalone@devalone 19]$ echo "Test Line 2" | sed 'a\Test Line 1'
   Test Line 2
   Test Line 1

在命令行界面提示符上使用 sed 编辑器时，会看到次提示符来提醒输入新的行数据。必须在该行完成 sed 编辑器命令。一旦输入了结尾的单引号，bash
shell 就会执行该命令。

示例：
   [devalone@devalone 19]$ echo "Test Line 2" | sed 'i\
   > Test Line 1'
   Test Line 1
   Test Line 2
   [devalone@devalone 19]$

这样能够给数据流中的文本前面或后面添加文本。

要向数据流行内部插入或附加数据，必须用寻址来告诉 sed 编辑器想让数据出现在什么位置。可以在用这些命令时只指定一个行地址。可以匹配一个数字
行号或文本模式，但不能用地址区间。这合乎逻辑，因为只能将文本插入或附加到单个行的前面或后面，而不是行区间的前面或后面。

下面的例子是将一个新行插入到数据流第三行前：

   [devalone@devalone 19]$ sed '3i\
   >This is an inserted line.' data6.txt
   This is line number 1.
   This is line number 2.
   This is an inserted line.
   This is line number 3.
   This is line number 4.

下面的例子是将一个新行附加到数据流中第三行后:
   [devalone@devalone 19]$ sed '3a\
   > This is an appended line.' data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is an appended line.
   This is line number 4.

它使用与插入命令相同的过程，只是将新文本行放到了指定的行号后面。

如果有一个多行数据流，想要将新行附加到数据流的末尾，只要用代表数据最后一行的美元符就可以了。

示例：
   [devalone@devalone 19]$ sed '$a\
   > This is a new line of text.' data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   This is a new line of text.
   [devalone@devalone 19]$

同样的方法也适用于要在数据流起始位置增加一个新行。只要在第一行之前插入新行即可。

要插入或附加多行文本，就必须对要插入或附加的新文本中的每一行使用反斜线，直到最后一行。

示例：
   [devalone@devalone 19]$ sed '1i\
   > This is one line of new text.\
   > This is anoter line of new text.' data6.txt
   This is one line of new text.
   This is anoter line of new text.
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.

3.2.5 修改行
-----------------------------------------------------------------------------------------------------------------------------------------
修改（change）命令允许修改数据流中整行文本的内容。它跟插入和附加命令的工作机制一样，必须在 sed 命令中单独指定新行。

示例：
   [devalone@devalone 19]$ sed '3c\
   > This is a changed line of text.' data6.txt
   This is line number 1.
   This is line number 2.
   This is a changed line of text.
   This is line number 4.

在这个例子中，sed 编辑器会修改第三行中的文本。也可以用文本模式来寻址：

   [devalone@devalone 19]$ sed '/number 3/c\
   > This is a changed line of text.' data6.txt
   This is line number 1.
   This is line number 2.
   This is a changed line of text.
   This is line number 4.

文本模式修改命令会修改它匹配的数据流中的任意文本行。

示例：
   [devalone@devalone 19]$ cat data8.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   This is line number 1 again.
   This is yet another line.
   This is the last line in the file.

   [devalone@devalone 19]$ sed '/number 1/c\
   > This is a changed line of text.' data8.txt
   This is a changed line of text.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   This is a changed line of text.
   This is yet another line.
   This is the last line in the file.

可以在修改命令中使用地址区间，但结果未必如愿。

示例：
   [devalone@devalone 19]$ sed '2,3c\
   > This is a new line of text.' data6.txt
   This is line number 1.
   This is a new line of text.
   This is line number 4.

sed 编辑器会用这一行文本来替换数据流中的两行文本，而不是逐一修改这两行文本。

3.2.6 转换命令
-----------------------------------------------------------------------------------------------------------------------------------------
转换（transform）命令（y）是唯一可以处理单个字符的 sed 编辑器命令。转换命令格式如下：

[address]y/inchars/outchars/

转换命令会对 inchars 和 outchars值进行一对一的映射。inchars中的第一个字符会被转换为 outchars中的第一个字符，第二个字符会被转换成 outchars
中的第二个字符。这个映射过程会一直持续到处理完指定字符。如果 inchars 和 outchars 的长度不同，则 sed 编辑器会产生一条错误消息。

示例：
   [devalone@devalone 19]$ sed 'y/123/789/' data8.txt
   This is line number 7.
   This is line number 8.
   This is line number 9.
   This is line number 4.
   This is line number 7 again.
   This is yet another line.
   This is the last line in the file.

inchars 模式中指定字符的每个实例都会被替换成 outchars 模式中相同位置的那个字符。

转换命令是一个全局命令，也就是说，它会在文本行中找到的所有指定字符自动进行转换，而不会考虑它们出现的位置。

示例：
[devalone@devalone 19]$ echo "This 1 is a test of 1 try." | sed 'y/123/456/'
This 4 is a test of 4 try.

3.2.7 回顾打印
-----------------------------------------------------------------------------------------------------------------------------------------
3.2.1节介绍了如何使用 p 标记和替换命令显示 sed 编辑器修改过的行。另外有 3 个命令也能用来打印数据流中的信息：

   □ p命令用来打印文本行；
   □ 等号（=）命令用来打印行号；
   □ l（小写的L）命令用来列出行。

■ 打印行
-----------------------------------------------------------------------------------------------------------------------------------------
跟替换命令中的 p 标记类似，p 命令可以打印 sed 编辑器输出中的一行。如果只用这个命令，也没什么特别的。

示例：
   [devalone@devalone 19]$ echo "this is a test" | sed 'p'
   this is a test
   this is a test

它所做的就是打印已有的数据文本。

打印命令最常见的用法是打印包含匹配文本模式的行：

   [devalone@devalone 19]$ cat data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   [devalone@devalone 19]$ sed -n '/number 3/p' data6.txt
   This is line number 3.

在命令行上用 -n 选项，可以禁止输出其他行，只打印包含匹配文本模式的行。

也可以用它来快速打印数据流中的某些行：

   [devalone@devalone 19]$ sed -n '2,3p' data6.txt
   This is line number 2.
   This is line number 3.

如果需要在修改之前查看行，也可以使用打印命令，比如与替换或修改命令一起使用。可以创建一个脚本在修改行之前显示该行。

   [devalone@devalone 19]$ sed -n '/3/{
   p
   s/line/test/p
   }' data6.txt
   This is line number 3.
   This is test number 3.
   [devalone@devalone 19]$

sed 编辑器命令会查找包含数字 3 的行，然后执行两条命令。首先，脚本用 p 命令来打印出原始行；然后它用 s 命令替换文本，并用 p 标记打印出替换
结果。输出同时显示了原来的行文本和新的行文本。

■ 打印行号
-----------------------------------------------------------------------------------------------------------------------------------------
等号命令会打印行在数据流中的当前行号。行号由数据流中的换行符决定。每次数据流中出现一个换行符，sed 编辑器会认为一行文本结束了。

示例：
   [devalone@devalone 19]$ cat data1.txt
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy dog.
   This quick brown fox jumps over the lazy dog.
   [devalone@devalone 19]$ sed '=' data1.txt
   1
   This quick brown fox jumps over the lazy dog.
   2
   This quick brown fox jumps over the lazy dog.
   3
   This quick brown fox jumps over the lazy dog.
   4
   This quick brown fox jumps over the lazy dog.
   [devalone@devalone 19]$

sed 编辑器在实际的文本行出现前打印了行号。如果要在数据流中查找特定文本模式的话，等号命令用起来非常方便。

示例：
   [devalone@devalone 19]$ sed -n '/number 4/{
   > =
   > p
   > }' data6.txt
   4
   This is line number 4.
   [devalone@devalone 19]$

■ 列出行
-----------------------------------------------------------------------------------------------------------------------------------------
列出（list）命令（l）可以打印数据流中的文本和不可打印的 ASCII 字符。任何不可打印字符要么在其八进制值前加一个反斜线，要么使用标准 C 风格的
命名法（用于常见的不可打印字符），比如\t，来代表制表符。

示例：
   [devalone@devalone 19]$ cat data9.txt
   This    line    contains                tabs.
   [devalone@devalone 19]$ sed -n 'l' data9.txt
   This\tline\tcontains\t\ttabs.$

制表符的位置使用 \t 来显示。行尾的美元符表示换行符。如果数据流包含了转义字符，列出命令会在必要时候用八进制码来显示。

3.2.8 使用 sed 处理文件
-----------------------------------------------------------------------------------------------------------------------------------------
替换命令包含一些可以用于文件的标记。还有一些 sed 编辑器命令也可以实现同样的目标，不需要非得替换文本。

■ 写入文件
-----------------------------------------------------------------------------------------------------------------------------------------
w 命令用来向文件写入行。命令的格式如下：

[address]w filename

filename 可以使用相对路径或绝对路径，但不管是哪种，运行 sed 编辑器的用户都必须有文件的写权限。地址可以是 sed 中支持的任意类型的寻址方式，
例如单个行号、行区间或文本模式。

示例：
   [devalone@devalone 19]$ sed '1,2w test.txt' data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.

   [devalone@devalone 19]$ cat test.txt
   This is line number 1.
   This is line number 2.
   [devalone@devalone 19]$

将数据流中的前两行打印到一个文本文件 test.txt 中。如果不想让行显示到 STDOUT 上，可以用 sed 命令的 -n 选项。

如果要根据一些公用的文本值从主文件中创建一份数据文件，比如下面的邮件列表中的，那么 w 命令会非常好用。

示例：
   [devalone@devalone 19]$ cat data11.txt
   Blum, R Browncoat
   McGuiness, A Alliance
   Bresnahan, C Browncoat
   Harken, C Alliance

   [devalone@devalone 19]$ sed -n '/Browncoat/w Browncoats.txt' data11.txt
   [devalone@devalone 19]$ cat Browncoats.txt
   Blum, R Browncoat
   Bresnahan, C Browncoat
   [devalone@devalone 19]$

sed 编辑器会只将匹配文本模式的数据行写入目标文件。

■ 从文件读取数据
-----------------------------------------------------------------------------------------------------------------------------------------
sed 读取（read）命令（r）允许将一个独立文件中的数据插入到数据流中。命令格式如下：

[address]r filename

filename 参数指定了数据文件的绝对路径或相对路径。

在读取命令中使用地址区间，只能指定单独一个行号或文本模式地址。sed编辑器会将文件中的文本插入到指定地址后。

示例：
   [devalone@devalone 19]$ cat data12.txt
   This is an added line
   This is the second added line

   [devalone@devalone 19]$ sed '3r data12.txt' data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is an added line
   This is the second added line
   This is line number 4.

sed 编辑器会将数据文件中的所有文本行都插入到数据流中。同样的方法在使用文本模式地址时也适用：

示例：
   [devalone@devalone 19]$ sed '/number 2/r data12.txt' data6.txt
   This is line number 1.
   This is line number 2.
   This is an added line
   This is the second added line
   This is line number 3.
   This is line number 4.

如果要在数据流的末尾添加文本，只需用美元符地址符就行了。

示例：
   [devalone@devalone 19]$ sed '$r data12.txt' data6.txt
   This is line number 1.
   This is line number 2.
   This is line number 3.
   This is line number 4.
   This is an added line
   This is the second added line

读取命令的另一个很好的用法是和删除命令配合使用：利用另一个文件中的数据来替换文件中的占位文本。例如，假定有一份套用信件保存在文本文件中：

   [devalone@devalone 19]$ cat notice.std
   Would the following people:
   LIST
   please report to the ship's captain.

套用信件将通用占位文本 LIST 放在人物名单的位置。要在占位文本后插入名单，只需读取命令就行了。但这样的话，占位文本仍然会留在输出中。要删除
占位文本，可以用删除命令。结果如下：

   [devalone@devalone 19]$ sed '/LIST/{
   > r data11.txt
   > d
   > }' notice.std
   Would the following people:
   Blum, R Browncoat
   McGuiness, A Alliance
   Bresnahan, C Browncoat
   Harken, C Alliance
   please report to the ship's captain.
   [devalone@devalone 19]$

现在占位文本已经被替换成了数据文件中的名单。

系列目录：

Linux shell 脚本编程-高级篇（一）

Linux shell 脚本编程-高级篇（二）

Linux shell 脚本编程-高级篇（三）

Linux shell 脚本编程-高级篇（四）

Linux shell 脚本编程-高级篇（五）

Linux shell 脚本编程-高级篇（六）

Linux shell 脚本编程-高级篇（七）

-----------------------------------------------------------------------------------------------------------------------------------------
参考：

《Linux 命令行与 shell 脚本编程大全》第 3 版 —— 2016.8（美）Richard Blum Cristine Bresnahan

你可能感兴趣的:(Linux shell 脚本编程-高级篇（三）)

麒麟v10安装mysql5.7（ARM架构） qqxinxi arm开发
下载路径：华为云镜像麒麟v10是潮流时代的新时髦的linux操作系统，但随着ARM架构流行，出现了一些卡点，不以为然，没当回事的大吃一惊。经常卡住。例如:在安装mysql5.7（ARM架构）最简单：使用rpmmysql-5.7.27.1.el7.aarch64.rpm文件比较小下载完之后rpm-ivhmysql-5.7.27.1.el7.aarch64.rpm比较简单常用的方法，再不能连接互联网时
五大常考SQL面试题 Begin to change MySQL sql 面试
目录一、找出连续7天登陆，连续30天登陆的用户（小红书笔试，电信云面试），最大连续登陆天数的问题--窗口函数二、求连续点击三次的用户数，而且中间不能有别人的点击三、计算除去部门最高工资，和最低工资的平均工资（字节跳动面试）--窗口函数四、留存的计算，和累计求和的计算--窗口函数，自联结（pdd面试）一、找出连续7天登陆，连续30天登陆的用户（小红书笔试，电信云面试），最大连续登陆天数的问题--窗口
深入了解 CDN：概念、原理、过程、作用及工作场景羊村懒哥网络网络加速缓存
目录一、CDN的概念二、CDN的工作原理三、CDN的工作过程四、CDN的作用五、CDN可结合使用的技术六、CDN能够解决的网络问题七、CDN的工作场景在当今互联网飞速发展的时代，用户对于网页加载速度和内容获取的时效性要求越来越高。CDN（ContentDeliveryNetwork，⭐内容分发网络）应运而生，它在提升网络性能和用户体验方面发挥着关键作用。本文将详细介绍CDN的概念、工作原理、工作过
vue3-video-play 插件在 Vue 3 项目上的应用放逐者-保持本心，方可放逐 vue3应用 vue.js 前端 javascript vue3-video-play
文章目录vue3-video-play插件在Vue3项目上的应用一、插件简介二、插件安装三、插件组件应用示例1.局部引入组件2.全局引入组件四、需要注意的事项五、本地环境将`package.json`中`"module":"./dist/index.es.js"`改为`"module":"./dist/index.mjs"`问题解析探索问题描述原因分析解决方案格式及应用实例vue3-video-p
Mybatis判断问题：深入解析与实战案例 DTcode7 sql数据库相关数据库 mysql SQL 数据库开发 sql
Mybatis判断问题：深入解析与实战案例基础概念与作用说明``标签``,``,````示例一：基本的``标签使用说明示例二：``,``,``的使用说明示例三：使用``标签简化条件语句说明实际工作中的使用技巧自行拓展内容在现代企业级应用开发中，MyBatis作为一款优秀的持久层框架，以其灵活的SQL映射机制和强大的动态SQL功能，深受广大开发者的喜爱。然而，在使用过程中，如何准确地进行条件判断，特
前端导出word文件—包含canvas(echarts图表) Liuer_Qin js canvas echarts echarts 前端 javascript
一、使用的插件html-docx-js二、整体思路因为canvas是运行在内存中的，所以不能简单的通过dom获取canvas图片，需要手动的先将canvas转为image。三、实现先克隆要下载的DOM的副本。因为canvas是运行在内存中的，所以也不能通过cloneNode方法克隆下来（克隆下来是空的）。我们这里将原DOM中的canvas转成图片，然后插入到副本的对应位置，这样操作不会影响原DOM
linux网络安全网络安全Max linux web安全运维
Linux网络安全一直是IT行业中备受关注的话题，而红帽作为Linux操作系统的知名发行版，在网络安全领域也扮演着重要的角色。红帽公司一直致力于为用户提供安全可靠的Linux解决方案，以帮助用户建立强大的网络安全防护体系。首先，红帽操作系统本身具有较高的安全性。作为一款开源操作系统，Linux具有代码透明、强大的权限管理和丰富的安全功能等特点，这使得Linux相对于其他闭源操作系统更加安全可靠。而
深入解析JVM性能问题定位与优化测试不打烊性能测试 jvm 性能优化
JVM性能问题定位与优化详解：架构、内存、Linux命令与监控工具的全面解析引言Java虚拟机（JVM）是运行Java应用程序的核心组件，它管理内存、执行字节码，并提供垃圾回收机制等功能。然而，随着应用规模的增长，JVM的性能问题时常会成为系统瓶颈。为了有效定位和优化JVM性能问题，我们需要从JVM架构、内存管理、Linux系统命令，以及监控工具入手，对JVM的各类指标进行详尽的分析和优化。本文将
安装与部署openeuler 的HA VX-IT BANG 服务器网络 linux
实现原理LinuxHA（HighAvailability，高可用性）是指利用Linux操作系统构建的高可用集群解决方案，旨在确保关键业务服务在面临硬件故障、软件错误、网络中断等各种异常情况时，依然能够持续、稳定地运行，尽量减少服务中断时间，提高系统的可靠性和可用性。以下从几个方面详细介绍：关键组件和技术心跳监测（Heartbeat）这是LinuxHA系统中最基础也是最重要的组件之一。它通过在节点之
关于个人财务系统的javaweb小项目竹木有心 tomcat java
个人财务管理系统-项目计划书1.项目背景与目的随着现代社会的进步与人们收入水平的提高，个人财务的管理变得越来越重要。如何有效地记录、管理、分析个人的收支状况，成为了很多人关注的焦点。本项目旨在设计并实现一个基于JavaWeb技术的个人财务管理系统，通过该系统，用户可以轻松管理自己的收入与支出，查看财务统计分析，帮助用户进行财务规划与控制。本系统适用于大三学生的课程设计要求，涉及JavaWeb技术、
【自然语言处理|迁移学习-08】：中文语料完型填空爱学习不掉头发深度学习自然语言处理（NLP）自然语言处理迁移学习人工智能
文章目录1中文语料完型填空任务介绍2数据集加载及处理3定义下游任务模型4模型训练5.模型测试1中文语料完型填空任务介绍任务介绍：完成中文语料完型填空完型填空是一个分类问题，[MASK]单词有21128种可能数据构建实现分析：使用迁移学习方式完成使用预训练模型bert模型提取文特征，后面添加全连接层和softmax进行单标签多分类2数据集加载及处理数据介绍：数据文件有三个train.csv，test
已经commit但是没有push，想撤回本次commit 逐云之巅 git git
使用gitreset命令撤回提交，有三种模式可选：1.gitreset--softHEAD~（推荐）#将HEAD指针移动到上一个提交，但保留暂存区和工作区的更改。这意味着你可以重新提交这些更改，但不需要重新gitadd。2.gitreset(--mixed)HEAD~#不带参数或者带参数--mixed；撤销提交，将更改的文件和目录恢复到工作区，需要手动暂存和更改3.gitreset--hardHE
揭秘 CSS Houdini：用浏览器魔法解锁 CSS 的终极潜力寒鸦xxx css houdini 前端
一、为什么我们需要CSSHoudini？1.1传统CSS的困境当我们试图用CSS实现一个波浪形边框时，通常会经历这样的挣扎：/*传统实现方案*/.wave-border{position:relative;overflow:hidden;}.wave-border::after{content:'';position:absolute;/*需要复杂计算和多个伪元素拼接*/}这种实现方式存在三个致命
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
ubuntu22.4搭建单节点es8.1 宇智波云大数据项目运维 elasticsearch
下载对应的包elasticsearch-8.1.1-linux-x86_64.tar.gz创建es租户groupaddelasticsearcuseraddelasticsearch-gelasticsearch-pelasticsearchchmodu+w/etc/sudoerschmod-Relasticsearch:elasticsearchelasticsearch修改配置文件vim/et
关于防火墙运维面试题2 编织幻境的妖运维网络 php
三、防火墙配置与管理类21.如何根据企业的网络安全策略，制定一套全面的防火墙规则集？需要考虑哪些关键因素？以下是根据企业网络安全策略制定全面防火墙规则集的指导，以及需要考虑的关键因素：一、关键因素（一）网络架构与拓扑了解企业的网络结构明确企业网络是简单的星型拓扑、复杂的网状拓扑还是混合拓扑等。例如，在星型拓扑中，所有设备都连接到一个中心交换机或集线器，这种结构下防火墙规则可能相对集中和简单；而在网
ubuntu终端常用快捷键 superyuanzhe linux linux
转自http://forum.ubuntu.org.cn/viewtopic.php?f=86&t=318908今天看到一个有关快捷键的帖子，觉得不错，粘过来大家看看:BashShell快捷键l：删除从光标到行尾的部分l：删除从光标到行首的部分l：删除从光标到当前单词结尾的部分l：删除从光标到当前单词开头的部分l：将光标移到行首l：将光标移到行尾l：将光标移到当前单词头部l：将光标移到当前单词尾部
Linux发展史：从个人项目到开源帝国的技术演进 ♢.＊人工智能大模型 Linux 操作系统
一、起源与诞生（1960s-1991）UNIX的奠基Linux的基因可追溯至1969年贝尔实验室的KenThompson与DennisRitchie。为运行《星际旅行》游戏，Thompson用BCPL语言开发了UNIX原型，后由Ritchie以C语言重构，成为首个可移植操作系统12。其“一切皆文件”的设计哲学深刻影响了后续系统架构1。MINIX的启发1987年，AndrewS.Tanenbaum开
webpack性能优化策略雅望天堂i webpack 前端 node.js
1.代码分割（CodeSplitting）通过代码分割，可以将代码拆分成多个较小的文件，实现按需加载，减少首屏加载时间。使用SplitChunksPlugin将公共代码提取到单独的chunk中，避免重复打包。config.optimization.splitChunks({chunks:'all',cacheGroups:{//第三方组件libs:{name:'chunk-libs',test:/
mac下docker搭建nginx+php+mysql,并实现nginx负载均衡自娱自乐22 macos docker nginx 负载均衡 php
一环境系统：macOSSonoma14.3芯片：AppleM3Prodocker版本：25.0.5二软件OrbStack[推荐，一款轻量化的docker管理软件，还是docker的命令]item2三步骤拉取nginx镜像dockerpullnginx新建一个nginx容器dockerrun--namenginx5-d-p80:80nginx确认nginx内部的目录[第一次一定要确认下目录]-配置目
亲测centos7安装docker可用 a4132447 云原生 docker linux 运维
1.配置yum下载源为aliyun源yum-config-manager--add-repohttps://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo备份当前的yum源mv/etc/yum.repos.d/CentOS-Base.repo/etc/yum.repos.d/CentOS-Base.repo.backup下载新的Ce
Ubuntu 常用快捷键及操作技巧 YsDynamic ubuntu linux 运维操作系统
Ubuntu是一种流行的Linux操作系统，拥有许多强大的功能和快捷键，可以提高工作效率。本文将详细介绍一些常用的Ubuntu快捷键和操作技巧，帮助您更好地利用Ubuntu。终端快捷键Ubuntu的终端是一个强大的工具，可以通过快捷键加快命令行操作。Ctrl+Alt+T：打开一个新的终端窗口。Ctrl+Shift+T：在当前终端窗口中打开一个新的选项卡。Ctrl+Shift+W：关闭当前终端选项卡
RHEL 安装 Hadoop 服务器 XhClojure hadoop 服务器大数据
在这篇文章中，我们将探讨如何在RedHatEnterpriseLinux(RHEL)上安装和配置Hadoop服务器。Hadoop是一个开源的分布式数据处理框架，用于处理大规模数据集。以下是在RHEL上安装Hadoop的详细步骤。步骤1：安装Java在安装Hadoop之前，我们需要确保系统上安装了JavaDevelopmentKit(JDK)。执行以下命令安装JDK：sudoyuminstallja
【Go语言快速上手】第二部分：Go语言进阶之测试与性能优化卜及中 Golang golang 性能优化 log4j
文章目录前言：测试和性能优化一、编写单元测试和基准测试1.1单元测试1.1.1示例：编写单元测试1.2基准测试1.2.1示例：编写基准测试二、使用pprof进行性能分析2.1启用pprof2.1.1示例：启用pprof2.2使用pprof工具分析性能2.2.1示例：生成CPU性能报告2.2.2示例：生成内存使用报告2.3分析报告三、代码优化技巧3.1减少内存分配3.1.1示例：重用切片3.2避免锁
如何安装配置虚拟机薇晶晶 hadoop 大数据分布式
1.CentOS-7-x86_64-Minimal-2009.iso：linux安装文件。用来安装系统。2.VMware17.6.exe：虚拟机软件。用来在自己的电脑上安装虚拟机。它调用CentOS-7-x86_64-Minimal-2009.iso来安装操作系统.3.VC_redist.x86.exe:系统补丁。如果安装VMware17.6时，提示缺少文件，再来安装它，否则不用。4.finals
代理IP助力AI图像处理，开启行业新篇章傻啦嘿哟关于代理IP那些事儿人工智能 tcp/ip 图像处理
目录一、代理IP技术简介二、代理IP在AI图像处理中的应用1.提升数据访问速度2.增强数据处理能力3.突破网络限制三、代理IP在AI图像处理中的实际案例案例一：AI图像生成软件案例二：AI动画创作四、代理IP技术的未来展望五、结语在科技日新月异的今天，AI图像处理技术以其广泛的应用前景和强大的处理能力，正深刻改变着我们的世界。从人脸识别、自动驾驶到医学影像分析，AI图像处理技术无处不在，发挥着不可
【Python 学习 / 7】模块与文件操作卜及中 Python基础 python 学习数据库
文章目录前言一、导入模块1.导入整个模块2.导入模块中的特定函数3.给模块或函数起别名二、常用模块1.`math`模块2.`random`模块3.`os`模块4.`sys`模块三、文件处理1.打开文件2.读取文件3.写入文件4.关闭文件5.使用`with`语句管理文件四、日期时间1.`datetime`模块获取当前日期和时间创建日期和时间对象格式化日期和时间解析字符串为日期对象2.`time`模块
如何安装Hadoop 薇晶晶 hadoop 大数据分布式
Hadoop入门(一)——CentOS7下载+VM上安装（手动分区）Hadoop入门(二)——VMware虚拟网络设置+Windows10的IP地址配置+CentOS静态IP设置Hadoop入门(三)——XSHELL7远程访问工具+XFTP7文件传输Hadoop入门(四)——模板虚拟机环境准备Hadoop入门(五)——Hadoop集群搭建-克隆三台虚拟机Hadoop入门(六)——JDK安装Hado
A、B、C三级机房数据中心是怎么划分的？ wayuncn 网络服务器云计算运维
依据国家GB50174《电子信息系统机房设计规范》规定，数据中心设计时迎根据机房的使用性质，管理要求及其在经济社会中的重要性确认机房级别，划分为A、B、C三级。1.A级:符合以下情况之一的数据中心应为A级(1)电子信息系统运行中断将造成重大的经济损失;(2)电子信息系统运行中断将造成公共场所秩序严重混乱。A级为容错型，A级电子信息系统机房内的场地设备应按容错系统配置，在电子信息系统运行期间，场地设
23种设计模式-享元(Flyweight)设计模式萨达大软考中级-软件设计师设计模式享元模式软考软件设计师 C++行为型设计模式 JAVA
文章目录一.什么是享元设计模式？二.享元模式的特点三.享元模式的结构四.享元模式的优缺点五.享元模式的C++实现六.享元模式的JAVA实现七.代码解析八.总结类图：享元设计模式类图一.什么是享元设计模式？享元（Flyweight）设计模式是一种结构型设计模式，通过共享对象来减少内存占用和对象创建开销。它通过将对象的可共享部分与不可共享部分分离，减少重复对象的数量，从而节省内存。享元模式的核心思
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

Linux shell 脚本编程-高级篇 （三）

你可能感兴趣的:(Linux shell 脚本编程-高级篇 （三）)

Linux shell 脚本编程-高级篇（三）

你可能感兴趣的:(Linux shell 脚本编程-高级篇（三）)