devalone

Linux shell 脚本编程-高级篇（六）

继： Linux shell 脚本编程-高级篇（五）

6. gawk 进阶

本节将进一步深入了解如何定制 gawk。gawk 是一门功能丰富的编程语言，可以通过它所提供的各种特性来编写高级程序处理数据。

6.1 使用变量

所有编程语言共有的一个重要特性是使用变量来存取值。gawk编程语言支持两种不同类型的变量：

□ 内建变量
□ 自定义变量

gawk 有一些内建变量。这些变量存放用来处理数据文件中的数据字段和记录的信息。用户也可以在 gawk 程序里创建自己的变量。

6.1.1 内建变量
-----------------------------------------------------------------------------------------------------------------------------------------

gawk 程序使用内建变量来引用程序数据里的一些特殊功能。

■ 字段和记录分隔符变量
-----------------------------------------------------------------------------------------------------------------------------------------
数据字段变量允许使用美元符号（$）和字段在该记录中的位置值来引用记录对应的字段。要引用记录中的第一个数据字段，就用变量 $1；引用第二个字段，
就用 $2，依次类推。

数据字段是由字段分隔符来划定的。默认情况下，字段分隔符是一个空白字符，也就是空格符或者制表符。在命令行下使用命令行参数 -F 或者在 gawk 程序
中使用特殊的内建变量 FS 来更改字段分隔符。

内建变量 FS 是一组内建变量中的一个，这组变量用于控制 gawk 如何处理输入输出数据中的字段和记录。下表列出了这些内建变量：

   gawk 数据字段和记录变量
   +---------------+-------------------------------------------------------------------------
   | 变量           | 描述
   +---------------+-------------------------------------------------------------------------
   | FIELDWIDTHS   | 由空格分隔的一列数字，定义了每个数据字段确切宽度
   +---------------+-------------------------------------------------------------------------
   | FS           | 输入字段分隔符
   +---------------+-------------------------------------------------------------------------
   | RS           | 输入记录分隔符
   +---------------+-------------------------------------------------------------------------
   | OFS           | 输出字段分隔符
   +---------------+-------------------------------------------------------------------------
   | ORS           | 输出记录分隔符
   +---------------+-------------------------------------------------------------------------

变量 FS 和 OFS 定义了 gawk 如何处理数据流中的数据字段。我们已经知道了如何使用变量 FS 来定义记录中的字段分隔符。变量 OFS 具备相同的功能，
只不过是用在 print 命令的输出上。

默认情况下，gawk 将 OFS 设成一个空格，所以如果用命令：

print $1,$2,$3

会看到如下输出：

   field1 field2 field3

示例：
   [devalone@devalone 22]$ cat data1
   data11,data12,data13,data14,data15
   data21,data22,data23,data24,data25
   data31,data32,data33,data34,data35
   [devalone@devalone 22]$ gawk 'BEGIN{FS=","} {print $1,$2,$3}' data1
   data11 data12 data13
   data21 data22 data23
   data31 data32 data33

print 命令会自动将 OFS 变量的值放置在输出中的每个字段间。通过设置 OFS 变量，可以在输出中使用任意字符串来分隔字段。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{FS=",";OFS="-"} {print $1,$2,$3}' data1
   data11-data12-data13
   data21-data22-data23
   data31-data32-data33

   [devalone@devalone 22]$ gawk 'BEGIN{FS=",";OFS="--"} {print $1,$2,$3}' data1
   data11--data12--data13
   data21--data22--data23
   data31--data32--data33

   [devalone@devalone 22]$ gawk 'BEGIN{FS=",";OFS="<-->"} {print $1,$2,$3}' data1
   data11<-->data12<-->data13
   data21<-->data22<-->data23
   data31<-->data32<-->data33

FIELDWIDTHS 变量允许不依靠字段分隔符来读取记录。在一些应用程序中，数据并没有使用字段分隔符，而是被放置在了记录中的特定列。这种情况下，必须
设定 FIELDWIDTHS 变量来匹配数据在记录中的位置。

一旦设置了 FIELDWIDTH 变量，gawk 就会忽略 FS 变量，并根据提供的字段宽度来计算字段。下面是个采用字段宽度而非字段分隔符的例子:

   [devalone@devalone 22]$ cat data1b
   1005.3247596.37
   115-2.349194.00
   05810.1298100.1
   [devalone@devalone 22]$ gawk 'BEGIN{FIELDWIDTHS="3 5 2 5"}{print $1,$2,$3}' data1b
   100 5.324 75
   115 -2.34 91
   058 10.12 98

FIELDWIDTHS 变量定义了四个字段，gawk 依此来解析数据记录。每个记录中的数字串会根据已定义好的字段长度来分割。

   NOTE:
   -------------------------------------------------------------------------------------------------------------------------------------
   一定要记住，一旦设定了 FIELDWIDTHS 变量的值，就不能再改变了。这种方法并不适用于变长的字段。

变量 RS 和 ORS定义了 gawk程序如何处理数据流中的字段。默认情况下，gawk 将 RS 和 ORS 设为换行符。默认的 RS 值表明，输入数据流中的每行新文本
就是一条新纪录。

有时，会在数据流中碰到占据多行的字段。典型的例子是包含地址和电话号码的数据，其中地址和电话号码各占一行。

   Riley Mullen
   123 Main Street
   Chicago, IL 60601
   (312)555-1234

如果用默认的 FS 和 RS 变量值来读取这组数据，gawk 就会把每行作为一条单独的记录来读取，并将记录中的空格当作字段分隔符。这可不是希望看到的。

要解决这个问题，只需把 FS 变量设置成换行符。这就表明数据流中的每行都是一个单独的字段，每行上的所有数据都属于同一个字段。但现在令人头疼的
是无从判断一个新的数据行从何开始。

对于这一问题，可以把 RS 变量设置成空字符串，然后在数据记录间留一个空白行。gawk 会把每个空白行当作一个记录分隔符。

示例：
   [devalone@devalone 22]$ cat data2
   Riley Mullen
   123 Main Street
   Chicago, IL 60601
   (312)555-1234

   Frank Williams
   456 Oak Street
   Indianapolis, IN 46201
   (317)555-9876

   Haley Snell
   4231 Elm Street
   Detroit, MI 48201
   (313)555-4938
   [devalone@devalone 22]$ gawk 'BEGIN{FS="\n"; RS=""} {print $1,$4}' data2
   Riley Mullen (312)555-1234
   Frank Williams (317)555-9876
   Haley Snell (313)555-4938

现在 gawk 把文件中的每行都当成一个字段，把空白行当作记录分隔符。

■ 数据变量
-----------------------------------------------------------------------------------------------------------------------------------------
除了字段和记录分隔符变量外，gawk 还提供了其他一些内建变量来帮助了解数据发生了什么变化，并提取 shell 环境的信息。下表列出了 gawk 中的其他
内建变量：

   更多的 gawk 内建变量
   +---------------+--------------------------------------------------------------------------
   | 变量           | 描述
   +---------------+--------------------------------------------------------------------------
   | ARGC           | 当前命令行参数个数
   +---------------+--------------------------------------------------------------------------
   | ARGIND       | 当前文件在ARGV中的位置
   +---------------+--------------------------------------------------------------------------
   | ARGV           | 包含命令行参数的数组
   +---------------+--------------------------------------------------------------------------
   | CONVFMT       | 数字的转换格式（参见printf语句），默认值为%.6 g
   +---------------+--------------------------------------------------------------------------
   | ENVIRON       | 当前shell环境变量及其值组成的关联数组
   +---------------+--------------------------------------------------------------------------
   | ERRNO           | 当读取或关闭输入文件发生错误时的系统错误号
   +---------------+--------------------------------------------------------------------------
   | FILENAME       | 用作gawk输入数据的数据文件的文件名
   +---------------+--------------------------------------------------------------------------
   | FNR           | 当前数据文件中的数据行数
   +---------------+--------------------------------------------------------------------------
   | IGNORECASE   | 设成非零值时，忽略gawk命令中出现的字符串的字符大小写
   +---------------+--------------------------------------------------------------------------
   | NF           | 数据记录中的字段总数
   +---------------+--------------------------------------------------------------------------
   | NR           | 已处理的输入记录数
   +---------------+--------------------------------------------------------------------------
   | OFMT           | 数字的输出格式，默认值为%.6 g
   +---------------+--------------------------------------------------------------------------
   | RLENGTH       | 由 match 函数所匹配的子字符串的长度
   +---------------+--------------------------------------------------------------------------
   | RSTART       | 由 match 函数所匹配的子字符串的起始位置
   +---------------+--------------------------------------------------------------------------

ARGC 和 ARGV 变量允许从 shell 中获得命令行参数的总数以及它们的值。但这可能有点麻烦，因为 gawk 并不会将程序脚本当成命令行参数的一部分。

如：
   [devalone@devalone 22]$ gawk 'BEGIN{print ARGC,ARGV[0]}' data1
   2 gawk
   [devalone@devalone 22]$ gawk 'BEGIN{print ARGC,ARGV[1]}' data1
   2 data1

ARGC 变量表明命令行上有两个参数。这包括 gawk 命令和 data1参数（记住，程序脚本并不算参数）。ARGV 数组从索引 0 开始，代表的是命令。第一个
数组值是 gawk 命令后的第一个命令行参数。

   NOTE:
   -------------------------------------------------------------------------------------------------------------------------------------
   跟 shell 变量不同，在脚本中引用 gawk 变量时，变量名前不加美元符。

ENVIRON 变量使用关联数组来提取 shell 环境变量。关联数组用文本作为数组的索引值，而不是数值。

数组索引中的文本是 shell 环境变量名，而数组的值则是 shell 环境变量的值。

示例：
   [devalone@devalone 22]$ gawk '
   > BEGIN{
   > print ENVIRON["HOME"]
   > print ENVIRON["PATH"]
   > }'
   /home/devalone
   /usr/local/protoc/bin:/home/devalone/programs/apache-tomcat-8.5.11/bin:/usr/local/apache/maven/bin:/usr/local/apache/ant/bin

ENVIRON["HOME"] 变量从 shell 中提取了 HOME 环境变量的值。类似地，ENVIRON["PATH"] 提取了 PATH 环境变量的值。可以用这种方法来从 shell 中
提取任何环境变量的值，以供 gawk 程序使用。

当要在 gawk 程序中跟踪数据字段和记录时，变量 FNR、NF 和 NR 用起来就非常方便。有时并不知道记录中到底有多少个数据字段。NF 变量可以在不知道
具体位置的情况下指定记录中的最后一个数据字段。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{FS=":";OFS=":"} {print $1, $NF}' /etc/passwd
   root:/bin/bash
   bin:/sbin/nologin
   daemon:/sbin/nologin
   adm:/sbin/nologin
   lp:/sbin/nologin
   sync:/bin/sync
   shutdown:/sbin/shutdown

   ...
   devalone:/bin/bash

NF 变量含有数据记录中最后一个数据字段的数字值。可以在它前面加个美元符将其用作字段变量。

FNR 和 NR 变量虽然类似，但又略有不同。FNR 变量含有当前数据文件中已处理过的记录数，NR 变量则含有已处理过的记录总数。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{FS=","}{print $1, "FNR="FNR}' data1 data1
   data11 FNR=1
   data21 FNR=2
   data31 FNR=3
   data11 FNR=1
   data21 FNR=2
   data31 FNR=3

在这个例子中，gawk 程序的命令行定义了两个输入文件（两次指定的是同样的输入文件）。这个脚本会打印第一个数据字段的值和 FNR 变量的当前值。
注意，当 gawk 程序处理第二个数据文件时，FNR 值被设回了 1。

现在，加上 NR 变量看看会输出什么：

   [devalone@devalone 22]$ gawk 'BEGIN{FS=","}{print $1, "FNR="FNR,"NR="NR} END{print "There were",NR, "records processed"}' data1 data1
   data11 FNR=1 NR=1
   data21 FNR=2 NR=2
   data31 FNR=3 NR=3
   data11 FNR=1 NR=4
   data21 FNR=2 NR=5
   data31 FNR=3 NR=6
   There were 6 records processed

FNR 变量的值在 gawk 处理第二个数据文件时被重置了，而 NR 变量则在处理第二个数据文件时继续计数。结果就是：如果只使用一个数据文件作为输入，
FNR 和 NR的值是相同的；如果使用多个数据文件作为输入，FNR 的值会在处理每个数据文件时被重置，而 NR 的值则会继续计数直到处理完所有的数据文件。

6.1.2 自定义变量
-----------------------------------------------------------------------------------------------------------------------------------------
跟其他典型的编程语言一样，gawk 允许用户定义自己的变量在程序代码中使用。gawk 自定义变量名可以是任意数目的字母、数字和下划线，但不能以数字
开头。gawk 变量名区分大小写。

■ 在脚本中给变量赋值
-----------------------------------------------------------------------------------------------------------------------------------------
在 gawk 程序中给变量赋值跟在 shell 脚本中赋值类似，都用赋值语句：

   [devalone@devalone 22]$ gawk '
   > BEGIN{
   > testing="This is a test"
   > print testing
   > }'
   This is a test

print 语句的输出是 testing 变量的当前值。跟 shell 脚本变量一样，gawk 变量可以保存数值或文本值。

示例：
   [devalone@devalone 22]$ gawk '
   > BEGIN{
   > testing="this is a test"
   > print testing
   > testing=45
   > print testing
   > }'
   this is a test
   45

在这个例子中，testing 变量的值从文本值变成了数值。

赋值语句还可以包含数学算式来处理数字值：

[devalone@devalone 22]$ gawk 'BEGIN {x=4;x=x * 2 + 3; print x}'
11

gawk 编程语言包含了用来处理数字值的标准算数操作符。其中包括求余符号（%）和幂运算符号（^或**）。

■ 在命令行上给变量赋值
-----------------------------------------------------------------------------------------------------------------------------------------
也可以用 gawk 命令行来给程序中的变量赋值。这允许在正常的代码之外赋值，即时改变变量的值。下面的例子使用命令行变量来显示文件中特定数据字段。

示例：
   [devalone@devalone 22]$ cat script1.gawk
   BEGIN{FS=","}
   {print $n}
   [devalone@devalone 22]$ gawk -f script1.gawk n=2 data1
   data12
   data22
   data32
   [devalone@devalone 22]$ gawk -f script1.gawk n=3 data1
   data13
   data23
   data33

这个特性可以在不改变脚本代码的情况下就能够改变脚本的行为。第一个例子显示了文件的第二个数据字段，第二个例子显示了第三个数据字段，只要在命令
行上设置 n 变量的值就行。

使用命令行参数来定义变量值会有一个问题。在设置了变量后，这个值在代码的 BEGIN 部分不可用。

示例：
   [devalone@devalone 22]$ cat script2.gawk
   BEGIN{print "The starting value is",n; FS=","}
   {print $n}
   [devalone@devalone 22]$ gawk -f script2.gawk n=3 data1
   The starting value is
   data13
   data23
   data33

可以用 -v 命令行参数来解决这个问题。它允许在 BEGIN 代码之前设定变量。在命令行上，-v 命令行参数必须放在脚本代码之前。

示例：
   [devalone@devalone 22]$ gawk -v n=3 -f script2.gawk data1
   The starting value is 3
   data13
   data23
   data33

现在在 BEGIN 代码部分中的变量 n 的值已经是命令行上设定的那个值了。

6.2 处理数组
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言使用关联数组提供数组功能。关联数组跟数字数组不同之处在于它的索引值可以是任意文本字符串。不需要用连续的数字来标识数组中的数据
元素。相反，关联数组用各种字符串来引用值。每个索引字符串都必须能够唯一地标识出赋给它的数据元素。

6.2.1 定义数组变量
-----------------------------------------------------------------------------------------------------------------------------------------
可以用标准赋值语句来定义数组变量。数组变量赋值的格式如下：

var[index] = element

其中 var 是变量名，index 是关联数组的索引值，element 是数据元素值。下面是一些 gawk 中数组变量的例子:

   capital["Illinois"] = "Springfield"
   capital["Indiana"] = "Indianapolis"
   capital["Ohio"] = "Columbus"

在引用数组变量时，必须包含索引值来提取相应的数据元素值。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > capital["Illinois"] = "Springfield"
   > print capital["Illinois"]
   > }'
   Springfield

在引用数组变量时，会得到数据元素的值。数据元素值是数字值时也一样。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > var[1] = 34
   > var[2] = 3
   > total = var[1] + var[2]
   > print total
   > }'
   37

可以像使用 gawk 程序中的其他变量一样使用数组变量。

6.2.2 遍历数组变量
-----------------------------------------------------------------------------------------------------------------------------------------
关联数组变量的问题在于可能无法知晓索引值是什么。跟使用连续数字作为索引值的数字数组不同，关联数组的索引可以是任何东西。

如果要在 gawk 中遍历一个关联数组，可以用 for 语句的一种特殊形式：

   for (var in array)
   {
       statements
   }

这个 for 语句会在每次循环时将关联数组 array 的下一个索引值赋给变量 var，然后执行一遍 statements。重要的是记住这个变量中存储的是索引值而
不是数组元素值。可以将这个变量用作数组的索引，轻松地取出数据元素值。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > var["a"] = 1
   > var["b"] = 2
   > var["m"] = 3
   > var["u"] = 4
   > for (test in var)
   > {
   >     print "Index:", test, " - Value:", var[test]
   > }
   > }'
   Index: u - Value: 4
   Index: m - Value: 3
   Index: a - Value: 1
   Index: b - Value: 2

注意，索引值不会按任何特定顺序返回，但它们都能够指向对应的数据元素值。明白这点很重要，因为不能指望返回的值都是有固定的顺序，只能保证索引值
和数据值是对应的。

6.2.3 删除数组变量
-----------------------------------------------------------------------------------------------------------------------------------------
从关联数组中删除数组索引要用一个特殊的命令:

delete array[index]

删除命令会从数组中删除关联索引值和相关的数据元素值。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > var["a"] = 1
   > var["g"] = 2
   > for (test in var)
   > {
   >    print "Index:", test, " - Value:", var[test]
   > }
   > delete var["g"]
   > print "---"
   > for (test in var)
   > {
   >    print "Index:", test, " - Value:", var[test]
   > }
   > }'
   Index: a - Value: 1
   Index: g - Value: 2
   ---
   Index: a - Value: 1

一旦从关联数组中删除了索引值，就没法再用它来提取元素值。

6.3 使用模式
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 程序支持多种类型的匹配模式来过滤数据记录，这一点跟 sed 编辑器大同小异。之前已经介绍了两种特殊的模式在实践中的应用。BEGIN 和 END 关键
字是用来在读取数据流之前或之后执行命令的特殊模式。类似地，也可以创建其他模式在数据流中出现匹配数据时执行一些命令。

6.3.1 正则表达式
-----------------------------------------------------------------------------------------------------------------------------------------
可以用基础正则表达式（BRE）或扩展正则表达式（ERE）来选择程序脚本作用在数据流中的哪些行上。

在使用正则表达式时，正则表达式必须出现在它要控制的程序脚本的左花括号前。

示例：
   [devalone@devalone 22]$ cat data1
   data11,data12,data13,data14,data15
   data21,data22,data23,data24,data25
   data31,data32,data33,data34,data35
   [devalone@devalone 22]$ gawk 'BEGIN{FS=","} /11/{print $1}' data1
   data11

正则表达式 /11/ 匹配了数据字段中含有字符串11的记录。gawk 程序会用正则表达式对记录中所有的数据字段进行匹配，包括字段分隔符。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{FS=","} /,d/{print $1}' data1
   data11
   data21
   data31

这个例子使用正则表达式匹配了用作字段分隔符的逗号。这也并不总是件好事。它可能会造成如下问题：当试图匹配某个数据字段中的特定数据时，这些
数据又出现在其他数据字段中。如果需要用正则表达式匹配某个特定的数据实例，应该使用匹配操作符。

6.3.2 匹配操作符
-----------------------------------------------------------------------------------------------------------------------------------------
匹配操作符（matching operator）允许将正则表达式限定在记录中的特定数据字段。匹配操作符是波浪线（~）。可以指定匹配操作符、数据字段变量以及
要匹配的正则表达式，如：

$1 ~ /^data/

$1 变量代表记录中的第一个数据字段。这个表达式会过滤出第一个字段以文本 data 开头的所有记录。

示例：
[devalone@devalone 22]$ gawk 'BEGIN{FS=","} $2 ~ /^data2/{print $0}' data1
data21,data22,data23,data24,data25

匹配操作符会用正则表达式 /^data2/ 来比较第二个数据字段，该正则表达式指明字符串要以文本 data2 开头。

这是件强大的工具，gawk 程序脚本中经常用它在数据文件中搜索特定的数据元素。

示例：
[devalone@devalone 22]$ gawk -F: '$1 ~ /devalone/{print $1, $NF}' /etc/passwd
devalone /bin/bash

这个例子会在第一个数据字段中查找文本 devalon。如果在记录中找到了这个模式，它会打印该记录的第一个和最后一个数据字段值。

也可以用 ! 符号来排除正则表达式的匹配：

$1 !~ /expression/

如果记录中没有找到匹配正则表达式的文本，程序脚本就会作用到记录数据。

示例：
   [devalone@devalone 22]$ gawk -F: '$1 !~ /devalone/{print $1, $NF}' /etc/passwd
   root /bin/bash
   bin /sbin/nologin
   daemon /sbin/nologin
   adm /sbin/nologin
   lp /sbin/nologin
   sync /bin/sync
   shutdown /sbin/shutdown
   halt /sbin/halt
   mail /sbin/nologin
   ...

这个例子中，gawk 程序脚本打印 /etc/passwd 文件中与用户ID devalone 不匹配的用户ID和登录 shell。

6.3.3 数学表达式
-----------------------------------------------------------------------------------------------------------------------------------------
除了正则表达式，也可以在匹配模式中用数学表达式。这个功能在匹配数据字段中的数字值时非常方便。

示例：显示所有属于root用户组（组ID为0）的系统用户

   [devalone@devalone 22]$ gawk -F: '$4 == 0{print $1}' /etc/passwd
   root
   sync
   shutdown
   halt
   operator

这段脚本会查看第四个数据字段含有值 0 的记录。在这个 Linux 系统中，有五个用户账户属于 root 用户组。

可以使用任何常见的数学比较表达式：

   □ x == y：值x等于y。
   □ x <= y：值x小于等于y。
   □ x < y：值x小于y。
   □ x >= y：值x大于等于y。
   □ x > y：值x大于y。

也可以对文本数据使用表达式，但必须小心。跟正则表达式不同，表达式必须完全匹配。数据必须跟模式严格匹配。

示例：
   [devalone@devalone 22]$ gawk -F, '$1 == "data"{print $1}' data1
   [devalone@devalone 22]$
   [devalone@devalone 22]$ gawk -F, '$1 == "data11"{print $1}' data1
   data11
   [devalone@devalone 22]$

第一个测试没有匹配任何记录，因为第一个数据字段的值不在任何记录中。第二个测试用值 data11 匹配了一条记录。

6.4 结构化命令
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言支持常见的结构化编程命令。

6.4.1 if 语句
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言支持标准的 if-then-else 格式的 if 语句。必须为 if 语句定义一个求值的条件，并将其用圆括号括起来。如果条件求值为 TRUE，紧跟在
if 语句后的语句会执行。如果条件求值为 FALSE，这条语句就会被跳过。可以用这种格式：

if (condition)
statement1

也可以将它放在一行上，像这样：

if (condition) statement1

示例：
   [devalone@devalone 22]$ gawk '{if ($1 > 20) print $1}' data4
   50
   34

如果需要在 if 语句中执行多条语句，就必须用花括号将它们括起来。

示例：
   [devalone@devalone 22]$ gawk '{
   > if ($1 > 20)
   > {
   >     x = $1 * 2
   >     print x
   > }
   > }' data4
   100
   68

注意，不能弄混 if 语句的花括号和用来表示程序脚本开始和结束的花括号。如果弄混了，gawk 程序能够发现丢失了花括号，并产生一条错误消息。

gawk 的 if 语句也支持 else 子句，允许在 if 语句条件不成立的情况下执行一条或多条语句。

示例：
   [devalone@devalone 22]$ gawk '{
   > if ($1 > 20)
   > {
   >     x = $1 * 2
   >     print x
   > } else
   > {
   >     x = $1 /2
   >     print x
   > }}' data4
   5
   2.5
   6.5
   100
   68

可以在单行上使用 else 子句，但必须在 if 语句部分之后使用分号：

   if (condition) statement1; else statement2

示例：
   [devalone@devalone 22]$ gawk '{if ($1 > 20) print $1 * 2; else print $1/2}' data4
   5
   2.5
   6.5
   100
   68

这个格式更紧凑，但也更难理解。

6.4.2 while 语句
-----------------------------------------------------------------------------------------------------------------------------------------
while 语句为 gawk 程序提供了一个基本的循环功能。下面是 while 语句的格式：

   while (condition)
   {
       statements
   }

while 循环允许遍历一组数据，并检查迭代的结束条件。如果在计算中必须使用每条记录中的多个数据值，这个功能能帮得上忙。

示例：
   [devalone@devalone 22]$ cat data5
   130 120 135
   160 113 140
   145 170 215
   [devalone@devalone 22]$ gawk '{
   > total = 0
   > i = 1
   > while (i < 4)
   > {
   >     total += $i
   >     i++
   > }
   > avg = total / 3
   > print "Average:",avg
   > }' data5
   Average: 128.333
   Average: 137.667
   Average: 176.667

while 语句会遍历记录中的数据字段，将每个值都加到 total 变量上，并将计数器变量 i 增值。当计数器值等于 4 时，while 的条件变成了 FALSE，循环
结束，然后执行脚本中的下一条语句。这条语句会计算并打印出平均值。这个过程会在数据文件中的每条记录上不断重复。

gawk 编程语言支持在 while 循环中使用 break 语句和 continue语句，允许从循环中跳出。

示例：
   [devalone@devalone 22]$ gawk '{
   > total = 0
   > i = 1
   > while (i < 4)
   > {
   >     total += $i
   >     if (i == 2)
   >         break
   >     i++
   > }
   > avg = total / 2
   > print "The average of the first two data elements is:",avg
   > }' data5
   The average of the first two data elements is: 125
   The average of the first two data elements is: 136.5
   The average of the first two data elements is: 157.5

6.4.3 do-while 语句
-----------------------------------------------------------------------------------------------------------------------------------------
do-while 语句类似于 while 语句，但会在检查条件语句之前执行命令。下面是 do-while 语句的格式：

   do
   {
       statements
   } while (condition)

这种格式保证了语句会在条件被求值之前至少执行一次。当需要在求值条件前执行语句时，这个特性非常方便。

示例：
   [devalone@devalone 22]$ gawk '{
   > total = 0
   > i = 1
   > do
   > {
   >     total += $i
   >     i++
   > } while (total < 150)
   > print total }' data5
   250
   160
   315

这个脚本会读取每条记录的数据字段并将它们加在一起，直到累加结果达到 150。如果第一个数据字段大于150（就像在第二条记录中看到的那样），则脚本
会保证在条件被求值前至少读取第一个数据字段的内容。

6.4.4 for 语句
-----------------------------------------------------------------------------------------------------------------------------------------
for 语句是许多编程语言执行循环的常见方法。gawk 编程语言支持 C 风格的 for 循环：

for( variable assignment; condition; iteration process)

示例：
   [devalone@devalone 22]$ gawk '{
   > total = 0
   > for (i=0; i<4; i++)
   > {
   >     total += $i
   > }
   > avg = total / 3
   > print "Average:",avg
   > }' data5
   Average: 171.667
   Average: 191
   Average: 225

定义了 for 循环中的迭代计数器，就不用担心要像使用 while 语句一样自己负责给计数器增值了。

6.5 格式化打印
-----------------------------------------------------------------------------------------------------------------------------------------
print 语句在 gawk 如何显示数据上并未提供多少控制。能做的只是控制输出字段分隔符（OFS）。如果要创建详尽的报表，通常需要为数据选择特定的格式
和位置。

解决办法是使用格式化打印命令，叫作 printf。如果熟悉 C 语言编程的话，gawk 中的 printf 命令用法也是一样，允许指定具体如何显示数据的指令。

printf 命令的格式：

printf "format string", var1, var2 . . .

format string 是格式化输出的关键。它会用文本元素和格式化指定符来具体指定如何呈现格式化输出。格式化指定符是一种特殊的代码，会指明显示什么
类型的变量以及如何显示。gawk 程序会将每个格式化指定符作为占位符，供命令中的变量使用。第一个格式化指定符对应列出的第一个变量，第二个对应第
二个变量，依此类推。

格式化指定符采用如下格式：

%[modifier]control-letter

其中 control-letter 是一个单字符代码，用于指明显示什么类型的数据，而 modifier 则定义了可选的格式化特性。下表列出了可用在格式化指定符中的
控制字母。

   格式化指定符的控制字母
   +-----------+------------------------------------------------------------------------------
   | 控制字母   | 描述
   +-----------+------------------------------------------------------------------------------
   | c           | 将一个数作为ASCII字符显示
   +-----------+------------------------------------------------------------------------------
   | d           | 显示一个整数值
   +-----------+------------------------------------------------------------------------------
   | i           | 显示一个整数值（跟d一样）
   +-----------+------------------------------------------------------------------------------
   | e           | 用科学计数法显示一个数
   +-----------+------------------------------------------------------------------------------
   | f           | 显示一个浮点值
   +-----------+------------------------------------------------------------------------------
   | g           | 用科学计数法或浮点数显示（选择较短的格式）
   +-----------+------------------------------------------------------------------------------
   | o           | 显示一个八进制值
   +-----------+------------------------------------------------------------------------------
   | s           | 显示一个文本字符串
   +-----------+------------------------------------------------------------------------------
   | x           | 显示一个十六进制值
   +-----------+------------------------------------------------------------------------------
   | X           | 显示一个十六进制值，但用大写字母A~F
   +-----------+------------------------------------------------------------------------------

因此，如果需要显示一个字符串变量，可以用格式化指定符 %s。如果需要显示一个整数值，可以用 %d或 %i（%d 是十进制数的 C风格显示方式）。如果要
用科学计数法显示很大的值，就用 %e 格式化指定符。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > x = 10 * 100
   > printf "The answer is: %e\n",x
   > }'
   The answer is: 1.000000e+03

除了控制字母外，还有 3 种修饰符可以用来进一步控制输出：

   □ width：指定了输出字段最小宽度的数字值。如果输出短于这个值，printf 会将文本右对齐，并用空格进行填充。如果输出比指定的宽度还要长，
           则按照实际的长度输出。
   □ prec：这是一个数字值，指定了浮点数中小数点后面位数，或者文本字符串中显示的最大字符数。
   □ -（减号）：指明在向格式化空间中放入数据时采用左对齐而不是右对齐。

在使用 printf 语句时，可以完全控制输出样式。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{FS="\n"; RS=""} {print $1, $4}' data2
   Riley Mullen (312)555-1234
   Frank Williams (317)555-9876
   Haley Snell (313)555-4938

可以用 printf 命令来帮助格式化输出，使得输出信息看起来更美观：

   [devalone@devalone 22]$ gawk 'BEGIN{FS="\n"; RS=""} {printf "%s %s\n", $1, $4}' data2
   Riley Mullen (312)555-1234
   Frank Williams (317)555-9876
   Haley Snell (313)555-4938

注意，需要在 printf 命令的末尾手动添加换行符来生成新行。没添加的话，printf 命令会继续在同一行打印后续输出。如果需要用几个单独的 printf
命令在同一行上打印多个输出，这就会非常有用。

示例：
[devalone@devalone 22]$ gawk 'BEGIN{FS=","} {printf "%s ", $1} END{printf "\n"}' data1
data11 data21 data31

每个 printf 的输出都会出现在同一行上。为了终止该行，END 部分打印了一个换行符。

下一步，用修饰符来格式化第一个字符串值：

   [devalone@devalone 22]$ gawk 'BEGIN{FS="\n"; RS=""} {printf "%16s %s\n", $1, $4}' data2
       Riley Mullen (312)555-1234
      Frank Williams (317)555-9876
       Haley Snell (313)555-4938

通过添加一个值为 16 的修饰符，强制第一个字符串的输出宽度为 16 个字符。默认情况下，printf 命令使用右对齐来将数据放到格式化空间中。要改成
左对齐，只需给修饰符加一个减号即可：

   [devalone@devalone 22]$ gawk 'BEGIN{FS="\n"; RS=""} {printf "%-16s %s\n", $1, $4}' data2
   Riley Mullen     (312)555-1234
   Frank Williams   (317)555-9876
   Haley Snell      (313)555-4938

现在看起来专业多了！

printf 命令在处理浮点值时也非常方便。通过为变量指定一个格式，可以让输出看起来更统一。

示例：
   [devalone@devalone 22]$ gawk '{
   > total = 0
   > for (i = 1; i < 4; i++)
   > {
   >     total += $i
   > }
   > avg = total / 3
   > printf "Average: %5.1f\n",avg
   > }' data5
   Average: 128.3
   Average: 137.7
   Average: 176.7

可以使用 %5.1f 格式指定符来强制 printf 命令将浮点值近似到小数点后一位。

6.6 内建函数
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言提供了不少内置函数，可进行一些常见的数学、字符串以及时间函数运算。可以在 gawk 程序中利用这些函数来减少脚本中的编码工作。

6.6.1 数学函数
-----------------------------------------------------------------------------------------------------------------------------------------
下表列出了 gawk 中内建的数学函数。

   gawk 数学函数
   +---------------+---------------------------------------------------------------------
   | 函数           | 描述
   +---------------+---------------------------------------------------------------------
   | atan2(x, y)   | x/y的反正切，x和y以弧度为单位
   +---------------+---------------------------------------------------------------------
   | cos(x)       | x的余弦，x以弧度为单位
   +---------------+---------------------------------------------------------------------
   | exp(x)       | x的指数函数
   +---------------+---------------------------------------------------------------------
   | int(x)       | x的整数部分，取靠近零一侧的值
   +---------------+---------------------------------------------------------------------
   | log(x)       | x的自然对数
   +---------------+---------------------------------------------------------------------
   | rand()       | 比0大比1小的随机浮点值
   +---------------+---------------------------------------------------------------------
   | sin(x)       | x的正弦，x以弧度为单位
   +---------------+---------------------------------------------------------------------
   | sqrt(x)       | x的平方根
   +---------------+---------------------------------------------------------------------
   | srand(x)       | 为计算随机数指定一个种子值
   +---------------+---------------------------------------------------------------------

虽然数学函数的数量并不多，但 gawk 提供了标准数学运算中要用到的一些基本元素。int() 函数会生成一个值的整数部分，但它并不会四舍五入取近似值。
它的做法更像其他编程语言中的 floor 函数。它会生成该值和 0 之间最接近该值的整数。

这意味着int()函数在值为 5.6 时返回 5，在值为 -5.6 时则返回 -5。

rand() 函数非常适合创建随机数，但需要用点技巧才能得到有意义的值。rand() 函数会返回一个随机数，但这个随机数只在 0和 1之间（不包括0或1）。
要得到更大的数，就需要放大返回值。

产生较大整数随机数的常见方法是用 rand() 函数和 int() 函数创建一个算法。

示例：

   x = int(10 * rand())

这会返回一个 0～9（包括0和9）的随机整数值。只要为程序用上限值替换掉等式中的 10 就可以了。

在使用一些数学函数时要小心，因为 gawk 语言对于它能够处理的数值有一个限定区间。如果超出了这个区间，就会得到一条错误消息。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{x = exp(100); print x}'
   26881171418161356094253400435962903554686976
   [devalone@devalone 22]$ gawk 'BEGIN{x = exp(1000); print x}'
   gawk: cmd. line:1: warning: exp: argument 1000 is out of range
   inf

第一个例子会计算 e 的 100次幂，虽然数值很大，但尚在系统的区间内。第二个例子尝试计算e 的 1000 次幂，已经超出了系统的数值区间，所以就生成了
一条错误消息。

除了标准数学函数外，gawk 还支持一些按位操作数据的函数：

   □ and(v1, v2)   ：执行值 v1和 v2的按位与运算。
   □ compl(val)   ：执行val的补运算。
   □ lshift(val, count)：将值 val左移 count位。
   □ or(v1, v2)   ：执行值 v1和 v2的按位或运算。
   □ rshift(val, count)：将值 val右移 count位。
   □ xor(v1, v2)   ：执行值 v1和 v2的按位异或运算。

位操作函数在处理数据中的二进制值时非常有用。

6.6.2 字符串函数
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言还提供了一些可用来处理字符串值的函数：

   gawk 字符串函数
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | 函数                   | 描述                                                                                           |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | asort(s [,d])           | 将数组 s 按数据元素值排序。索引值会被替换成表示新的排序顺序的连续数字。另外，如果指定了 d，   |
   |                       | 则排序后的数组会存储在数组 d 中。                                                               |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | asorti(s [,d])       | 将数组s按索引值排序。生成的数组会将索引值作为数据元素值，用连续数字索引来表明排序顺序。       |
   |                       | 另外如果指定了d，排序后的数组会存储在数组d中                                                   |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | gensub(r, s, h [, t])   | 查找变量$0或目标字符串t（如果提供了的话）来匹配正则表达式r。如果h是一个以g或G开头的字符串，   |
   |                       | 就用s替换掉匹配的文本。如果h是一个数字，它表示要替换掉第 h处 r匹配的地方                       |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | gsub(r, s [,t])       | 查找变量$0或目标字符串t（如果提供了的话）来匹配正则表达式r。如果找到了，就全部替换成字符串s   |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | index(s, t)           | 返回字符串t在字符串s中的索引值，如果没找到的话返回0                                           |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | length([s])           | 返回字符串s的长度；如果没有指定的话，返回$0的长度                                               |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | match(s, r [,a])       | 返回字符串s中正则表达式r出现位置的索引。如果指定了数组a，它会存储s中匹配正则表达式的那部分   |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | split(s, a [,r])       | 将 s 用 FS 字符或正则表达式 r（如果指定了的话）分开放到数组 a 中。返回字段的总数               |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | sprintf(format,       | 用提供的 format和 variables返回一个类似于 printf输出的字符串                                   |
   | variables)           |                                                                                               |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | sub(r, s [,t])       | 在变量$0或目标字符串t中查找正则表达式r的匹配。如果找到了，就用字符串s替换掉第一处匹配           |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | substr(s, i [,n])       | 返回s中从索引值i开始的n个字符组成的子字符串。如果未提供n，则返回 s剩下的部分                   |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | tolower(s)           | 将 s中的所有字符转换成小写                                                                   |
   +-----------------------+-----------------------------------------------------------------------------------------------+
   | toupper(s)           | 将 s中的所有字符转换成大写                                                                   |
   +-----------------------+-----------------------------------------------------------------------------------------------+

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{x = "testing"; print toupper(x); print length(x) }'
   TESTING
   7

但一些字符串函数的用法相当复杂。asort 和 asorti 函数是新加入的 gawk函数，允许基于数据元素值（asort）或索引值（asorti）对数组变量进行排序。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > var["a"] = 1
   > var["g"] = 2
   > var["m"] = 3
   > var["u"] = 4
   > asort(var,test)
   > for(i in test)
   >     print "Index:", i," - value:",test[i]
   > }'
   Index: 1 - value: 1
   Index: 2 - value: 2
   Index: 3 - value: 3
   Index: 4 - value: 4

新数组 test 含有排序后的原数组的数据元素，但索引值现在变为表明正确顺序的数字值了。

split 函数是将数据字段放到数组中以供进一步处理的好办法。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{ FS=","} {
   > split($0,var)
   > print var[1], var[5]
   > }' data1
   data11 data15
   data21 data25
   data31 data35

新数组使用连续数字作为数组索引，从含有第一个数据字段的索引值 1 开始。

6.6.3 时间函数
-----------------------------------------------------------------------------------------------------------------------------------------
gawk 编程语言包含一些函数来帮助处理时间值，如下表所示：

   gawk 的时间函数
   +-------------------------------+---------------------------------------------------------------------------------
   | 函数                           | 描述
   +-------------------------------+---------------------------------------------------------------------------------
   | mktime(datespec)               | 将一个按YYYY MM DD HH MM SS [DST]格式指定的日期转换成时间戳值
   +-------------------------------+---------------------------------------------------------------------------------
   | strftime(format [,timestamp])   | 将当前时间的时间戳或timestamp（如果提供了的话）转化格式化日期（采用shell
   |                               | 函数date()的格式）
   +-------------------------------+---------------------------------------------------------------------------------
   | systime( )                   | 返回当前时间的时间戳
   +-------------------------------+---------------------------------------------------------------------------------

时间函数常用来处理日志文件，而日志文件则常含有需要进行比较的日期。通过将日期的文本表示形式转换成 epoch时间（自1970-01-01 00:00:00 UTC 到
现在的秒数），可以轻松地比较日期。

示例：
   [devalone@devalone 22]$ gawk 'BEGIN{
   > date = systime()
   > day = strftime("%A,%B %d,%Y",date)
   > print day
   > }'
   星期五,七月 13,2018

该例用 systime 函数从系统获取当前的 epoch 时间戳，然后用 strftime 函数将它转换成用户可读的格式，转换过程中使用了 shell 命令 date 的日期
格式化字符。

6.7 自定义函数
-----------------------------------------------------------------------------------------------------------------------------------------
除了 gawk 中的内建函数，还可以在 gawk 程序中创建自定义函数。

6.7.1 定义函数
-----------------------------------------------------------------------------------------------------------------------------------------
要定义自己的函数，必须用 function 关键字:

   function name([variables])
   {
       statements
   }

函数名必须能够唯一标识函数。可以在调用的 gawk 程序中传给这个函数一个或多个变量。

示例：
function printthird()
{
print $3
}

这个函数会打印记录中的第三个数据字段。

函数还能用 return 语句返回值：

return value

值可以是变量，或者是最终能计算出值的算式：

   function myrand(limit)
   {
       return int(limit * rand())
   }

可以将函数的返回值赋给gawk程序中的一个变量：

x = myrand(100)

这个变量包含函数的返回值。

6.7.2 使用自定义函数
-----------------------------------------------------------------------------------------------------------------------------------------
在定义函数时，它必须出现在所有代码块之前（包括 BEGIN 代码块）。乍一看可能有点怪异，但它有助于将函数代码与 gawk 程序的其他部分分开。

示例：
   [devalone@devalone 22]$ gawk '
   > function myprint()
   > {
   >     printf "%-16s - %s\n", $1,$4
   > }
   > BEGIN{FS="\n"; RS=""}
   > {
   >     myprint()
   > }' data2
   Riley Mullen     - (312)555-1234
   Frank Williams   - (317)555-9876
   Haley Snell      - (313)555-4938

函数定义了 myprint() 函数，它会格式化记录中的第一个和第四个数据字段以供打印输出。gawk 程序然后用该函数显示出数据文件中的数据。

6.7.3 创建函数库
-----------------------------------------------------------------------------------------------------------------------------------------
每次使用函数都要重写一遍并不美妙。gawk 提供了一种途径来将多个函数放到一个库文件中，这样就能在所有的 gawk 程序中使用了。

首先，需要创建一个存储所有 gawk 函数的文件。

   [devalone@devalone 22]$ cat funclib
   function myprint()
   {
           printf "%-16s - %s\n", $1, $4
   }

   function myrand(limit)
   {
           return int(limit * rand())
   }

   function printthird()
   {
           print $3
   }

funclib 文件含有三个函数定义。

需要使用 -f 命令行参数来使用它们。很遗憾，不能将 -f 命令行参数和内联 gawk 脚本放到一起使用，不过可以在同一个命令行中使用多个 -f 参数。

因此，要使用库，只要创建一个含有 gawk 程序的文件，然后在命令行上同时指定库文件和程序文件就行了。

示例：
   [devalone@devalone 22]$ cat script4.gawk
   BEGIN{ FS="\n"; RS=""}
   {
           myprint()
   }
   [devalone@devalone 22]$ gawk -f funclib -f script4.gawk data2
   Riley Mullen     - (312)555-1234
   Frank Williams   - (317)555-9876
   Haley Snell      - (313)555-4938

要做的是当需要使用库中定义的函数时，将 funclib 文件加到 gawk 命令行上就可以了。

系列目录：

Linux shell 脚本编程-高级篇（一）

Linux shell 脚本编程-高级篇（二）

Linux shell 脚本编程-高级篇（三）

Linux shell 脚本编程-高级篇（四）

Linux shell 脚本编程-高级篇（五）

Linux shell 脚本编程-高级篇（六）

Linux shell 脚本编程-高级篇（七）

-----------------------------------------------------------------------------------------------------------------------------------------
参考：

《Linux 命令行与 shell 脚本编程大全》第 3 版 —— 2016.8（美）Richard Blum Cristine Bresnahan

你可能感兴趣的:(Linux,操作系统,CentOS7,Fedora)

uboot（bootrom的作用）花落已飘 uboot linux uboot
BootROM详细讲解1.什么是BootROM？BootROM（BootRead-OnlyMemory）是一种固化在芯片内部的只读存储器（ROM），用于存放设备启动时执行的第一阶段引导代码。由于它是只读的，意味着其内容在芯片出厂时已经写入，无法更改。作用：当设备上电或复位时，BootROM负责最早的引导过程，它会初始化硬件环境，并决定从哪个存储介质加载操作系统或用户程序。2.BootROM的作用B
Python 错误处理赔罪 Python 系统学习 python 开发语言
目录try调用栈记录错误抛出错误练习小结在程序运行的过程中，如果发生了错误，可以事先约定返回一个错误代码，这样，就可以知道是否有错，以及出错的原因。在操作系统提供的调用中，返回错误码非常常见。比如打开文件的函数open()，成功时返回文件描述符（就是一个整数），出错时返回-1。用错误码来表示是否出错十分不便，因为函数本身应该返回的正常结果和错误码混在一起，造成调用者必须用大量的代码来判断是否出错：
linux脚本怎么访问http,如何使用现有的tcp连接从bash脚本访问http服务器？玲珑阁玉韦 linux脚本怎么访问http
在bashshellscipt中,我使用几个命令行工具(wget,curl,httpie)来测试我的http服务器.当使用例如curl调用GET请求,我看到tcp连接打开到我的服务器并在http通信完成后立即关闭.$curlhttp://10.5.1.1/favicon.ico-o/dev/null为了更好地测试我的服务器的保持活动行为,我想在多个http请求/响应周期中保持tcp连接打开.我可以
systemd-networkd NetworkManager 介绍追心嵌入式 linux
systemd-networkd和NetworkManager的详细介绍systemd-networkd和NetworkManager都是Linux系统中常用的网络管理工具，但它们的设计目标和使用场景不同。以下是它们的详细介绍、功能、使用场景和差异。1.systemd-networkdsystemd-networkd是一个由systemd提供的网络管理工具，旨在为Linux系统提供网络配置和管理的
【Linux 下的 bash 无法正常解析, Windows 的 CRLF 换行符问题导致的】待磨的钝刨 linux bash windows
文章目录报错原因：解决办法：方法一：用`dos2unix`修复方法二：手动转换换行符方法三：VSCode或其他编辑器手动改总结这个错误很常见，原因是你的wait_for_gpu.sh脚本文件格式不对，具体来说是Windows的CRLF换行符问题导致的，Linux下的bash无法正常解析。hadoop@hadoop:~/anaconda3$bashwait_for_gpu.sh:invalidopt
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
Xilinx系ZYNQ学习笔记（二）ZYNQ入门及点亮LED灯贾saisai FPGA学习学习笔记 fpga开发
系列文章目录文章目录系列文章目录前言简单介绍简称xc7z020型号FPGAZYNQ实操通用IO点亮LED灯硬件逻辑基础前言简单入门一下ZYNQ是何种架构，如何编程，至于深入了解应该要分开深入学习Linux和FPGA简单介绍其基本架构都是在同一个硅片上集成FPGA和CPU，并通过高速、高带宽的互联架构连接起来。ARM的顺序控制、丰富外设，开源驱动、FPGA的并行运算、高速接口、灵活定制、数字之王的特
Ubuntu 20.04 安装并使用Cursor 爱学习的小道长 AI ubuntu linux 运维 python ai
1.安装1.1下载cursor官网：https://www.cursor.com/cn点击下载LINUX查看下载下来的文件：$ls~/Downloads/Cursor-0.47.8-82ef0f61c01d079d1b7e5ab04d88499d5af500e3.deb.glibc2.25-x86_64.AppImage/home/xxx/Downloads/Cursor-0.47.8-82ef0
linux 逻辑卷LVM IT小饕餮 linux基础 linux 运维服务器
LVM（LogicalVolumeManager）逻辑卷管理是一种在Linux系统中用于管理磁盘空间的技术，它提供了一种灵活、高效的方式来管理硬盘分区和卷。以下是关于LVM逻辑管理的详细介绍：LVM的基本概念物理卷（PhysicalVolume，PV）物理卷是LVM的基本组成部分，可以是一块磁盘、也可以是一个分区。物理卷是LVM存储的基础，用于提供实际的存储空间。卷组（VolumeGroup，VG
nginx-部署Python网站项目 skyQAQLinux python linux nginx 服务器
一、部署Python网站项目实验要求配置Nginx使其可以将动态访问转交给uWSGI安装Python工具及依赖1)拷贝软件到proxy主机[root@server1~]#scp-r/linux-soft/s2/wk/python/192.168.99.5:/root2)安装python依赖软件[root@proxy~]#yum-yinstallgccmakepython3python3-devel
Python 3.6.8 64位独立安装程序霍娴果Myrtle
Python3.6.864位独立安装程序【下载地址】Python3.6.864位独立安装程序Python3.6.864位独立安装程序欢迎使用Python3.6.64位版安装包！本资源专门针对需要在64位操作系统上进行Python环境搭建的用户项目地址:https://gitcode.com/open-source-toolkit/98d19欢迎使用Python3.6.64位版安装包！本资源专门针对
AWS CLI with MinIO Server 库海无涯 aws 云计算
1、InstallMinIOServerhttps://min.io/docs/minio/linux/index.htmlCreateAKandSKandrecordinformation.AK:ZYYMPcLi6dSPsDfr5QeWSK:Am3m2qtpkUk2wAgT5dPbpE4hGD2tX7a6RpjsbeEdAndcreateabucketnamedaswtest.2、Install
Python 3.6.8 安装包下载何盼思Kit
Python3.6.8安装包下载【下载地址】Python3.6.8安装包下载Python3.6.8安装包下载本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构项目地址:https://gitcode.com/open-source-toolkit/d9647本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构。Pyt
5.进程基本概念就很对 java 服务器 linux
5.进程基本概念**1.进程的基本概念****2.进程与程序的区别****3.进程的状态****4.进程调度****5.进程相关命令****6.进程创建与管理****7.进程的应用场景****8.练习与作业****9.进程的地址空间****10.进程的分类****11.进程的并发与并行****12.总结**1.进程的基本概念进程：进程是程序执行的过程，操作系统会为其分配内存资源和CPU调度。PCB
RK3588开发笔记-buildroot添加telnet服务 flypig哗啦啦 RK3588 buildroot busybox
目录前言一、Telnet服务背景与适用场景二、telnet服务开启Busybox配置三、固件编译及烧录RK3588烧录验证客户端连接测试3.1Linux/MacOS连接3.2Windows连接总结前言本文主要介绍在RK3588SDK文件包中添加telnet服务，由于sdkbuildroot默认添加的是ssh服务，如用户需要主动开启telnet，则需要另外在busybox中开启telnetd服务，下
安卓 vs iOS 文件系统深度解析：开放自由与封闭安全的终极博弈 jingling1007 Android android ios 安全安全性测试
安卓和iOS的差异远不止于界面和生态，它们的文件系统设计更是体现了两种截然不同的技术哲学。安卓的开放目录允许用户“为所欲为”，而iOS的沙盒机制则像一座密不透风的堡垒。本文将通过技术细节对比、真实场景案例、用户操作指南，深度剖析两大系统的核心设计，回答一个关键问题：谁的设计更能平衡自由与安全？一、文件系统架构：从根目录到沙盒1.安卓：Linux的开放基因目录结构全景根目录（/）：包含所有系统层级（
Linux线程控制封装及线程互斥 z一一m Linux linux
1.clone函数的使用#define_GNU_SOURCE#include#includeintclone(int(*fn)(void*),void*child_stack,intflags,void*arg,...);fn：子进程或线程的入口函数child_stack：子进程的栈地址，通常需要手动分配，栈的大小需要足够容纳子进程变量的局部变量和函数调用。flags：控制子进程或线程共享哪些资源
解决Centos使用yum命令报错“Cannot find a valid baseurl for repo: base/7/x86_64”问题牛奶咖啡13 运维/测试 centos linux 解决Centos仓库源失效 InfluxDB作服务失败问题 [Errno 256]HTTPS Error 404
一、问题描述我们在使用Centos7.9使用【sudoyuminstallinfluxdb2】命令安装influxDB数据库的时候提示“LoadingmirrorspeedsfromcachedhostfileCouldnotretrievemirrorlisthttp://mirrorlist.centos.org/release=7&arch=x86_64&repo=os&infra=stoc
Docker-部署ES和Kibana 相逢太短，莫等茶凉 docker elasticsearch mac
资料kibana和elasticserch兼容性表https://www.elastic.co/cn/support/matrix#matrix_compatibilityMac系统安装需要版本支持linux/arm64，需要两个都要支持有arm64，有些es支持，kibana不支持。ps:dockerpullelasticsearch出现elasticsearch:latestnotfound，
Linux——Linux系统编程之基于TFTP实现服务器与开发板间的文件传输实战总结 Winter_world Linux系统 TFTP服务器搭建 TFTP文件传输
目录0引言1TFTP服务器搭建1.1TFTP基础1.2Ubuntu搭建TFTP服务器1.3测试TFTP服务器2开发板实现TFTP文件传输2.1同一网段2.2配置2.3客户端与服务器的通信0引言我们前面总结的Linux字符设备、串口编程博文中，在虚拟机中编译得到可执行文件后，都是通过U盘连接开发板进行测试验证的，或者就是把可执行文件编译到最小系统中，再OTG烧写进开发板，这两种方法都比较麻烦，这里我
宝塔安装mayfly-go mayans005 数据库
mayfly-go:web版linux(终端文件脚本进程)、数据库(mysqlpgsql)、redis(单机哨兵集群)、mongo统一管理操作平台。1、终端执行命令下载程序包wgethttps://gitee.com/objs/mayfly-go/releases/download/v1.3.0/mayfly-go-linux-amd64.zip2、在宝塔新建一个MySQL数据库，将下载程序包中的
开源项目推荐：Mayfly-go 周风队
开源项目推荐：Mayfly-gomayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-goMayfly-go是一个基于浏览器的统一管理操作平台，它支持多种数据库和系统管理功能。该项目主要使用Go语言和前端框架
推荐项目：Mayfly-Go - 高性能的时间序列数据库齐游菊Rosemary
推荐项目：Mayfly-Go-高性能的时间序列数据库mayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-go项目简介是一款由Dromara团队开发的高性能、轻量级时间序列数据库（TimeSeriesData
Mayfly-Go 开源项目教程方蕾嫒Falcon
Mayfly-Go开源项目教程mayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-go项目介绍Mayfly-Go是一个基于Go语言开发的开源项目，旨在提供一个轻量级、高性能的微服务框架。该项目由Dromar
*如何在 Mac 上安装 macOS Sequoia 开发测试版* Topstip macos
在WWDC主题演讲中，Apple概述了今年秋季会推出的macOSSequoia版本的新功能。它的亮点包括iPhone镜像、专门的密码应用，以及适用于M1及更高型号的AppleIntelligence功能。Apple现在发布了macOSSequoia的第一个开发者测试版。虽然操作系统更新要到今年秋季才会公开发布，但现在测试版让用户可以立即安装并运行预发布版本。（甚至不需要是Apple开发者）本文就教
linux+docker安装常见中间件+shell学习笔记芦屋花绘 linux docker 中间件
初始设置下载虚拟机软件：选择适合的虚拟机软件（如VirtualBox或VMware）。下载操作系统ISO映像文件：选择并下载你想安装的Linux发行版（例如Ubuntu、CentOS等）的ISO文件。ISO映像文件：是包含了完整光盘内容的文件，包含引导记录、文件系统、数据文件和目录结构。导入ISO文件到虚拟机，并进行相关配置，如分配内存、硬盘空间等。了解基本linuxLinux常见目录及其用途Li
文件系统（File System — FS）夏L. linux 运维服务器
概念文件系统是Linux内部用来管理磁盘上文件的一套系统，主要体现在文件的存取、查找功能（本身是一套软件，对磁盘上存放的文件进行管理）。内核（Kernel）内核是操作系统内部最核心的软件。查看内核版本uname-r内核作用对CPU进行调度管理对内存进行分配管理对进程进行管理对文件系统进行管理对其他硬件进行管理内核中XFS文件系统存放地址/usr/lib/modules/3.10.0-1160.el
[ Linux 命令基础 ] Linux 命令大全-命令前置知识-系统管理-文件和目录管理-文本处理命令-网络管理命令-权限和用户管理命令-磁盘管理命令 _PowerShell shell脚本入门到精通 Linux 命令大全 linux命令前置知识 linux系统管理 linux文件和目录管理 linux文本处理命令 linux网络管理命令 linux权限和用户管理命令
博主介绍‍博主介绍：大家好，我是_PowerShell，很高兴认识大家~✨主攻领域：【渗透领域】【数据通信】【通讯安全】【web安全】【面试分析】点赞➕评论➕收藏==养成习惯（一键三连）欢迎关注一起学习一起讨论⭐️一起进步文末有彩蛋作者水平有限，欢迎各位大佬指点，相互学习进步！我们搞网络安全需要经常用到linux命令，比用拿到linux的shell，需要使用linux命令。再比如sh脚本，我们经常
【Hive】-- hive 3.1.3 伪分布式部署（单节点） oo寻梦in记 Apache Paimon 大数据服务部署 hive 分布式 hadoop
1、环境准备1.1、版本选择apachehive3.1.3apachehadoop3.1.0oraclejdk1.8mysql8.0.15操作系统：Macos10.151.2、软件下载https://archive.apache.org/dist/hive/https://archive.apache.org/dist/hadoop/1.3、解压tar-zxvfapache-hive-4.0.0-
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

Linux shell 脚本编程-高级篇 （六）

你可能感兴趣的:(Linux,操作系统,CentOS7,Fedora)

Linux shell 脚本编程-高级篇（六）