weixin_34233618

awk使用

第9章 AWK介绍

2008-08-19 18:02:20| 分类： shell| 标签： |字号大中小订阅

如果要格式化报文或从一个大的文本文件中抽取数据包，那么awk可以完成这些任务。它在文本浏览和数据的熟练使用上性能优异。

整体来说，awk是所有shell过滤工具中最难掌握的，不知道为什么，也许是其复杂的语法或含义不明确的错误提示信息。在学习awk语言过程中，就会慢慢掌握诸如Bailing out 和awk:cmd.Line:等错误信息。可以说awk是一种自解释的编程语言，之所以要在shell中使用awk是因为awk本身是学习的好例子，但结合awk与其他工具诸如grep和sed，将会使shell编程更加容易。

本章没有讲述awk的全部特性，也不涉及awk的深层次编程，（这些可以在专门讲述awk的书籍中找到）。本章仅注重于讲述使用awk执行行操作及怎样从文本文件和字符串中抽取信息。

本章内容有：

? 抽取域。

? 匹配正则表达式。

? 比较域。

? 向awk传递参数。

? 基本的awk行操作和脚本。

本书几乎所有包含awk命令的脚本都结合了sed和grep，以从文本文件和字符串中抽取信息。为获得所需信息，文本必须格式化，意即用域分隔符划分抽取域，分隔符可能是任意

符，在以后讲述awk时再详细讨论。

awk以发展这种语言的人Aho.Weninberger和Kernigham命名。还有nawk和gawk，它们扩展了文本特性，但本章不予讨论。

awk语言的最基本功能是在文件或字符串中基于指定规则浏览和抽取信息。awk抽取信息后，才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息。

9.1 调用awk

有三种方式调用awk，第一种是命令行方式，如：

awk [-F field-separator] ’commands’ input-file(s)

这里，commands是真正的awk命令。本章将经常使用这种方法。

上面例子中，[-F域分隔符]是可选的，因为awk使用空格作为缺省的域分隔符，因此如果要浏览域间有空格的文本，不必指定这个选项，但如果要浏览诸如passwd文件，此文件各域以冒号作为分隔符，则必须指明-F选项，如：

awk -F: ’commands’ input-file

第二种方法是将所有awk命令插入一个文件，并使awk程序可执行，然后用awk命令解释器作为脚本的首行，以便通过键入脚本名称来调用它。

第三种方式是将所有的awk命令插入一个单独文件，然后调用：

awk -f awk-script-file input-file(s)

-f选项指明在文件awk-script-file中的awk脚本， input-file(s)是使用awk进行浏览的文件名。

9.2 awk脚本

在命令中调用awk时，awk脚本由各种操作和模式组成。

如果设置了-F选项，则awk每次读一条记录或一行，并使用指定的分隔符分隔指定域，但如果未设置-F选项，awk假定空格为域分隔符，并保持这个设置直到发现一新行。当新行出现时，awk命令获悉已读完整条记录，然后在下一个记录启动读命令，这个读进程将持续到文件尾或文件不再存在。

参照表9-1，awk每次在文件中读一行，找到域分隔符（这里是符号#），设置其为域n，直至一新行（这里是缺省记录分隔符），然后，划分这一行作为一条记录，接着awk再次启动下一行读进程。

表9-1 awk读文件记录的方式

域1 分隔符域2 分隔符域3 分隔符域4及换行

P.Bunny(记录1) # 02/99 # 48 # Yellow\n

J.Troll(记录2) # 07/99 # 4842 # Brown-3\n

9.2.1模式和动作

任何awk语句都由模式和动作组成。在一个awk脚本中可能有许多语句。模式部分决定动作语句何时触发及触发事件。处理即对数据进行的操作。如果省略模式部分，动作将时刻保持执行状态。

模式可以是任何条件语句或复合语句或正则表达式。模式包括两个特殊字段BEGIN和END。使用BEGIN语句设置计数和打印头。BEGIN语句使用在任何文本浏览动作之前，之后文本浏览动作依据输入文件开始执行。END语句用来在awk完成文本浏览动作后打印输出文本总数和结尾状态标志。如果不特别指明模式，awk总是匹配或打印行数。

实际动作在大括号{}内指明。动作大多数用来打印，但是还有些更长的代码诸如if和循环（looping）语句及循环退出结构。如果不指明采取动作，awk将打印出所有浏览出来的记录。

下面将深入讲解这些模式和动作。

9.2.2域和记录

awk执行时，其浏览域标记为$1,$2...$n。这种方法称为域标识。使用这些域标识将更容易对域进行进一步处理。

使用$1,$3表示参照第1和第3域，注意这里用逗号做域分隔。如果希望打印一个有5个域的记录的所有域，不必指明$1,$2,$3,$4,$5，可使用$0，意即所有域。awk浏览时，到达一新行，即假定到达包含域的记录末尾，然后执行新记录下一行的读动作，并重新设置域分隔。

注意执行时不要混淆符号$和shell提示符$，它们是不同的。

为打印一个域或所有域，使用print命令。这是一个awk动作（动作语法用圆括号括起来）。

1.抽取域

真正执行前看几个例子，现有一文本文件grade.txt，记录了一个称为柔道数据库的行信息。

$ pg grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

此文本文件有7个域，即（1）名字、（2）升段日期、（3）学生序号、（4）腰带级别、（5）年龄、（6）目前比赛积分、（7）比赛最高分。

因为域间使用空格作为域分隔符，故不必用- F选项划分域，现浏览文件并导出一些数据。

在例子中为了利于显示，将空格加宽使各域看得更清晰。

2.保存awk输出

有两种方式保存shell提示符下awk脚本的输出。最简单的方式是使用输出重定向符号>文件名，下面的例子重定向输出到文件wow。

$ awk ’{print $0}’ grade.txt > wow

使用这种方法要注意，显示屏上不会显示输出结果。因为它直接输出到文件。只有在保证输出结果正确时才会使用这种方法。它也会重写硬盘上同名数据。

第二种方法是使用tee命令，在输出到文件的同时输出到屏幕。在测试输出结果正确与否时多使用这种方法。例如输出重定向到文件delete_me_and_die，同时输出到屏幕。使用这种方法，在awk命令结尾写入| tee delete_me_and_die。

$ awk ’{print $0}’ grade.txt | tee delete_me_and_die

3.使用标准输入

在深入讲解这一章之前，先对awk脚本的输入方法简要介绍一下。实际上任何脚本都是从标准输入中接受输入的。为运行本章脚本，使用awk脚本输入文件格式，例如：

$ belts.awk grade_student.txt

也可替代使用下述格式：

使用重定向方法：

$ belts.awk < grade2.txt

或管道方法：

$ grade2.txt | belts.awk

4. 打印所有记录

$ awk ’{print $0}’ grade.txt

awk读每一条记录。因为没有模式部分，只有动作部分{print $0}(打印所有记录)，这个动作必须用花括号括起来。上述命令打印整个文件。

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

5.打印单独记录

假定只打印学生名字和腰带级别，通过查看域所在列，可知为field-1和field-4，因此可以使用$1和$4，但不要忘了加逗号以分隔域。

$ awk ’{print $1,$4}’ grade.txt

M.Tansley Green

J.Lulu green

P.Bunny Yellow

J.Troll Brown-3

L.Tansley Brown-2

6.打印报告头

上述命令输出在名字和腰带级别之间用一些空格使之更容易划分，也可以在域间使用tab键加以划分。为加入tab键，使用tab键速记引用符\t，后面将对速记引用加以详细讨论。也可以为输出文本加入信息头。本例中加入name和belt及下划线。下划线使用\n，强迫启动新行，并在\n下一行启动打印文本操作。打印信息头放置在BEGIN模式部分，因为打印信息头被界定为一个动作，必须用大括号括起来。在awk查看第一条记录前，信息头被打印。

$awk 'BEGIN {print "Name Belt\n--------------------------------"} {print $1"\t"$4}' grade.txt

Name Belt

--------------------------------

M.Tansley Green

J.Lulu green

P.Bunny Yellow

J.Troll Brown-3

L.Tansley Brown-2

7.打印信息尾

如果在末行加入end of report信息，可使用END语句。END语句在所有文本处理动作执行完之后才被执行。END语句在脚本中的位置放置在主要动作之后。下面简单打印头信息并告之查询动作完成。

$ awk 'BEGIN {print "Name\n-------"} {print $1} END {print "end-of-report"}' grade.txt

Name

-------

M.Tansley

J.Lulu

P.Bunny

J.Troll

L.Tansley

end-of-report

8.awk错误信息提示

几乎可以肯定，在使用awk时，将会在命令中碰到一些错误。awk将试图打印错误行，但由于大部分命令都只在一行，因此帮助不大。

系统给出的显示错误信息提示可读性不好。使用上述例子，如果丢了一个双引号，a w k将返回：

$ awk 'BEGIN {print "Name\n-------} {print $1} END {print "end-of-report"}' grade.txt

awk: cmd. line:1: BEGIN {print "Name\n-------} {print $1} END {print "end-of-report"}

awk: cmd. line:1: ^ unterminated string

当第一次使用awk时，可能被错误信息搅得不知所措，但通过长时间和不断的学习，可总结出以下规则。在碰到awk错误时，可相应查找：

? 确保整个awk命令用单引号括起来。

? 确保命令内所有引号成对出现。

? 确保用花括号括起动作语句，用圆括号括起条件语句。

? 可能忘记使用花括号，也许你认为没有必要，但awk不这样认为，将按之解释语法。

如果查询文件不存在，将得到下述错误信息：

$ awk 'END {print NR}' grades.txt

awk: cmd. line:2: fatal: cannot open file `grades.txt' for reading (No such file or directory)

9.awk 键盘输入

如果在命令行并没有输入文件grade.txt，将会怎样？

$ awk 'BEGIN {print "Name Belt\n------------------------------------"} {print $1"\t"$4}'

Name Belt

------------------------------------

BEGIN部分打印了文件头，但awk最终停止操作并等待，并没有返回shell提示符。这是因为awk期望获得键盘输入。因为没有给出输入文件，awk假定下面将会给出。如果愿意，顺序输入相关文本，并在输入完成后敲键。如果敲入了正确的域分隔符，awk会像第一个例子一样正常处理文本。这种处理并不常用，因为它大多应用于大量的打印稿。

9.2.3 awk中正则表达式及其操作

在grep一章中，有许多例子用到正则表达式，这里将不使用同样的例子，但可以使用条件操作讲述awk中正则表达式的用法。

这里正则表达式用斜线括起来。例如，在文本文件中查询字符串Green，使用/Green/可以查出单词Green的出现情况。

9.2.4元字符

这里是awk中正则表达式匹配操作中经常用到的字符，详细情况请参阅本书第7章正则表达式概述。

\^$.[]|()*+?

这里有两个字符第7章没有讲到，因为它们只适用于awk而不适用于grep或sed。它们是：

+ 使用+匹配一个或多个字符。

？匹配模式出现频率。例如使用/XY?Z/匹配XYZ或YZ。

9.2.5条件操作符

表9-2给出awk条件操作符，后面将给出其用法。

表9-2 awk条件操作符

操作符描述操作符描述

< 小于 >= 大于等于

<= 小于等于 ~ 匹配正则表达式

== 等于 !~ 不匹配正则表达式

!= 不等于

1.匹配

为使一域号匹配正则表达式，使用符号‘～’后紧跟正则表达式，也可以用if语句。awk中if后面的条件用（）括起来。

观察文件grade.txt，如果只要打印brown腰带级别可知其所在域为field-4，这样可以写出表达式{if($4~/brown/) print }意即如果field-4包含Brown，打印它。如果条件满足，则打印匹配记录行。可以编写下面脚本，因为这是一个动作，必须用花括号{}括起来。

$ awk '{if($4~/Brown/) print $0}' grade.txt

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

匹配记录找到时，如果不特别声明，awk缺省打印整条记录。使用if语句开始有点难，但不要着急，因为有许多方法可以跳过它，并仍保持同样结果。下面例子意即如果记录包含模式Brown，就打印它：

$ awk '$0 ~/Brown/' grade.txt

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

2.精确匹配

假定要使字符串精确匹配，比如说查看学生序号48，文件中有许多学生序号包含48，如果在field-3中查询序号48，awk将返回所有序号带48的记录：

$ awk '{if($3~/48/) print $0}' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

为精确匹配48，使用等号==，并用单引号括起条件。例如$3=="48"，这样确保只有48序号得以匹配，其余则不行。

$ awk '$3=="48" {print $0}' grade.txt

P.Bunny 02/99 48 Yellow 12 35 28

3.不匹配

有时要浏览信息并抽取不匹配操作的记录，与~相反的符号是!~，意即不匹配。像原来使用查询brown腰带级别的匹配操作一样，现在看看不匹配情况。表达式$0!~/brown/，意即查询不包含模式brown腰带级别的记录并打印它。

注意，缺省情况下，awk将打印所有匹配记录，因此这里不必加入动作部分。

$ awk '$0!~/Brown/' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

可以只对field-4进行不匹配操作，方法如下：

$ awk '{if($4!~/Brown/) print $0}' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

如果只使用命令awk '$4!="Brown" {print $0}' grade.txt，将返回错误结果，因为用引号括起了Brown，将只匹配Brown而不匹配Brown-2和Brown-3，当然，如果想要查询非Brown-2的腰带级别，可做如下操作：

awk '$4!="Brown-2" {print $0}' grade.txt

4.小于

看看哪些学生可以获得升段机会。测试这一点即判断目前级别分field-6是否小于最高分field-7，在输出结果中，加入这一改动很容易。

$ awk '{if($6<$7) print $1" Try better at the next comp"}' grade.txt

M.Tansley Try better at the next comp

J.Lulu Try better at the next comp

5.小于等于

对比小于，小于等于只在操作符上做些小改动，满足此条件的记录也包括上面例子中的输出情况。

$ awk '{if($6<=$7) print $1}' grade.txt

M.Tansley

J.Lulu

J.Troll

6.大于

大于符号大家都熟知，请看例子：

$ awk '{if($6>$7) print $1}' grade.txt

P.Bunny

L.Tansley

希望读者已经掌握了操作符的基本用法。

7.设置大小写

为查询大小写信息，可使用[]符号。在测试正则表达式时提到可匹配[]内任意字符或单词，因此若查询文件中级别为green的所有记录，不论其大小写，表达式应为'/[Gg]reen/'：

$ awk '/[Gg]reen/' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

8.任意字符

抽取名字，其记录第一域的第四个字符a，使用句点.。表达式/^...a/意为行首前三个字符任意，第四个a，尖角符号代表行首。

$ awk '$1~/^...a/' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

L.Tansley 05/99 4712 Brown-2 12 30 28

9.或关系匹配

为抽取级别为Yellow或Brown的记录，使用竖线符|。意为匹配| 两边模式之一。注意，使用竖线符时，语句必须用圆括号括起来。

$ awk '$0~/(Yellow|Brown)/' grade.txt

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

上面例子输出所有级别为Yellow或Brown的记录。

使用这种方法在查询级别为Green或green时，可以得到与使用[]表达式相同的结果。

$ awk '$0~/(Green|green)/' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

10.行首

不必总是使用域号。如果查询文本文件行首包含48的代码，可简单使用下面^符号：

$ awk '/^48/' input-file

这里讲述了在awk中怎样使用第7章中涉及的表达式。像第7章的开头提到的，所有表达式（除字符重复出现外）在awk中都是合法的。

复合模式或复合操作符用于形成复杂的逻辑操作，复杂程度取决于编程者本人。有必要了解的是，复合表达式即为模式间通过使用下述各表达式互相结合起来的表达式：

&& AND：语句两边必须同时匹配为真。

|| OR：语句两边同时或其中一边匹配为真。

! NO：求逆

11.AND

打印记录，使其名字为P.Bunny且级别为Yellow，使用表达式($1=="P.Bunny" && $4=="Yellow")，意为&&两边匹配均为真。完整命令如下：

$ awk '{if($1=="P.Bunny" && $4=="Yellow") print $0}' grade.txt

P.Bunny 02/99 48 Yellow 12 35 28

12.OR

如果查询级别为Yellow或Brown，使用或命令。意为“||”符号两边的匹配模式之一或全部为真。

$ awk '{if($4=="Yellow" || $4~/Brown/) print $0}' grade.txt

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

9.2.6 awk内置变量

awk有许多内置变量用来设置环境信息。这些变量可以被改变。表9-3显示了最常使用的一些变量，并给出其基本含义。

表9-3 awk内置变量

ARGC 命令行参数个数

ARGV 命令行参数排列

ENVIRON 支持队列中系统环境变量的使用

FILENAME awk浏览的文件名

FNR 浏览文件的记录数

FS 设置输入域分隔符，等价于命令行-F选项

NF 浏览记录的域个数

NR 已读的记录数

OFS 输出域分隔符

ORS 输出记录分隔符

RS 控制记录分隔符

ARGC支持命令行中传入awk脚本的参数个数。ARGV是ARGC的参数排列数组，其中每一元素表示为ARGV[n]，n为期望访问的命令行参数。

ENVIRON支持系统设置的环境变量，要访问单独变量，使用实际变量名，例如ENVIRON["EDITOR"]="Vi"。

FILENAME支持awk脚本实际操作的输入文件。因为awk可以同时处理许多文件，因此如果访问了这个变量，将告之系统目前正在浏览的实际文件。

FNR支持awk目前操作的记录数。其变量值小于等于NR。如果脚本正在访问许多文件，每一新输入文件都将重新设置此变量。

FS用来在awk中设置域分隔符，与命令行中-F选项功能相同。缺省情况下为空格。如果用逗号来作域分隔符，设置FS=","。

NF支持记录域个数，在记录被读之后再设置。

OFS允许指定输出域分隔符，缺省为空格。如果想设置为#，写入OFS="#"。

ORS为输出记录分隔符，缺省为新行（\n）。

RS是记录分隔符，缺省为新行(\n)。

9.2.7 NF、NR和FILENAME

下面看一看awk内置变量的例子。

要快速查看记录个数，应使用NR。比如说导出一个数据库文件后，如果想快速浏览记录个数，以便对比于其初始状态，查出导出过程中出现的错误。使用NR将打印输入文件的记录个数。print NR放在END语法中。

$ awk 'END {print NR}' grade.txt

以下例子中，所有学生记录被打印，并带有其记录号。使用NF变量显示每一条读记录中有多少个域，并在END部分打印输入文件名。

$ awk '{print NF,NR,$0}END{print FILENAME}' grade.txt

7 1 M.Tansley 05/99 48311 Green 8 40 44

7 2 J.Lulu 06/99 48317 green 9 24 26

7 3 P.Bunny 02/99 48 Yellow 12 35 28

7 4 J.Troll 07/99 4842 Brown-3 12 26 26

7 5 L.Tansley 05/99 4712 Brown-2 12 30 28

grade.txt

在从文件中抽取信息时，最好首先检查文件中是否有记录。下面的例子只有在文件中至少有一个记录时才查询Brown级别记录。使用AND复合语句实现这一功能。意即至少存在一个记录后，查询字符串Brown，最后打印结果。

$ awk '{if(NR>0 && $4~/Brown/) print $0}' grade.txt

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

NF的一个强大功能是将变量$PWD的返回值传入awk并显示其目录。这里需要指定域分隔符/。

$ pwd

/usr/local/etc

$ echo $PWD | awk -F/ '{print $NF}'

etc

另一个例子是显示文件名。

$ echo "/usr/local/etc/rc.sybase" | awk -F/ '{print $NF}'

rc.sybase

9.2.8 awk操作符

在awk中使用操作符，基本表达式可以划分为数字型、字符串型、变量型、域及数组元素，前面已经讲过一些。下面列出其完整列表。

在表达式中可以使用下述任何一种操作符。

= += *= / = %= ^= 赋值操作符

？条件表达操作符

|| && ! 并、与、非（上一节已讲到）

~!~ 匹配操作符，包括匹配和不匹配

< <= == != >= > 关系操作符

+ - * / % ^ 算术操作符

++ -- 前缀和后缀

前面已经讲到了其中几种操作，下面继续讲述未涉及的部分。

1.设置输入域到域变量名

在awk中，设置有意义的域名是一种好习惯，在进行模式匹配或关系操作时更容易理解。一般的变量名设置方式为name=$n，这里name为调用的域变量名，n为实际域号。例如设置学生域名为name，级别域名为belt，操作为name=$1;belts=$4。注意分号的使用，它分隔awk命令。下面例子中，重新赋值学生名域为name，级别域为belts。查询级别为Yellow的记录，并最终打印名称和级别。

$ awk '{name=$1;belts=$4; if(belts~/Yellow/) print name" is belt "belts}' grade.txt

P.Bunny is belt Yellow

2.域值比较操作

有两种方式测试一数值域是否小于另一数值域。

1) 在BEGIN中给变量名赋值。

2) 在关系操作中使用实际数值。

通常在BEGIN部分赋值是很有益的，可以在awk表达式进行改动时减少很多麻烦。

使用关系操作必须用圆括号括起来。

下面的例子查询所有比赛中得分在27点以下的学生。

用引号将数字引用起来是可选的，“27”、27产生同样的结果。

$ awk '{if($6 < 27) print $0}' grade.txt

J.Lulu 06/99 48317 green 9 24 26

J.Troll 07/99 4842 Brown-3 12 26 26

第二个例子中给数字赋以变量名BASELINE和在BEGIN部分给变量赋值，两者意义相同。

$ awk 'BEGIN {BASELINE="27"}{if($6 < BASELINE) print $0}' grade.txt

J.Lulu 06/99 48317 green 9 24 26

J.Troll 07/99 4842 Brown-3 12 26 26

3.修改数值域取值

当在awk中修改任何域时，重要的一点是要记住实际输入文件是不可修改的，修改的只是保存在缓存里的awk复本。awk会在变量NR或NF变量中反映出修改痕迹。

为修改数值域，简单的给域标识重赋新值，如：$1=$1+5，会将域1数值加5，但要确保赋值域其子集为数值型。

修改M.Tansley的目前级别分域，使其数值从40减为39，使用赋值语句$6=$6-1，当然在实施修改前首先要匹配域名。

$ awk '{if($1=="M.Tansley") $6=$6-1; print $1,$6,$7}' grade.txt

M.Tansley 39 44

J.Lulu 24 26

P.Bunny 35 28

J.Troll 26 26

L.Tansley 30 28

4.修改文本域

修改文本域即对其重新赋值。需要做的就是赋给一个新的字符串。在J.Troll中加入字母，使其成为J.L.Troll，表达式为$1="J.L.Troll"，记住字符串要使用双秒号（""），并用圆括号括起整个语法。

$ awk '{if($1=="J.Troll") ($1="J.L.Troll"); print $1}' grade.txt

M.Tansley

J.Lulu

P.Bunny

J.L.Troll

L.Tansley

5.只显示修改记录

上述例子均是对一个小文件的域进行修改，因此打印出所有记录查看修改部分不成问题，但如果文件很大，记录甚至超过100，打印所有记录只为查看修改部分显然不合情理。在模式后面使用花括号将只打印修改部分。取得模式，再根据模式结果实施操作，可能有些抽象，现举一例，只打印修改部分。注意花括号的位置。

$ awk '{if($1=="J.Troll") {$1="J.L.Troll"; print $1}}' grade.txt

J.L.Troll

6.创建新的输出域

在awk中处理数据时，基于各域进行计算时创建新域是一种好习惯。创建新域要通过其他域赋予新域标识符。如创建一个基于其他域的加法新域{$4=$2+$3}，这里假定记录包含3个域，则域4为新建域，保存域2和域3相加结果。

在文件grade.txt中创建新域8保存域目前级别分与域最高级别分的减法值。表达式为‘{$8=$7-$6}’，语法首先测试域目前级别分小于域最高级别分。新域因此只打印其值大于零的学生名称及其新域值。在BEGIN部分加入tab键以对齐报告头。

$ awk 'BEGIN{ print "Name\t Difference"} {if($6 < $7) {$8=$7-$6; print $1,$8}}' grade.txt

Name Difference

M.Tansley 4

J.Lulu 2

当然可以创建新域，并赋给其更有意义的变量名。例如：

$ awk 'BEGIN{ print "Name\t Difference"} {if($6 < $7) {diff=$7-$6; print $1,diff}}' grade.txt

Name Difference

M.Tansley 4

J.Lulu 2

7.增加列值

为增加列数或进行运行结果统计，使用符号+ =。增加的结果赋给符号左边变量值，增加到变量的域在符号右边。例如将$1加入变量total，表达式为total+=$1。列值增加很有用。许多文件都要求统计总数，但输出其统计结果十分繁琐。在awk中这很简单，请看下面的例子。

将所有学生的‘目前级别分’加在一起，方法是tot+=$6，tot即为awk浏览的整个文件的域6结果总和。所有记录读完后，在END部分加入一些提示信息及域6总和。不必在awk中显示说明打印所有记录，每一个操作匹配时，这是缺省动作。

$ awk '(tot+=$6); END{print "Club student total points :" tot}' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

Club student total points :155

如果文件很大，你只想打印结果部分而不是所有记录，在语句的外面加上大括号{}即可。

$ awk '{(tot+=$6)}; END{print "Club student total points :" tot}' grade.txt

Club student total points :155

8.文件长度相加

在目录中查看文件时，如果想快速查看所有文件的长度及其总和，但要排除子目录，使用ls -l命令，然后管道输出到awk，awk首先剔除首字符为d（使用正则表达式）的记录，然后将文件长度列相加，并输出每一文件长度及在END部分输出所有文件的长度。

本例中，首先用ls -l命令查看一下文件属性。注意第二个文件属性首字符为d，说明它是一个目录，文件长度是第5列，文件名是第9列。如果系统不是这样排列文件名及其长度，应适时加以改变。

-rw-r--r-- 1 root root 80 Apr11 18:56 acc.txt

drwx------ 2 root root 1024 Mar26 20:53 nsmail

Columns1 2 3 4 5 6 7 8 9

下面的正则表达式表明必须匹配行首，并排除字符d，表达式为^[^d]。

使用此模式打印文件名及其长度，然后将各长度相加放入变量tot中。

$ ls -l | awk '/^[^d]/ {print $9"\t"$5} {tot+=$5} END {print "total KB:"tot}'

dev_pkg.fail 345

failedlogin 12416

messages 4260

sulog 12810

utmp 1856

wtmp 7104

total KB:41351

9.2.9内置的字符串函数

awk有许多强大的字符串函数，见表9-4。

表9-4 awk内置字符串函数

gsub(r,s) 在整个$0中用s替代r

gsub(r,s,t) 在整个t中用s替代r

index(s,t) 返回s中字符串t的第一位置

length(s) 返回s长度

match(s,r) 测试s是否包含匹配r的字符串

split(s,a,fs) 在fs上将s分成序列a

sprint(fmt,exp) 返回经fmt格式化后的exp

sub(r,s) 用$0中最左边最长的子串代替s

substr(s,p) 返回字符串s中从p开始的后缀部分

substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分

gsub函数有点类似于sed查找和替换。它允许替换一个字符串或字符为另一个字符串或字符，并以正则表达式的形式执行。第一个函数作用于记录$0，第二个gsub函数允许指定目标，然而，如果未指定目标，缺省为$0。

index(s,t)函数返回目标字符串s中查询字符串t的首位置。length函数返回字符串s字符长度。match函数测试字符串s是否包含一个正则表达式r定义的匹配。split使用域分隔符fs将字符串s划分为指定序列a。sprint函数类似于printf函数（以后涉及），返回基本输出格式fmt的结果字符串exp。sub(r,s)函数将用s替代$ 0中最左边最长的子串，该子串被(r)匹配。sub(s,p)返回字符串s在位置p后的后缀。substr(s,p,n）同上，并指定子串长度为n。

现在看一看awk中这些字符串函数的功能。

1. gsub

要在整个记录中替换一个字符串为另一个，使用正则表达式格式：/目标模式/，替换模式。例如改变学生序号4842到4899：

$ awk 'gsub(/4842/,4899) {print $0}' grade.txt

J.Troll 07/99 4899 Brown-3 12 26 26

2.index

查询字符串s中t出现的第一位置。必须用双引号将字符串括起来。例如返回目标字符串Bunny中ny出现的第一位置，即字符个数。

$ awk 'BEGIN {print index("Bunny","ny")}' grade.txt

3.length

返回所需字符串长度，例如检验字符串J.Troll返回名字及其长度，即人名构成的字符个数。

$ awk '$1=="J.Troll" {print length($1)" "$1}' grade.txt

7 J.Troll

还有一种方法，这里字符串加双引号。

$ awk 'BEGIN {print length("A FEW GOOD MEN")}'

4.match

match测试目标字符串是否包含查找字符的一部分。可以对查找部分使用正则表达式，返回值为成功出现的字符排列数。如果未找到，返回0，第一个例子在ANCD中查找d。因其不存在，所以返回0。第二个例子在ANCD中查找C。因其存在，所以返回ANCD中D出现的首位置字符数。第三个例子在学生J.Lulu中查找u。

$ awk 'BEGIN{print match("ANCD",/d/)}'

$ awk 'BEGIN{print match("ANCD",/C/)}'

$ awk '$1=="J.Lulu" {print match($1,"u")}' grade.txt

5.split

使用split返回字符串数组元素个数。工作方式如下：如果有一字符串，包含一指定分隔符-，例如AD2-KP9-JU2-LP-1，将之划分成一个数组。使用split，指定分隔符及数组名。此例中，命令格式为("AD2-KP9-JU2-LP-1", parts_array, "-"），split然后返回数组下标数，这里结果为5。

$ awk 'BEGIN {print split("AD2-KP9-JU2-LP-1", parts_array, "-")}'

还有一个例子使用不同的分隔符。

$ awk 'BEGIN {print split("123#456#678", myarray, "#")}'

这个例子中，split返回数组myarray的下标数。数组myarray取值如下：

Myarray[1]="123"

Myarray[2]="456"

Myarray[3]="678"

本章结尾部分讲述数组概念。

6.sub

使用sub发现并替换模式的第一次出现位置。字符串STR包含'poped pope pill'，执行下列sub命令sub(/op/, "OP", STR）。模式op第一次出现时，进行替换操作，返回结果如下：

'pOPed pope pill'。

$ awk 'BEGIN{STR="poped pope pill";sub(/op/,"OP",STR);print STR}'

pOPed pope pill

本章文本文件中，学生J.Troll的记录有两个值一样，“目前级别分”与“最高级别分”。只改变第一个为29，第二个仍为26不动，操作命令为sub(/26/,"29",$0），只替换第一个出现26的位置。注意J.Troll记录需存在。

$ awk '$1=="J.Troll" sub(/26/,"29",$0)' grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 29

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 29 26

L.Tansley 05/99 4712 Brown-2 12 30 28

7.substr

substr是一个很有用的函数。它按照起始位置及长度返回字符串的一部分。例子如下：

$ awk '$1=="L.Tansley" {print substr($1,1,5)}' grade.txt

L.Tan

上面例子中，指定在域1的第一个字符开始，返回其前面5个字符。

如果给定长度值远大于字符串长度，awk将从起始位置返回所有字符，要抽取L.Tansley的姓，只需从第3个字符开始返回长度为7。可以输入长度99，awk返回结果相同。

$ awk '$1=="L.Tansley" {print substr($1,3,99)}' grade.txt

Tansley

substr的另一种形式是返回字符串后缀或指定位置后面字符。这里需要给出指定字符串及其返回字串的起始位置。例如，从文本文件中抽取姓氏，需操作域1，并从第三个字符开始：

$ awk '{print substr($1,3)}' grade.txt

Tansley

Lulu

Bunny

Troll

Tansley

还有一个例子，在BEGIN部分定义字符串，在END部分返回从第7个字符开始抽取的子串。

$ awk 'BEGIN {STR="A FEW GOOD MEN"}END{print substr(STR,7)}' grade.txt

GOOD MEN

8.从shell中向awk传入字符串

本章开始已经提到过，awk脚本大多只有一行，其中很少是字符串表示的。本书大多要求在一行内完成awk脚本，这一点通过将变量传入awk命令行会变得很容易。现就其基本原理讲述一些例子。

使用管道将字符串stand-by传入awk，返回其长度。

$ echo "stand-by" | awk '{print length($0)}'

设置文件名为一变量，管道输出到awk，返回不带扩展名的文件名。

$ STR="mydoc.txt"

$ echo $STR | awk '{print substr($STR,1,5)}'

mydoc

设置文件名为一变量，管道输出到awk，只返回其扩展名。

$ STR="mydoc.txt"

$ echo $STR | awk '{print substr($STR,7)}'

txt

9.2.10字符串屏蔽序列

使用字符串或正则表达式时，有时需要在输出中加入一新行或查询一元字符。

打印一新行时，（新行为字符\n），给出其屏蔽序列，以不失其特殊含义，用法为在字符串前加入反斜线。例如使用\n强迫打印一新行。

如果使用正则表达式，查询花括号({})，在字符前加反斜线，如/\{/，将在awk中失掉其特殊含义。

表9-5列出awk识别的另外一些屏蔽序列

表9-5 awk中使用的屏蔽序列

\b 退格键 \t ab键

\f 走纸换页 \ddd 八进制值

\n 新行 \c 任意其他特殊字符，例如\ \为反斜线符号

\r 回车键

使用上述符号，打印May Day，中间夹tab键，后跟两个新行，再打印May Day，但这次使用八进制数104、141、171、分别代表D、a、y。

$ awk 'BEGIN {print "May\tDay\n\nMay\t\104\141\171"}'

May Day

注意，\104为D的八进制ASCII码，\141为a的八进制ASCII码，等等。

9.2.11 awk输出函数printf

目前为止，所有例子的输出都是直接到屏幕，除了tab键以外没有任何格式。awk提供函数printf，拥有几种不同的格式化输出功能。例如按列输出、左对齐或右对齐方式。

每一种printf函数（格式控制字符）都以一个%符号开始，以一个决定转换的字符结束。转换包含三种修饰符。

printf函数基本语法是printf ([格式控制符],参数)，格式控制字符通常在引号里。

9.2.12 printf修饰符

表9-6 awk printf修饰符

- 左对齐

Width 域的步长，用0表示0步长

.prec 最大字符串长度，或小数点右边的位数

表9-7 awk printf格式

%c ASCII字符

%d 整数

%e 浮点数，科学记数法

%f 浮点数，例如(123.44)

%g awk决定使用哪种浮点数转换e或者f

%o 八进制数

%s 字符串

%x 十六进制数

1.字符转换

观察ASCII码中65的等价值。管道输出65到awk.printf进行ASCII码字符转换。这里也加入换行，因为缺省情况下printf不做换行动作。

$ echo "65" | awk '{printf "%c\n",$0}'

当然也可以按同样方式使用awk得到同样结果。

$ awk 'BEGIN {printf "%c\n",65}'

所有的字符转换都是一样的，下面的例子表示进行浮点数转换后‘999’的输出结果。整数传入后被加了六个小数点。

$ awk 'BEGIN {printf "%f\n",999}'

999.000000

2.格式化输出

打印所有的学生名字和序列号，要求名字左对齐，15个字符长度，后跟序列号。注意\ n换行符放在最后一个指示符后面。输出将自动分成两列。

$ awk '{printf "%-15s %s\n",$1,$3}' grade.txt

M.Tansley 48311

J.Lulu 48317

P.Bunny 48

J.Troll 4842

L.Tansley 4712

最好加入一些文本注释帮助理解报文含义。可在正文前嵌入头信息。注意这里使用print加入头信息。如果愿意，也可使用printf。

$ awk 'BEGIN {print "Name \t\tS.Number"}{printf "%-15s %s\n",$1,$3}' grade.txt

Name S.Number

M.Tansley 48311

J.Lulu 48317

P.Bunny 48

J.Troll 4842

L.Tansley 4712

3.向一行awk命令传值

在查看awk脚本前，先来查看怎样在awk命令行中传递变量。

在awk执行前将值传入awk变量，需要将变量放在命令行中，格式如下：

awk 命令变量=输入文件值

（后面会讲到怎样传递变量到awk脚本中）。

下面的例子在命令行中设置变量AGE等于10，然后传入awk中，查询年龄在10岁以下的所有学生。

$ awk '{if($5 < AGE) print $0}' AGE=10 grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

要快速查看文件系统空间容量，观察其是否达到一定水平，可使用下面awk一行脚本。因为要监视的已使用空间容量不断在变化，可以在命令行指定一个触发值。首先用管道命令将df -k 传入awk，然后抽出第4列，即剩余可利用空间容量。使用$4~/^[0-9]/取得容量数值（1024块）而不是df的文件头，然后对命令行与'if($4 < TRIGGER) '上变量TRIGGER中指定的值进行查询测试。

$ df -k | awk '($4~/^[0-9]/) {if($4 < TRIGGER) print $6"\t"$4}' TRIGGER=56000

/dos 55808

/apps 51022

在系统中使用df -k命令，产生下列信息：

Filesystem 1K-blocks Used Avail Capacity Mounted on

Column 1 2 3 4 5 6

如果系统中df输出格式不同，必须相应改变列号以适应工作系统。

当然可以使用管道将值传入awk。本例使用who命令，who命令第一列包含注册用户名，这里打印注册用户，并加入一定信息。

$ who | awk '{print $1 " is logged on"}'

louisel is logged on

papam is logged on

awk也允许传入环境变量。下面的例子使用环境变量LOGNAME支持当前用户名。可从who命令管道输出到awk中获得相应信息。

$ who | awk '{if($1==user) print $1" you are connected to "$2}' user=$LOGNAME

如果root为当前登录用户，输出如下：

root you are connected to ttyp1

4.awk脚本文件

可以将awk脚本写入一个文件再执行它。命令不必很长（尽管这是写入一个脚本文件的主要原因），甚至可以接受一行命令。这样可以保存a w k命令，以使不必每次使用时都需要重新输入。使用文件的另一个好处是可以增加注释，以便于理解脚本的真正用途和功能。

使用前面的几个例子，将之转换成awk可执行文件。像原来做的一样，将学生目前级别分相加awk '(tot+=$6) END{print "club student total points："tot}' grade.txt。

创建新文件student_tot.awk，给所有awk程序加入awk扩展名是一种好习惯，这样通过查看文件名就知道这是一个awk程序。文本如下：

#!/usr/bin/awk -f

# all comment lines must start with a hash '#'

# name: student_tot.awk

# to call: student_tot.awk grade.txt

# prints total and average of club student points

# print a header first

BEGIN{

print "Student Date Member No. Grade AgePoints Max"

print "Name Joined Gained Point Available"

print "=================================================================="

}

# let's add the scores of points gained

(tot+=$6)

# finished processing now let's print the total and average point

END{print "Club student total points : " tot"\nAverage Club Student points: " tot/NR}

第一行是#!/bin/awk -f。这很重要，没有它自包含脚本将不能执行。这一行告之脚本系统中awk的位置。通过将命令分开，脚本可读性提高，还可以在命令之间加入注释。这里加入头信息和结尾的平均值。基本上这是一个一行脚本文件。

执行时，在脚本文件后键入输入文件名，但是首先要对脚本文件加入可执行权限。

$ chmod u+x student_tot.awk

$ ./student_tot.awk grade.txt

Student Date Member No. Grade Age Points Max

Name Joined Gained Point Available

======================================================================

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

P.Bunny 02/99 48 Yellow 12 35 28

J.Troll 07/99 4842 Brown-3 12 26 26

L.Tansley 05/99 4712 Brown-2 12 30 28

Club student total points :155

Average Club Student points:31

系统中运用的帐号核实程序检验数据操作人的数据输入，不幸的是这个程序有一点错误，或者应该说是“非文本特征”。如果一个记录被发现包含一个错误，它应该一次只打印一行 “ERROR*”，但实际上打印了许多这样的错误行。这会给帐号管理员造成误解，因此需要用awk脚本过滤出错误行的出现频率，使得每一个失败记录只对应一个错误行。

在awk实施过滤前先看看部分文件：

...

INVALID LCSD 98GJ23

ERROR*

CAUTION LPSS ERROR ON ACC NO.

ERROR*

PASS FIELD INVALID ON LDPS

ERROR*

PASS FIELD INVALID ON GHSI

ERROR*

CAUTION LPSS ERROR ON ACC NO.

ERROR*

awk脚本如下：

#!/bin/awk -f

# error_strip.awk

# to call: error_strip.awk

# strips out the ERROR* lines if there are more than one

# ERROR* lines after each failed record.

BEGIN {error_line=""}

# tell awk the whole is "ERROR*"

{if($0=="ERROR*" && error_line=="ERROR*")

# go to next line

next;

error_line=$0; print}

awk过滤结果如下：

$ strip.awk strip

INVALID LCSD 98GJ23

ERROR*

CAUTION LPSS ERROR ON ACC NO.

ERROR*

PASS FIELD INVALID ON LDPS

ERROR*

PASS FIELD INVALID ON GHSI

ERROR*

CAUTION LPSS ERROR ON ACC NO.

ERROR*

5.在awk中使用FS变量

如果使用非空格符做域分隔符（FS）浏览文件，例如#或:，编写这样的一行命令很容易，因为使用FS选项可以在命令行中指定域分隔符。

$ awk -F: 'awk {print $0}' input-file

使用awk脚本时，记住设置FS变量是在BEGIN部分。如果不这样做，awk将会发生混淆，不知道域分隔符是什么。

下述脚本指定FS变量。脚本从/etc/passwd文件中抽取第1和第5域，通过冒号“:”分隔passwd文件域。第1域是帐号名，第5域是帐号所有者。

$ pg passwd.awk

#!/bin/awk -f

# to call: passwd.awk /etc/passwd

# print out the first and fifth fields

BEGIN{

FS=":"}

{print $1,"\t",$5}

$ passwd.awk /etc/passwd

root Special Admin login

xdm Restart xdm Login

sysadm Regular Admin login

daemon Daemon Login for daemons needing permissions

6.向awk脚本传值

向awk脚本传值与向awk一行命令传值方式大体相同，格式为：

awk script_file var=value input_file

下述脚本对比检查文件中域号和指定数字。这里使用了NF变量MAX，表示指定检查的域号，使用双引号将域分隔符括起来，即使它是一个空格。

$ pg fieldcheck.awk

#!/bin/awk -f

# check on how many fields in a file

# name:fieldcheck.awk

# to call: fieldcheck MAX=n FS= filename

NF!=MAX{

print("line " NR " does not have" MAX " fields")}

如果以/etc/passwd作输入文件（passwd文件有7个域），运行上述脚本。参数格式如下：

$ fieldcheck.awk MAX=7 FS=":" /etc/passwd

使用前面一行脚本的例子，将之转换成awk脚本如下：

$ pg age.awk

#!/bin/awk -f

# name: age.awk

# to call: age.awk AGE=n grade.txt

# prints ages that are lower than the age supplied on the command line

{if($5 < AGE)

print $0}

文本包括了比实际命令更多的信息，没关系，仔细研读文本后，就可以精确知道其功能及如何调用它。

不要忘了增加脚本的可执行权限，然后将变量和赋值放在命令行脚本名字后、输入文件前执行。

$ age.awk AGE=10 grade.txt

M.Tansley 05/99 48311 Green 8 40 44

J.Lulu 06/99 48317 green 9 24 26

同样可以使用前面提到的管道命令传值，下述awk脚本从du命令获得输入，并输出块和字节数。

$ pg duawk.awk

#!/bin/awk -f

# to call: du | duawk.awk

# prints file/direc's in bytes and blocks

BEGIN{

FS="\t" ;

print "name" "\t\t","bytes","blocks\n"

print "=============================="}

{print $2,"\t\t",$1*512,$1}

为运行这段脚本，使用du命令，并管道输出至awk脚本。

$ du | duawk.awk

name bytes blocks

=================================

./profile.d 2048 4

./X11 135680 265

./rc.d/init.d 27136 53

./rc.d/rc0.d 512 1

./rc.d/rc1.d 512 1

9.2.13 awk数组

前面讲述split函数时，提到怎样使用它将元素划分进一个数组。这里还有一个例子：

$ awk 'BEGIN {print split("123#456#678", myarray, "#")}'

在上面的例子中，split返回数组myarray下标数。实际上myarray数组为：

Myarray[1]="123"

Myarray[2]="456"

Myarray[3]="678"

数组使用前，不必定义，也不必指定数组元素个数。经常使用循环来访问数组。下面是一种循环类型的基本结构：

For (element in array) print array[element]

对于记录“123#456#789”，先使用split函数划分它，再使用循环打印各数组元素。操作脚本如下：

$ pg arraytest.awk

#!/bin/awk -f

# name: arraytest.awk

# prints out an array

BEGIN{

record="123#456#789";

split(record, myarray, "#")}

END{for(i in myarray) {print myarray[i]}}

要运行脚本，使用/dev/null作为输入文件。

$ arraytest.awk /dev/null

123

456

789

数组和记录

上面的例子讲述怎样通过split函数使用数组。也可以预先定义数组，并使用它与域进行比较测试，下面的例子中将使用更多的数组。

下面是从空手道数据库卸载的一部分数据，包含了学生级别及是否是成人或未成年人的信息，有两个域，分隔符为（#），文件如下：

$ pg grade_student.txt

Yellow#Junior

Orange#Senior

Yellow#Junior

Purple#Junior

Brown-2#Junior

White#Senior

Orange#Senior

Red#Junior

Brown-2#Senior

Yellow#Senior

Red#Junior

Blue#Senior

Green#Senior

Purple#Junior

White#Junior

脚本功能是读文件并输出下列信息。

1)俱乐部中Yellow、Orange和Red级别的人各是多少。

2)俱乐部中有多少成年人和未成年人。

查看文件，也许20秒内就会猜出答案，但是如果记录超过60个又怎么办呢？这不会很容易就看出来，必须使用awk脚本。

首先看看awk脚本，然后做进一步讲解。

$ pg belts.awk

#!/bin/awk -f

# name: belts.awk

# to call: belts.awk grade_student.txt

# loops through the grade2.txt file and counts how many

# belts we have in (yellow, orange, red)

# also count how many adults and juniors we have

# start of BEGIN

# set FS and load the arrays with our values

BEGIN{FS="#"

# load the belt colours we are interested in only

belt["Yellow"]

belt["Orange"]

belt["Red"]

# end of BEGIN

# load the student type

student["Junior"]

student["Senior"]

}

# loop through array that holds the belt colors against field-1

# if we have a match, keep a runnning total

{for(colour in belt)

{if($1==colour)

belt[colour]++}}

# loop through array that holds the student type against

# field-2 if we have a match, keep a running total

{for(senior_or_junior in student)

{if($2==senior_or_junior)

student[senior_or_junior]++}}

# finished processing so print out the matches..for each array

END{for(colour in belt) print "The club has", belt[colour], colour, "Belts"

for(senior_or_junior in student) print "The club has", student[senior_or_junior]\

, senior_or_junior, "students"}

BEGIN部分设置FS为符号#，即域分隔符，因为要查找Yellow、Orange和Red三个级别。然后在脚本中手工建立数组下标对学生做同样的操作。注意，脚本到此只有下标或元素，并没有给数组名本身加任何注释。初始化完成后， BEGIN部分结束。记住BEGIN部分并没有文件处理操作。

现在可以处理文件了。首先给数组命名为color，使用循环语句测试域1级别列是否等于数组元素之一（Yellow、Orange或Red），如果匹配，依照匹配元素将运行总数保存进数组。

同样处理数组‘Senior_or_junior’，浏览域2时匹配操作满足，运行总数存入junior或senior的匹配数组元素。

END部分打印浏览结果，对每一个数组使用循环语句并打印它。

注意在打印语句末尾有一个\符号，用来通知awk（或相关脚本）命令持续到下一行，当输入一个很长的命令，并且想分行输入时可使用这种方法。运行脚本前记住要加入可执行权限。

$ ./belts.awk grade_student.txt

The club has 2 Red Belts

The club has 2 Orange Belts

The club has 3 Yellow Belts

The club has 7 Senior students

The club has 8 Junior students

9.3 小结

awk语言学起来可能有些复杂，但使用它来编写一行命令或小脚本并不太难。本章讲述了awk的最基本功能，相信大家已经掌握了awk的基本用法。awk是shell编程的一个重要工具。在shell命令或编程中，虽然可以使用awk强大的文本处理能力，但是并不要求你成为这方面的专家。

本文转自：http://linitok.blog.163.com/blog/static/5055992020087196220383/

自己的一个小例子：

ls -lrt *.unl|awk '{print $9}'|awk -F\. '{print "truncate table "$1";"}'

意思就是说：

1、把所有后缀是unl的文件按文件修改时间逆序排序并打印出来

2、去掉文件的后缀并打印文件名

3、在文件名的前面加上"truncate table "，在文件名的后面加上";"。最后就OK了。

你可能感兴趣的:(awk使用)

Python基础—用python读取xml文件！小尤笔记 python xml 开发语言
读取XML文件在Python中是一个常见的任务，通常可以使用内置的xml.etree.ElementTree模块来完成。这个模块提供了简单而高效的XML解析和生成功能。下面是一个详细的代码示例和讲解，展示了如何使用xml.etree.ElementTree来读取XML文件。代码示例假设我们有一个名为example.xml的XML文件，内容如下：120081411004201159900我们的目标是
SQLite 3.48.0 发布，有哪些更新？不剪发的Tony老师 SQLite sqlite 数据库
SQLite开发团队于2025年1月14日发布了SQLite3.48.0版本，我们来解读一下新版本的改进功能。EXPLAINQUERYPLANSQLite使用EXPLAINQUERYPLAN命令获取查询语句的执行计划，新版本改进了执行计划输出结果中的覆盖索引优化信息：sqlite>createtablet1(idint,nametext,priceint,desctext);sqlite>crea
Golang学习笔记_28——工厂方法模式 LuckyLay Golang学习笔记 golang 学习笔记设计模式工厂方法模式
Golang学习笔记_25——协程Golang学习笔记_26——通道Golang学习笔记_27——单例模式文章目录工厂方法模式1.介绍2.优点3.类图4.实现源码工厂方法模式1.介绍工厂方法模式（FactoryMethod）是一种创建型设计模式，它提供了一种创建对象的接口，但由子类决定要实例化的类是哪一个。工厂方法模式让类的实例化推迟到子类中进行2.优点解耦：将对象的创建与使用分离，客户端不需要知
鸿蒙Flutter实战：15-Flutter引擎Impeller鸿蒙化、性能优化与未来星释鸿蒙 Flutter 实战鸿蒙 flutter harmonyos
Flutter技术原理Flutter是一个主流的跨平台应用开发框架，基于Dart语言开发UI界面，它将描述界面的Dart代码直接编译成机器码，并使用渲染引擎调用GPU/CPU渲染。渲染引擎的优势使用自己的渲染引擎，这也是Flutter与其他跨平台框架最大的区别。与ReactNative等高度依赖原生组件的框架不同，Flutter摆脱了原生组件依赖，界面布局更加灵活，多端展示效果高度一致。由于渲染引
使用腾讯云AI代码助手快速实现一个办公AI助手星释编程实践腾讯云AI代码助手
使用腾讯云AI代码助手快速实现一个办公AI助手作品简介这是一个基于Vue.js和TDesign的AI聊天演示项目，旨在为用户提供便捷的办公交流体验。技术架构本项目采用了前端框架Vue.js结合TDesign组件库进行开发，同时集成了相关的AI聊天功能模块。实现过程开发环境、开发流程开发环境：Node.js版本v18+开发流程：克隆项目代码。在项目根目录下运行npmi安装依赖。运行npmrundev
GitHub无法访问、下载文件慢以及加速方法 yunfanleo github
1.GitHub加速器为了解决访问速度慢以及无法访问等GitHub访问不稳定的问题，可以通过修改hosts文件来解决DNS污染问题，直接访问GitHub的CDN节点，从而加速访问。有些GitHub加速器就是为此而生，比较适合需要访问GitHub官网的开发者用户以及其他经常需要使用GitHub网站的用户。GitHub加速器：GitHub加速-办公人导航https://www.bgrdh.com/si
Golang 中强大的重试机制，解决瞬态错误 Ai 编码 Golang教程 golang 开发语言后端
文章精选推荐1JetBrainsAiassistant编程工具让你的工作效率翻倍2ExtraIcons：JetBrainsIDE的图标增强神器3IDEA插件推荐-SequenceDiagram，自动生成时序图4BashSupportPro这个ides插件主要是用来干嘛的？5IDEA必装的插件：SpringBootHelper的使用与功能特点6Aiassistant,又是一个写代码神器7Cursor
curl的使用 workingman_li java
curl的使用1.1URL访问访问一个网页时，可以使用curl命令后加上要访问的网址：$curlitbilu.com301MovedPermanently301MovedPermanentlynginx/1.6.2如上所示，我们就看到所访问网址的页面源码。重定向跟踪在上面示例中，页面使用了301重定向，这时我们可以添加-L参数来跟踪URL重定向：$curl-Litbilu.com页面保存如果需要将
Python 中 PIL 构建图片裁剪工具 winfredzhang python crop
概述这篇博客将为您展示如何使用wxPython和PIL库开发一个图片裁剪工具。本工具能够加载图片，允许用户通过拖拽选择框裁剪图片，并保存裁剪后的结果。以下是完整代码和实现步骤。C:\pythoncode\new\cropimageandsave.py功能特性图片加载：支持加载JPG和PNG格式的图片。动态裁剪：通过鼠标绘制矩形选择框进行裁剪。缩放适配：图片会根据面板大小自动缩放显示。保存裁剪结果：
程序员如何培养技术领导力？借雨醉东风管理及面试心得职场和发展
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
模型部署工具01：Docker || 用Docker打包模型 Build Once Run Anywhere Tiandaren 模型部署 docker java 容器服务器深度学习人工智能 linux
Docker是一个开源的容器化平台，可以让开发者和运维人员轻松构建、发布和运行应用程序。Docker的核心概念是通过容器技术隔离应用及其依赖项，使得软件在不同的环境中运行时具有一致性。无论是开发环境、测试环境，还是生产环境，Docker都能够提供高效、可靠的解决方案。在本教程中，我们将详细介绍Docker的核心概念、安装方法，以及如何使用Docker进行容器化操作。Docker是什么？为什么值得学
Docker部署nnunetv2简洁教程 Tiandaren 模型部署 docker 容器运维 pytorch 人工智能深度学习 python
前言：感觉一些教程没必要说那么多，直接贴出重点的配置文件。如果有不懂的，可以把此文档丢给gpt，配合自己的环境一同服用。首先，在nnunet路径下创建一个Dockerfile。由于我已经完成了nnUNet的训练，所以不需要将相关数据全部上传到容器中，而是只保留源码。#使用适当的基础镜像（如pytorch官方镜像）FROMpytorch/pytorch:latest#更新apt-get并安装必要的工
python读取路径只能是双左斜杠、双右斜杠、左斜杠，不能是右斜杠吗？神笔馬良人工智能
问题描述：python读取路径只能是双左斜杠、双右斜杠、左斜杠，不能是右斜杠吗？问题解答：在Python中，读取文件路径时，可以使用双左斜杠（\），也可以使用双右斜杠（//），或者使用单左斜杠（/）。事实上，Python中的路径处理函数通常会接受和处理这三种形式的路径分隔符。但是，在Windows操作系统中，路径中的分隔符通常是反斜杠（\），而在Linux和Unix系统中通常是正斜杠（/）。因此，
mysql+binlog+查看+加密,mysql查看binlog日志疯疯疯狂的野兔
MySQL的二进制日志可以说是MySQL最重要的日志了，它记录了所有的DDL和DML(除了数据查询语句)语句，以事件形式记录，还包含语句所执行的消耗的时间，MySQL的二进制日志是事务安全型的。一般来说开启二进制日志大概会有1%的性能损耗(参见MySQL官方中文手册5.1.24版)。二进制有两个最重要的使用场景:其一：MySQLReplication在Master端开启binlog，Mster把它
杨建：网站加速--服务器编写篇黄传通服务器 centos buffer server tcp 多线程
杨建：网站加速--服务器编写篇（上）--提升性能的同时为你节约10倍以上成本From:http://blog.sina.com.cn/iyangjian一，如何节约CPU二，怎样使用内存三，减少磁盘I/O四，优化你的网卡五，调整内核参数六，衡量WebServer的性能指标七，NBAjs直播的发展历程八，新浪财经实时行情系统的历史遗留问题(7byte=10.68wRMB/year)---------
(RAG系列) FastGPT工作流的http请求模块使用是小白_鸭 RAG 语言模型 ai 自然语言处理
FastGPT工作流的http请求模块使用版本使用说明代码模板版本fastgptv4.8.10使用说明question接收传入的变量，msg集合则是包含返回的变量，fastgpt的工作流的http请求模块填写url->http://xxxx:5000/deal_response代码模板fromflaskimportFlask,requestimportjsonimportreapp=Flask(_
Python（四）——SVG 图坐标轴数字和其他文本设置总结八年。。 python 开发语言笔记
在学术论文中，图像的质量和规范性直接影响文章的专业性和表达效果。尤其是在使用Python绘制SVG图时，图像的字体选择、大小设置、以及整体样式需要符合期刊或会议的要求。这不仅能提升视觉呈现的清晰度，还能增强论文内容的可读性和说服力。因此，合理设置坐标轴字体（如数字使用“TimesNewRoman”、文字使用“宋体”）和调整图像细节是学术制图中不可忽视的重要环节。1.设置全局字体frommatplo
《零基础Go语言算法实战》【题目 7-4】删除数组重复项，使每个元素只出现一次并返回新的长度廖显东-ShirDon 讲编程算法算法数据结构 go语言 go web web编程程序员 golang
《零基础Go语言算法实战》【题目7-4】删除数组重复项，使每个元素只出现一次并返回新的长度给定一个排序数组array，就地删除重复项，使每个元素只出现一次并返回新的长度。不要为另一个数组分配额外的空间，开发者必须通过使用空间复杂度为O(1)的额外内存就地修改输入数组来做到这一点。示例如下。输入：array=[5,5,6]输出：2【解答】①思路。本题可以通过希尔排序算法实现。注意本题中数组的删除并不
使用 MySQL 从 JSON 字符串提取数据 m0_74825678 面试学习路线阿里巴巴 mysql json oracle
使用MySQL从JSON字符串提取数据在现代数据库管理中，JSON格式因其灵活性而广泛使用。然而，当数据存储在JSON中时，我们经常需要将其转换为更易于处理的格式。本篇文章将通过一个具体的SQL查询示例，展示如何从存储在MySQL中的JSON字符串提取数据并重新格式化。1.背景知识JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，易于阅读和编写，同时也易于机器
Python中Cache的使用爬虫俗手小马达 python 开发语言缓存
文章目录一、缓存的基础概念二、基础使用三、进阶使用四、外部缓存工具五、缓存的注意事项一、缓存的基础概念缓存（Cache）是一种在应用程序中提升性能的技术，它通过将一些数据临时存储在快速访问的存储介质（如内存）中，以减少数据的重复计算或重复读取。通常，缓存用于存储一些昂贵计算或IO密集型操作的结果，从而加快程序的执行速度。在Python中，缓存通常用于函数的输出、API请求的结果、数据库查询、文件读
Python学习：Pandas库使用（二）之读写Excel文件——read_excel()和to_excel()函数及其参数详解爬虫俗手小马达 python 学习 pandas
在Python的Pandas库中，读取和写入Excel文件主要使用read_excel和to_excel函数。以下是详细用法和示例：1.读取Excel文件：pd.read_excel()importpandasaspd#读取Excel文件df=pd.read_excel('文件路径.xlsx',sheet_name='Sheet1',header=0,usecols='A:C',skiprows=
WPS不登录无法使用基本功能的解决方案愚公移山填海经验分享
前言WPS不登录无法使用基本功能的原因通常是为了同步数据、提供更多高级功能或满足软件授权要求。‌然而，一些用户可能出于隐私或便捷性的考虑，不愿意登录账号。在这种情况下，WPS可能会限制未登录用户的使用权限，导致工具栏变灰，无法使用基本功能。‌解决方法1.使用配置工具进行重置修复‌打开WPS配置工具，进入高级设置界面。选择“重置修复”选项，然后点击“重置工具栏”。完成修复后，重启WPS软件以确保设置
怎么在wps里面进行批量序号替换通配符； Bruce-Lan wps
删除所有的6.1.[1-9].[1-9].[1-9]的序号？6\.1\.[1-9]\.[1-9]\.[1-9]1，ctrl+f；2，点击替换，使用通配符；3，查找内容输入：6\.1\.[1-9]\.[1-9]\.[1-9]，替换内容自拟比如1.2.3.5.64，执行替换，搞定。
PyInstaller 打包 exe 文件 cliffordl python 综合 python 开发语言
PyInstaller是一个第三方库，它能够在Windows、Linux、MacOSX等操作系统下将Python源文件打包。通过对源文件打包，Python程序可以在没有安装Python的环境中运行，也可以作为一个独立文件方便传递和管理。PyInstaller支持Python2.7和Python3.3+。可以在Windows、MacOSX和Linux上使用，但是并不是跨平台的，而是说你要是希望打包成
C++：inline函数的作用湫兮之风 c++c++算法开发语言
1.基本概念inline是C++中的一个关键字，用于建议编译器将函数的调用替换为函数体本身，而不是执行传统的函数调用操作。函数调用通常涉及将参数压栈、跳转到函数代码处执行、返回结果等操作，对于一些小的、频繁调用的函数，这些开销可能会影响性能。使用inline可以避免这些开销。2.示例代码#include//定义一个inline函数inlineintadd(inta,intb){returna+b;
OpenCV: 深入理解OpenCV中CV_WRAP_AS宏及其作用湫兮之风 opencv opencv 人工智能计算机视觉
在OpenCV中，CV_WRAP_AS是一个宏，主要用于为C++函数或运算符定义别名，以便在生成语言绑定时使用。这对于在不同的编程语言（如Python）中使用OpenCV库时提供更友好的接口非常有用。尽管它在C++代码中不会改变函数的行为，但它在OpenCV的语言绑定系统中起到了重要作用，特别是当OpenCV要为多个语言（如Python）提供接口时。1.CV_WRAP_AS宏的基本用途CV_WRA
uni-app无法触发onReachBottom触底事件的解决方案沐雨MUYU_ 问题总结 uni-app 小程序前端
遇到的问题背景：在使用uni-app开发小程序时，想要列表滚动到底部时，设置上拉加载。但页面滚动到底部时，无法触发onReachBottom函数过程：排除了下文提到的（pages.json未配置，以及容器未设置高度）等问题后，也更换了方式，使用scroll-view标签进行包裹，发现仍无法解决原因：最终发现是列表容器使用了绝对定位的问题（或固定定位也可能出现），导致容器脱离标准流，无法触底.pag
mongodb清理删除历史数据程序员
批量清理mongodb历史数据清理程序的原来目前项目组上很多平台上线历史数据积压，导致入库查询数据缓慢，历史数据有些已经归档，进行历史数据清理删除。之前临时写shell脚本，太简陋，重新使用Python进行改造，新增备份功能，和配置文件删除指定字段和时间范围内数据。代码篇#!/usr/local/python3/bin/python3importconfigparser,logging.confi
项目进度管理：如何使用甘特图实现精准跟踪？
一、甘特图——项目进度管理的得力助手（一）甘特图的基本概念与构成甘特图（GanttChart）又称横道图、条状图，出现于20世纪初，是一种常用于项目管理的、按照时间进度标出工作活动的图表，以提出者亨利・L・甘特（HenrryL.Ganntt）先生的名字命名。它是一个二维平面图，用横轴表示项目进度或活动时间，比如可以按日期为单位，展示项目的整体时间范围，像从项目启动到结束所涵盖的天数、周数、月数等；
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found