weixin_33739541

AWK基础讲解笔记

awk课程总结... 1

第1章 awk基础入门... 1

1.1 awk基础入门... 1

1.2 awk简介... 1

1.2.1 一种名字怪异的语言... 1

1.2.2 模式扫描和处理... 1

1.3 学过awk可以掌握的内容... 1

1.4 awk命令... 1

1.5模式及pattern，可以类似理解成sed的模式匹配，可以由表达式组成，也可以是俩个正斜杠之间的正则表达式，比如：NR==1 ，这就是模式，可以理解为一个条件。... 2

1.6动作即action，是由在大括号里面的一条或者多条语句组成，语句之间使用分号隔开，如下awk使用格式... 2

1.7 awk执行过程... 2

1.8 接下来说俩个新概念：记录和字段，这里为了方便理解可以把记录当做行记录===行，字段相当于列，字段===列。... 3

1.9 awk记录分隔符 -RS. 3

1.9.1 awk默认情况下每一行都是一个记录... 3

1.9.2 RS即record separator输入数据记录分隔符，每一行是怎么来的，表示每个记录输入的时候的分隔符，即行与行之间如何分割。... 3

1.9.3 NR即number of record 记录行号，表示当前正在处理的行的号码... 5

1.9.4 ORS即output record separator 输出记录分隔符。... 5

1.9.5 awk使用内置变量RS来存放输入记录分隔符，RS表示的是输入的记录分隔符，这个值可以通过BEGIN模块重新定义修改。... 5

1.10 思路... 5

1.11 awk记录知识小结... 6

1.11.1 NR存放着每个记录的号（行号），读取新行时候会自动加1（+1）... 6

1.11.2 RS是输入数据的记录的分隔符，简单理解就是可以指定每个记录的结尾标致... 6

1.11.3 RS作用就是表示一个记录的结束... 6

1.11.4 当我们修改了RS的值，最好配合NR来查看变化，也就是修改了RS的值通过NR查看结果，调试awk程序。... 6

1.11.5 ORS输出数据的记录的分隔符... 6

1.12 awk学习技巧一则... 6

1.13 字段（字段）... 6

1.14 FS. 7

1.15 说明：... 7

1.16 ORS与OFS简介... 8

1.16.1 利用OFS调换ETCpasswd位置... 8

1.17 awk都有哪几种模式... 9

1.17.1 正则表达式作为模式... 9

1.17.2 比较表达式作为模式... 9

1.17.3 范围模式... 9

1.17.4 特殊模式BEGIN和END.. 9

1.18 awk也支持大量的正则表达式，大部分与sed的元字符类似，而且正则表达式是玩转三剑客的必备工具，... 9

1.19 说明：... 10

1.20 awk注意事项说明：... 10

1.21 awk运算符... 10

第2章 awk特殊模式与END模式... 11

2.1 BEGIN模块... 11

2.2 命令行 -F本质就是修改的FS变量... 11

2.2.1 第二个作用，在读取文件之前输出些提示性信息，表头。... 11

2.3 awk中的变量的概念简介... 12

2.4 NEGIN模式说明... 12

2.5 END模块说明... 12

2.6 awk编程思想... 12

2.6.1 先处理，最后在END模式输出... 12

2.6.2 ｛print NF ,$0｝ boby 模块处理，处理完毕后... 12

2.6.3 END{print"end of file"} 输出一个结果... 12

2.7 awk调试技巧：... 12

2.8 几种常用的运算表达式... 12

2.9 awk中的动作... 13

2.10 awk模式与动作小结... 13

2.11 awk执行过程文字版... 13

第3章 awk数组... 14

3.1 图片-数组-酒店... 14

3.2 awk数组小结... 15

3.3 这个不知道起什么名... 15

3.4 企业面试题数组题分解执行过程... 16

第4章练习题... 16

4.1 测试文件... 16

4.1.1 显示姓Zhang的人的第二次捐款金额及她的名字... 16

4.1.2 显示Xiaoyu的名字和ID号码... 17

4.1.3 显示所有以41开头的ID号码的人的全名和ID号码... 17

4.1.4 显示所有以一个D或X开头的人名全名... 17

4.1.5 显示所有ID号码最后一位数字是1或5的人的全名... 17

4.1.6 显示Xiaoyu的捐款.每个值时都有以$开头.如$520$200$135. 18

4.2 正则表达式部分的疑问... 20

4.3 匹配除了含有oldboy的其他行... 20

4.3.1 测试文件... 20

4.3.2 注意精确... 21

4.4 表示一个范围，与sed（2，5p）意思相近... 21

4.5 BEGIN在读取文件以前执行... 21

4.6 a=1输出1a=lidaoawk会将lidao（英文字母）认为是一个变量（需要加“”）... 21

4.7 END模式... 22

4.8 awk调试过程... 22

4.9 数组... 23

第5章企业案例... 23

5.1 企业面试题: 按单词出现频率降序排序（计算文件中每个单词的重复数量）... 23

5.1.1 按字母查找... 24

5.2 考试题1：处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)24

5.2.1 答案：... 24

5.3 【】企业面试题】处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)24

5.3.1 答案：... 25

5.3.2 方法一... 26

5.3.3 方法二... 26

awk课程总结

第1章 awk基础入门

要弄懂awk程序，必须熟悉了解这个工具的规则，

1.2 awk简介

1.2.1 一种名字怪异的语言

1.2.2 模式扫描和处理

awk不仅仅是Linux中的一个命令，而且是一种编程语言，可以用来处理数据和生成报告，处理的数据可以是一个或者多个文件，可以是来自标准输入，也可以是通过管道获取标准输入，awk可以在命令行上直接编辑命令进行操作，也可以编写成awk程序来进行运用，本章主要讲解awk命令行的运用，较为复杂的程序会包含在以后的课程中

回顾sed命令，把文件当做流水一样处理

1.3 学过awk可以掌握的内容

1记录和字段

2 模式匹配：模式与动作

3 基本的awk执行过程

4awk常用的内置变量（预定义变量）

5 awk数组（工作常用的）

6awk语法：循环，条件

7awk常用的函数

8 向awk传递参数

9awk引用shell变量

10 awk小程序及调试思路

1.4 awk命令

awk -v RS=":" 与‘BEGIN{RS=":"}’一样

uniq 合并相同行 -c 将相同行相加输出

sort 排序，默认按照字母顺序排序 -r 逆向排序 -n 排序

culomn -t 使行，列对齐

awk的默认的FS 分隔符空格序列 TAB键一个或者多个空格，都认为是一个整体

OFS不支持正则表达式

FS=-F 指定分隔符

posix 使awk支持扩展正则表达式，如：'/0{2,3}/'

awk中 $N==root 要写成$N=="root" 如果不佳双引号，awk会把等于看成是一个变量

例子：

[root@oldboy32-vm1~]# awk -F ":"'NR<=5{print $1,$3}' /etc/passwd

root 0

bin 1#awk 参数 '条件(找谁){动作(干啥)}' /etc/passwd

1.5 模式及pattern，可以类似理解成sed的模式匹配，可以由表达式组成，也可以是俩个正斜杠之间的正则表达式，比如：NR==1，这就是模式，可以理解为一个条件。

1.6 动作即action，是由在大括号里面的一条或者多条语句组成，语句之间使用分号隔开，如下awk使用格式

awk处理的内容可以来自标准输入（>），一个或者多个文本或管道

模式动作里面分俩部分，大括号外面的叫找谁里面的叫干啥

1.7 awk执行过程

1 首先读取一行

2 模式是我要处理的行吗？

3 如果是，则对读入行执行动作里的命令

4 如果否，则重复上面的过程直到最后一个文件结尾

5 END模块

6 结束

1.8 接下来说俩个新概念：记录和字段，这里为了方便理解可以把记录当做行记录===行，字段相当于列，字段===列。

record	记录，行
field	域，区域，字段，列

1.9 awk记录分隔符 -RS

记录分隔符 -每一个记录是如何结束的

[root@zxw files]# cat reg.txt

Zhang （FS）Dandan41117397:250:100:175$0

Zhang （FS）Xiaoyu390320151:155:90:201$0

Meng（FS）Feixue80042789:250:60:50$0

1.9.1 awk默认情况下每一行都是一个记录

1.9.2 RS即record separator输入数据记录分隔符，每一行是怎么来的，表示每个记录输入的时候的分隔符，即行与行之间如何分割。

例子：

awk指定RS分割符号：

[root@oldboy32-vm1files]# head -2 awkfile.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

[root@oldboy32-vm1files]# awk 'BEGIN{RS="/"}{print NR,$0}' awkfile.txt

1root:x:0:0:root:

2 root:

3 bin

4 bash

1.9.3 NR即number of record 记录行号，表示当前正在处理的行的号码

取oldboy

[root@oldboy32-vm1files]# echo "I am oldboy,my qq is31333741">>/server/files/oldboy.txt

[root@oldboy32-vm1files]# cat oldboy.txt

I am oldboy,myqq is 31333741

[root@oldboy32-vm1files]# echo oldboy,31333741

oldboy,31333741

[root@oldboy32-vm1files]# awk -F " |," '{print $3,$NF}'oldboy.txt

oldboy31333741

[root@oldboy32-vm1files]# awk -F " |," '{print$3","$NF}' oldboy.txt

oldboy,31333741

[root@oldboy32-vm1files]# awk -F "[ ,]" '{print$3","$NF}' oldboy.txt

oldboy,31333741

1.9.4 ORS即output record separator 输出记录分隔符。

1.9.5 awk使用内置变量RS来存放输入记录分隔符，RS表示的是输入的记录分隔符，这个值可以通过BEGIN模块重新定义修改。

1.10 思路

1 让所有的单词排成一列，这样每个单词都是单独的一行

2 设置RS的值为空格

3 将文件里面的所有空格替换为回车换行符“\n”

4 grep所有连续的字母，grep -o 参数让他们排成一排

整体思路：想办法让所有单词排成一行，站成一队，排序，合并重复的，显示重复数量

1.11 awk记录知识小结

1.11.1 NR存放着每个记录的号（行号），读取新行时候会自动加1（+1）

1.11.2 RS是输入数据的记录的分隔符，简单理解就是可以指定每个记录的结尾标致

1.11.3 RS作用就是表示一个记录的结束

1.11.4 当我们修改了RS的值，最好配合NR来查看变化，也就是修改了RS的值通过NR查看结果，调试awk程序。

1.11.5 ORS输出数据的记录的分隔符

ORS

[root@oldboy32-vm1files]# cat ors.txt

[root@oldboy32-vm1files]# awk 'BEGIN{ORS="oldboy"}{print $0}'ors.txt

aoldboyboldboycoldboy[root@oldboy32-vm1files]#

1.12 awk学习技巧一则

大象放冰箱分几步？打开冰箱门，把大象放进去，关上冰箱门。awk也是一样，一步一步来，先修改RS，然后用NR调试，看看到底如何分割的，然后通过sort排序，uniq去掉重复的。

1.13 字段（字段）

每条记录都是由多个区域组成的，默认情况下区域之间的分隔符是由空格（即空格或者制表符）来分割，并且将分隔符记录在内置变量FS中每行记录的区域数据保存在awk的内置变量NF中

约定：

field有很多多种解释，域，记录，区域，为了方便理解统一使用区域表示field。

Zhang （FS）Dandan41117397:250:100:175$0

Zhang （FS）Xiaoyu390320151:155:90:201$0

Meng （FS） Feixue80042789:250:60:50$0

Wu（FS）Waiwai70271111:250:80:75$0

Liu（FS）Bingbing41117483:250:100:175 $0

Wang（FS）Xiaoai3515064655:50:95:135 $0

Zi（FS）Gege1986787350:250:168:200 $0

1.14 FS

FS即field separator，输入字段（列）分隔符，分隔符就是菜刀，把一行字符串切为很多个区域。

NF即number offields ，表示一行中列的个数，可以理解为菜刀切过一行后，切成了多少份，OFS输出字段（列）分隔符

awk使用内置变量FS来记录区域分隔符的内容，FS可以在命令行上通过 F 参数来更改，也艺客通过BEGIN模块来更改。

然后通过$n ,n是整数，来取北切割后的区域，$1取第一个区域，$2取第二个区域，$NF取最后一个区域。

列子

[root@oldboy32-vm1files]# ifconfig eth0 |awk 'NR==2{print $1}'

inet

[root@oldboy32-vm1files]# ifconfig eth0 |awk -F "[ :]+"'NR==2{print $1}'

[root@oldboy32-vm1files]# ifconfig eth0 |awk -F "[ :]+"'NR==2{print $2}'

inet

[root@oldboy32-vm1files]# #awk默认的FS 分隔符空格序列一个空格或多个空格 tab 都认为是一样的一个整体

[root@oldboy32-vm1files]# #[ \t]+

[root@oldboy32-vm1files]# echo -e "\ta\t\tb"

[root@oldboy32-vm1files]# echo -e "\ta\t\tb"|awk '{print $1}'

[root@oldboy32-vm1files]# echo -e "\ta\t\tb"|awk '{print $2}'

1.15 说明：

这个文件的开头有很多连续的空格，然后才是inet这个字符

当我们使用默认的分隔符的时候，$1是有内容的

当我们指定其他分隔符（费空格），是的时候区域会有所变化

到底为何会这样，我们在这里不在深究，只要了解有这种情况，注意一下就行，因为这个样的结果会仅仅会导致，其余串成一个。

1.16 ORS与OFS简介

OFS与ORS是awk的俩个内置变量

RS是输入记录分隔符，决定awk如何读取或分隔符每行（记录）

ORS表示输出记录分隔符，决定awk如何输出一行（记录）的，默认是回车换行符—（/n）

OFS表示输出区域分隔符，决定awk输出每个区域的时候用什么分隔符

FS表示输入区域分隔符，决定awk输出每个区域的时候用什么分隔符

awk无比强大，可以通过RS，FS，决定awk如何读取数据，也可以通过修改ORS，OFS的值来指定awk如何输出结果。

1.16.1 利用OFS调换ETCpasswd位置

[root@oldboy32-vm1files]# awk'BEGIN{FS=":"}{print $NF,$2,$3,$4,$5,$6,$1}' awkfile.txt

/bin/bashx 0 0 root /root root

/sbin/nologinx 1 1 bin /bin bin

/sbin/nologinx 2 2 daemon /sbin daemon

[root@oldboy32-vm1files]# awk'BEGIN{FS=":";OFS=":"}{print $NF,$2,$3,$4,$5,$6,$1}'awkfile.txt

/bin/bash:x:0:0:root:/root:root

/sbin/nologin:x:1:1:bin:/bin:bin

/sbin/nologin:x:2:2:daemon:/sbin:daemon

1.17 awk都有哪几种模式

1.17.1 正则表达式作为模式

1.17.2 比较表达式作为模式

1.17.3 范围模式

1.17.4 特殊模式BEGIN和END

awk的模式是你学好awk的必备也是最基础的内容，必须熟练掌握

1.18 awk也支持大量的正则表达式，大部分与sed的元字符类似，而且正则表达式是玩转三剑客的必备工具，

以什么开头，精确到列

[root@oldboy32-vm1files]# awk '$3~/c/' count.txt

sync xsync sbin bin sync

uucp xuucp var spool uucp sbin nologin

[root@oldboy32-vm1files]# awk '$3~/c$/' count.txt

sync xsync sbin bin sync

[root@oldboy32-vm1files]# awk '/c$/' count.txt

sync xsync sbin bin sync

[root@oldboy32-vm1files]# awk '$0~/c$/' count.txt

sync xsync sbin bin sync

下面的元字符是AWK的正则表达式符号，基本与sed相同，除了 ( ^ $ ) 他俩有点不i同

元字符	功能	示例	解释
^	字符串开头	/^oldboy/ $3~/^oldboy/	匹配所有以oldboy开头的字符串匹配出所有第三列中以oldboy开头
$	字符串结尾	/oldbou$/	匹配所有以oldbou结尾的文本（字符串）匹配第三列中以oldboy结尾的文本
.	匹配任意单个字符（包括回车符）	/o....y/	匹配字母o，然后两个任意字符，再以y结尾的行。如：oldboy，oldddy
*	重复0个或多个前一个字符	/a*cool/	匹配0个或多个a之后紧跟着cool的行，比如：cool，aacool
+	重复前一个字符一次或多次	/a+b/	匹配一个或多个a紧跟着加b的行，如：ab，aaab，aaaaab
？	重复前一个字符0到1次	/a?b/	匹配0个或1个a，紧跟着b，如：b，ab
[ ]	匹配指定字符组内的任一个字符	/^[abc]/	匹配以字母a或b或c开头的行
[^]	匹配不再指定字符组内的任一个字符	/^[^abc]/	匹配不以字母a或b或c开头的行
( )	子表达式组合	/(cool)+/	表示一个或多个cool组合，当一些字符需要组合一个整体时，使用括号括起来
\|	或者的意思	/(cool)\|B/	匹配cool或者字母B的行

1.19 说明：

-F 指定分隔符，现在应该知道-F 和FS也是支持正则表达式的了把

[ :]+表示连续的空格或者冒号

-F "[ :]"以连续的空格或者冒号为分隔符

/zhang/表示条件，整行中包Zhang字符的这个条件

｛print$1,$(NF-1)｝表示动作，满足条件后，执行显示第一列（$1）和倒数第二列（$(NF-1）当然$5也可以。

注意：

NF是一行中有多少列，NF-1 整行就是倒数第二列

$(NF-1)就是取倒数第二列内容

1.20 awk注意事项说明：

awk在输出整行即$0的时候，仅仅是原封不动的输出整行，没有任何修改，这就造成一个问题，如果我修改了OFS，那么输出整行的时候print $0的时候，也不会有任何改变，即：如果awk的action动作没有改行的内容，OFS都不会生效。

所以我们需要让awk知道$0被修改了，这一个事情

$1=$1 是把$1的值赋值给了$1这显然不会修改任何内容，但是这个动作会通知awk我修改了$1的内容，所以再次修改print $0的时候，$0的内容就变化了。

这是一个小技巧、

1.21 awk运算符

awk是一种编程语言，能够进行更为复杂的判断，，当条件为真的时候，awk就会执行相关的action，主要是在针对某一区域做出相关的判断，比如打印成绩在80分以上的行，这样就必须对一个区域做比较判断， awk可以使用的关系运算符，可以用来比较数字者字符串，哈un有正则表达式，当表达式为真的时候，表达式结果为1，否之为0 ，只有表达式为真，awk才执行相关action。

运算符	含义	示例
<	小于	x>y
<=	小于或等于	x<=y
==	等于	x==y
!=	不等于	x!=y
>.	大于	x>y
>=	大于或等于	x>=y
以上的运算符均是针对数字，下面俩个运算符正对字符串
~	与正则表达式匹配	x~/y/
!~	与正则表达式不匹配	x!~y

第2章 awk特殊模式与END模式

2.1 BEGIN模块

BEGIN模块在awk读取文件之前就执行，一般用来定义我们的内置变量（预定义变量，eg.FSRS）

可以输出表头，（类似excel）表格名称）

BEGIN模式之前我们有在示例中提到，自定义变量，给内容变量赋值等，都使用过，需要注意的是DEGIN模式后面需要接一个action操作块，包含大括号内，awk必须在对输入文件进行任何处理钱都需要先执行BEGIN里的动作，我们可以不要任何输入文件，就可以对BEGIN模块进行测试，因为awk需要先执行BEGIN模式，才能对输入文件做处理，BEGIN模式常用来修改内置变量，ORS,RS,FS,OFS，等的值。

2.2 命令行 -F本质就是修改的FS变量

2.2.1 第二个作用，在读取文件之前输出些提示性信息，表头。

显示文件awkfile.txt的第一列和第三列（passwd前10行）并在第一行useraanme和UID

[root@zxw files]# awk -F: 'BEGIN{print"useradd","UID"}{print $1 ,$3}'awkfile.txt

useradd UID

root 0

bin 1

daemon 2

adm 3

2.3 awk中的变量的概念简介

直接定义，直接使用即可

awk中字母将会被认为是变量，如果真的要给一个变量赋值字母，（字符串），请使用双引号。

[root@zxwfiles]# awk'BEGIN{abcd=123456;a=abcd;print a}'

123456

[root@zxwfiles]# awk'BEGIN{a=abcd;print a}'

[root@zxwfiles]# awk'BEGIN{a="abcd";print a}'

abcd

2.4 NEGIN模式说明

没有文件awk依旧可以处理BEGIN模式下的动作（命令）

2.5 END模块说明

END在awk读取完文件的时候，再执行END模块，一般用来输出一个结果。（累加，数组结果），也可以是和BEGIN模块类似的结尾标示信息。

与BEGIN模式相对应的END模块，格式一样，但是END模块仅在awk处理万所有行后才进行处理。

2.6 awk编程思想

2.6.1 先处理，最后在END模式输出

2.6.2 ｛print NF ,$0｝ boby 模块处理，处理完毕后

.6.3 END{print"endof file"} 输出一个结果

2.7 awk调试技巧：

让awk显示出每一步的执行结果。

一般通过print来配合完成

2.8 几种常用的运算表达式

c=c+1 >c++

c=c+2 >c+=2

c=c+$0 >c+=$0

2.9 awk中的动作

在一个模式-动作语句中，模式决定动作什么时候执行，有时候动作会非常简单：一条单独的打印

或赋值语句，在有些时候，动作有可能是多条语句，语句之间用换行符或者都好分开。

awk的动作中如果有俩个或者俩个以上的语句，需要用分号分开

动作部分理解为花括号里面的内容即可，总体分为：

1 表达式

2 流程控制语句

3 空语句

4 数组

2.10 awk模式与动作小结

awk命令核心由模式和动作俩部分组成，就是找谁｛干啥｝

模式就是条件，动作就是具体干什么

1正则表达式

2条件表达式

3范围表达式

注意BEGIN或者END模块只能有一个，BEGIN{}BEGIN{} 或者END{}END{}都是错误的。

找谁干吗模块可以是多个

BEGIN AWK中只能有一个

END awk中只能有一个

他俩可以同时出现

2.11 awk执行过程文字版

1 命令行的赋值（-F或-）

2 执行BEGIN模式里面的内容

3 开始读取文件

4 判断条件（模式）是否成立

成立则执行对应动作里面的内容

读取下一行，循环判断

直到读取到最后一个文件的结尾

5 最后执行END模式里面的内容

5 结束

第3章 awk数组

awk提供了数组来存放一组相关的值

awk是一种编程语言，肯定也支持数组的运用，但是有不同与C语言的数组，数组在awk中被称为关联数据，因为它的下标既可以是数字也可以是字符串，下标通常北称为key，并且与对应的数组元素的值关联，数组元素的key和值都存放在awk程序内部的一张表中，通过一定散列算法来储存，所以数组元素都不是按照顺序相互寻的，打印出来的也肯定不是按序号一定的顺序，但是我们可以通过管道来实现对所需要的数据再次操作来表达自己的效果。

3.1 图片-数组-酒店

老男孩教育酒店

oldboyhotel

酒店里面的几个房间

110oldboyhotel[110]

119oldboyhotel[119]

121oldboyhotel[121]

114oldboyhotel[114]

酒店里面住的客人

101房间住着xiaoyu oldboyhotel[110] ="xiaoyu"

119房间住着ruxueoldboyhotel[119]="ruxue"

120房间住着dandanoldboyhotel[121="dandan"

114房间住着waiwaioldboyhotel[114]="waiwai"

3.2 awk数组小结

pol	in	hotel
变量	关键字	数组名
警察	找人	酒店名称
for循环
for （pol in hotel）
循环（循环找人酒店名称）
pol===房间号码===数组元素名字===数组的下标（[ ]）===门把手
hotel[pol]===GPS定位 ===酒店名称 [房间号码] hotel [ "b" ]===print hotel["b"]

3.4 企业面试题数组题分解执行过程

指定分隔符

单引号

创建awk数组（酒店）

取结果

单引号

awk -F "[/.]+"

{hotel[$2]++}

c++

END{for (pol in hotel)}

print pol , hotel [pol]

sort.txt

思路：先处理后输出（END模块输出）

第4章练习题

4.1 测试文件

[root@zxwfiles]# cat reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

4.1.1 显示姓Zhang的人的第二次捐款金额及她的名字

4.1.1.1 第一种

[root@zxw files]# awk -F "[:]+" '/Zhang/{print $1,$2,$6}' reg.txt

Zhang Dandan 175

Zhang Xiaoyu 201

4.1.1.2 第二种

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/' reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

4.1.1.3 第三种

[root@oldboy32-vm1files]# awk -F "[ :]+" '$0~/^Zhang/' reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

4.1.1.4 第四种

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/{print$2,$5}' reg.txt

Dandan100

Xiaoyu90

4.1.1.5 注意错误1

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/{print$2,$NF-1}' reg.txt

Dandan174

Xiaoyu200

4.1.1.6 注意错误2

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/{print$2,$(NF-1)}' reg.txt

Dandan100

Xiaoyu90

4.1.2 显示Xiaoyu的名字和ID号码

[root@zxwfiles]# awk -F "[ :]+" '/Xiaoyu/{print$1,$2,$3}' reg.txt

ZhangXiaoyu 390320151

4.1.3 显示所有以41开头的ID号码的人的全名和ID号码

[root@zxwfiles]# awk -F "[ :]+" '$3~/^41/ {print $1 $2$3}' reg.txt

ZhangDandan41117397

LiuBingbing41117483

4.1.4 显示所有以一个D或X开头的人名全名

[root@zxwfiles]# awk -F "[ :]+" '$2~/^D|^X/{print$1,$2}' reg.txt

ZhangDandan

ZhangXiaoyu

WangXiaoai

4.1.5 显示所有ID号码最后一位数字是1或5的人的全名

[root@zxwfiles]# awk -F "[ :]+" '$3~/1$|5$/{print$1,$2}' reg.txt

ZhangXiaoyu

WuWaiwai

WangXiaoai

4.1.6 显示Xiaoyu的捐款.每个值时都有以$开头.如$520$200$135

4.1.6.1 第一种

[root@zxwfiles]# awk'BEGIN {FS=":" ; OFS="$"} {print "$"，$2,$3,$4}' reg.txt

250$100$175

155$90$201

250$60$50

4.1.6.2 第二种

[root@oldboy32-vm1files]# awk '$2~/^Xiaoyu$/{print $NF}' reg.txt

:155:90:201

[root@oldboy32-vm1files]# awk '$2~/^Xiaoyu$/{print $NF}' reg.txt |tr":" "$"

$155$90$201

[root@oldboy32-vm1files]# #sub gsub gensub

[root@oldboy32-vm1files]# #gsub

[root@oldboy32-vm1files]# #gsub(r, s [, t])

[root@oldboy32-vm1files]# #函数

[root@oldboy32-vm1files]# #gsub(正则表达式,你要替换成啥[,目标($1 $2 $3)])

[root@oldboy32-vm1files]# awk '$2~/^Xiaoyu$/{gsub(/:/,"$")}'reg.txt

[root@oldboy32-vm1files]# awk'$2~/^Xiaoyu$/{gsub(/:/,"$");print $NF}' reg.txt

$155$90$201

[root@oldboy32-vm1files]# awk'$2~/^Xiaoyu$/{gsub(/:/,"$",$NF);print $NF}' reg.txt

$155$90$201

4.1.6.3 第三种

awk'BEGIN {FS=":";OFS="$"}{print "",$2,$3,$4}' reg.txt

4.1.6.4 疑问（下面$0和$1,$2,$3）输出的结果为啥不一样

[root@oldboy32-vm1 files]#awk -F : -v OFS="$"'{print $0}' reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

MengFeixue80042789:250:60:50

与

[root@oldboy32-vm1files]# awk -F : -v OFS="$"'{print $1,$2,$3}' reg.txt

ZhangDandan41117397$250$100

ZhangXiaoyu390320151$155$90

LaoNanhai918391635$250$100

XManX10000$999$999

[root@oldboy32-vm1files]# awk -F : -v OFS="$"'{print $1,$2,$3,$4}' reg.txt

ZhangDandan41117397$250$100$175

ZhangXiaoyu390320151$155$90$201

MengFeixue80042789$250$60$50

[root@oldboy32-vm1files]# awk -F : -v OFS="$"'{$1=$1;print $0}' reg.txt

ZhangDandan41117397$250$100$175

ZhangXiaoyu390320151$155$90$201

LiYoujiu918391635$175$75$300

4.1.6.5 显示所有人的全名，以姓,名的格式显示，如Meng,Feixue

[root@zxwfiles]# awk'BEGIN {FS="[ ]+";OFS=","}{print $2,$1}' reg.txt

Dandan,Zhang

Xiaoyu,Zhang

Feixue,Meng

4.2 正则表达式部分的疑问

[root@demon files]# awk '/^Xiaoyu/' /server/files/reg.txt

[root@demon files]# awk '$2~/^Xiaoyu/' /server/files/reg.txt

/^Xiaoyu/的意思不是以Xiaoyu为开头的字符串吗，为什么默认$0匹配就不行了？

/Xiaoyu/这样就可以了，这是为什么？

解答：

awk不会自动匹配，需要明确告诉它是那一列

^ matches the beginning of astring. #匹配字符串的开头的位置

$ matches the end of a string. #匹配字符串结尾的位置

awk '/^Xiaoyu/' /server/files/reg.txt

awk '/Xiaoyu/' /server/files/reg.txt

grep "^Xiaoyu" reg.txt

grep "Xiaoyu" reg.txt

4.3 匹配除了含有oldboy的其他行

4.3.1 测试文件

[root@zxw files]# cat test.txt

lidao

oldboy

oldboylinux

zhangdao

xiadao

[root@zxw files]#

4.3.2 注意精确

[root@oldboy32-vm1files]# awk '/^l|z|x|x$/' test.txt

lidao

oldboylinux

zhangdao

[root@oldboy32-vm1files]# egrep "^l|z|x|x$" test.txt

lidao

oldboylinux

zhangdao

[root@oldboy32-vm1files]# egrep "^l|x$|^z|^x" test.txt

lidao

oldboylinux

zhangdao

4.4 表示一个范围，与sed（2，5p）意思相近

[root@oldboy32-vm1files]# awk 'NR==2,NR==5' awkfile.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[root@oldboy32-vm1files]# #范围条件/范围模式

4.5 BEGIN在读取文件以前执行

[root@oldboy32-vm1files]# awk 'BEGIN{print 3/10}'

0.3

[root@oldboy32-vm1files]# awk 'BEGIN{print 10/3}'

3.33333

4.6 a=1 输出1 a=lidao awk会将lidao（英文字母）认为是一个变量（需要加“”）

[root@oldboy32-vm1files]# awk 'BEGIN{a=1;print a}'

[root@oldboy32-vm1files]# awk 'BEGIN{a=lidao;print a}'

[root@oldboy32-vm1files]# awk 'BEGIN{a="";print a}'

[root@oldboy32-vm1files]# awk 'BEGIN{a="lidao";print a}'

lidao

4.7 END模式

[root@oldboy32-vm1 files]# awk'BEGIN{print "name","ID"}{print $2,$3}END{print"hello" }' reg.txt

name ID

Dandan 41117397

Xiaoyu 390320151

Feixue 80042789

hello

4.8 awk调试过程

[root@oldboy32-vm1~]# awk '/^$/{notepad++}END{print notepad}'/etc/services16

[root@oldboy32-vm1~]# awk '/^$/{notepad++;print notepad}'/etc/services

4.9 数组

[root@oldboy32-vm1~]# awk'BEGIN{hotel[110]="xiaoyu";hotel[114]="xiadao";

hotel[121]="dandan"

hotel[119]="waiwai"

print hotel[110],hotel[114],hotel[119],hotel[121]}'

xiaoyuxiadao waiwai dandan

[root@oldboy32-vm1~]# awk'BEGIN{hotel[110]="xiaoyu";hotel[114]="xiadao";

hotel[121]="dandan"

hotel[119]="waiwai"

for(pol in hotel )print pol,hotel[pol]}'

110xiaoyu

121dandan

114xiadao

119waiwai

数组

[root@zxw~]# awk 'BEGIN{hotel[100]="zxw";hotel[200]="mzl";hotel[300]="wyf";hotel[400]="yz";for(abc in hotel)print abc,hotel[abc]}'

100 zxw

200 mzl

300 wyf

400 yz

第5章企业案例

5.1 企业面试题: 按单词出现频率降序排序（计算文件中每个单词的重复数量）

注：（此处使用sort与uniq即可）

[root@oldboy32-vm1files]# #sort 默认是按照字母顺序排列

awk -vRS=" " '{print $0}' count.txt|xargs -n1|sort|uniq -c|sort -nr

awk -vRS=" " '{print $0}' count.txt|sort|uniq -c|sort -nr

5.1.1 按字母查找

awk 'BEGIN{RS="[:0-9/ ]+"}{printNR,$0}' awkfile.txt

awk 'BEGIN{RS="[^a-zA-Z]+"}{printNR,$0}' awkfile.txt

[root@zxwfiles]# awk 'BEGIN{RS=":|/|[0-9]"}{print $0}' awkfile.txt|sort|uniq-c|sort -rn

5.2 考试题1：处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)

oldboy.log

http://www.etiantian.org/index.html

http://www.etiantian.org/1.html

http://post.etiantian.org/index.html

http://mp3.etiantian.org/index.html

http://www.etiantian.org/3.html

http://post.etiantian.org/2.html

5.2.1 答案：

[root@zxwfiles]# awk 'BEGIN{FS="."}{print$3}' oldboy.txt|sort|uniq -c |sort -rn

3 org/index

1 org/3

1 org/2

1 org/1

[root@zxwfiles]#

5.3 【企业面试题】处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)

[root@zxwfiles]# cat oldboy.txt

http://www.etiantian.org/index.html

http://www.etiantian.org/1.html

http://post.etiantian.org/index.html

http://mp3.etiantian.org/index.html

http://www.etiantian.org/3.html

http://post.etiantian.org/2.html

[root@zxwfiles]#

5.3.1 答案：

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h["www"]}' url.txt

www 1

www 2

post 2

mp3 2

www 3

post 3

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h["www"]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h[""]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h["post"]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h[$2]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++}END{for(polin h) print pol,h[pol]}' url.txt

www 3

mp3 1

post 2

[root@oldboy32-vm1files]# awk -F "[/]+" '{h[$2]++}END{for(polin h) print pol,h[pol]}' url.txt

mp3.etiantian.org1

post.etiantian.org2

www.etiantian.org3

5.3.2 方法一

awk -v RS="[^a-zA-Z]+"'{h[$0]++}END{for(pol in h)print pol,h[pol]}' awkfile.txt |sort-rnk2|column -t

5.3.3 方法二

awk'BEGIN{RS="[^a-zA-Z]+"}{h[$0]++}END{for(pol in h)printpol,h[pol]}' awkfile.txt |sort -rnk2|column -t

本文出自 “11845753” 博客，转载请与作者联系！

awk课程总结... 1

第1章 awk基础入门... 1

1.1 awk基础入门... 1

1.2 awk简介... 1

1.2.1 一种名字怪异的语言... 1

1.2.2 模式扫描和处理... 1

1.3 学过awk可以掌握的内容... 1

1.4 awk命令... 1

1.6动作即action，是由在大括号里面的一条或者多条语句组成，语句之间使用分号隔开，如下awk使用格式... 2

1.7 awk执行过程... 2

1.8 接下来说俩个新概念：记录和字段，这里为了方便理解可以把记录当做行记录===行，字段相当于列，字段===列。... 3

1.9 awk记录分隔符 -RS. 3

1.9.1 awk默认情况下每一行都是一个记录... 3

1.9.2 RS即record separator输入数据记录分隔符，每一行是怎么来的，表示每个记录输入的时候的分隔符，即行与行之间如何分割。... 3

1.9.3 NR即number of record 记录行号，表示当前正在处理的行的号码... 5

1.9.4 ORS即output record separator 输出记录分隔符。... 5

1.9.5 awk使用内置变量RS来存放输入记录分隔符，RS表示的是输入的记录分隔符，这个值可以通过BEGIN模块重新定义修改。... 5

1.10 思路... 5

1.11 awk记录知识小结... 6

1.11.1 NR存放着每个记录的号（行号），读取新行时候会自动加1（+1）... 6

1.11.2 RS是输入数据的记录的分隔符，简单理解就是可以指定每个记录的结尾标致... 6

1.11.3 RS作用就是表示一个记录的结束... 6

1.11.4 当我们修改了RS的值，最好配合NR来查看变化，也就是修改了RS的值通过NR查看结果，调试awk程序。... 6

1.11.5 ORS输出数据的记录的分隔符... 6

1.12 awk学习技巧一则... 6

1.13 字段（字段）... 6

1.14 FS. 7

1.15 说明：... 7

1.16 ORS与OFS简介... 8

1.16.1 利用OFS调换ETCpasswd位置... 8

1.17 awk都有哪几种模式... 9

1.17.1 正则表达式作为模式... 9

1.17.2 比较表达式作为模式... 9

1.17.3 范围模式... 9

1.17.4 特殊模式BEGIN和END.. 9

1.18 awk也支持大量的正则表达式，大部分与sed的元字符类似，而且正则表达式是玩转三剑客的必备工具，... 9

1.19 说明：... 10

1.20 awk注意事项说明：... 10

1.21 awk运算符... 10

第2章 awk特殊模式与END模式... 11

2.1 BEGIN模块... 11

2.2 命令行 -F本质就是修改的FS变量... 11

2.2.1 第二个作用，在读取文件之前输出些提示性信息，表头。... 11

2.3 awk中的变量的概念简介... 12

2.4 NEGIN模式说明... 12

2.5 END模块说明... 12

2.6 awk编程思想... 12

2.6.1 先处理，最后在END模式输出... 12

2.6.2 ｛print NF ,$0｝ boby 模块处理，处理完毕后... 12

2.6.3 END{print"end of file"} 输出一个结果... 12

2.7 awk调试技巧：... 12

2.8 几种常用的运算表达式... 12

2.9 awk中的动作... 13

2.10 awk模式与动作小结... 13

2.11 awk执行过程文字版... 13

第3章 awk数组... 14

3.1 图片-数组-酒店... 14

3.2 awk数组小结... 15

3.3 这个不知道起什么名... 15

3.4 企业面试题数组题分解执行过程... 16

第4章练习题... 16

4.1 测试文件... 16

4.1.1 显示姓Zhang的人的第二次捐款金额及她的名字... 16

4.1.2 显示Xiaoyu的名字和ID号码... 17

4.1.3 显示所有以41开头的ID号码的人的全名和ID号码... 17

4.1.4 显示所有以一个D或X开头的人名全名... 17

4.1.5 显示所有ID号码最后一位数字是1或5的人的全名... 17

4.1.6 显示Xiaoyu的捐款.每个值时都有以$开头.如$520$200$135. 18

4.2 正则表达式部分的疑问... 20

4.3 匹配除了含有oldboy的其他行... 20

4.3.1 测试文件... 20

4.3.2 注意精确... 21

4.4 表示一个范围，与sed（2，5p）意思相近... 21

4.5 BEGIN在读取文件以前执行... 21

4.6 a=1输出1a=lidaoawk会将lidao（英文字母）认为是一个变量（需要加“”）... 21

4.7 END模式... 22

4.8 awk调试过程... 22

4.9 数组... 23

第5章企业案例... 23

5.1 企业面试题: 按单词出现频率降序排序（计算文件中每个单词的重复数量）... 23

5.1.1 按字母查找... 24

5.2 考试题1：处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)24

5.2.1 答案：... 24

5.3 【】企业面试题】处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)24

5.3.1 答案：... 25

5.3.2 方法一... 26

5.3.3 方法二... 26

awk课程总结

第1章 awk基础入门

要弄懂awk程序，必须熟悉了解这个工具的规则，

1.2 awk简介

1.2.1 一种名字怪异的语言

1.2.2 模式扫描和处理

回顾sed命令，把文件当做流水一样处理

1.3 学过awk可以掌握的内容

1记录和字段

2 模式匹配：模式与动作

3 基本的awk执行过程

4awk常用的内置变量（预定义变量）

5 awk数组（工作常用的）

6awk语法：循环，条件

7awk常用的函数

8 向awk传递参数

9awk引用shell变量

10 awk小程序及调试思路

1.4 awk命令

awk -v RS=":" 与‘BEGIN{RS=":"}’一样

uniq 合并相同行 -c 将相同行相加输出

sort 排序，默认按照字母顺序排序 -r 逆向排序 -n 排序

culomn -t 使行，列对齐

awk的默认的FS 分隔符空格序列 TAB键一个或者多个空格，都认为是一个整体

OFS不支持正则表达式

FS=-F 指定分隔符

posix 使awk支持扩展正则表达式，如：'/0{2,3}/'

awk中 $N==root 要写成$N=="root" 如果不佳双引号，awk会把等于看成是一个变量

例子：

[root@oldboy32-vm1~]# awk -F ":"'NR<=5{print $1,$3}' /etc/passwd

root 0

bin 1#awk 参数 '条件(找谁){动作(干啥)}' /etc/passwd

1.5 模式及pattern，可以类似理解成sed的模式匹配，可以由表达式组成，也可以是俩个正斜杠之间的正则表达式，比如：NR==1，这就是模式，可以理解为一个条件。

1.6 动作即action，是由在大括号里面的一条或者多条语句组成，语句之间使用分号隔开，如下awk使用格式

awk处理的内容可以来自标准输入（>），一个或者多个文本或管道

模式动作里面分俩部分，大括号外面的叫找谁里面的叫干啥

1.7 awk执行过程

1 首先读取一行

2 模式是我要处理的行吗？

3 如果是，则对读入行执行动作里的命令

4 如果否，则重复上面的过程直到最后一个文件结尾

5 END模块

6 结束

1.8 接下来说俩个新概念：记录和字段，这里为了方便理解可以把记录当做行记录===行，字段相当于列，字段===列。

record	记录，行
field	域，区域，字段，列

1.9 awk记录分隔符 -RS

记录分隔符 -每一个记录是如何结束的

[root@zxw files]# cat reg.txt

Zhang （FS）Dandan41117397:250:100:175$0

Zhang （FS）Xiaoyu390320151:155:90:201$0

Meng（FS）Feixue80042789:250:60:50$0

1.9.1 awk默认情况下每一行都是一个记录

1.9.2 RS即record separator输入数据记录分隔符，每一行是怎么来的，表示每个记录输入的时候的分隔符，即行与行之间如何分割。

例子：

awk指定RS分割符号：

[root@oldboy32-vm1files]# head -2 awkfile.txt

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

[root@oldboy32-vm1files]# awk 'BEGIN{RS="/"}{print NR,$0}' awkfile.txt

1root:x:0:0:root:

2 root:

3 bin

4 bash

1.9.3 NR即number of record 记录行号，表示当前正在处理的行的号码

取oldboy

[root@oldboy32-vm1files]# echo "I am oldboy,my qq is31333741">>/server/files/oldboy.txt

[root@oldboy32-vm1files]# cat oldboy.txt

I am oldboy,myqq is 31333741

[root@oldboy32-vm1files]# echo oldboy,31333741

oldboy,31333741

[root@oldboy32-vm1files]# awk -F " |," '{print $3,$NF}'oldboy.txt

oldboy31333741

[root@oldboy32-vm1files]# awk -F " |," '{print$3","$NF}' oldboy.txt

oldboy,31333741

[root@oldboy32-vm1files]# awk -F "[ ,]" '{print$3","$NF}' oldboy.txt

oldboy,31333741

1.9.4 ORS即output record separator 输出记录分隔符。

1.9.5 awk使用内置变量RS来存放输入记录分隔符，RS表示的是输入的记录分隔符，这个值可以通过BEGIN模块重新定义修改。

1.10 思路

1 让所有的单词排成一列，这样每个单词都是单独的一行

2 设置RS的值为空格

3 将文件里面的所有空格替换为回车换行符“\n”

4 grep所有连续的字母，grep -o 参数让他们排成一排

整体思路：想办法让所有单词排成一行，站成一队，排序，合并重复的，显示重复数量

1.11 awk记录知识小结

1.11.1 NR存放着每个记录的号（行号），读取新行时候会自动加1（+1）

1.11.2 RS是输入数据的记录的分隔符，简单理解就是可以指定每个记录的结尾标致

1.11.3 RS作用就是表示一个记录的结束

1.11.4 当我们修改了RS的值，最好配合NR来查看变化，也就是修改了RS的值通过NR查看结果，调试awk程序。

1.11.5 ORS输出数据的记录的分隔符

ORS

[root@oldboy32-vm1files]# cat ors.txt

[root@oldboy32-vm1files]# awk 'BEGIN{ORS="oldboy"}{print $0}'ors.txt

aoldboyboldboycoldboy[root@oldboy32-vm1files]#

1.12 awk学习技巧一则

1.13 字段（字段）

约定：

field有很多多种解释，域，记录，区域，为了方便理解统一使用区域表示field。

Zhang （FS）Dandan41117397:250:100:175$0

Zhang （FS）Xiaoyu390320151:155:90:201$0

Meng （FS） Feixue80042789:250:60:50$0

Wu（FS）Waiwai70271111:250:80:75$0

Liu（FS）Bingbing41117483:250:100:175 $0

Wang（FS）Xiaoai3515064655:50:95:135 $0

Zi（FS）Gege1986787350:250:168:200 $0

1.14 FS

FS即field separator，输入字段（列）分隔符，分隔符就是菜刀，把一行字符串切为很多个区域。

NF即number offields ，表示一行中列的个数，可以理解为菜刀切过一行后，切成了多少份，OFS输出字段（列）分隔符

awk使用内置变量FS来记录区域分隔符的内容，FS可以在命令行上通过 F 参数来更改，也艺客通过BEGIN模块来更改。

然后通过$n ,n是整数，来取北切割后的区域，$1取第一个区域，$2取第二个区域，$NF取最后一个区域。

列子

[root@oldboy32-vm1files]# ifconfig eth0 |awk 'NR==2{print $1}'

inet

[root@oldboy32-vm1files]# ifconfig eth0 |awk -F "[ :]+"'NR==2{print $1}'

[root@oldboy32-vm1files]# ifconfig eth0 |awk -F "[ :]+"'NR==2{print $2}'

inet

[root@oldboy32-vm1files]# #awk默认的FS 分隔符空格序列一个空格或多个空格 tab 都认为是一样的一个整体

[root@oldboy32-vm1files]# #[ \t]+

[root@oldboy32-vm1files]# echo -e "\ta\t\tb"

[root@oldboy32-vm1files]# echo -e "\ta\t\tb"|awk '{print $1}'

[root@oldboy32-vm1files]# echo -e "\ta\t\tb"|awk '{print $2}'

1.15 说明：

这个文件的开头有很多连续的空格，然后才是inet这个字符

当我们使用默认的分隔符的时候，$1是有内容的

当我们指定其他分隔符（费空格），是的时候区域会有所变化

到底为何会这样，我们在这里不在深究，只要了解有这种情况，注意一下就行，因为这个样的结果会仅仅会导致，其余串成一个。

1.16 ORS与OFS简介

OFS与ORS是awk的俩个内置变量

RS是输入记录分隔符，决定awk如何读取或分隔符每行（记录）

ORS表示输出记录分隔符，决定awk如何输出一行（记录）的，默认是回车换行符—（/n）

OFS表示输出区域分隔符，决定awk输出每个区域的时候用什么分隔符

FS表示输入区域分隔符，决定awk输出每个区域的时候用什么分隔符

awk无比强大，可以通过RS，FS，决定awk如何读取数据，也可以通过修改ORS，OFS的值来指定awk如何输出结果。

1.16.1 利用OFS调换ETCpasswd位置

[root@oldboy32-vm1files]# awk'BEGIN{FS=":"}{print $NF,$2,$3,$4,$5,$6,$1}' awkfile.txt

/bin/bashx 0 0 root /root root

/sbin/nologinx 1 1 bin /bin bin

/sbin/nologinx 2 2 daemon /sbin daemon

[root@oldboy32-vm1files]# awk'BEGIN{FS=":";OFS=":"}{print $NF,$2,$3,$4,$5,$6,$1}'awkfile.txt

/bin/bash:x:0:0:root:/root:root

/sbin/nologin:x:1:1:bin:/bin:bin

/sbin/nologin:x:2:2:daemon:/sbin:daemon

1.17 awk都有哪几种模式

1.17.1 正则表达式作为模式

1.17.2 比较表达式作为模式

1.17.3 范围模式

1.17.4 特殊模式BEGIN和END

awk的模式是你学好awk的必备也是最基础的内容，必须熟练掌握

1.18 awk也支持大量的正则表达式，大部分与sed的元字符类似，而且正则表达式是玩转三剑客的必备工具，

以什么开头，精确到列

[root@oldboy32-vm1files]# awk '$3~/c/' count.txt

sync xsync sbin bin sync

uucp xuucp var spool uucp sbin nologin

[root@oldboy32-vm1files]# awk '$3~/c$/' count.txt

sync xsync sbin bin sync

[root@oldboy32-vm1files]# awk '/c$/' count.txt

sync xsync sbin bin sync

[root@oldboy32-vm1files]# awk '$0~/c$/' count.txt

sync xsync sbin bin sync

下面的元字符是AWK的正则表达式符号，基本与sed相同，除了 ( ^ $ ) 他俩有点不i同

元字符	功能	示例	解释
^	字符串开头	/^oldboy/ $3~/^oldboy/	匹配所有以oldboy开头的字符串匹配出所有第三列中以oldboy开头
$	字符串结尾	/oldbou$/	匹配所有以oldbou结尾的文本（字符串）匹配第三列中以oldboy结尾的文本
.	匹配任意单个字符（包括回车符）	/o....y/	匹配字母o，然后两个任意字符，再以y结尾的行。如：oldboy，oldddy
*	重复0个或多个前一个字符	/a*cool/	匹配0个或多个a之后紧跟着cool的行，比如：cool，aacool
+	重复前一个字符一次或多次	/a+b/	匹配一个或多个a紧跟着加b的行，如：ab，aaab，aaaaab
？	重复前一个字符0到1次	/a?b/	匹配0个或1个a，紧跟着b，如：b，ab
[ ]	匹配指定字符组内的任一个字符	/^[abc]/	匹配以字母a或b或c开头的行
[^]	匹配不再指定字符组内的任一个字符	/^[^abc]/	匹配不以字母a或b或c开头的行
( )	子表达式组合	/(cool)+/	表示一个或多个cool组合，当一些字符需要组合一个整体时，使用括号括起来
\|	或者的意思	/(cool)\|B/	匹配cool或者字母B的行

1.19 说明：

-F 指定分隔符，现在应该知道-F 和FS也是支持正则表达式的了把

[ :]+表示连续的空格或者冒号

-F "[ :]"以连续的空格或者冒号为分隔符

/zhang/表示条件，整行中包Zhang字符的这个条件

｛print$1,$(NF-1)｝表示动作，满足条件后，执行显示第一列（$1）和倒数第二列（$(NF-1）当然$5也可以。

注意：

NF是一行中有多少列，NF-1 整行就是倒数第二列

$(NF-1)就是取倒数第二列内容

1.20 awk注意事项说明：

所以我们需要让awk知道$0被修改了，这一个事情

$1=$1 是把$1的值赋值给了$1这显然不会修改任何内容，但是这个动作会通知awk我修改了$1的内容，所以再次修改print $0的时候，$0的内容就变化了。

这是一个小技巧、

1.21 awk运算符

运算符	含义	示例
<	小于	x>y
<=	小于或等于	x<=y
==	等于	x==y
!=	不等于	x!=y
>.	大于	x>y
>=	大于或等于	x>=y
以上的运算符均是针对数字，下面俩个运算符正对字符串
~	与正则表达式匹配	x~/y/
!~	与正则表达式不匹配	x!~y

第2章 awk特殊模式与END模式

2.1 BEGIN模块

BEGIN模块在awk读取文件之前就执行，一般用来定义我们的内置变量（预定义变量，eg.FSRS）

可以输出表头，（类似excel）表格名称）

2.2 命令行 -F本质就是修改的FS变量

2.2.1 第二个作用，在读取文件之前输出些提示性信息，表头。

显示文件awkfile.txt的第一列和第三列（passwd前10行）并在第一行useraanme和UID

[root@zxw files]# awk -F: 'BEGIN{print"useradd","UID"}{print $1 ,$3}'awkfile.txt

useradd UID

root 0

bin 1

daemon 2

adm 3

2.3 awk中的变量的概念简介

直接定义，直接使用即可

awk中字母将会被认为是变量，如果真的要给一个变量赋值字母，（字符串），请使用双引号。

[root@zxwfiles]# awk'BEGIN{abcd=123456;a=abcd;print a}'

123456

[root@zxwfiles]# awk'BEGIN{a=abcd;print a}'

[root@zxwfiles]# awk'BEGIN{a="abcd";print a}'

abcd

2.4 NEGIN模式说明

没有文件awk依旧可以处理BEGIN模式下的动作（命令）

2.5 END模块说明

END在awk读取完文件的时候，再执行END模块，一般用来输出一个结果。（累加，数组结果），也可以是和BEGIN模块类似的结尾标示信息。

与BEGIN模式相对应的END模块，格式一样，但是END模块仅在awk处理万所有行后才进行处理。

2.6 awk编程思想

2.6.1 先处理，最后在END模式输出

2.6.2 ｛print NF ,$0｝ boby 模块处理，处理完毕后

.6.3 END{print"endof file"} 输出一个结果

2.7 awk调试技巧：

让awk显示出每一步的执行结果。

一般通过print来配合完成

2.8 几种常用的运算表达式

c=c+1 >c++

c=c+2 >c+=2

c=c+$0 >c+=$0

2.9 awk中的动作

在一个模式-动作语句中，模式决定动作什么时候执行，有时候动作会非常简单：一条单独的打印

或赋值语句，在有些时候，动作有可能是多条语句，语句之间用换行符或者都好分开。

awk的动作中如果有俩个或者俩个以上的语句，需要用分号分开

动作部分理解为花括号里面的内容即可，总体分为：

1 表达式

2 流程控制语句

3 空语句

4 数组

2.10 awk模式与动作小结

awk命令核心由模式和动作俩部分组成，就是找谁｛干啥｝

模式就是条件，动作就是具体干什么

1正则表达式

2条件表达式

3范围表达式

注意BEGIN或者END模块只能有一个，BEGIN{}BEGIN{} 或者END{}END{}都是错误的。

找谁干吗模块可以是多个

BEGIN AWK中只能有一个

END awk中只能有一个

他俩可以同时出现

2.11 awk执行过程文字版

1 命令行的赋值（-F或-）

2 执行BEGIN模式里面的内容

3 开始读取文件

4 判断条件（模式）是否成立

成立则执行对应动作里面的内容

读取下一行，循环判断

直到读取到最后一个文件的结尾

5 最后执行END模式里面的内容

5 结束

第3章 awk数组

awk提供了数组来存放一组相关的值

3.1 图片-数组-酒店

老男孩教育酒店

oldboyhotel

酒店里面的几个房间

110oldboyhotel[110]

119oldboyhotel[119]

121oldboyhotel[121]

114oldboyhotel[114]

酒店里面住的客人

101房间住着xiaoyu oldboyhotel[110] ="xiaoyu"

119房间住着ruxueoldboyhotel[119]="ruxue"

120房间住着dandanoldboyhotel[121="dandan"

114房间住着waiwaioldboyhotel[114]="waiwai"

3.2 awk数组小结

pol	in	hotel
变量	关键字	数组名
警察	找人	酒店名称
for循环
for （pol in hotel）
循环（循环找人酒店名称）
pol===房间号码===数组元素名字===数组的下标（[ ]）===门把手
hotel[pol]===GPS定位 ===酒店名称 [房间号码] hotel [ "b" ]===print hotel["b"]

3.4 企业面试题数组题分解执行过程

指定分隔符

单引号

创建awk数组（酒店）

取结果

单引号

awk -F "[/.]+"

{hotel[$2]++}

c++

END{for (pol in hotel)}

print pol , hotel [pol]

sort.txt

思路：先处理后输出（END模块输出）

第4章练习题

4.1 测试文件

[root@zxwfiles]# cat reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

4.1.1 显示姓Zhang的人的第二次捐款金额及她的名字

4.1.1.1 第一种

[root@zxw files]# awk -F "[:]+" '/Zhang/{print $1,$2,$6}' reg.txt

Zhang Dandan 175

Zhang Xiaoyu 201

4.1.1.2 第二种

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/' reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

4.1.1.3 第三种

[root@oldboy32-vm1files]# awk -F "[ :]+" '$0~/^Zhang/' reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

4.1.1.4 第四种

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/{print$2,$5}' reg.txt

Dandan100

Xiaoyu90

4.1.1.5 注意错误1

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/{print$2,$NF-1}' reg.txt

Dandan174

Xiaoyu200

4.1.1.6 注意错误2

[root@oldboy32-vm1files]# awk -F "[ :]+" '/^Zhang/{print$2,$(NF-1)}' reg.txt

Dandan100

Xiaoyu90

4.1.2 显示Xiaoyu的名字和ID号码

[root@zxwfiles]# awk -F "[ :]+" '/Xiaoyu/{print$1,$2,$3}' reg.txt

ZhangXiaoyu 390320151

4.1.3 显示所有以41开头的ID号码的人的全名和ID号码

[root@zxwfiles]# awk -F "[ :]+" '$3~/^41/ {print $1 $2$3}' reg.txt

ZhangDandan41117397

LiuBingbing41117483

4.1.4 显示所有以一个D或X开头的人名全名

[root@zxwfiles]# awk -F "[ :]+" '$2~/^D|^X/{print$1,$2}' reg.txt

ZhangDandan

ZhangXiaoyu

WangXiaoai

4.1.5 显示所有ID号码最后一位数字是1或5的人的全名

[root@zxwfiles]# awk -F "[ :]+" '$3~/1$|5$/{print$1,$2}' reg.txt

ZhangXiaoyu

WuWaiwai

WangXiaoai

4.1.6 显示Xiaoyu的捐款.每个值时都有以$开头.如$520$200$135

4.1.6.1 第一种

[root@zxwfiles]# awk'BEGIN {FS=":" ; OFS="$"} {print "$"，$2,$3,$4}' reg.txt

250$100$175

155$90$201

250$60$50

4.1.6.2 第二种

[root@oldboy32-vm1files]# awk '$2~/^Xiaoyu$/{print $NF}' reg.txt

:155:90:201

[root@oldboy32-vm1files]# awk '$2~/^Xiaoyu$/{print $NF}' reg.txt |tr":" "$"

$155$90$201

[root@oldboy32-vm1files]# #sub gsub gensub

[root@oldboy32-vm1files]# #gsub

[root@oldboy32-vm1files]# #gsub(r, s [, t])

[root@oldboy32-vm1files]# #函数

[root@oldboy32-vm1files]# #gsub(正则表达式,你要替换成啥[,目标($1 $2 $3)])

[root@oldboy32-vm1files]# awk '$2~/^Xiaoyu$/{gsub(/:/,"$")}'reg.txt

[root@oldboy32-vm1files]# awk'$2~/^Xiaoyu$/{gsub(/:/,"$");print $NF}' reg.txt

$155$90$201

[root@oldboy32-vm1files]# awk'$2~/^Xiaoyu$/{gsub(/:/,"$",$NF);print $NF}' reg.txt

$155$90$201

4.1.6.3 第三种

awk'BEGIN {FS=":";OFS="$"}{print "",$2,$3,$4}' reg.txt

4.1.6.4 疑问（下面$0和$1,$2,$3）输出的结果为啥不一样

[root@oldboy32-vm1 files]#awk -F : -v OFS="$"'{print $0}' reg.txt

ZhangDandan41117397:250:100:175

ZhangXiaoyu390320151:155:90:201

MengFeixue80042789:250:60:50

与

[root@oldboy32-vm1files]# awk -F : -v OFS="$"'{print $1,$2,$3}' reg.txt

ZhangDandan41117397$250$100

ZhangXiaoyu390320151$155$90

LaoNanhai918391635$250$100

XManX10000$999$999

[root@oldboy32-vm1files]# awk -F : -v OFS="$"'{print $1,$2,$3,$4}' reg.txt

ZhangDandan41117397$250$100$175

ZhangXiaoyu390320151$155$90$201

MengFeixue80042789$250$60$50

[root@oldboy32-vm1files]# awk -F : -v OFS="$"'{$1=$1;print $0}' reg.txt

ZhangDandan41117397$250$100$175

ZhangXiaoyu390320151$155$90$201

LiYoujiu918391635$175$75$300

4.1.6.5 显示所有人的全名，以姓,名的格式显示，如Meng,Feixue

[root@zxwfiles]# awk'BEGIN {FS="[ ]+";OFS=","}{print $2,$1}' reg.txt

Dandan,Zhang

Xiaoyu,Zhang

Feixue,Meng

4.2 正则表达式部分的疑问

[root@demon files]# awk '/^Xiaoyu/' /server/files/reg.txt

[root@demon files]# awk '$2~/^Xiaoyu/' /server/files/reg.txt

/^Xiaoyu/的意思不是以Xiaoyu为开头的字符串吗，为什么默认$0匹配就不行了？

/Xiaoyu/这样就可以了，这是为什么？

解答：

awk不会自动匹配，需要明确告诉它是那一列

^ matches the beginning of astring. #匹配字符串的开头的位置

$ matches the end of a string. #匹配字符串结尾的位置

awk '/^Xiaoyu/' /server/files/reg.txt

awk '/Xiaoyu/' /server/files/reg.txt

grep "^Xiaoyu" reg.txt

grep "Xiaoyu" reg.txt

4.3 匹配除了含有oldboy的其他行

4.3.1 测试文件

[root@zxw files]# cat test.txt

lidao

oldboy

oldboylinux

zhangdao

xiadao

[root@zxw files]#

4.3.2 注意精确

[root@oldboy32-vm1files]# awk '/^l|z|x|x$/' test.txt

lidao

oldboylinux

zhangdao

[root@oldboy32-vm1files]# egrep "^l|z|x|x$" test.txt

lidao

oldboylinux

zhangdao

[root@oldboy32-vm1files]# egrep "^l|x$|^z|^x" test.txt

lidao

oldboylinux

zhangdao

4.4 表示一个范围，与sed（2，5p）意思相近

[root@oldboy32-vm1files]# awk 'NR==2,NR==5' awkfile.txt

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

[root@oldboy32-vm1files]# #范围条件/范围模式

4.5 BEGIN在读取文件以前执行

[root@oldboy32-vm1files]# awk 'BEGIN{print 3/10}'

0.3

[root@oldboy32-vm1files]# awk 'BEGIN{print 10/3}'

3.33333

4.6 a=1 输出1 a=lidao awk会将lidao（英文字母）认为是一个变量（需要加“”）

[root@oldboy32-vm1files]# awk 'BEGIN{a=1;print a}'

[root@oldboy32-vm1files]# awk 'BEGIN{a=lidao;print a}'

[root@oldboy32-vm1files]# awk 'BEGIN{a="";print a}'

[root@oldboy32-vm1files]# awk 'BEGIN{a="lidao";print a}'

lidao

4.7 END模式

[root@oldboy32-vm1 files]# awk'BEGIN{print "name","ID"}{print $2,$3}END{print"hello" }' reg.txt

name ID

Dandan 41117397

Xiaoyu 390320151

Feixue 80042789

hello

4.8 awk调试过程

[root@oldboy32-vm1~]# awk '/^$/{notepad++}END{print notepad}'/etc/services16

[root@oldboy32-vm1~]# awk '/^$/{notepad++;print notepad}'/etc/services

4.9 数组

[root@oldboy32-vm1~]# awk'BEGIN{hotel[110]="xiaoyu";hotel[114]="xiadao";

hotel[121]="dandan"

hotel[119]="waiwai"

print hotel[110],hotel[114],hotel[119],hotel[121]}'

xiaoyuxiadao waiwai dandan

[root@oldboy32-vm1~]# awk'BEGIN{hotel[110]="xiaoyu";hotel[114]="xiadao";

hotel[121]="dandan"

hotel[119]="waiwai"

for(pol in hotel )print pol,hotel[pol]}'

110xiaoyu

121dandan

114xiadao

119waiwai

数组

[root@zxw~]# awk 'BEGIN{hotel[100]="zxw";hotel[200]="mzl";hotel[300]="wyf";hotel[400]="yz";for(abc in hotel)print abc,hotel[abc]}'

100 zxw

200 mzl

300 wyf

400 yz

第5章企业案例

5.1 企业面试题: 按单词出现频率降序排序（计算文件中每个单词的重复数量）

注：（此处使用sort与uniq即可）

[root@oldboy32-vm1files]# #sort 默认是按照字母顺序排列

awk -vRS=" " '{print $0}' count.txt|xargs -n1|sort|uniq -c|sort -nr

awk -vRS=" " '{print $0}' count.txt|sort|uniq -c|sort -nr

5.1.1 按字母查找

awk 'BEGIN{RS="[:0-9/ ]+"}{printNR,$0}' awkfile.txt

awk 'BEGIN{RS="[^a-zA-Z]+"}{printNR,$0}' awkfile.txt

[root@zxwfiles]# awk 'BEGIN{RS=":|/|[0-9]"}{print $0}' awkfile.txt|sort|uniq-c|sort -rn

5.2 考试题1：处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)

oldboy.log

http://www.etiantian.org/index.html

http://www.etiantian.org/1.html

http://post.etiantian.org/index.html

http://mp3.etiantian.org/index.html

http://www.etiantian.org/3.html

http://post.etiantian.org/2.html

5.2.1 答案：

[root@zxwfiles]# awk 'BEGIN{FS="."}{print$3}' oldboy.txt|sort|uniq -c |sort -rn

3 org/index

1 org/3

1 org/2

1 org/1

[root@zxwfiles]#

5.3 【企业面试题】处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题)

[root@zxwfiles]# cat oldboy.txt

http://www.etiantian.org/index.html

http://www.etiantian.org/1.html

http://post.etiantian.org/index.html

http://mp3.etiantian.org/index.html

http://www.etiantian.org/3.html

http://post.etiantian.org/2.html

[root@zxwfiles]#

5.3.1 答案：

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h["www"]}' url.txt

www 1

www 2

post 2

mp3 2

www 3

post 3

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h["www"]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h[""]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h["post"]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++;print$2,h[$2]}' url.txt

[root@oldboy32-vm1files]# awk -F "[/.]+" '{h[$2]++}END{for(polin h) print pol,h[pol]}' url.txt

www 3

mp3 1

post 2

[root@oldboy32-vm1files]# awk -F "[/]+" '{h[$2]++}END{for(polin h) print pol,h[pol]}' url.txt

mp3.etiantian.org1

post.etiantian.org2

www.etiantian.org3

5.3.2 方法一

awk -v RS="[^a-zA-Z]+"'{h[$0]++}END{for(pol in h)print pol,h[pol]}' awkfile.txt |sort-rnk2|column -t

5.3.3 方法二

awk'BEGIN{RS="[^a-zA-Z]+"}{h[$0]++}END{for(pol in h)printpol,h[pol]}' awkfile.txt |sort -rnk2|column -t

本文出自 “11845753” 博客，转载请与作者联系！

转载于:https://blog.51cto.com/11913516/1885649

你可能感兴趣的:(awk,面试,操作系统)

Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
经纬恒润二面&三七互娱一面&元象二面 Redstone Monstrosity 面试前端
1.请尽可能详细地说明，进程和线程的区别，分别有哪些应用场景？进程间如何通信？线程间如何通信？你的回答中不要写出示例代码。进程和线程是操作系统中的两个基本概念，它们在计算机系统中扮演着不同的角色，并且在不同的应用场景中发挥作用。进程和线程的区别定义：进程：进程是操作系统进行资源分配和调度的基本单位。每个进程都有独立的内存空间和系统资源。线程：线程是进程内的一个执行单元，是操作系统进行调度的最小单位
Day_11 ROC_bird.. 算法
面试题16.15.珠玑妙算-力扣（LeetCode）/***Note:Thereturnedarraymustbemalloced,assumecallercallsfree().*///下标和对应位置的值都一样，answer[0]+1,对应位置的值猜对了，但是下标不对，answer[1]+1int*masterMind(char*solution,char*guess,int*returnSiz
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
wandb一直上传解决方案行业边缘的摸鱼怪 bug解决方案服务器 linux 服务器
问题描述运行带有wandb的代码时，虽然可以实现及时同步非常方便，但当设置错参数或其他原因不得不使用ctrl+C停止运行时，总会出现wandb一直上传个不停的现象，给在同一终端重新运行新的代码造成困难。解决方案运行以下代码把wandb的进程直接杀死。psaux|grepwandb|grep-vgrep|awk'{print$2}'|xargskill-9参考链接[CLI]:Ctrl+Ctokill
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
AUTO TECH 2025 广州国际汽车软件与安全技术展览会 ws201907 汽车安全
AUTOTECH2025广州国际汽车软件与安全技术展览会ChinaGuangzhouSoftware-DefinedVehicleExpo2025亚洲领先的汽车软件与安全技术专业展会——是与来自世界各地的汽车工程师们交流的最佳平台！广州国际汽车软件与安全技术展览会是AUTOTECH2025华南展专题展之一，汇集了各种汽车嵌入式软件开发与应用、车载操作系统、智驾功能安全与SOTIF、基础软件平台、车
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Java -jar 如何在后台运行项目 vincent_hahaha
撸了今年阿里、头条和美团的面试，我有一个重要发现.......>>>说到运行jar包通常我们都会以下面的方式运行:java-jarspringboot-0.0.1-SNAPSHOT.jar这样运行的话会有一个问题，就是我们一关闭当前窗口就会停止运行项目，要想解决这个问题，就需要在后台运行。nohupjava-jarbabyshark-0.0.1-SNAPSHOT.jar >log.file 2>&
python中文版软件下载-Python中文版编程大乐趣
python中文版是一种面向对象的解释型计算机程序设计语言。python中文版官网面向对象编程，拥有高效的高级数据结构和简单而有效的方法，其优雅的语法、动态类型、以及天然的解释能力，让它成为理想的语言。软件功能强大，简单易学，可以帮助用户快速编写代码，而且代码运行速度非常快，几乎可以支持所有的操作系统，实用性真的超高的。python中文版软件介绍：python中文版的解释器及其扩展标准库的源码和编
关闭Windows自动更新的6种方法 Gemini1995 windows
在Windows操作系统中，可以使用多种方法来关闭自动更新。以下是其中一些常用的方法：使用设置应用：打开“设置”应用（Win+I），选择“更新和安全”。在左侧菜单中选择“Windows更新”。点击“更改活动时间”或“高级选项”。在“更新选项”下拉菜单中选择“通知我但不自动下载或安装”或“从不检查更新”。通过服务管理器：打开“服务”管理器，可以通过在运行对话框中输入services.msc来打开。找
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
【Kubernetes】常见面试题汇总（十一） summer.335 Kubernetes kubernetes 容器云原生
目录33.简述Kubernetes外部如何访问集群内的服务？34.简述Kubernetesingress？35.简述Kubernetes镜像的下载策略？33.简述Kubernetes外部如何访问集群内的服务？（1）对于Kubernetes，集群外的客户端默认情况，无法通过Pod的IP地址或者Service的虚拟IP地址：虚拟端口号进行访问。（2）通常可以通过以下方式进行访问Kubernetes集群
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

AWK基础讲解笔记

第1章 awk基础入门

1.2 awk简介

1.2.1 一种名字怪异的语言

1.2.2 模式扫描和处理

1.3 学过awk可以掌握的内容

1.4 awk命令

1.5 模式及pattern，可以类似理解成sed的模式匹配，可以由表达式组成，也可以是俩个正斜杠之间的正则表达式，比如：NR==1，这就是模式，可以理解为一个条件。

1.6 动作即action，是由在大括号里面的一条或者多条语句组成，语句之间使用分号隔开，如下awk使用格式

1.7 awk执行过程

1.8 接下来说俩个新概念：记录和字段，这里为了方便理解可以把记录当做行记录===行，字段相当于列，字段===列。

1.9 awk记录分隔符 -RS

1.9.1 awk默认情况下每一行都是一个记录

1.9.2 RS即record separator输入数据记录分隔符，每一行是怎么来的，表示每个记录输入的时候的分隔符，即行与行之间如何分割。

1.9.3 NR即number of record 记录行号，表示当前正在处理的行的号码

1.9.4 ORS即output record separator 输出记录分隔符。

1.9.5 awk使用内置变量RS来存放输入记录分隔符，RS表示的是输入的记录分隔符，这个值可以通过BEGIN模块重新定义修改。

1.10 思路

1.11 awk记录知识小结

1.11.1 NR存放着每个记录的号（行号），读取新行时候会自动加1（+1）

1.11.2 RS是输入数据的记录的分隔符，简单理解就是可以指定每个记录的结尾标致

1.11.3 RS作用就是表示一个记录的结束

1.11.4 当我们修改了RS的值，最好配合NR来查看变化，也就是修改了RS的值通过NR查看结果，调试awk程序。

1.11.5 ORS输出数据的记录的分隔符

1.12 awk学习技巧一则

1.13 字段（字段）

1.14 FS

1.15 说明：

1.16 ORS与OFS简介

1.16.1 利用OFS调换ETCpasswd位置

1.17 awk都有哪几种模式

1.17.1 正则表达式作为模式

1.17.2 比较表达式作为模式

1.17.3 范围模式

1.17.4 特殊模式BEGIN和END

1.18 awk也支持大量的正则表达式，大部分与sed的元字符类似，而且正则表达式是玩转三剑客的必备工具，

1.19 说明：

1.20 awk注意事项说明：

1.21 awk运算符

第2章 awk特殊模式与END模式

2.1 BEGIN模块

2.2 命令行 -F本质就是修改的FS变量

2.2.1 第二个作用，在读取文件之前输出些提示性信息，表头。

2.3 awk中的变量的概念简介

2.4 NEGIN模式说明

2.5 END模块说明

2.6 awk编程思想

2.6.1 先处理，最后在END模式输出

2.6.2 ｛print NF ,$0｝ boby 模块处理，处理完毕后

.6.3 END{print"endof file"} 输出一个结果

2.7 awk调试技巧：

2.8 几种常用的运算表达式

2.9 awk中的动作

2.10 awk模式与动作小结

2.11 awk执行过程文字版

第3章 awk数组

3.1 图片-数组-酒店

3.2 awk数组小结

3.4 企业面试题数组题分解执行过程

第4章 练习题

4.1 测试文件

4.1.1 显示姓Zhang的人的第二次捐款金额及她的名字

4.1.1.1 第一种

4.1.1.2 第二种

4.1.1.3 第三种

4.1.1.4 第四种

4.1.1.5 注意错误1

4.1.1.6 注意错误2

4.1.2 显示Xiaoyu的名字和ID号码

4.1.3 显示所有以41开头的ID号码的人的全名和ID号码

4.1.4 显示所有以一个D或X开头的人名全名

4.1.5 显示所有ID号码最后一位数字是1或5的人的全名

4.1.6 显示Xiaoyu的捐款.每个值时都有以$开头.如$520$200$135

4.1.6.1 第一种

4.1.6.2 第二种

4.1.6.3 第三种

4.1.6.4 疑问（下面$0和$1,$2,$3）输出的结果为啥不一样

4.1.6.5 显示所有人的全名，以姓,名的格式显示，如Meng,Feixue

4.2 正则表达式部分的疑问

4.3 匹配除了含有oldboy的其他行

第4章练习题

第5章企业案例