chen_01_c

Linux下Shell文本处理三剑客--awk

文章目录

1、选项
2、模式
3、内置变量
4、操作符
5、流程控制
6、数组
7、内置函数
8、I/O语句
9、printf语句
10、自定义函数
11、需求案例

awk

awk是一个处理文本的编程语言工具，能用简短的程序处理标准输入或文件、数据排序、计算以及生成报表等等。

在Linux系统下默认awk是gawk，它是awk的GNU版本。可以通过命令查看应用的版本：ls -l /bin/awk

基本的命令语法：awk option ‘pattern {action}’ file

其中pattern表示AWK在数据中查找的内容，而action是在找到匹配内容时所执行的一系列命令。花括号用于根据特定的模式对一系列指令进行分组。

awk处理的工作方式与数据库类似，支持对记录和字段处理，这也是grep和sed不能实现的。

在awk中，缺省的情况下将文本文件中的一行视为一个记录，逐行放到内存中处理，而将一行中的某一部分作为记录中的一个字段。用1,2,3…数字的方式顺序的表示行（记录）中的不同字段。用$后跟数字，引用对应的字段，以逗号分隔，0表示整个行。

1、选项

选项	描述
-f program-file	从文件中读取awk程序源文件
-F fs	指定fs为输入字段分隔符
-v var=value	变量赋值
–posix	兼容POSIX正则表达式
–dump-variables=[file]	把awk命令时的全局变量写入文件，默认文件是awkvars.out
–profile=[file]	格式化awk语句到文件，默认是awkprof.out

2、模式

常用模式有：

Pattern	Description
BEGIN{ }	给程序赋予初始状态，先执行的工作
END{ }	程序结束之后执行的一些扫尾工作
/regular expression/	为每个输入记录匹配正则表达式
pattern && pattern	逻辑and，满足两个模式
pattern \|\| pattern	逻辑or，满足其中一个模式
! pattern	逻辑not，不满足模式
pattern1, pattern2	范围模式，匹配所有模式1的记录，直到匹配到模式2

而动作呢，就是下面所讲的print、流程控制、I/O语句等。

示例：

1）从文件读取awk程序处理文件

[root@ chenc01 ~]# vi test.awk
{print $2}

[root@ chenc01 ~]# tail -n3 /etc/services |awk -f test.awk
48049/tcp
48128/tcp
49000/tcp

2）指定分隔符，打印指定字段 

打印第二字段，默认以空格分隔：

[root@ chenc01 ~]# tail -n3 /etc/services |awk '{print $2}'
48049/tcp
48128/tcp
48128/udp

指定冒号为分隔符打印第一字段：

[root@ chenc01 ~]# awk -F ':' '{print $1}' /etc/passwd
root
bin
daemon
adm
lp
sync
......

还可以指定多个分隔符，作为同一个分隔符处理：

[root@ chenc01 ~]# tail -n3 /etc/services |awk -F'[/#]' '{print $3}'  
 iqobject
 iqobject
 Matahari Broker

[root@ chenc01 ~]# tail -n3 /etc/services |awk -F'[/#]' '{print $1}'
iqobject    48619
iqobject    48619
matahari    49000

[root@ chenc01 ~]# tail -n3 /etc/services |awk -F'[/#]' '{print $2}'
tcp        
udp        
tcp        

[root@ chenc01 ~]# tail -n3 /etc/services |awk -F'[/#]' '{print $3}'
 iqobject
 iqobject
 Matahari Broker

[root@ chenc01 ~]# tail -n3 /etc/services |awk -F'[ /]+' '{print $2}'
48619
48619
49000

[]元字符的意思是符号其中任意一个字符，也就是说每遇到一个/或#时就分隔一个字段，当用多个分隔符时，就能更方面处理字段了。

3）变量赋值

[root@ chenc01 ~]# awk -v a=123 'BEGIN{print a}'  
123

系统变量作为awk变量的值：

[root@ chenc01 ~]# a=123
[root@ chenc01 ~]# awk -v a=$a 'BEGIN{print a}'  
123
或使用单引号
[root@ chenc01 ~]# awk 'BEGIN{print '$a'}'  
123

4）输出awk全局变量到文件
[root@ chenc01 ~]# seq 5 |awk --dump-variables '{print $0}'
1
2
3
4
5

[root@ chenc01 ~]# cat awkvars.out             
ARGC: number (1)
ARGIND: number (0)
ARGV: array, 1 elements
BINMODE: number (0)
CONVFMT: string ("%.6g")
ERRNO: number (0)
FIELDWIDTHS: string ("")
FILENAME: string ("-")
FNR: number (5)
FS: string (" ")
IGNORECASE: number (0)
LINT: number (0)
NF: number (1)
NR: number (5)
OFMT: string ("%.6g")
OFS: string (" ")
ORS: string ("\n")
RLENGTH: number (0)
RS: string ("\n")
RSTART: number (0)
RT: string ("\n")
SUBSEP: string ("\034")
TEXTDOMAIN: string ("messages")

5）BEGIN和END

BEGIN模式是在处理文件之前执行该操作，常用于修改内置变量、变量赋值和打印输出的页眉或标题。

例如：打印页眉

[root@ chenc01 ~]# tail /etc/services |awk 'BEGIN{print "Service\t\tPort\t\t\tDescription\n==="}{print $0}'
Service     Port          Description
===
3gpp-cbsp    48049/tcp           # 3GPP Cell Broadcast Service 
isnetserv    48128/tcp           # Image Systems Network Services
isnetserv    48128/udp           # Image Systems Network Services
blp5      48129/tcp              # Bloomberg locator
blp5      48129/udp              # Bloomberg locator
com-bardac-dw   48556/tcp        # com-bardac-dw
com-bardac-dw   48556/udp        # com-bardac-dw
iqobject    48619/tcp            # iqobject
iqobject    48619/udp            # iqobject
matahari    49000/tcp            # Matahari Broker

END模式是在程序处理完才会执行。

例如：打印页尾

[root@ chenc01 ~]# tail /etc/services |awk '{print $0}END{print "===\nEND......"}'
3gpp-cbsp    48049/tcp           # 3GPP Cell Broadcast Service 
isnetserv    48128/tcp           # Image Systems Network Services
isnetserv    48128/udp           # Image Systems Network Services
blp5      48129/tcp              # Bloomberg locator
blp5      48129/udp              # Bloomberg locator
com-bardac-dw   48556/tcp        # com-bardac-dw
com-bardac-dw   48556/udp        # com-bardac-dw
iqobject    48619/tcp            # iqobject
iqobject    48619/udp            # iqobject
matahari    49000/tcp            # Matahari Broker
===
END......

6）格式化输出awk命令到文件

[root@ chenc01 ~]# tail /etc/services |awk --profile 'BEGIN{print "Service\t\tPort\t\t\tDescription\n==="}{print $0}END{print "===\nEND......"}'
Service     Port           Description
===
nimgtw      48003/udp           # Nimbus Gateway
3gpp-cbsp    48049/tcp          # 3GPP Cell Broadcast Service Protocol
isnetserv    48128/tcp          # Image Systems Network Services
isnetserv    48128/udp          # Image Systems Network Services
blp5       48129/tcp            # Bloomberg locator
blp5       48129/udp            # Bloomberg locator
com-bardac-dw  48556/tcp        # com-bardac-dw
com-bardac-dw  48556/udp        # com-bardac-dw
iqobject     48619/tcp          # iqobject
iqobject     48619/udp          # iqobject
===
END......

[root@ chenc01 ~]# cat awkprof.out 
[root@ chenc01 ~]# gawk profile, created Sat Jan  7 19:45:22 2017
     # BEGIN block(s)
     BEGIN {
         print "Service\t\tPort\t\t\tDescription\n==="
     }
     # Rule(s)
     {
         print $0
     }

     # END block(s)
     END {
         print "===\nEND......"
     }

7）/re/正则匹配

匹配包含tcp的行：

[root@ chenc01 ~]# tail /etc/services |awk '/tcp/{print $0}'  
3gpp-cbsp    48049/tcp           # 3GPP Cell Broadcast Service 
isnetserv    48128/tcp           # Image Systems Network Services
blp5      48129/tcp              # Bloomberg locator
com-bardac-dw   48556/tcp        # com-bardac-dw
iqobject    48619/tcp            # iqobject
matahari    49000/tcp            # Matahari Broker
匹配开头是blp5的行：

[root@ chenc01 ~]# tail /etc/services |awk '/^blp5/{print $0}'  
blp5      48129/tcp             # Bloomberg locator
blp5      48129/udp             # Bloomberg locator
匹配第一个字段是8个字符的行：

[root@ chenc01 ~]# tail /etc/services |awk '/^[a-z0-9]{8} /{print $0}'
iqobject    48619/tcp           # iqobject
iqobject    48619/udp           # iqobject
matahari    49000/tcp           # Matahari Broker

如果没有匹配到，请查看你的awk版本（awk --version）是不是3，因为4才支持{}

8）逻辑and、or和not

匹配记录中包含blp5和tcp的行：

[root@ chenc01 ~]# tail /etc/services |awk '/blp5/ && /tcp/{print $0}'    
blp5      48129/tcp             # Bloomberg locator
匹配记录中包含blp5或tcp的行：

[root@ chenc01 ~]# tail /etc/services |awk '/blp5/ || /tcp/{print $0}'    
3gpp-cbsp    48049/tcp          # 3GPP Cell Broadcast Service 
isnetserv    48128/tcp          # Image Systems Network Services
blp5      48129/tcp             # Bloomberg locator
blp5      48129/udp             # Bloomberg locator
com-bardac-dw   48556/tcp       # com-bardac-dw
iqobject    48619/tcp           # iqobject
matahari    49000/tcp           # Matahari Broker
不匹配开头是#和空行：

[root@ chenc01 ~]# awk '! /^#/ && ! /^$/{print $0}' /etc/httpd/conf/httpd.conf
或
[root@ chenc01 ~]# awk '! /^#|^$/' /etc/httpd/conf/httpd.conf  
或
[root@ chenc01 ~]# awk '/^[^#]|"^$"/' /etc/httpd/conf/httpd.conf

9）匹配范围
[root@ chenc01 ~]# tail /etc/services |awk '/^blp5/,/^com/'
blp5      48129/tcp               # Bloomberg locator
blp5      48129/udp               # Bloomberg locator
com-bardac-dw    48556/tcp        # com-bardac-dw
对匹配范围后记录再次处理，例如匹配关键字下一行到最后一行：

[root@ chenc01 ~]# seq 5 |awk '/3/,/^$/{printf /3/?"":$0"\n"}' 
4
5

另一种判断真假的方式实现：

[root@ chenc01 ~]# seq 5 |awk '/3/{t=1;next}t'
4
5

1和2都不匹配3，不执行后面{}，执行t，t变量还没赋值，为空，空在awk中就为假，就不打印当前行。匹配到3，执行t=1，next跳出，不执行t。4也不匹配3，执行t，t的值上次赋值的1，为真，打印当前行，以此类推。（非0的数字都为真，所以t可以写任意非0数字）

如果想打印匹配行都最后一行，就可以这样了：

[root@ chenc01 ~]# seq 5 |awk '/3/{t=1}t'   
3
4
5

3、内置变量

变量名	描述
FS	输入字段分隔符，默认是空格或制表符
OFS	输出字段分隔符，默认是空格
RS	输入记录分隔符，默认是换行符\n
ORS	输出记录分隔符，默认是换行符\n
NF	统计当前记录中字段个数
NR	统计记录编号，每处理一行记录，编号就会+1
FNR	统计记录编号，每处理一行记录，编号也会+1，与NR不同的是，处理第二个文件时，编号会重新计数。
ARGC	命令行参数数量
ARGV	命令行参数数组序列数组，下标从0开始，ARGV[0]是awk
ARGIND	当前正在处理的文件索引值。第一个文件是1，第二个文件是2，以此类推
ENVIRON	当前系统的环境变量
FILENAME	输出当前处理的文件名
IGNORECASE	忽略大小写
SUBSEP	数组中下标的分隔符，默认为"\034"

示例：

1）FS和OFS

在程序开始前重新赋值FS变量，改变默认分隔符为冒号，与-F一样。

[root@ chenc01 ~]# awk 'BEGIN{FS=":"}{print $1,$2}' /etc/passwd |head -n5      
root x
bin x
daemon x
adm x
lp x

也可以使用-v来重新赋值这个变量：

[root@ chenc01 ~]# awk -vFS=':' '{print $1,$2}' /etc/passwd |head -n5    # 中间逗号被换成了OFS的默认值     
root x
bin x
daemon x
adm x
lp x

由于OFS默认以空格分隔，反向引用多个字段分隔的也是空格，如果想指定输出分隔符这样：

[root@ chenc01 ~]# awk 'BEGIN{FS=":";OFS=":"}{print $1,$2}' /etc/passwd |head -n5
root:x
bin:x
daemon:x
adm:x
lp:x

也可以通过字符串拼接实现分隔：

[root@ chenc01 ~]# awk 'BEGIN{FS=":"}{print $1"#"$2}' /etc/passwd |head -n5
root#x
bin#x
daemon#x
adm#x
lp#x

2）RS和ORS

RS默认是\n分隔每行，如果想指定以某个字符作为分隔符来处理记录：

[root@ chenc01 ~]# echo "www.baidu.com/user/test.html" |awk 'BEGIN{RS="/"}{print $0}'
www.baidu.com
user
test.html

RS也支持正则，简单演示下：

[root@ chenc01 ~]# seq -f "str%02g" 10 |sed 'n;n;a\-----' |awk 'BEGIN{RS="-+"}{print $1}'
str01
str04
str07
str10

将输出的换行符替换为+号：
[root@ chenc01 ~]# seq 10 |awk 'BEGIN{ORS="+"}{print $0}'
1+2+3+4+5+6+7+8+9+10+

替换某个字符：

[root@ chenc01 ~]# tail -n2 /etc/services |awk 'BEGIN{RS="/";ORS="#"}{print $0}'
iqobject    48619#udp        # iqobject
matahari    49000#tcp        # Matahari Broker

3）NF

NF是字段个数。

[root@ chenc01 ~]# echo "a b c d e f" |awk '{print NF}'
6

打印最后一个字段：
[root@ chenc01 ~]# echo "a b c d e f" |awk '{print $NF}'
f

打印倒数第二个字段：
[root@ chenc01 ~]# echo "a b c d e f" |awk '{print $(NF-1)}'
e

排除最后两个字段：
[root@ chenc01 ~]# echo "a b c d e f" |awk '{$NF="";$(NF-1)="";print $0}'
a b c d

排除第一个字段：
[root@ chenc01 ~]# echo "a b c d e f" |awk '{$1="";print $0}'
 b c d e f 

4）NR和FNR

NR统计记录编号，每处理一行记录，编号就会+1，FNR不同的是在统计第二个文件时会重新计数。

打印行数：

[root@ chenc01 ~]# tail -n5 /etc/services |awk '{print NR,$0}'
1 com-bardac-dw   48556/tcp        # com-bardac-dw
2 com-bardac-dw   48556/udp        # com-bardac-dw
3 iqobject     48619/tcp           # iqobject
4 iqobject     48619/udp           # iqobject
5 matahari     49000/tcp           # Matahari Broker
打印总行数：

[root@ chenc01 ~]# tail -n5 /etc/services |awk 'END{print NR}'
5

打印第三行：
[root@ chenc01 ~]# tail -n5 /etc/services |awk 'NR==3'    
iqobject     48619/tcp        # iqobject

打印第三行第二个字段：
[root@ chenc01 ~]# tail -n5 /etc/services |awk 'NR==3{print $2}'
48619/tcp

打印前三行：
[root@ chenc01 ~]# tail -n5 /etc/services |awk 'NR<=3{print NR,$0}'
1 com-bardac-dw  48556/tcp        # com-bardac-dw
2 com-bardac-dw  48556/udp        # com-bardac-dw
3 iqobject    48619/tcp           # iqobject

看下NR和FNR的区别：

[root@ chenc01 ~]# cat a
a
b
c
[root@ chenc01 ~]# cat b
c
d
e

[root@ chenc01 ~]# awk '{print NR,FNR,$0}' a b
1 1 a
2 2 b
3 3 c
4 1 c
5 2 d
6 3 e

可以看出NR每处理一行就会+1，而FNR在处理第二个文件时，编号重新计数。同时也知道awk处理两个文件时，是合并到一起处理。

[root@ chenc01 ~]# awk 'FNR==NR{print $0"1"}FNR!=NR{print $0"2"}' a b 
a1
b1
c1
c2
d2
e2

当FNR==NR时，说明在处理第一个文件内容，不等于时说明在处理第二个文件内容。

一般FNR在处理多个文件时会用到，下面会讲解。

5）ARGC和ARGV
ARGC是命令行参数数量
ARGV是将命令行参数存到数组，元素由ARGC指定，数组下标从0开始

[root@ chenc01 ~]# awk 'BEGIN{print ARGC}' 1 2 3
4

[root@ chenc01 ~]# awk 'BEGIN{print ARGV[0]}'
awk

[root@ chenc01 ~]# awk 'BEGIN{print ARGV[1]}' 1 2
1

[root@ chenc01 ~]# awk 'BEGIN{print ARGV[2]}' 1 2 
2

6）ARGIND

ARGIND是当前正在处理的文件索引值，第一个文件是1，第二个文件是2，以此类推，从而可以通过这种方式判断正在处理哪个文件。

[root@ chenc01 ~]# awk '{print ARGIND,$0}' a b
1 a
1 b
1 c
2 c
2 d
2 e

[root@ chenc01 ~]# awk 'ARGIND==1{print "a->"$0}ARGIND==2{print "b->"$0}' a b    
a->a
a->b
a->c
b->c
b->d
b->e

7）ENVIRON

ENVIRON调用系统变量。

[root@ chenc01 ~]# awk 'BEGIN{print ENVIRON["HOME"]}'
/root

如果是设置的环境变量，还需要用export导入到系统变量才可以调用：

[root@ chenc01 ~]# awk 'BEGIN{print ENVIRON["a"]}'

[root@ chenc01 ~]# export a

[root@ chenc01 ~]# awk 'BEGIN{print ENVIRON["a"]}'
123

8）FILENAME

FILENAME是当前处理文件的文件名。

[root@ chenc01 ~]# awk 'FNR==NR{print FILENAME"->"$0}FNR!=NR{print FILENAME"->"$0}' a b   
a->a
a->b
a->c
b->c
b->d
b->e

9）忽略大小写
[root@ chenc01 ~]# echo "A a b c" |xargs -n1 |awk 'BEGIN{IGNORECASE=1}/a/'
A
a

等于1代表忽略大小写。

4、操作符

运算符	描述
（…）	分组
$	字段引用
++ –	递增和递减
+ - !	加号，减号，和逻辑否定
* / %	乘，除和取余
+ -	加法，减法
\| \|&	管道，用于getline，print和printf
< > <= >= != ==	关系运算符
~ !~	正则表达式匹配，否定正则表达式匹配
in	数组成员
&& \|\|	逻辑and，逻辑or
?:	简写条件表达式：expr1 ? expr2 : expr3第一个表达式为真，执行expr2，否则执行expr3
= += -= *= /= %= ^=	变量赋值运算符

须知：*

在awk中，有3种情况表达式为假：数字是0，空字符串和未定义的值。

数值运算，未定义变量初始值为0。字符运算，未定义变量初始值为空。

举例测试：

[root@ chenc01 ~]# awk 'BEGIN{n=0;if(n)print "true";else print "false"}'
false

[root@ chenc01 ~]# awk 'BEGIN{s="";if(s)print "true";else print "false"}'
false

[root@ chenc01 ~]# awk 'BEGIN{if(s)print "true";else print "false"}'
false

示例：

1）截取整数

[root@ chenc01 ~]# echo "123abc abc123 123abc123" |xargs -n1 | awk '{print +$0}'
123
0
123

[root@ chenc01 ~]# echo "123abc abc123 123abc123" |xargs -n1 | awk '{print -$0}'
-123
0
-123

2）感叹号

打印奇数行：

[root@ chenc01 ~]# seq 6 |awk 'i=!i'
1
3
5

打印偶数行：

[root@ chenc01 ~]# seq 6 |awk '!(i=!i)'  
2
4
6

读取第一行：i是未定义变量，也就是i=!0，!取反意思。感叹号右边是个布尔值，0或空字符串为假，非0或非空字符串为真，!0就是真，因此i=1，条件为真打印当前记录。
没有print为什么会打印呢？因为模式后面没有动作，默认会打印整条记录。
读取第二行：因为上次i的值由0变成了1，此时就是i=!1，条件为假不打印。
读取第三行：上次条件又为假，i恢复初始值0，取反，继续打印。以此类推...
可以看出，运算时并没有判断行内容，而是利用布尔值真假判断输出当前行。

2）不匹配某行

[root@ chenc01 ~]# tail /etc/services |awk '!/blp5/{print $0}'
3gpp-cbsp    48049/tcp           # 3GPP Cell Broadcast Service isnetserv    48128/tcp        # Image Systems Network Services
isnetserv    48128/udp           # Image Systems Network Services
com-bardac-dw   48556/tcp        # com-bardac-dw
com-bardac-dw   48556/udp        # com-bardac-dw
iqobject    48619/tcp            # iqobject
iqobject    48619/udp            # iqobject
matahari    49000/tcp            # Matahari Broker

3）乘法和除法

[root@ chenc01 ~]# seq 5 |awk '{print $0*2}'
2
4
6
8
10

[root@ chenc01 ~]# seq 5 |awk '{print $0%2}'
1
0
1
0
1

打印偶数行：
[root@ chenc01 ~]# seq 5 |awk '$0%2==0{print $0}'
2
4

打印奇数行：
[root@ chenc01 ~]# seq 5 |awk '$0%2!=0{print $0}'
1
3
5

4）管道符使用

[root@ chenc01 ~]# seq 5 |shuf |awk '{print $0|"sort"}'
1
2
3
4
5

5）正则表达式匹配

[root@ chenc01 ~]# seq 5 |awk '$0~3{print $0}'
3

[root@ chenc01 ~]# seq 5 |awk '$0!~3{print $0}'
1
2
4
5

[root@ chenc01 ~]# seq 5 |awk '$0~/[34]/{print $0}'
3
4

[root@ chenc01 ~]# seq 5 |awk '$0!~/[34]/{print $0}'
1
2
5

[root@ chenc01 ~]# seq 5 |awk '$0~/[^34]/{print $0}'
1
2
5

6）判断数组成员

[root@ chenc01 ~]# awk 'BEGIN{a["a"]=123}END{if("a" in a)print "yes"}' 
yes

7）三目运算符

[root@ chenc01 ~]# awk 'BEGIN{print 1==1?"yes":"no"}'  # 三目运算作为一个表达式，里面不允许写print
yes

[root@ chenc01 ~]# seq 3 |awk '{print $0==2?"yes":"no"}'
no
yes
no

替换换行符为逗号：

[root@ chenc01 ~]# seq 5 |awk '{print n=(n?n","$0:$0)}'
1
1,2
1,2,3
1,2,3,4
1,2,3,4,5

[root@ chenc01 ~]# seq 5 |awk '{n=(n?n","$0:$0)}END{print n}'
1,2,3,4,5

说明：读取第一行时，n没有变量，为假输出$0也就是1，并赋值变量n，读取第二行时，n是1为真，输出1,2 以此类推，后面会一直为真。
每三行后面添加新一行：

[root@ chenc01 ~]# seq 10 |awk '{print NR%3?$0:$0 "\ntxt"}'
1
2
3
txt
4
5
6
txt
7
8
9
txt
10
在

两行合并一行：

[root@ chenc01 ~]# seq 6 |awk '{printf NR%2!=0?$0" ":$0" \n"}'  
1 2 
3 4 
5 6 

[root@ chenc01 ~]# seq 6 |awk 'ORS=NR%2?" ":"\n"' 
1 2
3 4
5 6

[root@ chenc01 ~]# seq 6 |awk '{if(NR%2)ORS=" ";else ORS="\n";print}'

8）变量赋值

字段求和：
[root@ chenc01 ~]# seq 5 |awk '{sum+=1}END{print sum}'
5

[root@ chenc01 ~]# seq 5 |awk '{sum+=$0}END{print sum}'
15

5、流程控制

1）if语句

格式：if (condition) statement [ else statement ]
单分支：

[root@ chenc01 ~]# seq 5 |awk '{if($0==3)print $0}'  
3

也支持正则匹配判断，一般在写复杂语句时使用：

[root@ chenc01 ~]# echo "123abc#456cde 789aaa#aaabbb " |xargs -n1 |awk -F# '{if($2~/[0-9]/)print $2}'  
456cde
[root@ chenc01 ~]# echo "123abc#456cde 789aaa#aaabbb " |xargs -n1 |awk -F# '{if($2!~/[0-9]/)print $2}'
aaabbb
或
[root@ chenc01 ~]# echo "123abc#456cde 789aaa#aaabbb" |xargs -n1 |awk -F# '$2!~/[0-9]/{print $2}'   
aaabbb

双分支：

[root@ chenc01 ~]# seq 5 |awk '{if($0==3)print $0;else print "no"}'
no
no
3
no
no

多分支：
[root@ chenc01 ~]# cat file
1 2 3
4 5 6
7 8 9
[root@ chenc01 ~]# awk '{if($1==4){print "1"} else if($2==5){print "2"} else if($3==6){print "3"} else {print "no"}}' file      
no
1
no

2）while语句

格式：while (condition) statement
遍历打印所有字段：

[root@ chenc01 ~]# awk '{i=1;while(i<=NF){print $i;i++}}' file
1
2
3
4
5
6
7
8
9

awk是按行处理的，每次读取一行，并遍历打印每个字段。

3）for语句C语言风格

格式：for (expr1; expr2; expr3) statement
遍历打印所有字段：

[root@ chenc01 ~]# cat file
1 2 3
4 5 6
7 8 9

[root@ chenc01 ~]# awk '{for(i=1;i<=NF;i++)print $i}' file
1
2
3
4
5
6
7
8
9

倒叙打印文本：

[root@ chenc01 ~]# awk '{for(i=NF;i>=1;i--)print $i}' file    
3
2
1
6
5
4
9
8
7

都换行了，这并不是我们要的结果。怎么改进呢？

[root@ chenc01 ~]# awk '{for(i=NF;i>=1;i--){printf $i" "};print ""}' file  # print本身就会新打印一行
3 2 1
6 5 4
9 8 7
或
[root@ chenc01 ~]# awk '{for(i=NF;i>=1;i--)if(i==1)printf $i"\n";else printf $i" "}' file
3 2 1
6 5 4
9 8 7

在这种情况下，是不是就排除第一行和倒数第一行呢？我们正序打印看下
排除第一行：

[root@ chenc01 ~]# awk '{for(i=2;i<=NF;i++){printf $i" "};print ""}' file
2 3
5 6
8 9

排除第二行：

[root@ chenc01 ~]# awk '{for(i=1;i<=NF-1;i++){printf $i" "};print ""}' file
1 2
4 5
7 8

IP加单引号：

[root@ chenc01 ~]# echo '10.10.10.1 10.10.10.2 10.10.10.3' |awk '{for(i=1;i<=NF;i++)printf "\047"$i"\047"}
'10.10.10.1'  '10.10.10.2'  '10.10.10.3'

\047是ASCII码，可以通过showkey -a命令查看。

4）for语句遍历数组

格式：for (var in array) statement

[root@ chenc01 ~]# seq -f "str%.g" 5 |awk '{a[NR]=$0}END{for(v in a)print v,a[v]}'
4 str4
5 str5
1 str1
2 str2
3 str3

5）break和continue语句

break跳过所有循环，continue跳过当前循环。

[root@ chenc01 ~]# awk 'BEGIN{for(i=1;i<=5;i++){if(i==3){break};print i}}'
1
2

[root@ chenc01 ~]# awk 'BEGIN{for(i=1;i<=5;i++){if(i==3){continue};print i}}'
1
2
4
5

6）删除数组和元素

格式：
delete array[index]  删除数组元素
delete array  删除数组

[root@ chenc01 ~]# seq -f "str%.g" 5 |awk '{a[NR]=$0}END{delete a;for(v in a)print v,a[v]}'
空的…  

[root@ chenc01 ~]# seq -f "str%.g" 5 |awk '{a[NR]=$0}END{delete a[3];for(v in a)print v,a[v]}'
4 str4
5 str5
1 str1
2 str2

7）exit语句

格式：exit [ expression ]
exit退出程序，与shell的exit一样。[ expr ]是0-255之间的数字。

[root@ chenc01 ~]# seq 5 |awk '{if($0~/3/)exit (123)}'     
[root@ chenc01 ~]# echo $?
123

6、数组

数组：存储一系列相同类型的元素，键/值方式存储，通过下标（键）来访问值。
awk中数组称为关联数组，不仅可以使用数字作为下标，还可以使用字符串作为下标。
数组元素的键和值存储在awk程序内部的一个表中，该表采用散列算法，因此数组元素是随机排序。
数组格式：array[index]=value

1）自定义数组

[root@ chenc01 ~]# awk 'BEGIN{a[0]="test";print a[0]}'
test

2）通过NR设置记录下标，下标从1开始
[root@ chenc01 ~]# tail -n3 /etc/passwd |awk -F: '{a[NR]=$1}END{print a[1]}'
systemd-network

[root@ chenc01 ~]# tail -n3 /etc/passwd |awk -F: '{a[NR]=$1}END{print a[2]}'
zabbix

[root@ chenc01 ~]# tail -n3 /etc/passwd |awk -F: '{a[NR]=$1}END{print a[3]}'
user

3）通过for循环遍历数组

[root@ chenc01 ~]# tail -n5 /etc/passwd |awk -F: '{a[NR]=$1}END{for(v in a)print a[v],v}'
zabbix 4
user 5
admin 1
systemd-bus-proxy 2
systemd-network 3

[root@ chenc01 ~]# tail -n5 /etc/passwd |awk -F: '{a[NR]=$1}END{for(i=1;i<=NR;i++)print a[i],i}'
admin 1
systemd-bus-proxy 2
systemd-network 3
zabbix 4
user 5

上面打印的i是数组的下标。
第一种for循环的结果是乱序的，刚说过，数组是无序存储。
第二种for循环通过下标获取的情况是排序正常。
所以当下标是数字序列时，还是用for(expr1;expr2;expr3)循环表达式比较好，保持顺序不变。

4）通过++方式作为下标

[root@ chenc01 ~]# tail -n5 /etc/passwd |awk -F: '{a[x++]=$1}END{for(i=0;i<=x-1;i++)print a[i],i}'
admin 0
systemd-bus-proxy 1
systemd-network 2
zabbix 3
user 4

x被awk初始化值是0，没循环一次+1

5）使用字段作为下标

[root@ chenc01 ~]# tail -n5 /etc/passwd |awk -F: '{a[$1]=$7}END{for(v in a)print a[v],v}'
/sbin/nologin admin
/bin/bash user
/sbin/nologin systemd-network
/sbin/nologin systemd-bus-proxy
/sbin/nologin zabbix

6）统计相同字段出现次数

[root@ chenc01 ~]# tail /etc/services |awk '{a[$1]++}END{for(v in a)print a[v],v}'
2 com-bardac-dw
1 3gpp-cbsp
2 iqobject
1 matahari
2 isnetserv
2 blp5

[root@ chenc01 ~]# tail /etc/services |awk '{a[$1]+=1}END{for(v in a)print a[v],v}' 
2 com-bardac-dw
1 3gpp-cbsp
2 iqobject
1 matahari
2 isnetserv
2 blp5

[root@ chenc01 ~]# tail /etc/services |awk '/blp5/{a[$1]++}END{for(v in a)print a[v],v}'
2 blp5

第一个字段作为下标，值被++初始化是0，每次遇到下标（第一个字段）一样时，对应的值就会被+1，因此实现了统计出现次数。
想要实现去重的的话就简单了，只要打印下标即可。

7）统计TCP连接状态

[root@ chenc01 ~]# netstat -antp |awk '/^tcp/{a[$6]++}END{for(v in a)print a[v],v}'
9 LISTEN
6 ESTABLISHED
6 TIME_WAIT

8）只打印出现次数大于等于2的

[root@ chenc01 ~]# tail /etc/services |awk '{a[$1]++}END{for(v in a) if(a[v]>=2){print a[v],v}}'
2 com-bardac-dw
2 iqobject
2 isnetserv
2 blp5

9）去重

只打印重复的行：
[root@ chenc01 ~]# tail /etc/services |awk 'a[$1]++'
isnetserv    48128/udp           # Image Systems Network Services
blp5      48129/udp              # Bloomberg locator
com-bardac-dw   48556/udp        # com-bardac-dw
iqobject    48619/udp            # iqobject

不打印重复的行：
[root@ chenc01 ~]# tail /etc/services |awk '!a[$1]++'
3gpp-cbsp    48049/tcp           # 3GPP Cell Broadcast Service 
isnetserv    48128/tcp           # Image Systems Network Services
blp5      48129/tcp              # Bloomberg locator
com-bardac-dw   48556/tcp        # com-bardac-dw
iqobject    48619/tcp            # iqobject
matahari    49000/tcp            # Matahari Broker

先明白一个情况，当值是0是为假，非0整数为真，知道这点就不难理解了。
只打印重复的行说明：当处理第一条记录时，执行了++，初始值是0为假，就不打印，如果再遇到相同的记录，值就会+1，不为0，则打印。
不打印重复的行说明：当处理第一条记录时，执行了++，初始值是0为假，感叹号取反为真，打印，如果再遇到相同的记录，值就会+1，不为0为真，取反为假就不打印。

[root@ chenc01 ~]# tail /etc/services |awk '{if(a[$1]++)print $1}'    
isnetserv
blp5
com-bardac-dw
iqobject
使用三目运算：

[root@ chenc01 ~]# tail /etc/services |awk '{print a[$1]++?$1:"no"}'  
no
no
isnetserv
no
blp5
no
com-bardac-dw
no
iqobject
no

[root@ chenc01 ~]# tail /etc/services |awk '{if(!a[$1]++)print $1}'
3gpp-cbsp
isnetserv
blp5
com-bardac-dw
iqobject
matahari

10）统计每个相同字段的某字段总数：

[root@ chenc01 ~]# tail /etc/services |awk -F'[ /]+' '{a[$1]+=$2}END{for(v in a)print v, a[v]}'
com-bardac-dw 97112
3gpp-cbsp 48049
iqobject 97238
matahari 49000
isnetserv 96256
blp5 96258

11）多维数组

awk的多维数组，实际上awk并不支持多维数组，而是逻辑上模拟二维数组的访问方式，比如a[a,b]=1，使用SUBSEP（默认\034）作为分隔下标字段，存储后是这样a\034b。

示例：

[root@ chenc01 ~]# awk 'BEGIN{a["x","y"]=123;for(v in a) print v,a[v]}'
xy 123

我们可以重新复制SUBSEP变量，改变下标默认分隔符：

[root@ chenc01 ~]# awk 'BEGIN{SUBSEP=":";a["x","y"]=123;for(v in a) print v,a[v]}'
x:y 123

根据指定的字段统计出现次数：

[root@ chenc01 ~]# cat file
A 192.168.1.1 HTTP
B 192.168.1.2 HTTP
B 192.168.1.2 MYSQL
C 192.168.1.1 MYSQL
C 192.168.1.1 MQ
D 192.168.1.4 NGINX

[root@ chenc01 ~]# awk 'BEGIN{SUBSEP="-"}{a[$1,$2]++}END{for(v in a)print a[v],v}' file
1 D-192.168.1.4
1 A-192.168.1.1
2 C-192.168.1.1
2 B-192.168.1.2

7、内置函数

函数	描述
int(expr)	截断为整数
sqrt(expr)	平方根
rand()	返回一个随机数N，0和1范围，0 < N < 1
srand([expr])	使用expr生成随机数，如果不指定，默认使用当前时间为种子，如果前面有种子则使用生成随机数
asort(a, b)	对数组a的值进行排序，把排序后的值存到新的数组b中，新排序的数组下标从1开始
asorti(a,b)	对数组a的下标进行排序，同上
sub(r, s [, t])	对输入的记录用s替换r正则匹配，t可选针对某字段替换，但只替换第一个字符串
gsub(r, s [, t])	对输入的记录用s替换r正则匹配，t可选针对某字段替换，否则替换所有字符串
gensub(r, s, h [, t])	对输入的记录用s替换r正则匹配，h替换指定索引位置
index(s, t)	返回s中字符串t的索引位置，0为不存在
length([s])	返回s的长度
match(s, r [, a])	测试字符串s是否包含匹配r的字符串，如果不包含返回0
split(s, a [, r [, seps] ])	根据分隔符seps将s分成数组a
substr(s, i [, n])	截取字符串s从i开始到长度n，如果n没指定则是剩余部分
tolower(str)	str中的所有大写转换成小写
toupper(str)	str中的所有小写转换成大写
systime()	当前时间戳
strftime([format [, timestamp[, utc-flag]]])	格式化输出时间，将时间戳转为字符串

示例：

1）int()

截断为整数：
[root@ chenc01 ~]# echo -e "123abc\nabc123\n123abc123" | awk '{print int($0)}'
123
0
123

[root@ chenc01 ~]# awk 'BEGIN{print int(10/3)}'
3

2）sqrt()

获取9的平方根：
[root@ chenc01 ~]# awk 'BEGIN{print sqrt(9)}'
3

3）rand()和srand()

rand()并不是每次运行就是一个随机数，会一直保持一个不变：
[root@ chenc01 ~]# awk 'BEGIN{print rand()}'
0.237788

当执行srand()函数后，rand()才会发生变化，所以一般在awk着两个函数结合生成随机数，但是也有很大几率生成一样：

[root@ chenc01 ~]# awk 'BEGIN{srand();print rand()}'
0.31687

如果想生成1-10的随机数可以这样：

[root@ chenc01 ~]# awk 'BEGIN{srand();print int(rand()*10)}'
4

如果想更完美生成随机数，还得做相应的处理！

4）asort()和asorti()

排序数组：
[root@ chenc01 ~]# seq -f "str%.g" 5 |awk '{a[x++]=$0}END{s=asort(a,b);for(i=1;i<=s;i++)print b[i],i}'       
str1 1
str2 2
str3 3
str4 4
str5 5

[root@ chenc01 ~]# seq -f "str%.g" 5 |awk '{a[x++]=$0}END{s=asorti(a,b);for(i=1;i<=s;i++)print b[i],i}' 
0 1
1 2
2 3
3 4
4 5

asort将a数组的值放到数组b，a下标丢弃，并将数组b的总行号赋值给s，新数组b下标从1开始，然后遍历。

5）sub()和gsub()

替换正则匹配的字符串：

[root@ chenc01 ~]# tail /etc/services |awk '/blp5/{sub(/tcp/,"icmp");print $0}'
blp5      48129/icmp        # Bloomberg locator
blp5      48129/udp         # Bloomberg locator

[root@ chenc01 ~]# tail /etc/services |awk '/blp5/{gsub(/c/,"9");print $0}'
blp5      48129/t9p         # Bloomberg lo9ator
blp5      48129/udp         # Bloomberg lo9ator

[root@ chenc01 ~]# echo "1 2 2 3 4 5" |awk 'gsub(2,7,$2){print $0}'
1 7 2 3 4 5

[root@ chenc01 ~]# echo "1 2 3 a b c" |awk 'gsub(/[0-9]/, '0'){print $0}'  
0 0 0 a b c

在指定行前后加一行：

[root@ chenc01 ~]# seq 5 | awk 'NR==2{sub('/.*/',"txt\n&")}{print}'
1
txt
2
3
4
5

[root@ chenc01 ~]# seq 5 | awk 'NR==2{sub('/.*/',"&\ntxt")}{print}'
1
2
txt
3
4
5

6）index()

获取字段索引起始位置：
[root@ chenc01 ~]# tail -n 5 /etc/services |awk '{print index($2,"tcp")}'
7
0
7
0
7

7）length()

统计字段长度：
[root@ chenc01 ~]# tail -n 5 /etc/services |awk '{print length($2)}'
9
9
9
9
9

统计数组的长度：
[root@ chenc01 ~]# tail -n 5 /etc/services |awk '{a[$1]=$2}END{print length(a)}'
3

8）match

[root@ chenc01 ~]# echo "123abc#456cde 789aaa#234bbb 999aaa#aaabbb" |xargs  -n1 |awk '{print match($0,234)}'     
0
8
0

如果记录匹配字符串234，则返回索引位置，否则返回0。
那么，我们只想打印包含这个字符串的记录就可以这样：

[root@ chenc01 ~]# echo "123abc#456cde 789aaa#234bbb 999aaa#aaabbb" |xargs  -n1 |awk '{if(match($0,234)!=0)print $0}' 
789aaa#234bbb    

9）split()

切分记录为数组a：
[root@ chenc01 ~]# echo -e "123#456#789\nabc#cde#fgh" |awk '{split($0,a);for(v in a)print a[v],v}'
123#456#789 1
abc#cde#fgh 1
以#号切分记录为数据a：

[root@ chenc01 ~]# echo -e "123#456#789\nabc#cde#fgh" |awk '{split($0,a,"#");for(v in a)print a[v],v}'
123 1
456 2
789 3
abc 1
cde 2
fgh 3

10）substr()

截取字符串索引4到最后：
[root@ chenc01 ~]# echo -e "123#456#789\nabc#cde#fgh" |awk '{print substr($0,4)}'           
#456#789
#cde#fgh

截取字符串索引4到长度5：
[root@ chenc01 ~]# echo -e "123#456#789\nabc#cde#fgh" |awk '{print substr($0,4,5)}'
#456#
#cde#

11）tolower()和toupper()

转换小写：
[root@ chenc01 ~]# echo -e "123#456#789\nABC#cde#fgh" |awk '{print tolower($0)}'
123#456#789
abc#cde#fgh

转换大写：
[root@ chenc01 ~]# echo -e "123#456#789\nabc#cde#fgh" |awk '{print toupper($0)}'
123#456#789
ABC#CDE#FGH

12)时间处理

返回当前时间戳：
[root@ chenc01 ~]# awk 'BEGIN{print systime()}'
1483297766

将时间戳转为日期和时间
[root@ chenc01 ~]# echo "1483297766" |awk '{print strftime("%Y-%m-%d %H:%M:%S",$0)}'      
2017-01-01 14:09:26

8、I/O语句

语句	描述
getline	读取下一个输入记录设置给$0
getline var	读取下一个输入记录并赋值给变量var
command \| getline [var]	运行Shell命令管道输出到$0或var
next	停止当前处理的输入记录后面动作
print	打印当前记录
printf fmt, expr-list	格式化输出
printf fmt, expr-list >file	格式输出和写到文件
system(cmd-line)	执行命令和返回状态
print … >> file	追加输出到文件
print … \| command	打印输出作为命令输入

示例：

1）getline

获取匹配的下一行：
[root@ chenc01 ~]# seq 5 |awk '/3/{getline;print}'
4

[root@ chenc01 ~]# seq 5 |awk '/3/{print;getline;print}'
3
4

在匹配的下一行加个星号：
[root@ chenc01 ~]# seq 5 |awk '/3/{getline;sub(".*","&*");print}'
4*

[root@ chenc01 ~]# seq 5 |awk '/3/{print;getline;sub(".*","&*")}{print}'
1
2
3
4*
5

2）getline var

把a文件的行追加到b文件的行尾：
[root@ chenc01 ~]# cat a
a
b
c

[root@ chenc01 ~]# cat b
1 one
2 two
3 three

[root@ chenc01 ~]# awk '{getline line<"a";print $0,line}' b   
1 one a
2 two b
3 three c

把a文件的行替换b文件的指定字段：

[root@ chenc01 ~]# awk '{getline line<"a";gsub($2,line,$2);print}' b  
1 a
2 b
3 c

把a文件的行替换b文件的对应字段：

[root@ chenc01 ~]# awk '{getline line<"a";gsub("two",line,$2);print}' b   
1 one
2 b
3 three

3）command | getline [var]

获取执行shell命令后结果的第一行：
[root@ chenc01 ~]# awk 'BEGIN{"seq 5"|getline var;print var}'
1

循环输出执行shell命令后的结果：
[root@ chenc01 ~]# awk 'BEGIN{while("seq 5"|getline)print}'
1
2
3
4
5

4）next

不打印匹配行：
[root@ chenc01 ~]# seq 5 |awk '{if($0==3){next}else{print}}'
1
2
4
5

删除指定行：
[root@ chenc01 ~]# seq 5 |awk 'NR==1{next}{print $0}'
2
3
4
5

如果前面动作成功，就遇到next，后面的动作不再执行，跳过。
或者：
[root@ chenc01 ~]# seq 5 |awk 'NR!=1{print}' 
2
3
4
5

把第一行内容放到每行的前面：
[root@ chenc01 ~]# cat a
hello 
1 a
2 b
3 c

[root@ chenc01 ~]# awk 'NR==1{s=$0;next}{print s,$0}' a  
hello  1 a
hello  2 b
hello  3 c

[root@ chenc01 ~]# awk 'NR==1{s=$0}NF!=1{print s,$0}' a   
hello  1 a
hello  2 b
hello  3 c

5）system()

执行shell命令判断返回值：
[root@ chenc01 ~]# awk 'BEGIN{if(system("grep root /etc/passwd &>/dev/null")==0)print "yes";else print "no"}'
yes

6）打印结果写到文件

[root@ chenc01 ~]# tail -n5 /etc/services |awk '{print $2 > "a.txt"}'
[root@ chenc01 ~]# cat a.txt
48049/tcp
48128/tcp
48128/udp
48129/tcp
48129/udp

7）管道连接shell命令

将结果通过grep命令过滤：
[root@ chenc01 ~]# tail -n5 /etc/services |awk '{print $2|"grep tcp"}'
48556/tcp
48619/tcp
49000/tcp

9、printf语句

格式化输出，默认打印字符串不换行。

格式：printf [format] arguments

Format	描述
%s	一个字符串
%d，%i	一个小数
%f	一个浮点数
%.ns	输出字符串，n是输出几个字符
%m.nf	输出浮点数，m是输出整数位数，n是输出的小数位数
%x	不带正负号的十六进制，使用a至f表示10到15
%X	不带正负号的十六进制，使用A至F表示10至15
%%	输出单个%
%-5s	左对齐，对参数每个字段左对齐,宽度为5
%-4.2f	左对齐，宽度为4，保留两位小数
%5s	右对齐，不加横线表示右对齐

示例：

将换行符换成逗号：
[root@ chenc01 ~]# seq 5 |awk '{if($0!=5)printf "%s,",$0;else print $0}' 
1,2,3,4,5

小括号中的5是最后一个数字。
输出一个字符：
[root@ chenc01 ~]# awk 'BEGIN{printf "%.1s\n","abc"}'    
a

保留一个小数点：
[root@ chenc01 ~]# awk 'BEGIN{printf "%.2f\n",10/3}'
3.33

格式化输出：
[root@ chenc01 ~]# awk 'BEGIN{printf "user:%s\tpass:%d\n","abc",123}'
user:abc    pass:123

左对齐宽度10：
[root@ chenc01 ~]# awk 'BEGIN{printf "%-10s %-10s %-10s\n","ID","Name","Passwd"}'
ID     Name    Passwd

右对齐宽度10：
[root@ chenc01 ~]# awk 'BEGIN{printf "%10s %10s %10s\n","ID","Name","Passwd"}'  
     ID    Name   Passwd

打印表格：
[root@ chenc01 ~]# vi test.awk
BEGIN{
print "+--------------------+--------------------+";
printf "|%-20s|%-20s|\n","Name","Number";
print "+--------------------+--------------------+";
}

[root@ chenc01 ~]# awk -f test.awk
+--------------------+--------------------+
|Name         |Number        |
+--------------------+--------------------+
格式化输出：
[root@ chenc01 ~]# awk -F: 'BEGIN{printf "UserName\t\tShell\n-----------------------------\n"}{printf "%-20s %-20s\n",$1,$7}END{print "END...\n"}' /etc/passwd

打印十六进制：
[root@ chenc01 ~]# awk 'BEGIN{printf "%x %X",123,123}'
7b 7B

10、自定义函数

格式：function name(parameter list) { statements }

示例：
[root@ chenc01 ~]# awk 'function myfunc(a,b){return a+b}BEGIN{print myfunc(1,2)}'   
3

11、需求案例

1）分析Nginx日志

日志格式：'$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for"'

统计访问IP次数：
[root@ chenc01 ~]# awk '{a[$1]++}END{for(v in a)print v,a[v]}' access.log

统计访问访问大于100次的IP：
[root@ chenc01 ~]# awk '{a[$1]++}END{for(v in a){if(a[v]>100)print v,a[v]}}' access.log 

统计访问IP次数并排序取前10：
[root@ chenc01 ~]# awk '{a[$1]++}END{for(v in a)print v,a[v] |"sort -k2 -nr |head -10"}' access.log

统计时间段访问最多的IP：
[root@ chenc01 ~]# awk '$4>="[02/Jan/2017:00:02:00" && $4<="[02/Jan/2017:00:03:00"{a[$1]++}END{for(v in a)print v,a[v]}' access.log

统计上一分钟访问量：
[root@ chenc01 ~]# date=$(date -d '-1 minute' +%d/%d/%Y:%H:%M)
[root@ chenc01 ~]# awk -vdate=$date '$4~date{c++}END{print c}' access.log

统计访问最多的10个页面：
[root@ chenc01 ~]# awk '{a[$7]++}END{for(v in a)print v,a[v] |"sort -k1 -nr|head -n10"}' access.log

统计每个URL数量和返回内容总大小：
[root@ chenc01 ~]# awk '{a[$7]++;size[$7]+=$10}END{for(v in a)print a[v],v,size[v]}' access.log

统计每个IP访问状态码数量：
[root@ chenc01 ~]# awk '{a[$1" "$9]++}END{for(v in a)print v,a[v]}' access.log

统计访问IP是404状态次数：
[root@ chenc01 ~]# awk '{if($9~/404/)a[$1" "$9]++}END{for(i in a)print v,a[v]}' access.log

2）两个文件对比

找出b文件在a文件相同记录：
[root@ chenc01 ~]# seq 1 5 > a
[root@ chenc01 ~]# seq 3 7 > b
方法1：
[root@ chenc01 ~]# awk 'FNR==NR{a[$0];next}{if($0 in a)print $0}' a b 
3
4
5

[root@ chenc01 ~]# awk 'FNR==NR{a[$0];next}{if($0 in a)print FILENAME,$0}' a b
b 3
b 4
b 5

[root@ chenc01 ~]# awk 'FNR==NR{a[$0]}NR>FNR{if($0 in a)print $0}' a b  
3
4
5

[root@ chenc01 ~]# awk 'FNR==NR{a[$0]=1;next}(a[$0]==1)' a b  # a[$0]是通过b文件每行获取值，如果是1说明有
[root@ chenc01 ~]# awk 'FNR==NR{a[$0]=1;next}{if(a[$0]==1)print}' a b
3
4
5

方法2：
[root@ chenc01 ~]# awk 'FILENAME=="a"{a[$0]}FILENAME=="b"{if($0 in a)print $0}' a b
3
4
5

方法3：
[root@ chenc01 ~]# awk 'ARGIND==1{a[$0]=1}ARGIND==2 && a[$0]==1' a b   
3
4
5

找出b文件在a文件不同记录：

方法1：
[root@ chenc01 ~]# awk 'FNR==NR{a[$0];next}!($0 in a)' a b       
6
7

[root@ chenc01 ~]# awk 'FNR==NR{a[$0]=1;next}(a[$0]!=1)' a b
[root@ chenc01 ~]# awk 'FNR==NR{a[$0]=1;next}{if(a[$0]!=1)print}' a b
6
7

方法2：
[root@ chenc01 ~]# awk 'FILENAME=="a"{a[$0]=1}FILENAME=="b" && a[$0]!=1' a b

方法3：
[root@ chenc01 ~]# awk 'ARGIND==1{a[$0]=1}ARGIND==2 && a[$0]!=1' a b 

3）合并两个文件

将a文件合并到b文件：
[root@ chenc01 ~]# cat a
zhangsan 20
lisi 23
wangwu 29

[root@ chenc01 ~]# cat b
zhangsan man
lisi woman
wangwu man

[root@ chenc01 ~]# awk 'FNR==NR{a[$1]=$0;next}{print a[$1],$2}' a b
zhangsan 20 man
lisi 23 woman
wangwu 29 man

[root@ chenc01 ~]# awk 'FNR==NR{a[$1]=$0}NR>FNR{print a[$1],$2}' a b     
zhangsan 20 man
lisi 23 woman
wangwu 29 man

将a文件相同IP的服务名合并：

[root@ chenc01 ~]# cat a
192.168.1.1: httpd
192.168.1.1: tomcat
192.168.1.2: httpd
192.168.1.2: postfix
192.168.1.3: mysqld
192.168.1.4: httpd

[root@ chenc01 ~]# awk 'BEGIN{FS=":";OFS=":"}{a[$1]=a[$1] $2}END{for(v in a)print v,a[v]}' a  
192.168.1.4: httpd
192.168.1.1: httpd tomcat
192.168.1.2: httpd postfix
192.168.1.3: mysqld

说明：数组a存储是$1=a[$1] $2，第一个a[$1]是以第一个字段为下标，值是a[$1] $2，也就是$1=a[$1] $2，值的a[$1]是用第一个字段为下标获取对应的值，但第一次数组a还没有元素，那么a[$1]是空值，此时数组存储是192.168.1.1=httpd，再遇到192.168.1.1时，a[$1]通过第一字段下标获得上次数组的httpd，把当前处理的行第二个字段放到上一次同下标的值后面，作为下标192.168.1.1的新值。此时数组存储是192.168.1.1=httpd tomcat。每次遇到相同的下标（第一个字段）就会获取上次这个下标对应的值与当前字段并作为此下标的新值。

4）将第一列合并到一行
[root@ chenc01 ~]# cat file
1 2 3
4 5 6
7 8 9

[root@ chenc01 ~]# awk '{for(i=1;i<=NF;i++)a[i]=a[i]$i" "}END{for(v in a)print a[v]}' file   
1 4 7
2 5 8
3 6 9

说明：
for循环是遍历每行的字段，NF等于3，循环3次。

读取第一行时：
第一个字段：a[1]=a[1]1" "  值a[1]还未定义数组，下标也获取不到对应的值，所以为空，因此a[1]=1 。
第二个字段：a[2]=a[2]2" "  值a[2]数组a已经定义，但没有2这个下标，也获取不到对应的值，为空，因此a[2]=2 。
第三个字段：a[3]=a[3]3" "  值a[2]与上面一样，为空,a[3]=3 。

读取第二行时：
第一个字段：a[1]=a[1]4" "  值a[2]获取数组a的2为下标对应的值，上面已经有这个下标了，对应的值是1，因此a[1]=1 4
第二个字段：a[2]=a[2]5" "  同上，a[2]=2 5
第三个字段：a[3]=a[3]6" "  同上，a[2]=3 6

读取第三行时：
处理方式同上，数组最后还是三个下标，分别是1=1 4 7，2=2 5 8，3=3 6 9。最后for循环输出所有下标值。

5）字符串拆分，统计出现的次数

字符串拆分：
方法1：
[root@ chenc01 ~]# echo "hello world" |awk -F '' '{print $1}'
h

[root@ chenc01 ~]# echo "hello" |awk -F '' '{for(i=1;i<=NF;i++)print $i}'   
h
e
l
l
o

方法2：
[root@ chenc01 ~]# echo "hello" |awk '{split($0,a,"''");for(v in a)print a[v]}'
l
o
h
e
l

统计字符串中每个字母出现的次数：

[root@ chenc01 ~]# echo "a.b.c,c.d.e" |awk -F '[.,]' '{for(i=1;i<=NF;i++)a[$i]++}END{for(v in a)print v,a[v]}'
a 1
b 1
c 2
d 1
e 1

6）统计平均成绩

[root@ chenc01 ~]# cat file
job 80
dave 84
tom 75
dave 73
job 72
tom 83
dave 88

[root@ chenc01 ~]# awk '{a[$1]+=$2;b[$1]++}END{for(i in a)print i,a[i]/b[i]}' file
job 76
dave 81.6667
tom 79

7）费用统计

[root@ chenc01 ~]# cat file
zhangsan 8000 1
zhangsan 5000 1
lisi 1000 1
lisi 2000 1
wangwu 1500 1
zhaoliu 6000 1
zhaoliu 2000 1
zhaoliu 3000 1

[root@ chenc01 ~]# awk '{name[$1]++;cost[$1]+=$2;number[$1]+=$3}END{for(v in name)print v,cost[v],number[v]}' file
zhangsan 5000 1
lisi 3000 2
wangwu 1500 1
zhaoliu 11000 3

8）获取数字字段最大值
[root@ chenc01 ~]# cat file
a b 1
c d 2
e f 3
g h 3
i j 2

获取第三字段最大值：
[root@ chenc01 ~]# awk 'BEGIN{max=0}{if($3>max)max=$3}END{print max}' file
3

打印第三字段最大行：
[root@ chenc01 ~]# awk 'BEGIN{max=0}{a[$0]=$3;if($3>max)max=$3}END{for(v in a)print v,a[v],max}' a
g h 3 3 3
e f 3 3 3
c d 2 2 3
a b 1 1 3
i j 2 2 3

[root@ chenc01 ~]# awk 'BEGIN{max=0}{a[$0]=$3;if($3>max)max=$3}END{for(v in a)if(a[v]==max)print v}' a
gh 3
e f 3

9）去除第一行和最后一行
[root@ chenc01 ~]# seq 5 |awk 'NR>2{print s}{s=$0}'
2
3
4

读取第一行，NR=1，不执行print s，s=1
读取第二行，NR=2，不执行print s，s=2 （大于为真） 
读取第三行，NR=3，执行print s，此时s是上一次p赋值内容2，s=3
最后一行，执行print s，打印倒数第二行，s=最后一行
获取Nginx负载均衡配置端IP和端口：

[root@ chenc01 ~]# cat nginx.conf
upstream example-servers1 {
  server 127.0.0.1:80 weight=1 max_fails=2 fail_timeout=30s;
}

upstream example-servers2 {
  server 127.0.0.1:80 weight=1 max_fails=2 fail_timeout=30s;
  server 127.0.0.1:82 backup;
}

[root@ chenc01 ~]# awk '/example-servers1/,/}/{if(NR>2){print s}{s=$2}}' nginx.conf  
127.0.0.1:80
[root@ chenc01 ~]# awk '/example-servers1/,/}/{if(i>1)print s;s=$2;i++}' nginx.conf  
[root@ chenc01 ~]# awk '/example-servers1/,/}/{if(i>1){print s}{s=$2;i++}}' nginx.conf
127.0.0.1:80

读取第一行，i初始值为0，0>1为假，不执行print s，x=example-servers1，i=1
读取第二行，i=1，1>1为假，不执行print s，s=127.0.0.1:80,i=2
读取第三行，i=2，2>1为真，执行print s，此时s是上一次s赋值内容127.0.0.1:80，i=3
最后一行，执行print s，打印倒数第二行，s=最后一行。
这种方式与上面一样，只是用i++作为计数器。

10）知道上述方式，就可以实现这种需求了，打印匹配行的上一行

[root@ chenc01 ~]# seq 5 |awk '/3/{print s}{s=$0}'
2

你可能感兴趣的:(Shell)

python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Shell、Bash、Zsh这都是啥啊小白码上飞 bash linux 开发语言
Zsh和Bash都是我们常用的Shell，那先搞明白啥是shell吧。Shell作为一个单词，他是“壳”的意思，蛋壳坚果壳。之所以叫壳，是为了和计算机的“核”来区分，用它表示“为使用者提供的操作界面”。所以这个命名其实很形象，翻译成中文，直译过来叫“壳层”。个人认为这个叫法很奇怪，意译貌似也没有什么好的词汇来匹配。就还是叫shell吧。维基百科给的定义是：Incomputing,ashellisa
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
简单说说关于shell中zsh和bash的选择秋刀prince MacOS 小猿们的开发日常 bash
希望文章能给到你启发和灵感～如果觉得文章对你有帮助的话，点赞+关注+收藏支持一下博主吧～阅读指南开篇说明一、基础环境说明1.1硬件环境1.2软件环境二、什么是shell、bash、zsh?2.1bash2.2zsh三、选择Bash还是Zsh？四、一些常见问题开篇说明本篇主要简单说明一下，shell中bash和zsh的区别和选择；我们经常会把这两个搞混，不知道什么时候用哪一个，以及怎么使用；一、基础
python结束子进程_如何清除python中的子进程 weixin_39995943 python结束子进程
我们使用python进程来管理长时间运行的python子进程。有时需要终止子进程。kill命令不会完全终止进程，只会使其失效。运行以下脚本将演示此行为。importsubprocessp=subprocess.Popen(['sleep','400'],stdout=subprocess.PIPE,shell=False)或者p=subprocess.Popen('sleep400',stdout
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
Shell脚本中sed使用 jcrhl321 linux
目录一、sed编辑器1、sed概述2、sed的工作流程3、sed命令的常见格式4、sed命令常用操作二、sed常用命令使用1、sed打印2、sed删除3、sed替换4、sed插入与增加4、sed剪切粘贴与复制粘贴一、sed编辑器sed（StreamEDitor）是一个强大而简单的文本解析转换工具，可以读取文本，并根据指定的条件对文本内容进行编辑（删除、替换、添加、移动等），最后输出所有行或者仅输出
shell脚本中sed命令如何使用变量歪歪的酒壶 linux
在shell脚本中我们常常需要使用sed命令进行配置文件的更新，但是更新的内容又往往根据环境相关。值并不是固定的。这里我们介绍一种在sed命令中使用变量的方法。比如，在nginx的配置中，我们需要根据环境来更新/etc/nginx/sites-available/default中的目录配置。通常我们采用一个变量，来记录当前环境需要配置的目录比如：dist_dir=/home/dev/code/ui
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【显示后台运行 & 的命令】晨春计 debug linux 服务器运维
目录背景步骤详解示例背景当你在Linuxshell中使用&符号将一个命令放到后台运行时，你可以使用jobs命令来查看这些后台进程的状态。但是，jobs命令并不会直接显示进程的PID（进程ID）。它会显示一个作业列表，其中包括每个作业的状态和一个作业标识符（通常是百分号%后面跟着一个数字），但不会直接显示PID。获取后台进程的PID步骤：1、使用jobs命令查看后台作业。2、使用ps命令配合grep
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
Ubuntu常用命令整理十里染林
ubuntu16.04server开启ssh:使用x-shell连接主机，发现22端口没有打开，开启ssh服务：安装openssh-serversudoapt-getinstallopenssh-server检查安装是否成功sudops-e|grepssh开启ssh服务sudoservicesshstartUbuntu开启/关闭防火墙:开启防火墙sudoufwenable关闭防火墙sudoufwd
CentOS7 安装MySQL5.7.44 不要Null了 java centos mysql
1.下载mysql安装包，我放在百度网盘里(下方链接)链接：https://pan.baidu.com/s/1_Mn1XW_1mWdTV4mhnLG66A提取码：s31n2.首先看看以前是否安装过mysqlrpm-qa|grep-imysql如果已经安装过mysql会提示卸载mysqlrpm-emysql-…3.使用FinallShell或者Xftp进行上传放到/usr/local/mysql，没
Python实现mysql命令行 xu-jssy python mysql adb
一、源码importosimportpymysqldefsql_shell():password=input("EnterPassword:")#访问密码ifpassword.strip()!="yyds":print("Bye")return#清空控制台输出os.system("cls"ifos.name=="nt"else"clear")try:#连接到MySQL数据库conn=pymysql
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
华为USG6000E-S12防火墙Key exchange failed.无法SSH解决方案 redmond88 网络技术 ssh 华为运维
由于目前防火墙算法太新，导致crt和xshell的版本无法登陆，按以下方法解决一、下载华为本地加载除弱安全算法组件包之外的组件包https://download.csdn.net/download/redmond88/89620664?spm=1001.2014.3001.5503二、先改后缀名为.cfg,上传文件到防火墙三、在用户视图下改后缀名为.mod四、move文件到$_install_mo
Mac配置环境变量的地方哪个鹿
Mac配置环境变量的地方①/etc/profile（建议不修改这个文件）全局（公有）配置，不管是哪个用户，登录时都会读取该文件。②/etc/bashrc（一般在这个文件中添加系统级环境变量）全局（公有）配置，bashshell执行时，不管是何种方式，都会读取此文件。③~/.bash_profile（一般在这个文件中添加用户级环境变量）每个用户都可使用该文件输入专用于自己使用的shell信息,当用户
docker 安装、运行nginx shell脚本三希 docker nginx 容器
以下是一个简单的用于安装和运行DockerNginx的shell脚本：bash#!/bin/bash#安装Docker（如果还未安装）#请根据实际情况调整安装命令#拉取Nginx镜像dockerpullnginx#运行Nginx容器dockerrun-d--namemynginx-p80:80nginx
mysql 隐秘后门_【技术分享】CVE-2016-5483：利用mysqldump备份可生成后门 Toby Dai mysql 隐秘后门
预估稿费：100RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿前言mysqldump是用来创建MySQL数据库逻辑备份的一个常用工具。它在默认配置下可以生成一个.sql文件，其中包含创建/删除表和插入数据等。在导入转储文件的时候，攻击者可以通过制造恶意表名来实现任意SQL语句查询和shell命令执行的目的。另一个与之相关的漏洞利用场景可以参考。攻击场景攻击者已经能够访问
docker项目切换（nginx）、重启shell 脚本懒惰的小蜗牛 docker docker nginx 容器
docker项目切换、重启脚本背景具体操作nginx配置配置文件1配置文件2编写nginx替换脚本(用来执行端口替换)编写启动脚本dockerfile文件正常编写给脚本授权执行./start脚本背景项目部署docker中，更新项目时，需要将原原来的容器停止，再启动新的容器，这样会有一个空窗期，导致不可用解决方案：映射不同的端口并启动新的容器，将nginx转发到新容器，停止旧容器具体操作说明ngin
FastCGI结合docker下的Nginx执行shell脚本南波波 nginx docker
1使用docker下载Nginx下面展示一些内联代码片。a.#dockerpullnginx#dockerrun--namerunoob-php-nginx-p8088:80-d\-v~/nginx/www:/usr/share/nginx/html:ro\-v~/nginx/conf/conf.d:/etc/nginx/conf.d:ro\nginxb.在~/nginx/conf/conf.d创
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
【LINUX】SHELL贪吃蛇缘起性本空 java 前端服务器
MapHeight=19MapWidth=17SnakeLength=3SnakeX=(234)SnakeY=(555)MoveDirection="Right"Food=(714)Map=(11111111111111111119100000000000000000191000000000000000001910000000000000000019100000000000000000191000
bat批处理循环执行adb命令 erhtre 程序员 adb
ping-n2127.0>nul等待2s:one::adbshellinputswipe90010007001000adbshellinputkeyevent25%KEYCODE_VOLUME_DOWN%ping-n2127.0>nulgototwo:twoadbshellinputkeyevent25%KEYCODE_VOLUME_DOWN%ping-n3127.0>nulgotoone附：An
【YashanDB知识库】YashanDB 开机自启 YashanDB YashanDB知识库数据库数据库系统崖山数据库 YashanDB oracle
【问题分类】YashanDB开机自启【关键字】开机自启，依赖包【问题描述】数据库所在服务器重启后只拉起monit、yasom、yasom进程，缺少yasdb进程：【问题原因分析】数据库安装的时候未启动守护进程【解决/规避方法】进入数据库之前的安装目录，启动守护进程：Shellcd/home/yashan/install./bin/yasbootmonitstart--clusteryashandb
详解 Pandas 的 query 函数文刀小桂 Pandas pandas python 开发语言
Pandas的query()方法能够使用字符串表达式来筛选DataFrame数据的行，类似于SQL的where子句importpandasaspddf=pd.DataFrame({"A":[1,3,5,6,7],"B":[11,10,9,8,12],"C":["hello","pandas","python","java","shell"],"D":["2024-02-01","2023-12-1
【ADB】adb、shell的介绍 "啦啦啦" adb shell adb shell
目录adb命令和shell命令的关系adb命令shell命令shell脚本shell脚本运行的环境是什么.sh脚本和.bat脚本有什么区别这两个脚本使用的命令和语法是一样的吗adb命令和shell命令的关系ADB（AndroidDebugBridge）命令和Shell命令都是用于与操作系统交互的命令行工具，但它们的使用环境和目标设备不同。ADB是一种调试工具，主要用于从计算机连接和操作Androi
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f