gawk学习笔记

    gawk和sed,grep是linux中文本处理三剑客,功能异常强大,可以把它当做一门独立的编程语言使用,之前的博客中已经描述了grep和sed的使用方法,下面描述gawk

基本用法:gawk [options] 'program' FILE ...
    program: PATTERN{ACTION STATEMENTS}
    语句之间用分号分隔
    print, printf
    选项:
        -F:指明输入时用到的字段分隔符;
        -v var=value: 自定义变量;

1、print
    print item1, item2, ...
    要点:
    (1) 逗号分隔符;
    (2) 输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式;

wKiom1YCnP3TElqDAABmmlb_IlI679.jpg

注意:Awk中变量如果想替换不可以用引号

wKioL1YCnP7yRKMVAACq7cZNE-s352.jpg

    (3) 如省略item,相当于print $0;

wKioL1YCnP7QreMiAADWT_3Hk_Q415.jpg

2、变量

    2.1 内建变量
        FS:input field seperator,默认为空白字符;

wKiom1YCnP2D5f0wAACeMDNulik226.jpg

        OFS:output field seperator,默认为空白字符;

wKiom1YCnP2AStQQAACltSwSz-I296.jpg

        RS:input record seperator,输入时的换行符;

wKiom1YCnQzCwIU5AAGUY6FZAKc038.jpg

        ORS:output record seperator,输出时的换行符;

        NF:number of field,字段数量
            {print NF}, {print $NF}

wKioL1YCnQ2i4NTPAAAqS3Fxv-s688.jpg

输出最后一段:

wKiom1YCnQyyqK4vAABocEJPmI8486.jpg

        NR:number of record, 行数;

wKioL1YCnQ3TiOc4AAAsehC7F5Y421.jpg

        FNR:各文件分别计数;行数;

wKioL1YCnQ7zG5IrAAA-05X_qac503.jpg

        FILENAME:当前文件名;

wKiom1YCnQyTh3QRAAB-LY3sNOU881.jpg

        ARGC:命令行参数的个数;

        ARGV:数组,保存的是命令行所给定的各参数;
wKiom1YCnr_RN_c9AAEeXGk4fL0125.jpg

    2.2 自定义变量
        (1) -v var=value
       变量名区分字符大小写;

wKioL1YCnx_gbN-TAAA1kuhM6Z4274.jpg

        (2) 在program中直接定义

wKioL1YCnx-inKUFAAAxYBfa5Ok728.jpg

3、printf命令
        格式化输出:printf FORMAT, item1, item2, ...
        (1) FORMAT必须给出;
        (2) 不会自动换行,需要显式给出换行控制符,\n
        (3) FORMAT中需要分别为后面的每个item指定一个格式化符号;
        格式符:将item中的信息使用格式刷定义了格式后输出
        %c: 显示字符的ASCII码;
        %d, %i: 显示十进制整数;

wKiom1YCofXzBWRsAACMK9eKOzI896.jpg

        %e, %E: 科学计数法数值显示;
        %f:显示为浮点数;
        %g, %G:以科学计数法或浮点形式显示数值;
        %s:显示字符串;

wKioL1YCofbQW0b1AABmKAG9y8Y294.jpg

        %u:无符号整数;
        %%: 显示%自身;   

    修饰符:
        #[.#]:第一个数字控制显示的宽度;第二个#表示小数点后的精度;
            例如:%3.1f代表宽度为3,精度为1
        -: 左对齐
        +:显示数值的符号

wKioL1YCofaSp7jDAACQ84eu6E4589.jpg

4、操作符
    算术操作符:
        x+y, x-y, x*y, x/y, x^y, x%y
        -x
        +x: 转换为数值;
    字符串操作符:没有符号的操作符---表示字符串连接
    赋值操作符:
        =, +=, -=, *=, /=, %=, ^=
        ++, --
    比较操作符:
        >, >=, <, <=, !=, ==
    模式匹配符:
        ~:是否匹配
        !~:是否不匹配
    逻辑操作符:
        &&
        ||
        !

    函数调用:
        function_name(argu1, argu2, ...)
    条件表达式:
        selector?if-true-expression:if-false-expression

wKioL1YCrd6j8GjXAACGGvDagXM685.jpg

5、PATTERN:地址定界
    (1) empty:空模式,匹配每一行;
    (2) /regular expression/:仅处理能够被此处的模式匹配到的行;

wKioL1YCr2_BYIkwAACO7AaqnAQ303.jpg

    (3) relational expression: 关系表达式;结果有“真”有“假”;结果为“真”才会被处理;
        真:结果为非0值,非空字符串都表示为真;

wKioL1YCr8LAuH2mAABDfay0foU980.jpg

    (4) line ranges:行范围,
        startline,endline:/pat1/,/pat2/
        注意: 不支持直接给出数字的格式

wKiom1YCr8HDAe8JAABC9eniOzs150.jpg

使用判断:

wKioL1YCsVDhIHHLAABYlBd96N4032.jpg

使用模式并判断:

wKioL1YCr8PTemS8AABbaA5dRkA816.jpg

    (5) BEGIN/END模式
        BEGIN{}: 仅在开始处理文件中的文本之前执行一次;
        END{}:仅在文本处理完成之后执行一次;

wKioL1YCr8OCPphYAAByorD86JQ175.jpg

7、控制语句
    if(condition) {statments}
    if(condition) {statments} else {statements}
    while(conditon) {statments}
    do {statements} while(condition)
    for(expr1;expr2;expr3) {statements}
    break
    continue
    delete array[index]
    delete array
    exit
    { statements }

7.1 if-else    使用场景:对awk取得的整行或某个字段做条件判断;

单分支:

wKiom1YCt4DiKwMDAABHeoqVrM8936.jpg

双分支:

wKioL1YCt4HCyy__AACNB9zx3k8704.jpg

仅输出字段数大于5的行

wKioL1YCubeD5NvWAAEAzZMuP44610.jpg

显示使用量大于20%的磁盘

wKioL1YCubeg7UvYAAA-byRRExM760.jpg

7.2 while循环
    语法:while(condition) statement
    条件“真”,进入循环;条件“假”,退出循环;

使用场景:对一行内的多个字段逐一类似处理时使用;对数组中的各元素逐一处理时使用

显示以空白和linux16开头的行的每一个字段包含的字符个数:

wKioL1YCu6XRevMeAAD7CEZUHe0271.jpg

显示以空白和linux16开头的行的每一个字段包含的字符个数,仅显示字符个数大于等于7的:

wKiom1YCvDfimXi0AADrFFH7ho4715.jpg

7.3 do-while循环
    语法:do statement while(condition)
    意义:至少执行一次循环体
7.4 for循环
    语法:for(expr1;expr2;expr3) statement

        for(variable assignment;condition;iteration process) {for-body}

wKioL1YCvXXRPHgvAAEDlAjEEmM803.jpg

特殊用法:
    能够使用变量遍历数组的下标从而处理数组中的元素;
    语法:for(var in array) {for-body}

7.5 switch语句
    语法:switch(expression) {case VALUE1 or /REGEXP/: statement; case VALUE2 or /REGEXP2/:     statement; ...; default: statement}

7.6 break和continue
    break [n]
    continue提前结束对本字段的处理而直接进入下一个字段
7.7 next
     提前结束对本行的处理而直接进入下一行;

wKioL1YCv76iYNsZAABkJ-HIkCc288.jpg


你可能感兴趣的:(grep,awk,sed,gawk)