yapian8

一个电影的时间掌握Awk（Linux）文本处理脚本语言

可以查看我用CmdMarkDown写的在线版，会比下面看起来舒服：在线分享版

Awk

Awk、sed与grep，俗称Linux下的三剑客，它们之前有很多相似点，但是同样也各有各的特色，相似的地方是它们都可以匹配文本，其中sed和awk还可以用于文本编辑，而grep则不具备这个功用。sed是一种非交互式且面向字符流的编辑器（a “non-interactive” stream-oriented editor），而awk则是一门模式匹配的编程语言，因为它的主要功能是用于匹配文本并处理，同时它有一些编程语言才有的语法，例如函数、分支循环语句、变量等等，当然比起我们常见的编程语言，Awk相对比较简单。

使用Awk，我们可以做以下事情：

将文本文件视为由字段和记录组成的文本数据库；
在操作文本数据库的过程中能够使用变量；
能够使用数学运算和字符串操作；
能够使用常见的编程结构，例如条件分支与循环；
能够格式化输出；
能够自定义函数；
能够在awk脚本中执行UNIX命令；
能够处理UNIX命令的输出结果；

awk的命令行语法也有两种形式：

  
  
  
  
   
   
   
   awk [-F ERE] [-v assignment] ... program [argument ...]
   
   
   
   awk [-F ERE] -f progfile ... [-v assignment] ...[argument ...]

将awk的脚本视为一段代码。而awk的脚本同样可以写到一个文件中，并通过-f参数指定。program一般由多个pattern和action序列组成，当读入的记录匹配pattern时，才会执行相应的action命令。这里有一点要注意，在第一种形式中，除去命令行选项外，program参数一定要位于第一个位置。

Awk的输入被解析成多个记录（Record），默认情况下，记录的分隔符是\n，因此可以认为一行就是一个记录，记录的分隔符可以通过内置变量RS更改。当记录匹配某个pattern时，才会执行后续的action命令。

内建标量变量：FILENAME - 当前输入文件的名称； FNR - 当前文件的记录数; FS - 字段分隔字符； NF - 当前记录的字段数； NR - 在工作中的记录数； OFS - 输出字段分隔字符； ORS - 输出记录分隔字符； RS - 输入记录分隔字符。

而每个记录由进一步地被分隔成多个字段（Field），默认情况下字段的分隔符是空白符，例如空格、制表符等等，也可以通过-F ERE选项或者内置变量FS更改。在awk中，可以通过$1，$2…来访问对应位置的字段，同时$0存放整个记录，这一点有点类似shell下的命令行位置参数。关于这些内容，我们会在下面详细介绍，这里你只要知道有这些东西就好。

标准的awk命令行参数主要由以下三个：

-F ERE：定义字段分隔符，该选项的值可以是扩展的正则表达式（ERE）；
-f progfile：指定awk脚本，可以同时指定多个脚本，它们会按照在命令行中出现的顺序连接在一起；
-v assignment：定义awk变量，形式同awk中的变量赋值，即name=value，赋值发生在awk处理文本之前；

通过-F参数设置冒号:为分隔符，并打印各个字段：

  
  
  
  
   
   
   
   $ echo "1:2:3" | awk -F: '{print $1 " and " $2 " and " $3}'
   
   
   
   1 and 2 and 3

在awk的脚本中访问通过-v选项设置的变量：

  
  
  
  
   
   
   
   $ echo | awk -v a=1 'BEGIN {print a}'
   
   
   
   1

从上面可以看到，通过-v选项设置的变量在BEGIN的位置就可以访问了。BEGIN是一个特殊的pattern，它在awk处理输入之前就会执行，这个时候内建的标量变量都没有值，因为文本还没有开始读入，可以认为是一个初始化语句，与此对应的还有END。

arguemnt有两种形式，它们分别是输入文件（file）和变量赋值（assignment）。

awk可以同时指定多个输入文件，如果输入文件的文件名为-，表示从标准输入读取内容。

变量赋值类似-v选项，它的形式为name=value。awk中的变量名同一般的编程语言无太多区别，但是不能同awk的保留关键字重名，可以查看awk的man手册查询哪些是保留关键字。而变量值只有两种形式：字符串和数值。变量赋值必须位于脚本参数的后面，与文件名参数无先后顺序的要求，但是位于不同位置的赋值它的执行时机是不同的。

用实际的例子来解释这个区别，假设有两个文件：a和b，它们的内容分别如下所示：

为了说明赋值操作发生的时机，我们在BEGIN，正常处理，END三个地方都打印变量的值。

第一种情况：变量赋值位于所有文件名参数之前

  
  
  
  
   
   
   
   $ awk 'BEGIN {print "BEGIN: " var} {print "PROCESS: " var} \
   
   
   
   END {print "END: " var }' var=1 a
   
   
   
   BEGIN:
   
   
   
   PROCESS: 1
   
   
   
   END: 1

结果：赋值操作发生在正常处理之前，BEGIN动作之后。

第二种情况：变量赋值位于所有文件名之后：

  
  
  
  
   
   
   
   $ awk 'BEGIN {print "BEGIN: " var} {print "PROCESS: " var} \
   
   
   
   END {print "END: " var }' a var=1 
   
   
   
   BEGIN:
   
   
   
   PROCESS:
   
   
   
   END: 1

结果：赋值操作发生在正常处理之后，END动作之前。

第三种情况：变量赋值位于文件名之间：

  
  
  
  
   
   
   
   $ awk 'BEGIN {print "BEGIN: " var} {print "PROCESS: " var} \
   
   
   
   END {print "END: " var }' a var=1 b
   
   
   
   BEGIN:
   
   
   
   PROCESS:
   
   
   
   PROCESS: 1
   
   
   
   END: 1

结果：赋值操作发生在处理前面的文件之后，并且位于处理后面的文件之前；

总结如下：

如果变量赋值在第一个文件参数之前，在BEGIN动作之后执行，影响到正常处理和END动作；
如果变量赋值在最后一个文件参数之后，在END动作之前执行，仅影响END动作；
如果文件参数不存在，情况同1所述；
如果变量赋值位于多个文件参数之间，在变量赋值前面的文件被处理后执行，影响到后续文件的处理和END动作；

所以变量赋值一定要考虑清楚用途，否则比较容易出错，不过一般情况下也不会用到变量赋值。

自然地大家会将变量赋值与-v assignment选项进行比较，赋值的形式是一致的，但是-v选项的执行时机比变量赋值要早：

  
  
  
  
   
   
   
   $ echo 1 | awk -v var=a 'BEGIN {print "BEGIN: " var}'
   
   
   
   BEGIN: a

可见，-v选项的赋值操作在BEGIN动作之前就执行了。

变量赋值一定要小心不要与保留关键字重名，否则会报错：

  
  
  
  
   
   
   
   $ echo 1 | awk -v BEGIN=1 'BEGIN {print "BEGIN: " BEGIN}'
   
   
   
   awk: fatal: cannot use gawk builtin `BEGIN' as variable name

记录（Record）与字段（Field)

对于数据库来说，一个数据库表是由多条记录组成的，每一行表示一条记录（Record）。每条记录由多列组成，每一列表示一个字段（Field)。Awk将一个文本文件视为一个文本数据库，因此它也有记录和字段的概念。默认情况下，记录的分隔符是回车，字段的分隔符是空白符，所以文本文件的每一行表示一个记录，而每一行中的内容被空白分隔成多个字段。利用字段和记录，awk就可以非常灵活地处理文件的内容。

可以通过-F选项来修改默认的字段分隔符，例如/etc/passwd的每一行都是由冒号分隔成多个字段的，所以这里就需要将分隔符设置成冒号：

  
  
  
  
   
   
   
   $ awk -F: '{print $1}' /etc/passwd | head -3
   
   
   
   root
   
   
   
   bin
   
   
   
   daemon

这里通过$1引用第一人字段，类似地$2表示第二个字段，$3表示第三个字段…. $0则表示整个记录。内置变量NF记录着字段的个数，所以$NF表示最后一个字段：

  
  
  
  
   
   
   
   $ awk -F: '{print $NF}' /etc/passwd | head -3 #最后一个字段
   
   
   
   /bin/bash
   
   
   
   /bin/false
   
   
   
   /bin/false

当然，$(NF-1)表示倒数第二个。

内置变量FS也可以用于更改字段分隔符，它记录着当前的字段分隔符：

  
  
  
  
   
   
   
   $ awk -F: '{print FS}' /etc/passwd | head -1
   
   
   
   :
   
   
   
   $ awk -v FS=: '{print $1}' /etc/passwd | head -1
   
   
   
   root

记录的分隔符可以通过内置变量RS更改：

  
  
  
  
   
   
   
   $ awk -v RS=: '{print $0}' /etc/passwd | head -1
   
   
   
   root

如果将RS设置成空，行为有就一点怪异了，它会将连续不为空行的所有行（一个段落）当作一个记录，而且强制回车为字段分隔符：

  
  
  
  
   
   
   
   $ cat awk_man.txt
   
   
   
   
   
   
   
   The awk utility shall execute programs written in the awk programming language,
   
   
   
   which is specialized for textual data manipulation. An awk program is a sequence
   
   
   
   of patterns and corresponding actions. When input is read that matches a
   
   
   
   pattern, the action associated with that pattern is carried out.
   
   
   
   
   
   
   
   Input shall be interpreted as a sequence of records. By default, a record is a line,
   
   
   
   less its terminating <newline>, but this can be changed by using the RS built-in
   
   
   
   variable. Each record of input shall be matched in turn against each pattern in the
   
   
   
   program. For each pattern matched, the associated action shall be executed.
   
   
   
   
   
   
   
   $ awk 'BEGIN {RS="";FS=":"} {print "First line: " $1}' awk_man.txt
   
   
   
   First line: The awk utility shall execute programs written in the awk programming language,
   
   
   
   First line: Input shall be interpreted as a sequence of records. By default, a record is a line,

这里，我们将变量赋值放到BEGIN动作中执行，因为BEGIN动作是在文件处理之前执行的，专门用于放初始化的语句。FS的赋值在这里是无效的，awk依然使用回车符来分隔字段。

脚本（Script）组成

命令行中的program部分，可以称为awk代码,也可以称为awk脚本。一段awk脚本是由多个pattern { action }序列组成的。action是一个或者多个语句，它在输入行匹配pattern的时候被执行。如果pattern为空，表明这个action会在每一行处理时都会被执行。下面的例子简单地打印文件的每一行，这里不带任何参数的print语句打印的是整个记录，类似print $0：

  
  
  
  
   
   
   
   $ echo -e 'line1\nline2' | awk '{print}'
   
   
   
   line1
   
   
   
   line2

除了pattern { action }，还可以在脚本中定义自定义的函数，函数定义格式如下所示：

function name(parameter list) { statements }

函数的参数列表用逗号分隔，参数默认是局部变量，无法在函数之外访问，而在函数中定义的变量为全局变量，可以在函数之外访问，如：

  
  
  
  
   
   
   
   $ echo line1 | awk '
   
   
   
   function t(a) {
   
   
   
    b=a;
   
   
   
    print a;
   
   
   
   }
   
   
   
   
   
   
   
   {
   
   
   
    print b;
   
   
   
    t("kodango.me");
   
   
   
    print b;
   
   
   
   }'
   
   
   
   
   
   
   
   kodango.me
   
   
   
   kodango.me

Awk脚本中的语句使用空行或者分号分隔，使用分号可以放在同一行，不过有时候会影响可读性，尤其是分支或循环结构中，很容易出错。

如果Awk中的一个语句太长，要分成多行，可以在行为使用反斜杠\：

  
  
  
  
   
   
   
   $ cat test.awk
   
   
   
   
   
   
   
   function t(a)
   
   
   
   {
   
   
   
    b=a
   
   
   
    print "This is a very long line, so use backslash to escape the newline \
   
   
   
   then we will print the variable a: a=" a
   
   
   
   }
   
   
   
   
   
   
   
   { print b; t("kodango.me"); print b;}
   
   
   
   
   
   
   
   $ echo 1 | awk -f test.awk
   
   
   
   
   
   
   
   This is a very long line, so use backslash to escape the newline then we will print the variable a: a=kodango.me
   
   
   
   kodango.me

这里我们将脚本写到文件中，并通过-f参数来指定。但是，在一些特殊符号之后，是可以直接换行的，例如, { && ||。

模式（Pattern）

模式是awk中比较重要的一部分，它有以下几种情况：

/regular expression/：扩展的正则表达式（Extended Regular Expression）
relational expression：关系表达式，例如大于、小于、等于，关系表达式结果为true表示匹配；
BEGIN：特殊的模式，在第一个记录处理之前被执行，常用于初始化语句的执行；
END：特殊的模式，在最后一个记录处理之前被执行，常用于输出汇总信息；
pattern, pattern：模式对，匹配两者之间的所有记录;

例如查找匹配数字3的行：

  
  
  
  
   
   
   
   $ seq 1 20 | awk '/3/ {print}'
   
   
   
   3
   
   
   
   13

相反地，可以在在正则表达式之前加上!表示不匹配：

$ seq 1 5 | awk '!/3/ {print}'

除了BEGIN和END这两个特殊的模式外，其余的模式都可以使用&&或者||运算符组合，前者表示逻辑与，后者表示逻辑或：

  
  
  
  
   
   
   
   $ seq 1 50 | awk '/3/ && /1/ {print}'
   
   
   
   13
   
   
   
   31

前面的正则都是整行匹配，有时候仅仅需要匹配某个字符，这样我们可以用表达式$n ~ /ere/：

  
  
  
  
   
   
   
   $ awk '$1 ~ /ko/ {print}' /etc/passwd #每一行的第一个字段匹配ko
   
   
   
   kodango:x:1000:1000::/home/kodango:/bin/bash

有时候我们只想显示特定和行，例如显示第一行：

$ seq 1 5 | awk 'NR==1 {print}'

数组

数组是一种特殊的变量，在awk中，比较特殊地是，数组的下标可以为数字或者字符串。数组的赋值很简单，下面将value赋值给数组下标为index的元素：

array[index]=value

可以用for..in..语法遍历数组元素，其中item是数组元素对应的下标(是随机遍历的)：

for (item in array)

当然也可以在if分支判断中使用in操作符：

if (item in array)

一个完整的例子如下所示：

  
  
  
  
   
   
   
   $ echo "1 2 3" | awk '{
   
   
   
   for (i=0;i<NF;i++)
   
   
   
    a[i]=i;
   
   
   
   }
   
   
   
   
   
   
   
   END {
   
   
   
   print 3 in a
   
   
   
   for (i in a)
   
   
   
    printf "%s: %s\n", i, a[i];
   
   
   
   }'
   
   
   
   0
   
   
   
   0: 0
   
   
   
   1: 1
   
   
   
   2: 2

内置变量

Awk在内部维护了许多内置变量，或者称为系统变量，例如之前提到的FS、RS等等。常见的内置变量如下表所示

变量名描述
ARGC 命令行参数的个数，即ARGV数组的长度
ARGV 存放命令行参数
CONVFMT 定义awk内部数值转换成字符串的格式，默认值为%.6g
OFMT 定义输出时数值转换成字符串的格式，默认值为%.6g
ENVIRON 存放系统环境变量的关联数组
NR 记录的总个数
FNR 当前文件中的记录的总个数
FS 字段分隔符，默认为空白
NF 每个记录中字段的个数
RS 记录的分隔符，默认为回车
OFS 输出时字段的分隔符，默认为空白
ORS 输出时记录的分隔符，默认为回车
RLENGTH 被match函数匹配的子串长度
RSTART 被match函数匹配的子串位于目标字符串的起始下标
1. ARGV与ARGC

ARGV与ARGC的意思比较好理解，就像C语言main(int argc, char **argv)。ARGV数组的下标从0开始到ARGC-1，它存放的是命令行参数，并且排除命令行选项（例如-v/-f）以及program部分。因此事实上ARGV只是存储argument的部分，即文件名（file）以及命令行变量赋值两部分的内容。

通过下面的例子可以大概了解ARGC与ARGV的用法：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   > for (i = 0; i < ARGC; i++)
   
   
   
   > print ARGV[i]
   
   
   
   > }' inventory-shipped BBS-list
   
   
   
   awk
   
   
   
   inventory-shipped
   
   
   
   BBS-list

ARGV的用法不仅限于此，它是可以修改的，可以更改数组元素的值，可以增加数组元素或者删除数组元素。

a. 更改ARGV元素的值

假设我们有a, b两个文件，它们各有一行内容：file a和file b。现在利用ARGV，我们可以做到偷梁换柱：

  
  
  
  
   
   
   
   $ awk 'BEGIN{ARGV[1]="b"} {print}' a
   
   
   
   file b

这里要注意ARGV[1]="b"的引号不能缺少，否则ARGV[1]=b会将变量b的值赋值给ARGV[1]。

当awk处理完一个文件之后，它会从ARGV的下一个元素获取参数，如果是一个文件则继续处理，如果是一个变量赋值则执行赋值操作：

  
  
  
  
   
   
   
   $ awk 'BEGIN{ARGV[1]="var=1"} {print var}' a b
   
   
   
   1

为什么这里只打印一次变量值呢？可以回头再看看上一篇中介绍变量赋值的内容。

而当下一个元素为空时，则跳过不处理，这样可以避开处理某个文件：

  
  
  
  
   
   
   
   $ awk 'BEGIN{ARGV[1]=""} {print}' a b
   
   
   
   file b

上面的例子中a这个文件就被跳过了。

而当下一个元素的值为-时，表明从标准输入读取内容：

  
  
  
  
   
   
   
   $ awk 'BEGIN{ARGV[1]="-"} {print}' a b
   
   
   
   a
   
   
   
   a # --> 这里按下CTRL+D停止输入
   
   
   
   file b

b. 删除ARGV元素

删除ARGV元素和将元素的值赋值为空的效果是一样的，它们都会跳转对某个参数的处理：

  
  
  
  
   
   
   
   $ awk 'BEGIN{delete ARGV[1]} {print}' a b
   
   
   
   file b

删除数组元素可以用delete语句。

CONVFMT与OFMT

Awk中允许数值到字符串相互转换，其中内置变量CONVFMT定义了awk内部数值到字符串转换的格式，它的默认值为%.6g：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
    printf "CONVFMT=%s, num=%f, str=%s\n", CONVFMT, 12.11, 12.11
   
   
   
   }' 
   
   
   
   CONVFMT=%.6g, num=12.110000, str=12.11

通过更改CONVFMT，我们可以定义自己的转换格式：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
    CONVFMT="%d";
   
   
   
    printf "CONVFMT=%s, num=%f, str=%s\n", CONVFMT, 12.11, 12.11
   
   
   
   }' 
   
   
   
   CONVFMT=%d, num=12.110000, str=12

与此对应地还有一个内置变量OFMT，它与CONVFMT的作用是类似的，只不过是影响输出的时候数字转换成字符串的格式：

  
  
  
  
   
   
   
   $ awk 'BEGIN { OFMT="%d";print 12.11 }' 
   
   
   
   12

ENVIRON

ENVIRON是一个存放系统环境变量的关联数组，它的下标是环境变量名称，值是相应环境变量的值。例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN { print ENVIRON["USER"] }' 
   
   
   
   kodango

利用环境变量也可以将值传递给awk：

  
  
  
  
   
   
   
   $ U=hello awk 'BEGIN { print ENVIRON["U"] }' 
   
   
   
   hello

可以利用for..in循环遍历ENVIRON数组：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   for (env in ENVIRON)
   
   
   
    printf "%s=%s\n", env, ENVIRON[env];
   
   
   
   }'

RLENGTH与RSTART

RLENGTH与RSTART都是与match函数相关的，前者表示匹配的子串长度，后者表示匹配的子串位于目标字符串的起始下标。例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {match("hello,world", /llo/); print RSTART,RLENGTH}'
   
   
   
   3 3

语句（Statement）

到目前为止，用得比较多的语句就是print，其它的还有printf、delete、break、continue、exit、next等等。这些语句与函数不同的是，它们不会使用带括号的参数，并且没有返回值。不过也有意外，比如printf就可以像函数一样的调用：

  
  
  
  
   
   
   
   $ echo 1 | awk '{printf("%s\n", "abc")}'
   
   
   
   abc

break和continue语句，大家应该比较了解，分别用于跳出循环和跳到下一个循环。

delete用于删除数组中的某个元素，这个我们在上面介绍ARGV的时候也使用过。

exit的用法顾名思义，就是退出awk的处理，然后会执行END部分的内容：

  
  
  
  
   
   
   
   $ echo $'line1\nline2' | awk '{print;exit} END {print "exit.."}'
   
   
   
   line1
   
   
   
   exit..

next语句类似sed的n命令，它会读取下一条记录，并重新回到脚本的最开始处执行：

  
  
  
  
   
   
   
   $ echo $'line1\nline2' | awk '{
   
   
   
   > print "Before next.."
   
   
   
   > print $0
   
   
   
   > next
   
   
   
   > print "After next.."
   
   
   
   > }'
   
   
   
   Before next..
   
   
   
   line1
   
   
   
   Before next..
   
   
   
   line2

从上面可以看出next后面的print语句不会执行。

print与printf语句是使用最多的，它们将内容输出到标准输出。注意在print语句中，输出的变量之间带不带逗号是有区别的：

  
  
  
  
   
   
   
   $ echo "1 2" | awk '{print $1, $2}'
   
   
   
   1 2
   
   
   
   
   
   
   
   $ echo "1 2" | awk '{print $1 $2}'
   
   
   
   12

print输出时，字段之间的分隔符可以由OFS重新定义：

  
  
  
  
   
   
   
   $ echo "1 2" | awk '{OFS=";";print $1,$2}'
   
   
   
   1;2

除此之外，print的输出还可以重定向到某个文件中或者某个命令：

  
  
  
  
   
   
   
   print items > output-file
   
   
   
   print items >> output-file
   
   
   
   print items | command

假设有这一样一个文件，第一列是语句名称，第二列是对应的说明：

  
  
  
  
   
   
   
   $ cat column.txt
   
   
   
   statement|description
   
   
   
   delete|delete item from an array
   
   
   
   exit|exit from the awk process
   
   
   
   next|read next input record and process

现在我们要将两列的内容分别输出到statement.txt和description.txt两个文件中：

  
  
  
  
   
   
   
   $ awk -F'|' '{
   
   
   
    > print $1 > "statement.txt";
   
   
   
    > print $2 > "description.txt"
   
   
   
    > }' column.txt
   
   
   
   
   
   
   
   $ cat statement.txt
   
   
   
   statement
   
   
   
   delete
   
   
   
   exit
   
   
   
   next
   
   
   
   
   
   
   
   $ cat description.txt
   
   
   
   description
   
   
   
   delete item from an array
   
   
   
   exit from the awk process
   
   
   
   read next input record and process

下面是一个重定向到命令的例子，假设我们要对下面的文件进行排序：

  
  
  
  
   
   
   
   $ cat num.list
   
   
   
   1
   
   
   
   3
   
   
   
   2
   
   
   
   9
   
   
   
   5

可以通过将print的内容重定向到sort -n命令：

  
  
  
  
   
   
   
   $ awk '{print | "sort -n"}' num.list
   
   
   
   1
   
   
   
   2
   
   
   
   3
   
   
   
   5
   
   
   
   9

printf命令的用法与print类似，也可以重定向到文件或者输出，只不过printf比print多了格式化字符串的功能。printf的语法也大多数语言包括bash的printf命令类似。

awk的函数分成数学函数、字符串函数、I/O处理函数以及用户自定义的函数

数学函数

awk中支持以下数学函数：

● atan2(y,x)：反正切函数；

● cos(x)：余弦函数；

● sin(x)：正弦函数；

● exp(x)：以自然对数e为底指数函数；

● log(x)：计算以e 为底的对数值；

● sqrt(x)：绝对值函数；

● int(x)：将数值转换成整数；

● rand()：返回0到1的一个随机数值，不包含1；

● srand([expr])：设置随机种子，一般与rand函数配合使用，如果参数为空，默认使用当前时间为种子；

例如，我们使用rand()函数生成一个随机数值：

  
  
  
  
   
   
   
   $ awk 'BEGIN {print rand(),rand();}'
   
   
   
   0.237788 0.291066
   
   
   
   
   
   
   
   $ awk 'BEGIN {print rand(),rand();}'
   
   
   
   0.237788 0.291066

但是你会发现，每次awk执行都会生成同样的随机数，但是在一次执行过程中产生的随机数又是不同的。因为每次awk执行都使用了同样的种子，所以我们可以用srand()函数来设置种子:

  
  
  
  
   
   
   
   $ awk 'BEGIN {srand();print rand(),rand();}'
   
   
   
   0.171625 0.00692412
   
   
   
   
   
   
   
   $ awk 'BEGIN {srand();print rand(),rand();}'
   
   
   
   0.43269 0.782984

这样每次生成的随机数就不一样了。

利用rand()函数我们也可以生成1到n的整数：

  
  
  
  
   
   
   
   $ awk '
   
   
   
   > function randint(n) { return int(n*rand()); }
   
   
   
   > BEGIN { srand(); print randint(10);
   
   
   
   > }'
   
   
   
   3

字符串函数

awk中包含大多数常见的字符串操作函数。

sub(ere, repl[, in])

描述：简单地说，就是将in中匹配ere的部分替换成repl，返回值是替换的次数。如果in参数省略，默认使用$0。替换的动作会直接修改变量的值。

下面是一个简单的替换的例子：

  
  
  
  
   
   
   
   $ echo "hello, world" | awk '{print sub(/ello/, "i"); print}'
   
   
   
   1
   
   
   
   hi, world

gsub(ere, repl[, in])

描述：同sub()函数功能类似，只不过是gsub()是全局替换，即替换所有匹配的内容。

index(s, t)

描述：返回字符串t在s中出现的位置，注意这里位置是从1开始计算的，如果没有找到则返回0。

例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {print index("kodango", "o")}'
   
   
   
   2
   
   
   
   
   
   
   
   $ awk 'BEGIN {print index("kodango", "w")}'
   
   
   
   0

length[([s])]

描述：返回字符串的长度，如果参数s没有指定，则默认使用$0作为参数。

例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {print length('kodango');}'
   
   
   
   0
   
   
   
   
   
   
   
   $ echo "first line" | awk '{print length();}'
   
   
   
   10

match(s, ere)

描述：返回字符串s匹配ere的起始位置，如果不匹配则返回0。该函数会定义RSTART和RLENGTH两个内置变量。RSTART与返回值相同，RLENGTH记录匹配子串的长度，如果不匹配则为-1。

例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   print match("kodango", /dango/);
   
   
   
   printf "Matched at: %d, Matched substr length: %d\n", RSTART, RLENGTH;
   
   
   
   }'
   
   
   
   3
   
   
   
   Matched at: 3, Matched substr length: 5

split(s, a[, fs])

描述：将字符串按照分隔符fs，分隔成多个部分，并存到数组a中。注意，存放的位置是从第1个数组元素开始的。如果fs为空，则默认使用FS分隔。函数返回值分隔的个数。

例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   > split("1;2;3;4;5", arr, ";")
   
   
   
   > for (i in arr)
   
   
   
   > printf "arr[%d]=%d\n", i, arr[i];
   
   
   
   > }'
   
   
   
   arr[4]=4
   
   
   
   arr[5]=5
   
   
   
   arr[1]=1
   
   
   
   arr[2]=2
   
   
   
   arr[3]=3

这里有一个奇怪的地方是for..in..输出的数组不是按顺序输出的，如果要按顺序输出可以用常规的for循环:

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   > split("1;2;3;4;5", arr, ";")
   
   
   
   > for (i=0;^C
   
   
   
   
   
   
   
   $ awk 'BEGIN {
   
   
   
   > n=split("1;2;3;4;5", arr, ";")
   
   
   
   > for (i=1; i<=n; i++)
   
   
   
   > printf "arr[%d]=%d\n", i, arr[i];
   
   
   
   > }'
   
   
   
   arr[1]=1
   
   
   
   arr[2]=2
   
   
   
   arr[3]=3
   
   
   
   arr[4]=4
   
   
   
   arr[5]=5

sprintf(fmt, expr, expr, ...)

描述：类似printf，只不过不会将格式化后的内容输出到标准输出，而是当作返回值返回。

例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   > var=sprintf("%s=%s", "name", "value")
   
   
   
   > print var
   
   
   
   > }'
   
   
   
   name=value

substr(s, m[, n])

描述：返回从位置m开始的，长度为n的子串，其中位置从1开始计算，如果未指定n或者n值大于剩余的字符个数，则子串一直到字符串末尾为止。

例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN { print substr("kodango", 2, 3); }'
   
   
   
   oda
   
   
   
   
   
   
   
   $ awk 'BEGIN { print substr("kodango", 2); }'
   
   
   
   odango

tolower(s)

描述：将字符串转换成小写字符。

  
  
  
  
   
   
   
   $ awk 'BEGIN {print tolower("KODANGO");}'
   
   
   
   kodango

toupper(s)

描述：将字符串转换成大写字符。

例如

  
  
  
  
   
   
   
   $ awk 'BEGIN {print tolower("kodango");}'
   
   
   
   KODANGO

I/O处理函数

getline

getline的用法相对比较复杂，它有几种不同的形式。不过它的主要作用就是从输入中每次获取一行输入。

a. expression | getline [var]

这种形式将前面管道前命令输出的结果作为getline的输入，每次读取一行。如果后面跟有var，则将读取的内容保存到var变量中，否则会重新设置$0和NF。

例如，我们将上面的statement.txt文件的内容显示作为getline的输入：

  
  
  
  
   
   
   
   $ awk 'BEGIN { while("cat statement.txt" | getline var) print var}'
   
   
   
   statement
   
   
   
   delete
   
   
   
   exit
   
   
   
   next

上面的例子中命令要用双引号，cat statement.txt，这一点同print/printf是一样的。

如果不加var，则直接写到$0中，注意NF值也会被更新：

  
  
  
  
   
   
   
   $ awk 'BEGIN { while("cat statement.txt" | getline) print $0,NF}'
   
   
   
   statement 1
   
   
   
   delete 1
   
   
   
   exit 1
   
   
   
   next 1

b. getline [var]

第二种形式是直接使用getline，它会从处理的文件中读取输入。同样地，如果var没有，则会设置$0，并且这时候会更新NF, NR和FNR：

  
  
  
  
   
   
   
   $ awk '{ 
   
   
   
   > while (getline)
   
   
   
   > print NF, NR, FNR, $0;
   
   
   
   > }' statement.txt
   
   
   
   1 2 2 delete
   
   
   
   1 3 3 exit
   
   
   
   1 4 4 next

c. getline [var] < expression

第三种形式从expression中重定向输入，与第一种方法类似，这里就不加赘述了。

close函数可以用于关闭已经打开的文件或者管道，例如getline函数的第一种形式用到管道，我们可以用close函数把这个管道关闭，close函数的参数与管道的命令一致：

  
  
  
  
   
   
   
   $ awk 'BEGIN {
   
   
   
   while("cat statement.txt" | getline) {
   
   
   
    print $0;
   
   
   
    close("cat statement.txt");
   
   
   
   }}'
   
   
   
   statement
   
   
   
   statement
   
   
   
   statement
   
   
   
   statement
   
   
   
   statement

但是每次读了一行后，关闭管道，然后重新打开又重新读取第一行就死循环了。所以要慎用，一般情况下也很少会用到close函数。

system

这个函数很简单，就是用于执行外部命令，例如：

  
  
  
  
   
   
   
   $ awk 'BEGIN {system("uname -r");}'
   
   
   
   3.6.2-1-ARCH

你可能感兴趣的:(一个电影的时间掌握Awk（Linux）文本处理脚本语言)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D