用Linux命令统计文件内容

 

近来用Cygwin中的Linux命令解决了很多Windows平台下的日常问题。比如下面要讨论的一个简单问题:统计文件中包含某段文件的行有多少。

 

1用Grep命令解决

grep "getPosPrice" 13_tp.log |cut -d "," -f 3 | grep"\"processState\":\"0\"" | wc -l

 

cut命令简介:

 

cut -d "," -f 3 13_tp.log

 

-d:按分隔符切割

-f:取第几列

 

2用Sed过滤行

 

Sed的强大在过滤行时体现的还不是很明显,在对行进行删除、替换、追加等操作时,Sed的优势体会的淋漓尽致。下面转载下另一篇文章中的例子,来一窥Sed强大之处。

 

举例:(假设我们有一文件名为ab)
     删除某行
     [root@localhost ruby] # sed'1d' ab             #删除第一行 
     [root@localhost ruby] # sed'$d' ab              #删除最后一行
     [root@localhost ruby] # sed'1,2d' ab           #删除第一行到第二行
     [root@localhost ruby] # sed'2,$d' ab           #删除第二行到最后一行

  显示某行
.    [root@localhost ruby] # sed -n '1p' ab           #显示第一行 
     [root@localhost ruby] # sed -n'$p' ab           #显示最后一行
     [root@localhost ruby] # sed -n'1,2p' ab        #显示第一行到第二行
     [root@localhost ruby] # sed -n'2,$p' ab        #显示第二行到最后一行

  使用模式进行查询
     [root@localhost ruby] # sed -n'/ruby/p' ab    #查询包括关键字ruby所在所有行
     [root@localhost ruby] # sed -n'/\$/p' ab        #查询包括关键字$所在所有行,使用反斜线\屏蔽特殊含义

  增加一行或多行字符串
     [root@localhost ruby]# cat ab
     Hello!
     ruby is me,welcome to my blog.
     end
     [root@localhost ruby] # sed '1adrink tea' ab  #第一行后增加字符串"drinktea"
     Hello!
     drink tea
     ruby is me,welcome to my blog. 
     end
     [root@localhost ruby] # sed'1,3a drink tea' ab #第一行到第三行后增加字符串"drink tea"
     Hello!
     drink tea
     ruby is me,welcome to my blog.
     drink tea
     end
     drink tea
     [root@localhost ruby] # sed '1adrink tea\nor coffee' ab   #第一行后增加多行,使用换行符\n
     Hello!
     drink tea
     or coffee
     ruby is me,welcome to my blog.
     end

  代替一行或多行
     [root@localhost ruby] # sed '1cHi'ab                #第一行代替为Hi
     Hi
     ruby is me,welcome to my blog.
     end
     [root@localhost ruby] # sed'1,2c Hi'ab             #第一行到第二行代替为Hi
     Hi
     end

  替换一行中的某部分
  格式:sed 's/要替换的字符串/新的字符串/g'   (要替换的字符串可以用正则表达式)
     [root@localhost ruby] # sed -n'/ruby/p' ab | sed 's/ruby/bird/g'    #替换ruby为bird
   [root@localhost ruby] # sed -n '/ruby/p'ab | sed 's/ruby//g'       #删除ruby

     插入
     [root@localhost ruby] # sed -i'$a bye' ab         #在文件ab中最后一行直接输入"bye"
     [root@localhost ruby]# cat ab
     Hello!
     ruby is me,welcome to my blog.
     end
     bye

 

3强大的Awk

通过-f参数可以达到cut命令的效果

 

awk –F “,” ‘{print $3}’ 13_tp.log

 

上面对文件行的过滤也都可以由awk来完成,甚至可以统计出现某段文字的行与未出现行的比例等各种复杂需求。

 

awk -F ","'BEGIN{s0=0;s1=0}{if($1 ~ "getPosPrice")

{if($3=="\"processState\":\"0\""){s0++}else{s1++}}}END{prints0,s1}' 13_tp.log

 

格式化后的结构如下:

awk -F "," 'BEGIN { s0=0;s1=0 } {

if ($1 ~"getPosPrice") {

if ($3=="\"processState\":\"0\"") {

s0++

}

else {

s1++

}

}

} END { print s0,s1 }' 13_tp.log

 

 

参考资料

 

linux之sed用法

http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html

 

 

你可能感兴趣的:(用Linux命令统计文件内容)