cut & sort & uniq 工具合集

cut

cut工具主要用于在文件中剪切数据,它的处理机制与sed、awk是一样的,都是以行为处理单位。
cut命令主要接受三个定位方法:-b , -c , -f

  • 字节(bytes):-b
    cut & sort & uniq 工具合集_第1张图片
  • 字符(characters):-c
    cut & sort & uniq 工具合集_第2张图片
  • 域(fields):-f
    -d指明了域分隔符,-f指明要剪切哪几个域,这个用法与awk类似
    cut & sort & uniq 工具合集_第3张图片

(截取字符串的方法:http://blog.csdn.net/qq_33951180/article/details/68059098)

sort

sort是常用的排序工具,将每一行作为一个单位进行比较,比较原则是从首字符向后,依次按照ASCII码值进行比较,最后将它们按照升序输出。
sort常用的有如下选项:

  • -u:在输出行中去除重复行
    cut & sort & uniq 工具合集_第4张图片

  • -r:逆序
    sort排序结果默认是升序的,用这个选项可以将sort排序结果改为降序
    cut & sort & uniq 工具合集_第5张图片

  • -o:将排序好的内容写回原文件
    由于sort默认是把结果输出到标准输出,所以需要用重定向才能将结果写入文件,形如sort filename > newfile。但是,如果你想把排序结果输出到原文件中,用重定向可就不行了。
    cut & sort & uniq 工具合集_第6张图片

  • -n:以数值进行排序
    假设文件中有1,10,100,想按照数值大小进行排序的话就需要用到这个选项
    cut & sort & uniq 工具合集_第7张图片

  • -k和-t:指定间隔符的指定列进行排序
    -t指明了域分隔符,-k指明要根据第几列进行排序。例如:file文件中有三列,第一列是产品名称,第二列是数量,第三列是价格,现在需要根据第三列进行排序
    cut & sort & uniq 工具合集_第8张图片

  • -f:忽略大小写进行排序(会将小写字母转换为大写字母进行排序)
    cut & sort & uniq 工具合集_第9张图片

  • sort的其他常用选项
    -b:忽略每一行前面的所有空白部分,从第一个可见字符开始比较。
    -c:检查文件是否已排好序,如果乱序,则输出第一个乱序的行的相关信息,最后返回1。
    -C:检查文件是否已排好序,如果乱序,不输出内容,仅返回1。
    -M:以月份来排序,比如JAN小于FEB等等。

uniq

uniq的作用是过滤重复部分、显示文件内容。这个命令读取输入文件,并比较相邻的行。正常情况下,第二个及以后更多个重复行将被删去,行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示,则从标准输入读取。
该命令常用选项如下:

  • -d:只显示重复行
    cut & sort & uniq 工具合集_第10张图片

  • -u:只显示文件中不重复的行
    cut & sort & uniq 工具合集_第11张图片

  • -c:显示输出中
    在每行行首加上文本行在文件中出现的次数。可以取代-u和-d选项
    cut & sort & uniq 工具合集_第12张图片

你可能感兴趣的:(Linux,Linux使用工具,Linux,&,计算机网络)