饕鬄。。

文本处理工具和正则表达式

一级标题

文本处理工具和正则表达式

二级标题

1.文本编辑工具VIM

文本编辑工具之神VIM

vi
 Visual editor，文本编辑器，是 Linux 必备工具之一，功能强大，学习曲线较陡峭，学习难度大

vim
 VIsual editor iMproved ，和 vi 使用方法一致，但功能更为强大，不是必备软件
 官网：www.vim.org
 其他相关编辑器：gvim 一个Vim编辑器的图形版本

1.1使用 vim 初步

 常用选项
  
  +# 打开文件后，让光标处于第#行的行首，+默认行尾
  +/PATTERN 让光标处于第一个被PATTERN匹配到的行行首
  -b file 二进制方式打开文件
  -d file1 file2… 比较多个文件，相当于 vimdiff
  -m file 只读打开文件
  -e file  直接进入ex模式，相当于执行ex file
  
  说明：
   如果该文件存在，文件被打开并显示内容
   如果该文件不存在，当编辑后第一次存盘时创建它

 1.2三种常见模式：
 
  
  命令或普通(Normal)模式：默认模式，可以实现移动光标，剪切/粘贴文本
 
  插入(Insert)或编辑模式：用于修改文本
 
  扩展命令(extended command )或命令(末)行模式：保存，退出等

   命令模式 --> 插入模式
   
    i insert, 在光标所在处输入
    I 在当前光标所在行的行首输入
    a append, 在光标所在处后面输入
    A 在当前光标所在行的行尾输入
    o 在当前光标所在行的下方打开一个新行
    O 在当前光标所在行的上方打开一个新行
   
    插入模式 --- ESC-----> 命令模式
   
    命令模式 ---- : ----> 扩展命令模式
   
    扩展命令模式 ----ESC,enter----> 命令模式
 
 
 
 1.3   扩展命令模式
  
  按“:”进入Ex模式 ，创建一个命令提示符: 处于底部的屏幕左侧
   
   扩展命令模式基本命令
    w 写（存）磁盘文件
    wq 写入并退出
    x 写入并退出
    X  加密
    q 退出
    q！ 不存盘退出，即使更改都将丢失
    r  filename 读文件内容到当前文件中
    w  filename 将当前文件内容写入另一个文件
    !command 执行命令
    r!command 读入命令的输出

  地址定界格式
   
   # #具体第#行，例如2表示第2行
   #,# #从左侧#表示起始行，到右侧#表示结尾行
   #,+# #从左侧#表示的起始行，加上右侧#表示的行数，范例：2,+3 表示2到5行
   .  #当前行
   $ #最后一行
   .,$-1 #当前行到倒数第二行
   % #全文, 相当于1,$
   /pattern/  #从当前行向下查找，直到匹配pattern的第一行,即:正则表达式
   /pat1/,/pat2/ #从第一次被pat1模式匹配到的行开始，一直到第一次被pat2匹配到的行结束
   #,/pat/   #从指定行开始，一直找到第一个匹配patttern的行结束
   /pat/,$   #向下找到第一个匹配patttern的行到整个文件的结尾的所有行
  
  地址定界后跟一个编辑命令
   
   d    #删除
   y #复制
   w file #将范围内的行另存至指定文件中
   r file #在指定位置插入指定文件中的所有内容
  
  查找并替换
   
   格式
    s/要查找的内容/替换为的内容/修饰符
   
   说明
    要查找的内容：可使用基末正则表达式模式
    替换为的内容：不能使用模式，但可以使用\1, \2, ...等后向引用符号；还可以使用“&”引用前面查找时查
    找到的整个内容
    
    修饰符：
     
     i #忽略大小写
     g #全局替换，默认情况下，每一行只替换第一次出现
     gc #全局替换，每次替换前询问
     
     查找替换中的分隔符/可替换为其它字符，如：#,@
 定制vim的工作特性
     
     扩展命令模式的配置只是对当前vim进程有效，可将配置存放在文件中持久保存
     
     配置文件：
      /etc/vimrc #全局
      ~/.vimrc #个人

 行号
  
  显示：set number，简写 set nu
  取消显示：set nonumber, 简写 set nonu
 
 忽略字符的大小写
  启用：set ignorecase，简写 set ic
  不忽略：set noic

 自动缩进
  启用：set autoindent，简写 set ai
  禁用：set noai

 复制保留格式
  启用：set paste
  禁用：set nopaste

 显示Tab和换行符 ^I 和$显示
  启用：set list
  禁用：set nolist
 
 高亮搜索
  启用：set hlsearch
  禁用：set nohlsearch

 语法高亮
  启用：syntax on
  禁用：syntax off

 文件格式
  启用windows格式：set fileformat=dos
  启用unix格式：set fileformat=unix
  简写 set ff=dos|unix

 设置文本宽度
  set textwidth=65 (vim only)

 设置光标所在行的标识线
  启用：set cursorline，简写 set cul
  禁用：set nocursorline

 加密
  启用： set key=password
  禁用： set key=  



1.4 命令模式
 命令模式，又称为Normal模式，功能强大，只是此模式输入指令并在屏幕上显示，所以需要记忆大量的快捷按键才能更好的使用
  
  1.退出VIM
   ZZ 保存退出
   ZQ 不保存退出
  
  2. 光标跳转
   
   字符间跳转：
   h: 左 L: 右 j: 下 k: 上
   #COMMAND：跳转由#指定的个数的字符

   单词间跳转：
    w：下一个单词的词首
    e：当前或下一单词的词尾
    b：当前或前一个单词的词首
    #COMMAND：由#指定一次跳转的单词数

   当前页跳转：
    H：页首 M：页中间行 L：页底
    zt：将光标所在当前行移到屏幕顶端
    zz：将光标所在当前行移到屏幕中间
    zb：将光标所在当前行移到屏幕底端

   行首行尾跳转：
    ^ 跳转至行首的第一个非空白字符
    0 跳转至行首
    $ 跳转至行尾

   行间移动：
    #G 或者扩展命令模式下 :# 跳转至由第#行
    G 最后一行
    1G, gg 第一行

   句间移动：
    ) 下一句 ( 上一句
   段落间移动：
    } 下一段 { 上一段

   命令模式翻屏操作
    Ctrl+f 向文件尾部翻一屏
    Ctrl+b 向文件首部翻一屏
    Ctrl+d 向文件尾部翻半屏
    Ctrl+u 向文件首部翻半屏

   3.字符编辑
    x 删除光标处的字符
    #x 删除光标处起始的#个字符
    xp 交换光标所在处的字符及其后面字符的位置
    ~ 转换大小写
    J 删除当前行后的换行符
   
   4.替换命令(replace)
    r 只替换光标所在处的一个字符
    R 切换成REPLACE模式（在末行出现-- REPLACE -- 提示）,按ESC回到命令模式

   5.删除命令（delete）
    d 删除命令，可结合光标跳转字符，实现范围删除
    d$ 删除到行尾
    d^ 删除到非空行首
    d0 删除到行首
    dw
    de
    db
    #COMMAND
    dd： 剪切光标所在的行
    #dd 多行删除
    D：从当前光标位置一直删除到行尾，等同于d$

   6.复制命令(yank)
    y 复制，行为相似于d命令
    y$
    y0
    y^
    ye
    yw
    yb
    #COMMAND
    yy：复制行
    #yy 复制多行
    Y：复制整行

   7.粘贴命令(paste)
    p 缓冲区存的如果为整行，则粘贴当前光标所在行的下方；否则，则粘贴至当前光标所在处的后面
    P 缓冲区存的如果为整行，则粘贴当前光标所在行的上方；否则，则粘贴至当前光标所在处的前面

   8. 改变命令(change)
    c: 删除后切换成插入模式
    c$
    c^
    c0
    cb
    ce
    cw
    #COMMAND
    cc：删除当前行并输入新内容，相当于S
    #cc
    C：删除当前光标到行尾，并切换成插入模式,相当于c$

   9. 查找
    /PATTERN：从当前光标所在处向文件尾部查找
    ?PATTERN：从当前光标所在处向文件首部查找
    n：与命令同方向
    N：与命令反方向

   10. 撤消更改
    u 撤销最近的更改，相当于windows中ctrl+z
    #u 撤销之前多次更改
    U 撤消光标落在这行后所有此行的更改
    Ctrl - r 重做最后的“撤消”更改，相当于windows中crtl+y
    . 重复前一个操作
    #. 重复前一个操作#次
   高级用法
    
    常见Command：y 复制、d 删除、gU 变大写、gu 变小写
     
     0y$ 命令
     0 → 先到行头
     y → 从这里开始拷贝
     $ → 拷贝到本行最后一个字符

     粘贴“wang”100次
      100iwang [ESC]

      di" 光标在” “之间，则删除” “之间的内容
      yi( 光标在()之间，则复制()之间的内容
      vi[ 光标在[]之间，则选中[]之间的内容
      dtx 删除字符直到遇见光标之后的第一个 x 字符
      ytx 复制字符直到遇见光标之后的第一个 x 字符




1.5 可视化模式
 在末行有”-- VISUAL -- “指示，表示在可视化模式

 允许选择的文本块

  v 面向字符，-- VISUAL --
  V 面向整行，-- VISUAL LINE --
  ctrl-v 面向块，-- VISUAL BLOCK  --

 可视化键可用于与移动键结合使用
  w ) } 箭头等

 突出显示的文字可被删除，复制，变更，过滤，搜索，替换等

 范例：在文件行首插入#
  输入ctrl+v 进入可视化模式
  输入 G 跳到最后1行，选中每一行的第一个字符
  输入 I 切换至插入模式
  输入 #
  按 ESC 键

1.6 多文件模式
 vim FILE1 FILE2 FILE3 ...
 :next 下一个
 :prev 前一个
 :first 第一个
 :last 最后一个
 :wall 保存所有
 :qall 不保存退出所有
 :wqall保存退出所有


1.7 多窗口模式
 多文件分割
  vim -o|-O FILE1 FILE2 ...
  -o: 水平或上下分割
  -O: 垂直或左右分割（vim only）
  在窗口间切换：Ctrl+w, Arrow

 单文件窗口分割
  Ctrl+w,s：split, 水平分割，上下分屏
  Ctrl+w,v：vertical, 垂直分割，左右分屏
  ctrl+w,q：取消相邻窗口
  ctrl+w,o：取消全部窗口
  :wqall 退出


1.8 vim的寄存器
 有26个命名寄存器和1个无命名寄存器，常存放不同的剪贴版内容，可以在同一个主机的不同会话（终端窗口）间共享
 寄存器名称a，b,…,z,格式： ”寄存器 放在数字和命令之间
 范例：
  3"tyy 表示复制3行到t寄存器中 ，末行显示 3 lines yanked into "t
  "tp 表示将t寄存器内容粘贴未指定，将使用无命名寄存器
  有10个数字寄存器，用0，1，…，9表示，0存放最近复制内容，1存放最近删除内容。当新的文本变更和删除时，1转存到2，2转存到3，以此类推。数字寄存器不能在不同会话间共享


  1.9 标记和宏(macro)
   ma 将当前位置标记为a，26个字母均可做标记， mb 、 mc 等等
   'a 跳转到a标记的位置，实用的文档内标记方法，文档中跳跃编辑时很有用
   qa 录制宏 a，a为宏的名称，末行提示： recording @a
   q 停止录制宏
   @a 执行宏 a
   @@ 重新执行上次执行的宏

二级标题

2.各种文本工具
查看文本文件内容
cat 可以查看文本内容
常见选项
-E：显示行结束符$
-A：显示所有控制符
-n：对显示出的每一行进行编号
-b：非空行编号
-s：压缩连续的空行成一行
范例：
[root@centos8 ~]#cat -A /data/fa.txt
a b$
c $
d^IbIc$
[root@centos8 ~]#cat /data/fa.txt
a b
c
d b c
[root@centos8 ~]#cat /data/fb.txt
a
b
c
[root@centos8 ~]#hexdump -C /data/fb.txt
00000000 61 0d 0a 62 0d 0a 63 0d 0a |a..b..c..|
00000009
[root@centos8 ~]#cat -A /data/fb.txt
a^M$
b^M$
c^M$
[root@centos8 ~]#file /data/fb.txt
/data/fb.txt: ASCII text, with CRLF line terminators

显示行号nl
 [root@centos8 ~]#cat /data/f1.txt
 a
 b
 c
 d
 e
 f

tac逆向显示文本内容
  [root@centos8 ~]#cat /data/fa.txt
  1
  2
  3
  4
  5
  [root@centos8 ~]#tac /data/fa.txt
  5
  4
  3
  2
  1

rev将同一行的内容逆向显示
 [root@centos8 ~]#rev
 abcdef
 fedcba
 [root@centos8 ~]#echo {1..10} |rev
 01 9 8 7 6 5 4 3 2 1

查看非文本文件内容
 hexdump
  hexdump -C -n 512 /dev/sda
  00000000 eb 63 90 10 8e d0 bc 00 b0 b8 00 00 8e d8 8e c0 |.c..............|
  echo {a..z} | tr -d ' '|hexdump -C
  00000000 61 62 63 64 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 |abcdefghijklmnop|
  00000010 71 72 73 74 75 76 77 78 79 7a 0a         |qrstuvwxyz.|
  0000001b

 od
  root@centos8 ~]#echo {a..z} | tr -d ' '|od -t x
  0000000 64636261 68676665 6c6b6a69 706f6e6d
  0000020 74737271 78777675 000a7a79
  0000033
  [root@centos8 ~]#echo {a..z} | tr -d ' '|od -t x1
  0000000 61 62 63 64 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70
  0000020 71 72 73 74 75 76 77 78 79 7a 0a
  0000033
  [root@centos8 ~]#echo {a..z} | tr -d ' '|od -t x1z
  0000000 61 62 63 64 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 >abcdefghijklmnop<
  0000020 71 72 73 74 75 76 77 78 79 7a 0a         >qrstuvwxyz.<
  0000033

 xxd
  echo {a..z} | tr -d ' '|xxd
  0000000: 6162 6364 6566 6768 696a 6b6c 6d6e 6f70 abcdefghijklmnop
  0000010: 7172 7374 7576 7778 797a 0a       qrstuvwxyz.


分页查看文件内容 
 more
 可以实现分页查看文件，可以配合管道实现输出信息的分页
 选项：
 -d: 显示翻页及退出提示
 less 也可以实现分页查看文件或STDIN输出
 查看时有用的命令包括：
 /文本 搜索 文本
 n/N 跳到下一个 或 上一个匹配

 less
  [root@centos8 ~]#cat /etc/init.d/functions |less
  # -*-Shell-script-*-
  #
  # functions This file contains functions to be used by most or all
  #    shell scripts in the /etc/init.d directory.
  #
  TEXTDOMAIN=initscripts
  # Make sure umask is sane
  umask 022
  # Set up a default search path.
  PATH="/sbin:/usr/sbin:/bin:/usr/bin"
  export PATH
  ...省略..

 显示文本前或后行内容 
  head
   可以显示文件或标准输入的前面行
   选项：
   -c # 指定获取前#字节
   -n # 指定获取前#行
   -# 同上

   [root@centos8 ~]#head -n 3 /etc/passwd
   root:x:0:0:root:/root:/bin/bash
   bin:x:1:1:bin:/bin:/sbin/nologin
   daemon:x:2:2:daemon:/sbin:/sbin/nologin
   [root@centos8 ~]#head -3 /etc/passwd
   root:x:0:0:root:/root:/bin/bash
   bin:x:1:1:bin:/bin:/sbin/nologin
   daemon:x:2:2:daemon:/sbin:/sbin/nologin
   [root@centos8 ~]#echo a我b | head -c4
   a我[root@centos8 ~]#
   
   [root@centos8 ~]#cat /dev/urandom | tr -dc '[:alnum:]'| head -c10
   G755MlZatW[root@centos8 ~]#cat /dev/urandom | tr -dc '[:alnum:]'| head -c10
   ASsax6DeBz[root@centos8 ~]#cat /dev/urandom | tr -dc '[:alnum:]'| head -c10 |
   tes.txt | passwd --stdin mage
   Changing password for user mage.
   passwd: all authentication tokens updated successfully.
   [root@centos8 ~]#cat pass.txt
   AGT952Essg[root@centos8 ~]#su - wang
   [wang@centos8 ~]$su - mage
   Password:

 tail
  tail 和head 相反，查看文件或标准输入的倒数行 
   -c # 指定获取后#字节
   -n # 指定获取后#行
   # 同上
   -f 跟踪显示文件fd新追加的内容,常用日志监控，相当于 --follow=descriptor,当文件删除再新建同名
   文件,将无法继续跟踪文件
   -F 跟踪文件名，相当于--follow=name --retry，当文件删除再新建同名文件,将可以继续跟踪文件
   tailf 类似 tail –f，当文件不增长时并不访问文件 

   [root@centos8 ~]#cat  /data/f1.txt
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    [root@centos8 ~]#tail -n 3 /data/f1.txt
    8
    9
    10

    #只查看最新发生的日志
    [root@centos8 ~]#tail -fn0 /var/log/messages
    [root@centos8 ~]#tail -0f /var/log/messages
    [root@centos8 data]#ifconfig | head -2 | tail -1

inet 10.0.0.8 netmask 255.255.255.0broadcast 10.0.0.255
按列抽取文本cut
cut 命令可以提取文本文件或STDIN数据的指定列
选项
-d DELIMITER: 指明分隔符，默认tab
-f FILEDS:
#: 第#个字段,例如:3
#,#[,#]：离散的多个字段，例如:1,3,6
#-#：连续的多个字段, 例如:1-6
混合使用：1-3,7
-c 按字符切割
--output-delimiter=STRING指定输出分隔符

  [root@centos8 ~]#cut -d: -f1,3-4,7 /etc/passwd
  [root@centos8 ~]#ifconfig |head -n2 |tail -n1|cut -d" " -f10
  10.0.0.8
  [root@centos8 ~]#ifconfig |head -n2 |tail -n1|tr -s " " |cut -d " " -f3
  10.0.0.8

  [root@centos8 ~]#cut -d: -f1,3,7 --output-delimiter="---" /etc/passwd
  root---0---/bin/bash
  bin---1---/sbin/nologin
  daemon---2---/sbin/nologin
  cat /etc/passwd | cut -d: -f7
  cut -c2-5 /usr/share/dict/words

  合并多个文件paste
   -d 分隔符：指定分隔符，默认用TAB
   -s : 所有行合成一行显示

   [root@centos8 ~]#paste -s seq.log
   1 2 3 4 5
   [root@centos8 ~]#paste -s alpha.log
   a b c d e f g h
   [root@centos8 ~]#paste -s alpha.log seq.log
   a b c d e f g h
   1 2 3 4 5



2.6分析文本的工具
 文本数据统计：wc
  wc 命令可用于统计文件的行总数、单词总数、字节总数和字符总数
  可以对文件或STDIN中的数据统计
  
  常用选项
  -l 只计数行数
  -w 只计数单词总数
  -c 只计数字节总数
  -m 只计数字符总数
  -L 显示文件中最长行的长度

  范例:
  [root@centos8 ~]#cat emp.txt
  mage
  zhang
  wang
  xu
  [root@centos8 ~]#paste title.txt emp.txt
  ceo mage
  coo zhang
  cto wang
  xu
  [root@centos8 ~]#paste -s title.txt emp.txt
  ceo coo cto
  mage zhang wang xu
  wc story.txt
  39   237   1901 story.txt
  行数  单词数  字节数
  [root@centos8 ~]#ll title.txt
  -rw-r--r-- 1 root root 30 Dec 20 11:05 title.txt
  [root@centos8 ~]#ll title1.txt
  -rw-r--r-- 1 root root 28 Dec 20 11:06 title1.txt
  [root@centos8 ~]#cat title.txt
  ceo mage
  coo zhang
  cto 老王
  [root@centos8 ~]#cat title1.txt
  ceo mage
  coo zhang
  cto wang
  [root@centos8 ~]#wc title.txt
  3  6 30 title.txt
  [root@centos8 ~]#wc title1.txt
  3  6 28 title1.txt
  [root@centos8 ~]#wc -l title.txt
  3 title.txt
  [root@centos8 ~]#cat title.txt | wc -l
  3
  [root@centos8 ~]#df | tail -n $(echo `df | wc -l`-1|bc)
  devtmpfs      910220    0   910220  0% /dev
  tmpfs       924728    0   924728  0% /dev/shm
  tmpfs       924728   9224   915504  1% /run
  tmpfs       924728    0   924728  0% /sys/fs/cgroup
  /dev/sda2    104806400 4836160  99970240  5% /
  /dev/sda3    52403200  398580  52004620  1% /data
  /dev/sda1     999320  131764   798744  15% /boot
  tmpfs       184944    4   184940  1% /run/user/0
 整理文本：sort
  把整理过的文本显示在STDOUT，不改变原始文件
   常用选项
    -r 执行反方向（由上至下）整理
    -R 随机排序
    -n 执行按数字大小整理
    -f 选项忽略（fold）字符串中的字符大小写
    -u 选项（独特，unique）删除输出中的重复行
    -t c 选项使用c做为字段界定符
    -k # 选项按照使用c字符分隔的 # 列来整理能够使用多次

    范例:
     [root@centos8 data]#cut -d: -f1,3 /etc/passwd|sort -t: -k2 -nr |head -n3
     nobody:65534
     xiaoming:1002
     mage:1001
     #统计日志访问量
     [root@centos8 data]#cut -d" " -f1 /var/log/nginx/access_log |sort -u|wc -l
     201

     统计分区利用率
      [root@centos8 ~]#df | tr -s " " %|cut -d% -f5|tr -d '[:alpha:]' | sort -nr|head
      -n1
      15
  去重uniq
   uniq命令从输入中删除前后相接的重复的行
    -c: 显示每行重复出现的次数
    -d: 仅显示重复过的行
    -u: 仅显示不曾重复的行

    范例：统计日志访问量最多的请求
     [root@centos8 data]#cut -d" " -f1 access_log |sort |uniq -c|sort -nr |head -3

    范例：并发连接最多的远程主机IP
     [root@centos8 ~]#ss -nt|tail -n+2 |tr -s ' ' : |cut -d: -f6|sort|uniq -c|sort -
     nr |head -n2

7 10.0.0.1
2 10.0.0.7

    范例：取两个文件的相同和不同的行
     [root@centos8 data]#cat test1.txt
     a
     b
     1
     c
     [root@centos8 data]#cat test2.txt
     b
     e
     f
     c
     1
     2
    
    #取文件的共同行
     [root@centos8 data]#cat test1.txt test2.txt | sort |uniq -d
     1
     b
     c
    
    #取文件的不同行
    [root@centos8 data]#cat test1.txt test2.txt | sort |uniq -u
    2
    a
    e
    f

 比较文件：diff和patch 
  diff 命令比较两个文件之间的区别
   [root@centos8 ~]#cat f1.txt
   mage
   zhang
   wang
   xu
   [root@centos8 ~]#cat f2.txt
    magedu
    zhang sir
    wang
    xu
    shi
   [root@centos8 ~]#diff f1.txt f2.txt
   1,2c1,2
   < mage
   < zhang
   ---
   > magedu
   > zhang sir
   4a5
   > shi
   [root@centos8 ~]#diff -u f1.txt f2.txt
   --- f1.txt 2019-12-13 21:31:30.892775671 +0800
   +++ f2.txt 2019-12-13 22:00:14.373677728 +0800
   @@ -1,4 +1,5 @@
   -mage
   -zhang
   +magedu
   +zhang sir
   wang
   xu
   +shi
   [root@centos8 ~]#diff -u f1.txt f2.txt > f.patch
   [root@centos8 ~]#rm -f f2.txt
   [root@centos8 ~]#patch -b f1.txt f.patch
   patching file f1.txt
   [root@centos8 ~]#cat f1.txt
   magedu
   zhang sir
   wang
   xu
   shi
   [root@centos8 ~]#cat f1.txt.orig
   mage
   zhang
   wang

   patch
    patch 复制在其它文件中进行的改变（要谨慎使用）
    适用 -b 选项来自动备份改变了的文件

二级标题

3.基本正则表达式和扩展正则表达式

REGEXP： Regular Expressions，由一类特殊字符及文本字符所编写的模式，其中有些字符（元字符）
不表示字符字面意义，而表示控制或通配的功能，类似于增强版的通配符功能，但与通配符不同，通配
符功能是用来处理文件名，而正则表达式是处理文本内容中字符
正则表达式被很多程序和开发语言所广泛支持：vim, less,grep,sed,awk, nginx,mysql 等

正则表达式分两类
基本正则表达式：BRE
扩展正则表达式：ERE

正则表达式的元字符分类：字符匹配、匹配次数、位置锚定、分组

帮助：man 7 regex

基本正则表达式元字符
字符匹配
. 匹配任意单个字符，可以是一个汉字
[] 匹配指定范围内的任意单个字符，示例：[wang] [0-9] [a-z] [a-zA-Z]
[^] 匹配指定范围外的任意单个字符,示例：[^wang]
[:alnum:] 字母和数字
[:alpha:] 代表任何英文大小写字符，亦即 A-Z, a-z
[:lower:] 小写字母,示例:[[:lower:]],相当于[a-z]
[:upper:] 大写字母
[:blank:] 空白字符（空格和制表符）
[:space:] 水平和垂直的空白字符（比[:blank:]包含的范围广）
[:cntrl:] 不可打印的控制字符（退格、删除、警铃...）
[:digit:] 十进制数字
[:xdigit:]十六进制数字
[:graph:] 可打印的非空白字符
[:print:] 可打印字符
[:punct:] 标点符号

  范例：
   [root@centos8 ~]#ls /etc/ | grep 'rc[.0-6]'
   rc0.d
   rc1.d
   rc2.d
   rc3.d
   rc4.d
   rc5.d
   rc6.d
   rc.d
   rc.local
   [root@centos8 ~]#ls /etc/ | grep 'rc[.0-6].'
   rc0.d
   rc1.d
   rc2.d
   rc3.d
   rc4.d
   rc5.d
   rc6.d
   rc.d
   rc.local

匹配次数
 用在要指定次数的字符后面，用于指定前面的字符要出现的次数 

 * 匹配前面的字符任意次，包括0次，贪婪模式：尽可能长的匹配
 .* 任意长度的任意字符
 \? 匹配其前面的字符0或1次,即:可有可无
 \+ 匹配其前面的字符至少1次,即:肯定有，>=1
 \{n\} 匹配前面的字符n次
 \{m,n\} 匹配前面的字符至少m次，至多n次
 \{,n\} 匹配前面的字符至多n次,<=n
 \{n,\} 匹配前面的字符至少n次 

 范例：
  [root@centos8 ~]#echo /etc/ |grep "/etc/\?"
  /etc/
  [root@centos8 ~]#echo /etc |grep "/etc/\?"
  /etc

位置锚定
 位置锚定可以用于定位出现的位置
   ^ 行首锚定，用于模式的最左侧
   $ 行尾锚定，用于模式的最右侧
   ^PATTERN$ 用于模式匹配整行
   ^$ 空行
   ^[[:space:]]*$ 空白行
   \< 或 \b 词首锚定，用于单词模式的左侧
   \> 或 \b 词尾锚定，用于单词模式的右侧
   \ 匹配整个单词 

   范例：
    [root@centos8 ~]#grep -v '^$' /etc/profile|grep -v '^#'

 分组其它
     分组：() 将多个字符捆绑在一起，当作一个整体处理，如：\(root\)+
     后向引用：分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中，这些变量的命名
     方式为: \1, \2, \3, ...
     \1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

     \(string1\(string2\)\)
     \1 ：string1\(string2\)
     \2 ：string2
      注意： 后向引用 引用前面的分组括号中的模式所匹配字符，而非模式本身


      或者\|
       a\|b #a或b 
       C\|cat #C或cat 
       \(C\|c\)at #Cat或cat

       范例：排除空行和#开头的行
        [root@centos6 ~]#grep -v '^#' /etc/httpd/conf/httpd.conf |grep -v ^$
        [root@centos6 ~]#grep -v '^#\|^$' /etc/httpd/conf/httpd.conf
        [root@centos6 ~]#grep -v '^\(#\|$\)' /etc/httpd/conf/httpd.conf
        [root@centos6 ~]#grep "^[^#]" /etc/httpd/conf/httpd.conf



扩展正则表达式
  字符匹配元字符
    . 任意单个字符
    [wang] 指定范围的字符
    [^wang] 不在指定范围的字符
    [:alnum:] 字母和数字
    [:alpha:] 代表任何英文大小写字符，亦即 A-Z, a-z
    [:lower:] 小写字母,示例:[[:lower:]],相当于[a-z]
    [:upper:] 大写字母
    [:blank:] 空白字符（空格和制表符）
    [:space:] 水平和垂直的空白字符（比[:blank:]包含的范围广）
    [:cntrl:] 不可打印的控制字符（退格、删除、警铃...）
    [:digit:] 十进制数字
    [:xdigit:]十六进制数字
    [:graph:] 可打印的非空白字符
    [:print:] 可打印字符
    [:punct:] 标点符号  

  次数匹配 
    *  匹配前面字符任意次
    ? 0或1次
    + 1次或多次
    {n} 匹配n次
    {m,n} 至少m，至多n次
    
   位置锚定
     ^ 行首
     $ 行尾
     \<, \b 语首
     \>, \b 语尾

   分组其它
    () 分组
    后向引用：\1, \2, ...
    | 或者
    a|b #a或b
    C|cat #C或cat
    (C|c)at #Cat或cat

二级标题

4.文本处理三剑客之grep
grep 命令主要对文本的（正则表达式）行基于模式进行过滤
grep: Global search REgular expression and Print out the line
作用：文本搜索工具，根据用户指定的“模式”对目标文本逐行进行匹配检查；打印匹配到的行
模式：由正则表达式字符及文本字符所编写的过滤条件

 常见选项：
  --color=auto 对匹配到的文本着色显示
  -m # 匹配#次后停止
  -v 显示不被pattern匹配到的行
  -i 忽略字符大小写
  -n 显示匹配的行号
  -c 统计匹配的行数
  -o 仅显示匹配到的字符串
  -q 静默模式，不输出任何信息
  -A # after, 后#行
  -B # before, 前#行
  -C # context, 前后各#行
  -e 实现多个选项间的逻辑or关系,如：grep –e ‘cat ’ -e ‘dog’ file
  -w 匹配整个单词
  -E 使用ERE，相当于egrep
  -F 不支持正则表达式，相当于fgrep
  -f file 根据模式文件处理
  -r 递归目录，但不处理软链接
  -R 递归目录，但处理软链接

  范例：
   grep root /etc/passwd
   grep "USER" /etc/passwd
   grep 'USER' /etc/passwd
   grep whoami /etc/passwd

   取两个文件的相同行
    [root@centos8 ~]#cat /data/f1.txt
    a
    b
    1
    c
    [root@centos8 ~]#cat /data/f2.txt
    b
    e
    f
    c
    1
    2
    [root@centos8 ~]#grep -f /data/f1.txt /data/f2.txt
    b
    c
    1
    
    df | grep '^/dev/sd' |tr -s ' ' %|cut -d% -f5|sort -n|tail -1
    
    [root@centos8 ~]#ss -nt | grep "^ESTAB" |tr -s ' ' : |cut -d: -f6|sort |uniq -c|sort -nr|head -n3

3 10.0.0.1
1 172.16.4.100
1 172.16.31.188

    [root@centos8 ~]#grep -v "^#" /etc/profile | grep -v '^$'
    [root@centos8 ~]#grep -v "^#\|^$" /etc/profile
    [root@centos8 ~]#grep -v "^\(#\|$\)" /etc/profile
    [root@centos8 ~]#grep -Ev "^(#|$)" /etc/profile
    [root@centos8 ~]#egrep -v "^(#|$)" /etc/profile
    [root@centos6 ~]#egrep -v '^(#|$)' /etc/httpd/conf/httpd.conf
    
    [root@centos8 ~]#ifconfig | grep -E '[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}'

inet 10.0.0.8 netmask 255. 255.255.0 broadcast 10.0.0.255
    inet 172.16.0.123 netmask 255.255.0.0 broadcast 172.16.255.255
    inet6 fe80::c11e:4792:7e77:12a4 prefixlen 64 scopeid 0x20
    inet 127.0.0.1 netmask 255.0.0.0
[root@centos8 ~]#ifconfig | grep -E '([0-9]{1,3}.){3}[0-9]{1,3}'
    inet 10.0.0.8 netmask 255.255.255.0 broadcast 10.0.0.255
    inet 172.16.0.123 netmask 255.255.0.0 broadcast 172.16.255.255
    inet6 fe80::c11e:4792:7e77:12a4 prefixlen 64 scopeid 0x20
    inet 127.0.0.1 netmask 255.0.0.0
[root@centos8 ~]#ifconfig eth0 | grep -Eo '([0-9]{1,3}.){3}[0-9]{1,3}'|head -1
10.0.0.8
[root@centos8 ~]#cat regex.txt
([0-9]{1,3}.){3}[0-9]{1,3}
[root@centos8 ~]#ifconfig | grep -oEf regex.txt
10.0.0.8
255.255.255.0
10.0.0.255
127.0.0.1
255.0.0.0

    [root@centos8 ~]#grep -E 'root|bash' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    operator:x:11:0:operator:/root:/sbin/nologin
    wang:x:1000:1000:wang:/home/wang:/bin/bash
    mage:x:1001:1001::/home/mage:/bin/bash
    xiaoming:x:1002:1002::/home/xiaoming:/bin/bash
    roob:x:1003:1003::/home/roob:/bin/bash
    [root@centos8 ~]#grep -e 'root' -e 'bash' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    operator:x:11:0:operator:/root:/sbin/nologin
    wang:x:1000:1000:wang:/home/wang:/bin/bash
    mage:x:1001:1001::/home/mage:/bin/bash
    xiaoming:x:1002:1002::/home/xiaoming:/b

    [root@centos8 ~]#grep "^\(.*\)\>.*\<\1$" /etc/passwd
    sync:x:5:0:sync:/sbin:/bin/sync
    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    halt:x:7:0:halt:/sbin:/sbin/halt
    bash:x:1008:1008::/home/bash:/bin/bash
    nologin:x:1011:1011::/home/nologin:/sbin/nologin

    [root@centos8 ~]#grep -E "^(.*)\>.*\<\1$" /etc/passwd
    sync:x:5:0:sync:/sbin:/bin/sync
    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    halt:x:7:0:halt:/sbin:/sbin/halt
    bash:x:1008:1008::/home/bash:/bin/bash
    nologin:x:1011:1011::/home/nologin:/sbin/nologin

    [root@centos8 ~]#egrep "^(.*)\>.*\<\1$" /etc/passwd
    sync:x:5:0:sync:/sbin:/bin/sync
    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    halt:x:7:0:halt:/sbin:/sbin/halt
    bash:x:1008:1008::/home/bash:/bin/bash
    nologin:x:1011:1011::/home/nologin:/sbin/nologin

二级标题

5.文本处理三剑客之sed

二级标题

6.文本处理三剑客之awk

你可能感兴趣的:(文本处理工具和正则表达式)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo