weixin_30542079

基础正则表达式

基本正则表达式

（一）正则表达式介绍

正则表达式是处理文件的内容，也就是字符

REGEXP ：由一类特殊字符及文本字符所编写的模式，其中有些字符（元字符）不表示字符字面意义，而表示控制或通配的功能。

程序支持：：grep,sed,awk,vim, less,nginx,varnish等

分两类：

基本正则表达式：BRE

扩展正则表达式：ERE。grep -E, egrep

正则表达式引擎：

采用不同算法，检查处理正则表达式的软件模块PCRE（Perl Compatible Regular Expressions）

元字符分类：字符匹配、匹配次数、位置锚定、分组

文件名可以使用通配符表示

*是通配符，涉及到文件管理。通配符是模糊匹配

aaa  aa.txt  access_log  anaconda-ks.cfg  anan.diff
[root@centos72 ~]# ls  a*  -l
-rw-r--r--. 1 root root        9 May 7 13:28 aaa -rw-r--r--. 1 root root 27 May 7 19:11 aa.txt -rw-r--r--. 1 root root 14372536 May 7 22:31 access_log -rw-------. 1 root root 1592 Jan 13 00:22 anaconda-ks.cfg -rw-r--r--. 1 root root 359 May 7 23:07 anan.diff

正则表达式是匹配字符串，不是匹配文件名。正则表达式是通用技术，对于开发也适用，所以非常重要。

学会了基本正则表达式也就学会了扩展的正则表达式。

正则表达式涉及到算法，正则表达式引擎和汽车的发动机类似，实际上就是软件。

采用不同算法，检查处理正则表达式的软件模块PCRE（Perl Compatible Regular Expressions）

perl语言功能太强太灵活，这就让很多人很难掌握。

代码主要是维护，经常要进行修改，所以代码写的容易理解是最好的

diff工具促进了开源软件的发展，因为可以对比代码

[root@centos72 ~]# rpm  -q  pcre
pcre-8.32-17.el7.x86_64
[root@centos72 ~]# which pcre /usr/bin/which: no pcre in (/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin) [root@centos72 ~]# yum whatprovides pcre Loaded plugins: fastestmirror Loading mirror speeds from cached hostfile pcre-8.32-17.el7.x86_64 : Perl-compatible regular expression library Repo : base pcre-8.32-17.el7.x86_64 : Perl-compatible regular expression library Repo : @anaconda

查看帮助

Regular expressions ("RE"s), as defined in POSIX.2表示其为国际上开发软件的标准

[root@centos72 ~]# man  7 regex
No manual entry for regex in section 7 [root@centos72 ~]# yum install man-pages Loaded plugins: fastestmirror Loading mirror speeds from cached hostfile Resolving Dependencies --> Running transaction check ---> Package man-pages.noarch 0:3.53-5.el7 will be installed --> Finished Dependency Resolution Dependencies Resolved ======================================================================================================== Package Arch Version Repository Size ======================================================================================================== Installing: man-pages noarch 3.53-5.el7 base 5.0 M Transaction Summary ======================================================================================================== Install 1 Package Total download size: 5.0 M Installed size: 4.6 M Is this ok [y/d/N]: y Downloading packages: Running transaction check Running transaction test Transaction test succeeded Running transaction Installing : man-pages-3.53-5.el7.noarch 1/1 Verifying : man-pages-3.53-5.el7.noarch 1/1 Installed: man-pages.noarch 0:3.53-5.el7 Complete! [root@centos72 ~]# man 7 regex

（二）基本正则表达式元字符匹配

. 匹配任意单个字符

[ ] 匹配指定范围内的任意单个字符

[ ^ ] 匹配指定范围外的任意单个字符

[:alnum:] 字母和数字

[:alpha:] 代表任何英文大小写字符，亦即 A-Z, a-z

[:lower:] 小写字母 [:upper:] 大写字母

[:blank:] 空白字符（空格和制表符）

[:space:] 水平和垂直的空白字符（比[:blank:] 包含的范围广）

[:cntrl:] 不可打印的控制字符（退格、删除、警铃...）
[:digit:] 字十进制数字 [:xdigit:] 十六进制数字

[:graph:] 可打印的非空白字符

[:print:] 可打印字符

[:punct:] 标点符号

（1）. 匹配任意单个字符

[root@centos72 ~]# grep  r..t  /etc/passwd
root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin [root@centos72 ~]# grep root /etc/passwd root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin

（2）[ ] 匹配指定范围内的任意单个字符

和文件通配符类似，只是适用的地方不同

[root@centos72 ~]# grep  [abco][abo]  /etc/passwd
root:x:0:0:root:/root:/bin/bash lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin mail:x:8:12:mail:/var/spool/mail:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin nobody:x:99:99:Nobody:/:/sbin/nologin postfix:x:89:89::/var/spool/postfix:/sbin/nologin wang:x:1000:1000:wang:/home/wang:/bin/bash [root@centos72 ~]# grep r[abco][abo]t /etc/passwd root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin

[root@centos72 ~]# echo   raat   |  grep  r[abco][abo]t 
raat
[root@centos72 ~]# echo   ract   |  grep r[abco][abo]t [root@centos72 ~]# echo rabt | grep r[abco][abo]t rabt [root@centos72 ~]# echo raot | grep r[abco][abo]t raot

（3）[^] 匹配指定范围外的任意单个字符

[root@centos72 ~]# echo   ract   |  grep  r[abco][^abo]t 
ract
[root@centos72 ~]# echo   ract   |  grep  r[^abco][^abo]t

（4）[:digit:] 字十进制数字 [:xdigit:] 十六进制数字

取出主版本号

在写脚本的时候要判断版本的不同

[[:digit:]]注意要写两个中括号，第1个中括号表示0-9，第2个中括号表示0-9的某个数字

[root@centos72 ~]# cat  /etc/centos-release  |  grep   [[:digit:]]
CentOS Linux release 7.5.1804 (Core)

只取6和7这个数字

如果版本在达到了10，那么也要对其考虑

[root@centos72 ~]# cat  /etc/centos-release  |  grep   -o  [[:digit:]]  
7
5
1 8 0 4

使用head过滤出了第1个

[root@centos72 ~]# cat  /etc/centos-release  |  grep   -o  [[:digit:]]  | head -n1
7

取出6版本

[root@centos65 ~]# cat  /etc/centos-release  |  grep   -o  [[:digit:]]  
6
8

[root@centos65 ~]# cat  /etc/centos-release  |  grep   -o  [[:digit:]]  | head -n1
6

如果版本在达到了10，那么也要对其考虑

[root@centos72 ~]# cat  /app/centos-release 
CentOS Linux release 17.5.1804 (Core) 
[root@centos72 ~]# cat /app/centos-release | grep -o [[:digit:]] 1 7 5 1 8 0 4 [root@centos72 ~]# cat /app/centos-release | grep -w [[:digit:]] CentOS Linux release 17.5.1804 (Core)

（三）匹配次数

匹配次数：用在要指定次数的字符后面，用于指定前面的字符要出现的次数

* 匹配前面的字符任意次，包括0次

贪婪模式：尽可能长的匹配

.* 任意长度的任意字符

\? 匹配其前面的字符0 或1次

\+ 匹配其前面的字符至少1次

\{n\} 匹配前面的字符n次

\{m,n\} 匹配前面的字符至少m 次，至多n次

\{,n\} 匹配前面的字符至多n次

\{n,\} 匹配前面的字符至少n次

ab*的情况是a,ab,abb,abbb,abbbb.......

所以和a没有关系的，只是打酱油的

文件通配符的*和正则表达式的*不一样。

通配符针对的是文件，比如下面匹配的是a开头的文件

[root@centos72 ~]# ls  a*
aaa  aa.txt  access_log  anaconda-ks.cfg  anan.diff
[root@centos72 ~]# ll  a*  
-rw-r--r--. 1 root root        9 May 7 13:28 aaa -rw-r--r--. 1 root root 27 May 7 19:11 aa.txt -rw-r--r--. 1 root root 14372536 May 7 22:31 access_log -rw-------. 1 root root 1592 Jan 13 00:22 anaconda-ks.cfg -rw-r--r--. 1 root root 359 May 7 23:07 anan.diff

[root@centos72 ~]# grep  root  /etc/passwd
root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin [root@centos72 ~]# grep ro*t /etc/passwd root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin

（2）.* 任意长度的任意字符

因为.是匹配任意单个字符，*匹配前面的字符任意次

贪婪模式：尽可能长的匹配，经常使用

巧记吃了点心才有动力去做任何事情

[root@centos72 ~]# grep   r.*t  /etc/passwd
root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin polkitd:x:999:998:User for polkitd:/:/sbin/nologin sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin postfix:x:89:89::/var/spool/postfix:/sbin/nologin apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin

[root@centos72 ~]# ls  |  grep  a.*
aaa
aa.txt
access_log
anaconda-ks.cfg

注意如果涉及到文件名，那么关键字就要加双引号，否则会被认为是通配符

[root@centos72 ~]# grep  "a*"  anaconda-ks.cfg 
#version=DEVEL # System authorization information auth --enableshadow --passalgo=sha512 # Use CDROM installation media cdrom # Use graphical install graphical # Run the Setup Agent on first boot firstboot --enable ignoredisk --only-use=sda # Keyboard layouts keyboard --vckeymap=us --xlayouts='us' # System language lang en_US.UTF-8 # Network information network --bootproto=dhcp --device=ens33 --onboot=off --ipv6=auto --no-activate network --hostname=centos72.huawei.com # Root password rootpw --iscrypted $6$3ZpKJEd3ctkruWkF$ACv/Y4HSNb4lTqk4Gbol157B2lHw0AVcKM1rjEshEOrMcIIXw1DvoPPCZy3y3i.SijcTdTAfvFs/uFPwLxKd51 # System services services --disabled="chronyd" # System timezone timezone Asia/Shanghai --isUtc --nontp user --name=wang --password=$6$PqqaCIq7qipkXclF$5idE9A8TzG/yLzqHbmlSg9cVaNUmxPG85y/K81a0KSrosFH/srLzY0HQxeTUMZKs.KVoyJOphaA8Xz.nidUF// --iscrypted --gecos="wang" # System bootloader configuration bootloader --location=mbr --boot-drive=sda # Partition clearing information clearpart --none --initlabel # Disk partitioning information part swap --fstype="swap" --ondisk=sda --size=2048 part /app --fstype="xfs" --ondisk=sda --size=20480 part / --fstype="xfs" --ondisk=sda --size=51200 part /boot --fstype="xfs" --ondisk=sda --size=1024 %packages @^minimal @core %end %addon com_redhat_kdump --disable --reserve-mb='auto' %end %anaconda pwpolicy root --minlen=6 --minquality=1 --notstrict --nochanges --notempty pwpolicy user --minlen=6 --minquality=1 --notstrict --nochanges --emptyok pwpolicy luks --minlen=6 --minquality=1 --notstrict --nochanges --notempty %end

[root@centos65 ~]# cat  anaconda-ks.cfg  |  grep  a*
[root@centos65 ~]# cat  anaconda-ks.cfg  |  grep  a* [root@centos65 ~]# cat anaconda-ks.cfg | grep a* [root@centos65 ~]# cat anaconda-ks.cfg | grep a* [root@centos65 ~]# cat anaconda-ks.cfg | grep a*

[root@centos72 ~]# grep  a* anaconda-ks.cfg 
[root@centos72 ~]# grep  a* anaconda-ks.cfg 
[root@centos72 ~]# grep  a* anaconda-ks.cfg [root@centos72 ~]# grep a* anaconda-ks.cfg [root@centos72 ~]# ls anaconda-ks.cfg | grep a* [root@centos72 ~]# ls anaconda-ks.cfg | grep a* [root@centos72 ~]# ls anaconda-ks.cfg | grep a* [root@centos72 ~]# ls anaconda-ks.cfg | grep "a*" anaconda-ks.cfg

通过管道传输之后，文件名就是字符，而添加双引号就是正则表达式

因为查看的文件名内容，所以后面的正则表达式要添加引号

[root@centos72 ~]# ls  |  grep  "a*" aaa aa.txt access_log anaconda-ks.cfg f1 f2 f3 f4 f5 grep

单引号也可以

[root@centos72 ~]# ls  |  grep  'a*' aaa aa.txt access_log anaconda-ks.cfg f1 f2 f3 f4 f5 grep

\? 匹配其前面的字符0或1次，也就是前面的字符是可有可无的

因为查看的文件名内容，所以后面的正则表达式要添加引号

前面加上反斜线是因为在通配符里面？是有特殊含义的

[root@centos72 ~]# cat  /etc/passwd  |  grep  "ba\?" root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin sync:x:5:0:sync:/sbin:/bin/sync shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown halt:x:7:0:halt:/sbin:/sbin/halt mail:x:8:12:mail:/var/spool/mail:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin games:x:12:100:games:/usr/games:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin nobody:x:99:99:Nobody:/:/sbin/nologin systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin dbus:x:81:81:System message bus:/:/sbin/nologin polkitd:x:999:998:User for polkitd:/:/sbin/nologin sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin postfix:x:89:89::/var/spool/postfix:/sbin/nologin wang:x:1000:1000:wang:/home/wang:/bin/bash apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin

[root@centos65 ~]# cat  anaconda-ks.cfg  |  grep  a\?
[root@centos65 ~]# cat  anaconda-ks.cfg  |  grep  "a\?" # Kickstart file automatically generated by anaconda. #version=DEVEL install cdrom lang en_US.UTF-8 keyboard us network --onboot no --device eth0 --bootproto dhcp --noipv6 rootpw --iscrypted $6$PnGoqdV0v.gilohW$pJsYiUbd8ZRFVyVXnZzJQutfCR.WGGsJGREUV4r6IguF9mBPXog/UJVw7RBdnF4m76RuGaQHHBZiAv46LcugO1 firewall --service=ssh authconfig --enableshadow --passalgo=sha512 selinux --enforcing timezone Asia/Shanghai bootloader --location=mbr --driveorder=sda --append="crashkernel=auto rhgb quiet" # The following is the partition information you requested # Note that any partitions you deleted are not expressed # here so unless you clear all partitions first, this is # not guaranteed to work #clearpart --none #part /boot --fstype=ext4 --size=1024 #part / --fstype=ext4 --size=50000 #part /app --fstype=ext4 --size=20000 #part swap --size=2048 repo --name="CentOS" --baseurl=cdrom:sr0 --cost=100 %packages @core @server-policy @workstation-policy %end

全部都匹配了，0次或者1次

[root@centos72 ~]# cat  1.txt  |  grep  a\?
[root@centos72 ~]# cat  1.txt | grep "a\?" a ab 1 2 3 b c [root@centos72 ~]# cat 1.txt a ab 1 2 3 b c

注意是贪婪匹配，也就是只要包含就可以了，超过一次相同的关键字都可以

实际上也就是匹配了多次

比如"a\?"只要有一个a就可以，如果是aa,aaa也可以，匹配了2次，3次

[root@centos72 ~]# cat  2.txt  |  grep  "a\?" a aa aaa aaaa aaaaa 1234 123456 12a sdfg dfgaa dgbaaafv dgvhaaaaa [root@centos72 ~]# cat 2.txt | grep "a\?" | wc 12 12 66 [root@centos72 ~]# cat 2.txt a aa aaa aaaa aaaaa 1234 123456 12a sdfg dfgaa dgbaaafv dgvhaaaaa [root@centos72 ~]# cat 2.txt | wc 12 12 66

匹配的关键字就显示红色

[root@centos72 ~]# cat  3.txt  |  grep  "ba\?" ba b bbb badgkcg fkfbljoajf baakkfj baaajko [root@centos72 ~]# cat 3.txt | grep "ba\?" | wc 7 7 44

[root@centos72 ~]# cat  3.txt 
ba
b
bbb
badgkcg
aaajlnhl
fkfbljoajf
baakkfj
baaajko
[root@centos72 ~]# cat  3.txt |  wc 8 8 53

\+ 匹配其前面的字符至少1次

[root@centos72 ~]# cat  /etc/passwd  |  grep  "ba\+" root:x:0:0:root:/root:/bin/bash wang:x:1000:1000:wang:/home/wang:/bin/bash

[root@centos72 ~]# cat  3.txt  |  grep  "ba\+" ba badgkcg baakkfj baaajko [root@centos72 ~]# cat 3.txt ba b bbb badgkcg aaajlnhl fkfbljoajf baakkfj baaajko

\{n\} 匹配前面的字符n次

先写大括号，中间是次数，在括号的前面都添加\，对大括号进行转义，最前面写上要过滤出来的关键字

下面表示匹配出现3次b

[root@centos72 ~]#  cat  3.txt  |  grep  "b\{3\}" bbb [root@centos72 ~]# cat 3.txt ba b bbb badgkcg aaajlnhl fkfbljoajf baakkfj baaajko

[root@centos72 ~]# cat  3.txt 
ba
b
bbb
badgkcg
aaajlnhl
fkfbljoajf
baakkfj
baaajko

贪婪匹配

文件出现了2次及以上，那么2次都可匹配

[root@centos72 ~]#  cat  3.txt  |  grep  "b\{2\}" bbb [root@centos72 ~]# cat 3.txt | grep "b\{1\}" ba b bbb badgkcg fkfbljoajf baakkfj baaajko

正则表达式最好都添加引号

[root@centos72 ~]# echo  "bbb"  |   grep  "b\{1\}" bbb [root@centos72 ~]# echo "bbb" | grep "b\{1\}" bbb [root@centos72 ~]# echo 'bbb' | grep "b\{1\}" bbb [root@centos72 ~]# echo 'bbb' | grep "b\{2\}" bbb [root@centos72 ~]# echo 'bbb' | grep "b\{3\}" bbb [root@centos72 ~]# echo 'bbb' | grep b\{3\} [root@centos72 ~]# echo 'bbb' | grep b\{3\} [root@centos72 ~]# echo 'bbb' | grep b\{2\} [root@centos72 ~]# echo 'bbb' | grep b\{1\} [root@centos72 ~]# echo "bbb" | grep b\{1\} [root@centos72 ~]# echo "bbb" | grep b\{2\} [root@centos72 ~]# echo "bbb" | grep b\{2\}

单引号也可以

[root@centos72 ~]# cat  /etc/passwd  | grep  'o\{1\}' root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown mail:x:8:12:mail:/var/spool/mail:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin games:x:12:100:games:/usr/games:/sbin/nologin ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin nobody:x:99:99:Nobody:/:/sbin/nologin systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin dbus:x:81:81:System message bus:/:/sbin/nologin polkitd:x:999:998:User for polkitd:/:/sbin/nologin sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin postfix:x:89:89::/var/spool/postfix:/sbin/nologin wang:x:1000:1000:wang:/home/wang:/bin/bash

\{m,n\} 匹配前面的字符至少m次，至多n次

[root@centos72 ~]# echo  "bbb"  |   grep  "b\{1,3\}" bbb [root@centos72 ~]# echo "bbb" | grep "b\{1,2\}" bbb

[root@centos72 ~]# cat  /etc/fstab    |   grep  "u\{2,3\}" [root@centos72 ~]# cat /etc/fstab | grep -i "u\{2,3\}" UUID=5998ead0-b370-4859-9153-ecf4e2b9dd84 / xfs defaults 0 0 UUID=ac6bb7e3-fa78-4eb2-b00d-e85c421c1bb0 /app xfs defaults 0 0 UUID=92886c3f-42a3-40f4-8cf7-c6890ca3a52e /boot xfs defaults 0 0 UUID=104520e1-0e97-4248-8fd0-a21e7d88a881 swap swap defaults 0 0

[root@centos72 ~]# cat  /etc/services | grep  "u\{2,3\}" uucp-path 117/tcp uucp-path 117/udp uucp 540/tcp uucpd # uucp daemon uucp 540/udp # uucpd uucp-rlogin 541/tcp # uucp-rlogin uucp-rlogin 541/udp # uucp-rlogin uuidgen 697/tcp # UUIDGEN uuidgen 697/udp # UUIDGEN opequus-server 2400/tcp # OpEquus Server opequus-server 2400/udp # OpEquus Server suucp 4031/tcp # UUCP over SSL suucp 4031/udp # UUCP over SSL continuus 5412/tcp # Continuus continuus 5412/udp # Continuus aequus 23456/tcp # Aequus Service aequus-alt 23457/tcp # Aequus Service Mgmt [root@centos72 ~]#

[root@centos72 ~]# echo  "bbbbbbbbbb"  |   grep  "b\{5,9\}" bbbbbbbbbb [root@centos72 ~]# echo "bbbbbbbbb" | grep "b\{5,9\}" bbbbbbbbb [root@centos72 ~]# echo "bbbbbbbb" | grep "b\{5,9\}" bbbbbbbb [root@centos72 ~]# echo "bbbbbbb" | grep "b\{5,9\}" bbbbbbb [root@centos72 ~]# echo "bbbbbb" | grep "b\{5,9\}" bbbbbb [root@centos72 ~]# echo "bbbbbbbbbb" | wc 1 1 11

如果是最小次数或者最大次数的整数倍，那么就会匹配整数次

刚好30个字符，那么匹配了6次，也就是最大次数的整数倍

[root@centos72 ~]# echo  "bbbbbbbbbbbbbbbbbbbbbbbbbbbbbb"  |   grep  "b\{4,5\}" bbbbbbbbbbbbbbbbbbbbbbbbbbbbbb [root@centos72 ~]# echo "bbbbbbbbbbbbbbbbbbbbbbbbbbbbbb" | wc 1 1 31

刚好14个字符，那么匹配了7次，也就是最小次数的整数倍

[root@centos72 ~]#  echo  "bbbbbbbbbbbbbb" | grep "b\{2,4\}" bbbbbbbbbbbbbb [root@centos72 ~]# echo "bbbbbbbbbbbbbb" | wc 1 1 15

也可以匹配最小次数和最大次数的整数倍

3和7加起来是10，刚好匹配了1次最小次数和最大次数之和

[root@centos72 ~]#  echo  "bbbbbbbbbb" | wc
      1 1 11 [root@centos72 ~]# echo "bbbbbbbbbb" | grep "b\{3,7\}" bbbbbbbbbb

注意不可以匹配最小次数和最大次数之间的次数，比如最小次数和最大次数是3，5

那么不可以匹配到7

\{,n\} 匹配前面的字符至多n次

虽然是7个字符，超过了5次，但是可以匹配多次

[root@centos72 ~]# echo  "bbbbbbb" |   wc
      1 1 8 [root@centos72 ~]# echo "bbbbbbb" | grep "b\{3,5\}" bbbbbbb [root@centos72 ~]# echo "bbbbbbb" | grep "b\{,5\}" bbbbbbb

\{n,\} 匹配前面的字符至少n次

[root@centos72 ~]# echo  "bbbbbbb" |   wc
      1 1 8 [root@centos72 ~]# echo "bbbbbbb" | grep "b\{3,5\}" bbbbbbb [root@centos72 ~]# echo "bbbbbbb" | grep "b\{,5\}" bbbbbbb [root@centos72 ~]# echo "bbbbbbb" | grep "b\{5,\}" bbbbbbb

为什么显示的是8个字符，实际上是7个字符，因为回车换行占用一个字符

[root@centos72 ~]# cat  4.txt 
bbbbbbb
[root@centos72 ~]# cat  4.txt  | wc 1 1 8 [root@centos72 ~]# hexdump -C 4.txt 00000000 62 62 62 62 62 62 62 0a |bbbbbbb.| 00000008

[root@centos72 ~]# cat  5.txt 
aaa
aaaa
aaaaa
aaaaaa
bcdaaaa
hdkfaaaa
hkflieaaaajdlhw
aa
a
fgbaa
[root@centos72 ~]# cat  5.txt  |  grep a\{3,\} [root@centos72 ~]# cat 5.txt | grep "a\{3,\}" aaa aaaa aaaaa aaaaaa bcdaaaa hdkfaaaa hkflieaaaajdlhw

前面的a一定要有，后面的a可有可无

示例1——取出主版本号

适用一位数和两位数

目前6是主流，也发行centos7版本，如果8出来那么主流就是7了，一般是滞后一个版本

法1

-o: 仅显示匹配到的字符串

\+ 匹配其前面的字符至少1次

下面假设版本是17

[root@centos72 ~]# grep  -o  "[0-9]\+"   /app/centos-release
17 5 1804 [root@centos72 ~]# grep -o "[0-9]\+" /app/centos-release | head -n1 17

[root@centos65 ~]# echo  111  |   grep  -o  "[0-9]\+" 111 [root@centos65 ~]# echo "111" | grep -o "[0-9]\+" 111 [root@centos65 ~]# echo "123456" | grep -o "[0-9]\+" 123456 [root@centos65 ~]# echo 123456 | grep -o "[0-9]\+" 123456

[root@centos65 ~]# cp  /etc/centos-release   /app/
[root@centos65 ~]# vim  /app/centos-release 
[root@centos65 ~]# cat  /app/centos-release 
CentOS release 16.8 (Final) [root@centos65 ~]# grep -o "[0-9]\+" /app/centos-release | head -n1 16

[root@centos72 ~]# grep  -o  "[0-9]\+"  /etc/centos-release  | head  1 head: cannot open ‘1’ for reading: No such file or directory [root@centos72 ~]# grep -o "[0-9]\+" /etc/centos-release | head -n1 7 [root@centos72 ~]# grep -o "[0-9]\+" /etc/centos-release | head -1 7

现在的版本

[root@centos65 ~]# grep  -o  "[0-9]\+"  /etc/centos-release  | head  -n1 6 [root@centos65 ~]# grep -o "[0-9]\+" /etc/centos-release | head -1 6 [root@centos65 ~]# grep -o "[0-9]\+" /etc/centos-release | head 1 head: cannot open `1' for reading: No such file or directory

[root@centos65 ~]# cat   /etc/centos-release 
CentOS release 6.8 (Final)
[root@centos72 ~]# cat   /etc/centos-release CentOS Linux release 7.5.1804 (Core)

法2：

去掉多余的空格

[root@centos72 ~]# cat  /app/centos-release  | tr -s ''
CentOS Linux release 17.5.1804 (Core)

以空格为分割符取第4个字段

[root@centos72 ~]# cat  /app/centos-release  | tr -s '' | cut -d" " -f4 17.5.1804

以点作为分割符


[root@centos72 ~]# cat  /app/centos-release  | tr -s '' | cut -d" " -f4 | grep "[[:digit:]]\{2\}" 17.5.1804 [root@centos72 ~]# cat /app/centos-release | tr -s '' | cut -d" " -f4 | grep "[[:digit:]]\{2\}" | cut -d. -f1 17

[root@centos65 ~]# cat  /app/centos-release |tr -s '' | cut -d" " -f3 | grep "[[:digit:]]\{1\}" |cut -d. -f1 16

（四）位置锚定

位置锚定：定位出现的位置
^ 行首锚定，用于模式的最左侧
$ 行尾锚定，用于模式的最右侧
^PATTERN$ 用于模式匹配整行
^$ 空行
^[[:space:]]*$ 空白行
\< 或或 \b 词首锚定，用于单词模式的左侧
\> 或或 \b 词尾锚定；用于单词模式的右侧
\

单纯的过滤不管关键字在什么地方都会显示

[root@centos72 ~]# grep  root  /etc/passwd
root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin

（1） ^ 行首锚定，用于模式的最左侧

显示以某个关键字开头的行

[root@centos72 ~]# grep  ^root  /etc/passwd
root:x:0:0:root:/root:/bin/bash [root@centos72 ~]# grep "^root" /etc/passwd root:x:0:0:root:/root:/bin/bash

[root@centos72 ~]# grep  '^root'  /etc/passwd root:x:0:0:root:/root:/bin/bash

（2）$行尾锚定，用于模式的最右侧

行尾锚定，用于模式的最右侧

行尾锚定，

[root@centos72 ~]# grep  'bash$'  /etc/passwd root:x:0:0:root:/root:/bin/bash wang:x:1000:1000:wang:/home/wang:/bin/bash

（3）显示非空行

空行就是起始和结尾没有任何内容；空白行表示空行的一种，而且还要空格

^$ 空行

^[[:space:]]*$ 空白行

[root@centos72 ~]# cat  /etc/issue 
\S
Kernel \r on an \m

[root@centos72 ~]# cat  /etc/issue | grep  ^$

[root@centos72 ~]# cat /etc/issue | grep "^$" [root@centos72 ~]# cat /etc/issue | grep "^$" | wc 1 0 1

空行和空白行显示的内容是一样的

[root@centos72 ~]# cat /etc/issue  |  grep  ^[[:space:]]*$

[root@centos72 ~]# cat /etc/issue  |  grep  ^[[:space:]]*$ | wc 1 0 1

下面是空行，但空行没有空格

空格是肉眼看不出来的

[root@centos72 ~]# cat -A  /etc/issue
\S$
Kernel \r on an \m$
$

行尾锚定，用于模

取反即可

[root@centos72 ~]# cat  /etc/issue | grep  -v   "^$" \S Kernel \r on an \m [root@centos72 ~]# cat /etc/issue | grep -v "^$" | wc 2 6 22

[root@centos72 ~]# cat /etc/issue  |  grep  -v ^[[:space:]]*$
\S
Kernel \r on an \m
[root@centos72 ~]# cat /etc/issue  |  grep  -v ^[[:space:]]*$  | wc 2 6 22

行尾锚定，用于模式的最右侧

行尾锚定，用于模

下面是空行，空行有空格

[root@centos72 ~]# cat -A  /etc/issue
\S$
Kernel \r on an \m$
       $

（4）显示空白行

"^$"只能显示空行，而^[[:space:]]*$的范围更广，可以显示空行和空白行

*表示0或者有

[root@centos72 ~]# cat  /etc/issue | grep  "^$" [root@centos72 ~]# cat /etc/issue | grep "^$" | wc 0 0 0 [root@centos72 ~]# cat /etc/issue | grep ^[[:space:]]*$ [root@centos72 ~]# cat /etc/issue | grep ^[[:space:]]*$ | wc 1 0 8

[root@centos72 ~]# cat /etc/issue  |  grep  -v ^$  | wc
      3       6      30 [root@centos72 ~]# cat /etc/issue | grep -v ^$ \S Kernel \r on an \m [root@centos72 ~]# cat /etc/issue | grep -v ^[[:space:]]*$ \S Kernel \r on an \m [root@centos72 ~]# cat /etc/issue | grep -v ^[[:space:]]*$ | wc 2 6 22

"^[[:space:]]$"和"^$"显示的结果一样

"^[[:space:]]$"表示空格或者tab键，也就是有换行

而"^$"显示的是空行

[root@centos72 ~]# cat /etc/issue  |  grep  "^[[:space:]]$" [root@centos72 ~]# cat /etc/issue | grep "^[[:space:]]$" | wc 0 0 0

（5）\< 或 \b 词首锚定，用于单词模式的左侧

\<可以理解为倒下的脱字符^

左边小括号就是词首，因为我们习惯于从左到右看内容

注意要判断是否为单词，那么除了子母数字下划线的都是单词的分隔符

[root@centos72 ~]# cat  /etc/passwd  | grep    "\" root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin

[root@centos72 ~]# cat  /etc/issue  | grep    "\" Kernel \r on an \m [root@centos72 ~]# cat /etc/issue | grep "\" [root@centos72 ~]# cat /etc/issue | grep -i "\" Kernel \r on an \m

注意要判断是否为单词，那么除了子母数字下划线的都是单词的分隔符

[root@centos72 ~]# echo  "aa_root"   | grep    "\" [root@centos72 ~]# echo "aa1root" | grep "\" [root@centos72 ~]# echo "aacroot" | grep "\" [root@centos72 ~]# echo "aa-root" | grep "\" aa-root [root@centos72 ~]# echo "aa root" | grep "\" aa root [root@centos72 ~]# echo "aa+ root" | grep "\" aa+ root [root@centos72 ~]# echo "aa=root" | grep "\" aa=root [root@centos72 ~]# echo "aa@root" | grep "\" aa@root [root@centos72 ~]# echo "aa！root" | grep "\" aa！root [root@centos72 ~]# echo "aa……root" | grep "\" aa……root

\> 或或 \b 词尾锚定；用于单词模式的右侧

[root@centos72 ~]# cat  /etc/passwd  | grep    "h\>" root:x:0:0:root:/root:/bin/bash wang:x:1000:1000:wang:/home/wang:/bin/bash

注意不要使用b作为词首词尾锚定，容易搞混的

[root@centos72 ~]# echo  "aa……root"   | grep    "\br" aa……root [root@centos72 ~]# echo "aa……rootr" | grep "r\b" aa……rootr [root@centos72 ~]# echo "aa……rootr" | grep "\br\b"

（6）\ 匹配整个单词，也就是完全匹配

[root@centos72 ~]# cat  /etc/passwd | grep  "\\"
> ^C [root@centos72 ~]# cat /etc/passwd | grep "\" root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin

注意cat /etc/passwd | grep root是模糊匹配

[root@centos72 ~]# cat  /etc/passwd | grep  "\" root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin [root@centos72 ~]# cat /etc/passwd | grep root root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin [root@centos72 ~]# cat /etc/passwd | grep "\" | wc 2 2 77 [root@centos72 ~]# cat /etc/passwd | grep root | wc 2 2 77

行尾锚定，用于模式的最右侧行尾锚定，用于模式的最右侧

创建一个用户

注意cat /etc/passwd | grep root是模糊匹配，范围更广

[root@centos72 ~]# useradd  rooter
[root@centos72 ~]# cat  /etc/passwd | grep  root 
root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin rooter:x:1001:1001::/home/rooter:/bin/bash [root@centos72 ~]# cat /etc/passwd | grep "\" root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin [root@centos72 ~]# cat /etc/passwd | grep root | wc 3 3 120 [root@centos72 ~]# cat /etc/passwd | grep "\" | wc 2 2 77 [root@centos72 ~]#

完全匹配和加上选项w的结果是一样的

[root@centos72 ~]# cat  /etc/passwd | grep -w   root 
root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin [root@centos72 ~]# cat /etc/passwd | grep -w root | wc 2 2 77

在下面的文件里面有很多带下划线的单纯后面加上（）比如apply_sysctl()

[root@centos72 ~]# cat /etc/init.d/functions

显示含有数字字母或者下划线的函数

[root@centos72 ~]# cat /etc/init.d/functions  | grep  ".*{$" systemctl_redirect () { checkpid() { __kill_pids_term_kill_checkpids() { __kill_pids_term_kill() { __pids_var_run() { __pids_pidof() { daemon() { killproc() { pidfileofproc() { pidofproc() { status() { echo_success() { echo_failure() { echo_passed() { echo_warning() { update_boot_stage() { success() { failure() { passed() { warning() { action() { strstr() { is_ignored_file() { convert2sec() { is_true() { is_false() { apply_sysctl() { [root@centos72 ~]# cat /etc/init.d/functions | grep ".*{$" | tr -d { systemctl_redirect () checkpid() __kill_pids_term_kill_checkpids() __kill_pids_term_kill() __pids_var_run() __pids_pidof() daemon() killproc() pidfileofproc() pidofproc() status() echo_success() echo_failure() echo_passed() echo_warning() update_boot_stage() success() failure() passed() warning() action() strstr() is_ignored_file() convert2sec() is_true() is_false() apply_sysctl()

法2

_和a-Z是或的关系

[root@centos72 ~]# grep  -o   "^[_a-Z]*()"   /etc/init.d/functions 
checkpid()
__kill_pids_term_kill_checkpids()
__kill_pids_term_kill()
__pids_var_run()
__pids_pidof()
daemon()
killproc()
pidfileofproc()
pidofproc()
status()
echo_success()
echo_failure()
echo_passed()
echo_warning()
update_boot_stage()
success()
failure()
passed()
warning()
action()
strstr()
is_ignored_file()
is_true()
is_false()
apply_sysctl()
[root@centos72 ~]#

法3

字母数字下划线是必须要有1个，空白可有可无

[root@centos72 ~]# grep  -o   "^[[:alnum:]_]\+[[:space:]]*()"   /etc/init.d/functions   
systemctl_redirect ()
checkpid()
__kill_pids_term_kill_checkpids()
__kill_pids_term_kill()
__pids_var_run()
__pids_pidof()
daemon()
killproc()
pidfileofproc()
pidofproc()
status()
echo_success()
echo_failure()
echo_passed()
echo_warning()
update_boot_stage()
success()
failure()
passed()
warning()
action()
strstr()
is_ignored_file()
convert2sec()
is_true()
is_false()
apply_sysctl()
[root@centos72 ~]# grep -o "^[[:alnum:]_]\+[[:space:]]*()" /etc/init.d/functions | wc 27 28 384 [root@centos72 ~]#

（7）分组： 将一个或多个字符捆绑在一起，当作一个整体进行处理。

分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中，

这些变量的命名方式为: \1, \2, \3, ...

\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

示例： $string1\+\(string2$*\)
\1 ：string1\+$string2$*
\2 ：string2

（8）后向引用：引用前面的分组括号中的模式所匹配字符，而非模式本身
或者：：\|
示例：a\|b: a 或b

C\|cat: C 或cat

$C\|c$at:Cat 或cat

注意\是对（），|进行转义

下面$a\|b\|c$是一个整体，并且是或的关系

[root@centos72 ~]# echo  ax bx cx  | grep  "\(a\|b\|c\)x" ax bx cx

如果不加括号，那么就不是组合了

[root@centos72 ~]# echo  ax bx cx  | grep  "\a\|b\|c\x" ax bx cx

显示t重复2次及以上

[root@centos72 ~]# echo  rootrootroottt  | grep  "root\{2,\}" rootrootroottt

显示root重复2次及以上

注意在基本正则表达式里面\要写的，进行转义

[root@centos72 ~]# echo  rootrootroot  | grep  "\(root\)\{2,\}" rootrootroot

分组： 将一个或多个字符捆绑在一起，当作一个整体进行处理

后向引用：引用前面的分组括号中的模式所匹配字符，而非模式本身

中间是两个字符都可以，空格不行

[root@centos72 ~]# echo  axyb  | grep  "\(a..b\)" axyb

[root@centos72 ~]# echo  ab  | grep  "\(a..b\)" [root@centos72 ~]# echo a b | grep "\(a..b\)" [root@centos72 ~]# echo a b | grep "\(a..b\)"

如果要表示axyb xx a12b yyy那么要使用两次分组

[root@centos72 ~]# echo  axyb  xx  a12b  yyy  | grep  "\(a..b\).*\(a..b\).*" axyb xx a12b yyy

下面是3种不同的情况:

axyb xx a12b yyy

axyb xx axyb yyy

a12 xx a12b yyy

使用正则表达式，可以使用相同的写法：

[root@centos72 ~]# echo  axyb  xx  a12b  yyy  | grep  "\(a..b\).*\(a..b\)*" axyb xx a12b yyy [root@centos72 ~]# echo axyb xx axyb yyy | grep "\(a..b\).*\(a..b\)*" axyb xx axyb yyy [root@centos72 ~]# echo a12b xx a12b yyy | grep "\(a..b\).*\(a..b\)*" a12b xx a12b yyy

[root@centos72 ~]# echo  axyb  xx  a12b  yyy  | grep  "\(a..b\).*\(a..b\).*" axyb xx a12b yyy [root@centos72 ~]# echo axyb xx axyb yyy | grep "\(a..b\).*\(a..b\).*" axyb xx axyb yyy [root@centos72 ~]# echo a12b xx a12b yyy | grep "\(a..b\).*\(a..b\).*" a12b xx a12b yyy

如果是后面两种情况，可以使用其他方法表示

因为出现了两次相同的字符，为了方便就不要再写一遍了

\1代表了(a..b\)里面的表达出来的字符串

[root@centos72 ~]# echo  a12b  xx  a12b  yyy  | grep  "\(a..b\).*\1.*" a12b xx a12b yyy

如果是两个正则表达式分组，并且是不同的

[root@centos72 ~]# echo  a12b  xx  n12m  yyy  | grep  "\(a..b\).*\(n..m\).*" a12b xx n12m yyy

\1调用了第1个分组(a..b\)里面的表达出来的字符串,.*都表示任意个任意字符串，\2表示调用了第2个分组（x..y \）里面的表达出来的字符串

后向引用：引用前面的分组括号中的模式所匹配字符，而非模式本身，在此例中就不是模式(a..b\)以及（x..y \），而是模式匹配出来的字符

\1对应第1个分组，\2对应第2个分组

0930(a..b\)出现两次并且是里面的字符是完全一样的，（x..y）出现两次并且是里面的字符是完全一样的

情况1

下面的完全一样的两部分：

[root@centos72 ~]# echo  a12bdggxxxxery a12bdggxxxxery |  grep   "\(a..b\).*\(x..y\).*\1.*\2" a12bdggxxxxery a12bdggxxxxery [root@centos72 ~]# echo a12bdggxxxxerya12bdggxxxxery | grep "\(a..b\).*\(x..y\).*\1.*\2" a12bdggxxxxerya12bdggxxxxery

情况2

除了括号里面的都一样，其他的不一样

a12b和xery出现了两次

[root@centos72 ~]# echo  a12bdggxxxgdfdhfdsgxerya12bdggxxxfgdsgvntexery |  grep   "\(a..b\).*\(x..y\).*\1.*\2" a12bdggxxxgdfdhfdsgxerya12bdggxxxfgdsgvntexery

情况3

没有出现两次a12b,虽然出现了两次xery,这是不能匹配的

[root@centos72 ~]# echo  a12bdggxxxgdfdhfdsgxerya34bdggxxxfgdsexery |  grep   "\(a..b\).*\(x..y\).*\1.*\2"

\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符，

\2表示左侧起第2个左括号以及与之匹配右括号之间的模式所匹配到的字符

$string1\+\(string2$*\)
\1 ：string1\+$string2$*
\2 ：string2

这里的\1分别代表了第2次出现的1234，xyz

搜索替代的时候很适合使用此技巧

[root@centos72 ~]# echo  12341234  | grep  "\(1..4\).*\1" 12341234 [root@centos72 ~]# echo xyzxyz | grep "\(x.z\).*\1" xyzxyz

或者：：\|

注意\表示对（），|进行转义

示例：a\|b: a 或b C\|cat: C 或cat $C\|c$at:Cat 或cat

转载于:https://www.cnblogs.com/wang618/p/11078720.html

你可能感兴趣的:(基础正则表达式)

蓝桥杯学习大纲ん贤蓝桥杯算法数据结构
（致酷德与热爱算法、编程的小伙伴们）在查阅了相当多的资料后，发现没有那篇博客、文章很符合我们备战蓝桥杯的学习路径。所以，干脆自己整理一篇，欢迎大家补充！一、蓝桥必备高频考点我们以此为重点学习方向：1.基础算法枚举模拟贪心递归分治构造前缀和差分2.搜索与排序线性搜索二分法BFSDFS回溯剪枝深搜优化记忆化搜索位运算冒泡排序归并排序快速排序桶排序3.动态规划编辑距离最长不重复子串整数背包矩阵连乘最长公
python正则表达式提取字符串密码,用python正则表达式提取字符串 weixin_39546092
用python正则表达式提取字符串1.单个位置的字符串提取这种情况我们可以使用(.+)这个正则表达式来提取.举例,一个字符串"a123b",如果我们想提取ab之间的值123,可以使用findall配合正则表达式,这样会返回一个包含所以符合情况的list,代码如下:importrestr="a123b"printre.findall(r"a(.+)b",str)#输出['123']1.1贪婪和非贪婪
量子计算基础知识-2019/11/12 poppy917 量子计算
1.超导量子计算2.量子点量子计算3.拓扑量子计算非阿贝尔统计马约拉纳零能模在粒子世界里，住着两大家族：费米子家族（如电子、质子）和玻色子家族（如光子、介子），它们分别以物理学家费米和玻色的名字命名。一般认为，每一种粒子都有它的反粒子，费米子和它的反粒子就像一对长相一模一样，但脾气完全相反的双胞胎兄弟，两兄弟一见面就“大打出手”，产生的能量甚至会让它们瞬间湮灭。然而在1937年，意大利物理学家埃托
最常见的正则表达式子之星正则表达式
一、校验数字的表达式作用表达式数字^[0-9]*$n位的数字^\d{n}$至少n位的数字^\d{n,}$m-n位的数字^\d{m,n}$零和非零开头的数字^(0|[1-9][0-9]*)$非零开头的最多带两位小数的数字^([1-9][0-9]*)+(.[0-9]{1,2})?$带1-2位小数的正数或负数^(\-)?\d+(\.\d{1,2})?$正数、负数、和小数^(\-|\+)?\d+(\.\d
2025年流行陪玩系统源码解析：三端搭建，覆盖APP、H5、小程序 vue.jsphpmysql
随着游戏电竞行业的蓬勃发展，陪玩系统源码作为开发陪玩平台的基础，也迎来了新的发展机遇。2025年，流行的陪玩系统源码普遍支持三端搭建，即覆盖APP、H5、小程序，以满足不同用户在不同设备上的使用需求。以下是对这类陪玩系统源码的详细解析：源码获取地址！！！！请点击！！！！传送门！！！一、系统架构与技术支持前端框架：采用跨平台前端框架Uni-app，实现响应式设计，支持多平台（App、小程序、H5）的
专栏简介：从入门到精通 JavaScript 1000例实战开发小蘑菇二号入门到精通 JavaScript 1000例实战开发 JavaScript 开发语言
目录专栏简介：从入门到精通JavaScript1000例实战开发专栏特色目标受众学习收获专栏目录：从入门到精通JavaScript1000例实战开发第一部分：JavaScript基础篇第二部分：JavaScript核心进阶篇第三部分：前端框架与库篇第四部分：高级实战篇第五部分：前沿技术篇附录专栏简介：从入门到精通JavaScript1000例实战开发本专栏旨在为开发者提供一套系统化的学习路径，帮助
HarmonyOS Next模型轻量化之基础认知与流程 harmonyos
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中模型轻量化相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、模型轻量化概述与重要性（一）概念与意义在HarmonyOSNext的世界里，模型轻量化就像是给一个臃肿的运动员“减肥塑形”。简单来说
2后端JAVA：下载数据库数据到EXCEL表格？代码 simplesin bug处理数据库 java excel
这是运用kimi，cursor写出来的后端基础增删改查代码心得系列。将从如何用cursor写出代码，修改cursor写出来的代码，连接数据库，上传下载代码等等方面展开。第一集：后端JAVA：Cursor与kimi如何结合？Cursor写出的代码出现哪些bug？-CSDN博客下载代码：/***下载数据库数据*总情况：将数据库中的合同信息导出为Excel文件*@paramresponseHTTP响应对
【Python 语法】Python 正则表达式（regular expressions, regex）一杯水果茶！人生苦短我用 Python python 正则表达式
1.元字符和特殊字符2.常用函数2.1`re.match()`和`re.fullmatch()`2.2`re.search()`2.3`re.findall()`2.4`re.sub()`2.5`re.split()`3.进阶用法3.1捕获组和非捕获组3.2零宽断言4.实现原理Python正则表达式官方教程源代码:Lib/re/Python正则表达式用于在字符串中查找、匹配和替换特定的模式。正则表
【网络安全】零基础入门网络安全劝退指北网络安全指导员程序员黑客网络安全 web安全安全
作为从16年接触网络安全的小白，谈谈零基础如何入门网络安全，有不对的地方，请多多指教。这些年最后悔的事情莫过于没有把自己学习的东西积累下来形成一个知识体系。后续我也会陆续的整理网络安全的相关学习资料及文章，与大家一起探讨学习。1.如何入门简单了解网络安全网络安全就是指的确保网络系统中的数据不被别人破坏，而网安工程师就是涉及程序来维护网络安全。网安方向有很多职位，比如安全产品工程师，安全分析师，数据
《网络安全基础》——习题集网络安全指导员黑客程序员网络安全 web安全安全
一、选择题：1、TCP/IP体系结构中的TCP和IP所提供的服务分别为()A.链路层服务和网络层服务B.网络层服务和传输层服务C.传输层服务和应用层服务D.传输层服务和网络层服务2、下列哪个攻击不在网络层()A.IP欺诈B.TeardropC.SmurfD.SQL注入3、ARP协议是将__地址转换成__的协议()A.IP、端口B.IP、MACC.MAC、IPD.MAC、端口4、__________
机器学习课程的常见章节结构 zhangfeng1133 机器学习分类学习
以下是机器学习课程的常见章节结构，结合了搜索结果中的信息：1.机器学习基础知识机器学习的定义与分类监督学习、无监督学习、半监督学习、强化学习机器学习的产生与发展机器学习的历史与现代应用经验误差与过拟合过拟合与欠拟合的概念及解决方案评估方法与性能度量交叉验证、准确率、召回率、F1分数等偏差与方差偏差-方差权衡及其对模型的影响2.经典机器学习算法2.1线性模型一元线性回归与多元线性回归梯度下降算法（批
数据库范式理解 Wlq0415 学习4 数据库
第一范式（1NF）：确保表中的每一列都是不可分割的基本数据项，即表中的每一列只能包含单一的数据类型。若列中包含多个数据类型或可分割的数据，如地址列中同时包含街道、城市、邮编等信息，则需要拆分该列，使其符合1NF的要求。记忆技巧：1NF关注的是列的不可分割性，可以联想为“简一列”，即简化每一列。第二范式（2NF）：在满足1NF的基础上，要求表中的非主键列都完全函数依赖于主键。这意味着，每一列的数据必
掌握Python异常处理：try、except、else、finally的全面解析清水白石008 Python题库 python 开发语言 python java 前端
掌握Python异常处理：try、except、else、finally的全面解析一、异常处理基础在Python中，异常是程序在运行时发生的错误。当Python解释器遇到一个它不能处理的错误时，它会抛出一个异常。如果异常没有被捕获和处理，程序就会中断执行，并打印出错误信息和堆栈跟踪。异常处理的主要目的是在程序遇到错误时，提供一种方法来处理这些错误，而不是简单地让程序崩溃。二、try语句块：异常捕捉
机器学习—逻辑回归 60岁的程序猿 1024程序员节机器学习逻辑回归人工智能算法
本内容是博主自学机器学习总结的。由于博主水平有限，内容可能有些许错误。如有错误，请发在评论区。目录1、基础概念1.1、什么是逻辑回归1.2、逻辑回归与线性回归的区别1.3应用场景2、逻辑回归模型2.1、模型定义2.2、Sigmoid函数2.3、决策边界2.4、概率解释3、模型训练3.1、损失函数3.2、梯度下降法3.3、牛顿法3.4、拟牛顿法3.4、正则化3.5、总结4、多分类问题4.1、一对多（
实验记录（openssl使用） cumt 方程实验记录 linux 安全
openssl基础使用openssl命令格式opensslenc-ciphername[-infilename][-outfilename][-passarg][-salt][-nosalt][-e][-d][-p][-P][-v][-nopad][-debug][-a][-A][-base64][-z][-bufsizenumber][-kpassword][-kfilefilename][-K
深度学习探索-基础篇-正则化篇神仙盼盼深度学习入门篇深度学习人工智能
文章目录一、正则化介绍1.1正则化的简介1.2正则化的方法介绍1.3正则化的用途二、正则化的详细介绍2.1L1正则化2.2L2正则化2.2.1L2正则化的工作原理2.2.2如何在训练中应用L2正则化2.2.3L2正则化的效果2.3WeightDecay2.4Dropout一、正则化介绍1.1正则化的简介在深度学习领域中，正则化是一种用于防止过拟合的技术。过拟合是指模型在训练数据上表现良好，但在未见
跨越感官鸿沟：AGI多模态融合技术解析 .猫的树 AGI-通用人工智能多模态学习 AGI 深度学习
文章目录引言：当AGI开始拥有"五感"一、多模态认知的理论基础1.1人类感官系统的启示1.2多模态表示学习的数学框架二、多模态融合的核心技术2.1跨模态对齐架构Transformer-based模型2.2动态模态融合2.3多模态自监督学习三、关键技术挑战与突破3.1模态差异鸿沟3.2多模态时序同步3.3认知一致性维护四、AGI多模态系统的实现路径4.1感知-认知-决策闭环4.2世界模型构建4.3具
前端极限革命：AI加速企业级超级引擎的崛起 Coder_Kevin_Vans 前端人工智能
在数字化浪潮与智能化趋势的推动下，前端工程化正从简单的页面展示转变为企业高效运转的核心引擎。传统开发模式存在重复劳动、沟通断层和质量失控等问题，而企业级前端体系的构建则旨在解决这些痛点，实现标准化、自动化和智能化升级。本文在原有内容基础上，经过全新优化与改造，为您呈现一套覆盖需求规划、开发联调、测试优化、构建部署、运维监控等全环节的前端工程化全景图，并着重探讨了AI在各阶段的创新应用。一、需求与规
力扣刷题打卡第一天——基础——知识积累 Helen_star_L leetcode 前端 javascript
第一题交替合并字符串题目描述：给你两个字符串word1和word2。请你从word1开始，通过交替添加字母来合并字符串。如果一个字符串比另一个字符串长，就将多出来的字母追加到合并后字符串的末尾。返回合并后的字符串。代码如下：/***@param{string}word1*@param{string}word2*@return{string}*///先将字符串变成小写的——>判断字符串长度（需符合条
本地部署DeepSeek的硬件配置建议冷冷清清中的风风火火笔记 AI ai 人工智能
本地部署DeepSeek的硬件配置需求因模型参数规模和部署工具不同而有所差异，以下是综合多个来源的详细要求：1.基础配置（适用于7B参数模型）内存：最低8GB，推荐16GB及以上；若使用Ollama工具，基础级需16GB内存。显卡：GTX1060（6GB显存）或更高，推荐RTX3060（8GB显存）；若需流畅运行7B模型，建议RTX4060显卡。存储：至少20GB剩余空间，推荐NVMe固态硬盘。2
【深度学习】Unet的基础介绍牧歌悠悠深度学习人工智能算法深度学习人工智能 U-net
U-Net是一种用于图像分割的深度学习模型，特别适合医学影像和其他需要分割细节的任务。如图：Unet论文原文为什么叫U-Net？U-Net的结构像字母“U”，所以得名。它的结构由两个主要部分组成：下采样（编码器）：图像逐渐被缩小并且提取特征。上采样（解码器）：逐渐恢复图像的尺寸，并通过“跳跃连接”将高分辨率的特征与低分辨率的特征结合，以保持细节。网络结构U-Net通常包括以下几部分：（1）下采样（
【STM32学习记录06】STM32功能介绍—时钟、复位和电源触角01010001 STM32 stm32 学习嵌入式硬件
主题内容教学目的/扩展视频STM32功能介绍（重点课程）包括ARM核心，内存，时钟，复位，电源，电压监控，看门狗，低功耗，ADC，中断，IO接口，调试模式，定时器，通信接口等功能的基础知识介绍。对单片机内部各功能有初步的认识，不要求深入了解。为未来细讲做信心上的准备。学习课程来源于洋桃电子，杜洋老师文章目录学习目标学习重点扩展⚠️注意事项相关资源学习目标对单片机内部的时钟，复位，电源各功能有初步的
【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全网络安全 python linux CTF夺旗赛
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
【系列专栏】银行IT的云原生架构-云基础架构-云资源 09 呱牛do it 金融科技云原生架构金融
银行IT的云原生架构：云基础架构（云资源）一、引言在银行IT云原生架构的构建进程中，云资源作为云基础架构的核心要素，发挥着支撑各类业务系统运行的关键作用。云资源涵盖计算资源、存储资源和网络资源等多个方面，其高效配置、灵活调度和稳定供应，直接关系到银行云原生架构的性能、可用性以及业务创新能力。深入剖析银行云资源的现状、面临的挑战以及应对策略，对银行充分挖掘云原生架构优势、实现数字化转型目标具有重要意
scratch闪亮登场 2024年9月scratch二级真题中国电子学会图形化编程 scratch二级真题和答案解析小兔子编程 scratch案例 scratch闪亮登场 scratch二级真题 scratch信息素养题目 24年9月scratch二级题 scratch考级二级真题 scratch等级考试二级真题
目录scratch闪亮登场一、题目要求1、准备工作2、功能实现二、案例分析1、角色分析2、背景分析3、前期准备三、实现流程1、案例分析2、详细过程四、程序编写五、考点分析六、推荐资料1、入门基础2、蓝桥杯比赛3、考级资料4、视频课程5、python资料scratch闪亮登场2024年9月电子学会图形化编程Scratch等级考试二级真题一、题目要求1、准备工作1.保留默认小猫角色;2.添加背景Neo
网络安全入门教程（非常详细）从零基础入门到精通程序员羊羊 web安全网络安全数据库运维
前言1.入行网络安全这是一条坚持的道路，三分钟的热情可以放弃往下看了。2.多练多想，不要离开了教程什么都不会了，最好看完教程自己独立完成技术方面的开发。3.有时多百度，我们往往都遇不到好心的大神，谁会无聊天天给你做解答。4.遇到实在搞不懂的，可以先放放，以后再来解决。先科普划分一下级别（全部按小白基础，会写个表格word就行的这种）**1级：脚本小子；难度：无，**达到“黑客新闻”的部分水准（一分
直流无刷电机（BLDC）基础知识---TMC4671-LA TRINAMIC-TMC-曹工嵌入式硬件驱动开发物联网 stm32 单片机
提到直流无刷电机，那不得不提的就是有刷电机了。有刷电机有一个比较令人讨厌的缺点：那就是“吵”。因为电刷和换向环需要时刻不停地摩擦，才能给电枢供电。所以，如果你想要一个“静音风扇”的话，肯定不能选使用了有刷电机的产品。并且电刷使用时间久了，比较容易损坏。电流较大的时候，你甚至可以看到电刷在换向的时候噼里啪啦地冒火花。而这些缺点，在下面将要介绍的直流无刷电机（BrushlessDCMotor）里，一样
基础设施在平台工程中的作用 Incredibuild 官方账号 C++DevOps ci/cd devops c++
平台工程侧重于设计和构建自助服务工具和环境，以简化软件开发和部署。通过简化和隐藏底层系统的复杂性，我们可以将精力集中在提供有意义的价值上。从传统的IT运营过渡到集成的DevOps基础设施实践优先考虑团队合作、简化的流程和持续交付，从而在开发和运营之间建立无缝连接。作为开发人员，我们的任务是快速高效地交付高质量的软件，这需要一个强大、敏捷并无缝集成到我们的工作流程中的基础设施。本指南探讨了现代基础设
JavaSE基础知识点记录 08章面向对象编程（高级）老CCC Java SE基础 java 开发语言
目录8-1static修饰成员变量与方法8-2单例的设计模式1、饿汉式2、懒汉式8-3main()的理解8-4类的成员之四：代码块1、静态代码块2、非静态代码块8-5实例变量赋值位置与赋值顺序8-6final关键字的使用8-7abstract关键字修饰类、方法8-8接口的理解与基本语法接口的实现8-9jdk8，jdk9中接口的新特性8-10类的成员之五：内部类1、成员内部类2、局部内部类8-11枚
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h