grep及正则表达式

grep可以说是Linux系统当中的一个文本检索工具。在Linux系统当中，其中有两个核心的理念：一切皆文件、配置文件保存为纯文本的格式。既然是纯文本的格式，可以想象，有一个好的文本检索工具是多么必要的。grep就是其中之一，他可以去匹配某种模式(PATTERN)来找出相应的行 (line)，并把匹配的行打印出来，并不影响原文件。那么说到这里，就不得会问,什么是模式？模式又是怎么来实现的呢？实际上正则表达式 (regular expression)就是一种模式，在Linux当中，基本上都是通过匹配正则表达式的模式来实现的，所以在说grep使用时就不得不说正则表达式，下面会把grep与正则表达式一块说下它的用法。

一个完整的正则表达式是由两部分组成的，元字符（metacharacters)和文字（literal)，或者说是普通的文本字符。可以把正则表达式理解为一个语言，普通的文本就对应于语言当中的普通文字，而元字符就特指语法。根据语言的规则，按照语法把单词组合起来，就表达了一个完整的思想。正则表达式也是这样，我们通过一些简单的文本和元字符，去表达一种意义，然后告诉计算机我们想要的是什么？比如说我要查询成千上万行中，帮我把有任意个s重复的文本显示出来该怎么办呢？可以简单的用正则表达式写为: s* 这里的s是文本，指定要匹配文本s，而*是元字符，表示把前面的字符匹配任意次。是不是很简单，简简单单的两个字符就完成了很长一句话要表达的东西。当然元字符不仅仅能表示重复的次数，还有位置锚定，字符锚定等，我们下面一点点的细说。

1. grep的基本使用格式

grep [options] 'PATTERN' FILE

选项模式文件

选项部分可以省略，在写模式时可以用单引，双引或者不加都可以，单引与双引之间的区别就是强弱引用的区别，双引号为弱引用。

2. 字符匹配

例1. 列出在/etc/passwd中包含root的行，很简单吧，直接表示为：

grep --color "root" /etc/passwd

这里简单解释下这个命令，grep是命令，--color是选项部分，是指把匹配上的用颜色显示出来，便于初学者理解正则表示式，双引号里面的是匹配的模式，也就是正则表达式部分，最后/etc/passwd是参数，这个命令执行的对象。

执行结果如下显示：

从红色显示的结果可以看出来，都匹配上了。很简单

这里强调一下：在匹配的时候一定要有一个以字符为思路的匹配而不是整个单词,上面应该理解为先匹配r如果匹配上了，然后是紧着匹配o，依次类推，最后匹配上 t，这样理解的结果跟整个匹配root是一样的，以字符为理解的好处在于新手可以很方便的去看懂一个不懂的正则表达式。

例2. 要求找出在/etc/passwd中以l开头，b结尾，中间跟任意字符的那一行怎么匹配呢？那么任意字符该怎么表示呢？元字符点(.)就表示匹配一个任意字符，那么可以写为

grep --color "l.b" /etc/passwd

执行结果如下：

从上面结果可以看出来匹配到了lib和lab，这里的lab是手动创建的一个用户，如果你的etc/passwd文件中没有创建些用户的话，可以通过useradd lab来创建一个lab用户，否则不会匹配到。

例3. 要求在/etc/passwd当中匹配出所有以r开关，以t结尾，中间有两个任意字符的行，我们知道点就表示一个任意字符，那写两个不就可以表示两个任意字符了吗？这样是不是就可以写为：

grep --color "r..t" /etc/passwd

执行结果如下：

是不是匹配了出来了呢？确实是的，但是这可以看到一个特殊的结果，看最后一行，r/ft也匹配上了，很奇怪的一个结果，假设如果我们不想匹配这种特殊字符怎么办？有没有一种方法只是匹配字母呢？确实是有的。另外一种特殊的匹配叫做范围匹配，用[]括起来，比如说[a-z]就表示，字母a到字母Z中的任意一个字符，我们再重新去匹配一下，用[]的方式，结果如下

看到区别了吧，这次我们并没有匹配上r/ft这个字符。

在正则表达式中，除了用[a-z]这种表示方法外，同样内部也定义了一些表示方式来达到同样的效果，比如说用[[:lower:]]来表示所有的小写字母。那么刚刚上面的写法是不是以可以写为：

grep --color "r[[:lower]][[:lower:]]t" /etc/passwd

常用的有以下的一些相应的表示

[0-9], [[:digit:]], \d: 表示所有数字
[a-z], [[:lower:]]：表示所有的小写字母
[A-Z], [[:upper:]]：表示所有的大写字母
[[:alpha:]]：表示所有的大小写字母
[[:alnum:]]：表示大小写字母及数字
[[:space:]]：表示空格
[[:punct:]]：表示特殊字符

最后在字符匹配中说一下取反，^(拖字符），比如说要取出来不包含数字的行，可以写为

grep --color "[^0-9]"　/etc/passwd

小结：在grep中经常用到的字符匹配

.:表示匹配任意字符

[]: 指定范围内的任意单个字符

[^]: 指定范围外的任意单个字符

3. 次数匹配

再回过头看下例3，要求匹配中间有两个任意字符的要求，当时我们是以两个点来表示的，当然这样写是没有任何错误的，那有没有更简单的方法来表示呢？再想下，这仅仅是两个字符，如果有时候要求任意次的时候该怎么匹配呢？写任意个点？不大现实吧，如果我们可以指定重复的次数是不是就能解决这个问题了。在grep中确实指定了重复的次数，比如说*就表示把*前字符重复任意次数，任意次数当然也包含了2次，所以我们可以把例3中的结果改下成如下，看下效果。

grep  --color "r.*t" /etc/passwd

执行结果如下:

image_thumb

很有趣的结果，看到不仅仅是匹配上root这个字符，还有更长的东西，这里就不得不说一个概念，贪婪模式，默认grep就是工作在这种模式下，他会尽量长的去匹配。看第一行中把两个root之间的所有字符都匹配上了，因为*表示任意次数的任意字符，所以是满足情况的。这里重点关注下用绿色圈出的那一行，"rt”也匹配上了，为什么？那么0算不算任意次呢？当然算，所以匹配上了"rt"。继续看，这样写虽然可以匹配上了两次，但是范围也太广，给出的结果已经完全超出期望，当然这不是我们希望看到的。那能不能指定匹配的次数呢？当然可以，使用\{m,n\}来指定匹配特写的次数，这里表示的是一个范围，m表示最小m次，n表示最大n次。如果只有一个数字，表示精确匹配数字指定的次数。

既然题目要求匹配两次，那就可以这么写：

grep --color "r.\{2\}t" /etc/passwd

执行结果如下：

image_thumb1

比较下两次的执行结果，是一样的。

　　小结：匹配次数常用的表达方式：

*：表示任意次
\?: 表示0次或者1次
\{m\}: 精确匹配m次
\{m,n\}: 最少m次，最大n次
\{m,\}: 至少m次
\{0,n\}: 到多n次

4. 锚定

还是说例3, 从上面可以看出来执行结果当中有r/ft这个字段，有时候我们并不想用这种字段，因为我们要匹配的是一个单词(word), 这种中间有特殊字符的结果，并不是我们想看到的。这个时候就需要告诉grep我们要求的是一个完整的word，那怎么告诉它呢？假设如果我们可以指定词首，指定词尾是不是就可以解决了呢？或者我有一个选项直接告诉它，我就是要匹配word不就可以了吗？

这两种方式都是可以的，在grep中可以指定词首，指定词尾，也就是锚定，"\<" 或者"\b”表示锚定词首，"\>"或者"\b”表示锚定词尾，那么我们之前的写法又可以改为：

grep --color "\<r.\{2\}t\>" /etc/passwd

执行结果如下:

image_thumb2

那么r/ft这个字符就不会匹配上了。其实还有一个grep也提供了一个选项，"-w"来指定去匹配word，我们把行尾，行尾的锚定符去掉，然后加上"-w"选项，看下结果

image_thumb3

对比下两种方式执行的结果，是一样的。

既然词首词尾可以锚定，行首行尾当然也可以锚定，我们应该知道/etc/passwd是用来保存用户信息的，那么现在要求找出root用户相关信息的那一行，该怎么匹配呢？直接写grep --color “root” /etc/passwd能匹配出来吗？先尝试下，

image_thumb4

除了匹配到root之外，我们也看到匹配上了operator这个用户，那么这个时候如果我们可以指定以root开头的是不是就能解决这个问题了呢，这就需要用到行首锚定，"^"用来锚定行首，表达式可以改写为：

grep --color "^root" /etc/passwd

结果如下：

image_thumb5

完美解决了问题。

细心的读者看到这可能会有个小小的疑问，我们之间提到过^可以表示取反，这里^又表示行首锚定，这样不是有冲突吗？其实是没有的，在取反的时候^是在[]内，如果没有[]的话就表示行尾锚定，试着理解下下面这个表达式的意思，

grep --color "^[^r]" /etc/passwd

这里有两个^，第一个^表示以[]内字符为行首，再看[]内，^表示以非r开关的，所以整个的意思就是以非字符r为行首的所有行。从这个例子中我们可以看出来，在[]内与外的意思是不同的，之前讲到过点表示任意字符，那这个点在[]内与外有什么不同呢？答案在这小节结果时说明。

我们继续回到行锚定上来，既然行首可以锚定，那么行尾一样也可以了。"$"就表示行尾锚定，为了明确说明这个有无行尾锚定之间的区别我们可以先添加一个用户bash并指定其shell为nologin，执行如下命令:

useradd -s /bin/nologin bash

添加完用户以后，我们可以去查找下shell为bash的用户的行。/etc/passwd行尾的bash就表示用户的shell类型，如果不把行尾锚定会有什么结果呢？眼见为实，执行命令如下：

grep --color "bash" /etc/passwd

image_thumb6

从结果中可以看出来，行首的bash也匹配上了，但是它的shell是bash吗？不是，它的shell为nologin，所以这个就需要把行尾锚定加上，执行如下命：

grep　--color “bash$” /etc/passwd

image_thumb7

比较下两次命令执行的区别，最后一行用户bash并没有匹配上。

我们说过了行首锚定，行尾锚定，那么不妨想下下面这三个表达式都表示什么意思

"^$"
"^root”
"^"

答案：

上文中提到过点在[]内外之间的区别，点如果是在[]外表示匹配任意字符，这个在字符匹配中已经说过，当然也说过[]内表示匹配指定的字符范围，既然是指定字符的范围，那么这个点在[]就仅仅表示字符点。说白了其实在[]内表示是一个字符，而在[]外是元字符，元字符的意思表示任意字符。

特殊的表达式含意

"^$" : 行首与行尾都锚定，中间什么都没有表示空白行
"^root” : 表示仅仅有root的那一行
"^"：所有的行都会有行首，只匹配行首的话，表示所有行

5. 分组

前面说过匹配次数，在匹配次数的时候说到是匹配前面的字符，如果要求匹配以一串字符为单位的重复该怎么办呢？这个时候就需要用到分组了，把几个字符分成一组，后面跟表示重复次数的元字符就可以解决这个问题，分组可以用""括起来表示一个组。举个例子来说，我们先在/etc/passwd当中添加两个用户，labb和lablab，然后去匹配用户lablab。

添加用户执行如下命令：

useradd labb 
useradd lablab

然后我们来比较下加不加分组之间的结果区别：

image_thumb8

从结果中可以看出来，如果不加分组的话，就是b重复两次，加了以后就是lab重复两次。

小结：

: 对字符串分组

6. 引用

说完分组，就可以去说另外一个比较有趣的例子，要求是以a开头以b结尾，中间跟任意一个数字的单词为开头，并且以同样的单词结尾的那一行？这个例子什么意思呢？举个例子来说，如果一行是以a6b开头，那么这一行就必须以a6b结尾，我想题目应该是很清楚了，我们先来分析一下。以a开头，以b结尾并且中间跟任意一个字符，可以写为"a[0-9]b“，以此单词开头那么又需要一个行首以及词尾锚定，因为行首已经锚定了，所以这个时候词首锚定也就不需要了，这样就成为了"^a[0-9]b\>”. 行首的问题解决了,中间跟任意字符可以表示为".*", 到这问题已经解决了一大半，那么行尾怎么办？"\<a[0-9]b$”这样写可以吗？验证下，我们先建立一个测试文档，执行如下命令：

cat > test.txt << EOF 
a6b is a6b a7b is a6b
EOF

通过上面的分析, 那么表达式可以写为：

grep --color "^a[0-9]b\>.*\<a[0-9]b$" test.txt

如果这个表达式可以完成的话，第二行应该匹配不到，对吧？看下结果

image_thumb9

从结果可以看出来，第二行也匹配到了，因为a6b与a7b都满足a[0-9]b的表达式。要解决这个问题，需要用到grep中的引用，引用可以引用前面括号中匹配的结果，而不是表达式。表示方式为\n. n是数字，按照从左向右数，1就表示引用第一个括号之内的内容。那么根据引用，就很容易解决这个问题了。表达式改写为：

grep --color "^\(a[0-9]b\)\>.*\1$" test.txt

执行结果如下:

image_thumb10

7. grep的常用选项及总结

在前文当中应该说过两个选项，一个是--color还有一个-w选项，这里重复下这两个选项的意思，然后再说下其它一些常用的选项。

-v: 取反，显示不能被模式所匹配到的行；
-o: 仅显示被模式匹配到的字串，而非整行；
-i: 不区分字符大小写, ignore-case
-n: 显示原文档的行数
-w: 以word匹配，相当于词锚定
-E: 支持扩展的正则表达式，相当于egrep
-A #：#表示数字，同时显示匹配到行的下#行
-B #：同时显示匹配到的上#行
-C #：同时显示匹配到上下#行
字符匹配：
- .: 表示匹配任意字符
- []: 表示匹配指定范围内的字符
次数匹配
- *：表示任意次数
- \?：0次或1次
- \{m,n\}: 最少m次，最大n次
- \{m\}: 匹配m次
位置锚定
- ^: 锚定行首
- $：锚定行尾
- \<或者\b：锚定词首
- \>或者\b：锚定词尾
分组与引用
- : 分组
- \n：引用第n个

8. 扩展的正则表达式：egrep

扩展的正则表达式使用方法基于类似于grep，同时grep -E也是支持扩展的正则表达式，常用元字符如下：

- (): 分组
- |：表示或的意思
- \n：引用第n个
- ^: 锚定行首
- $：锚定行尾
- \<或者\b：锚定词首
- \>或者\b：锚定词尾
- *：表示任意次数
- ?：0次或1次
- +：表示1次或多次
- {m,n}: 最少m次，最大n次
- {m}: 匹配m次
- .: 表示匹配任意字符
- []: 表示匹配指定范围内的字符
- 字符匹配：
- 次数匹配
- 位置锚定
- 分组与引用

9. 快速grep: fgrep

不匹配模式，也就是不做元字符的计算，直接快速匹配字符，相当于grep �CF

练习题（鼠标划取题目正文空白部分可以看到参考答案）：

1、显示/proc/meminfo文件中以大小写s开头的行；
# grep "^[sS]" /proc/meminfo
# grep -i "^s" /proc/meminfo
2、取出默认shell为非bash的用户；
# grep -v "bash$" /etc/passwd | cut -d: -f1
3、取出默认shell为bash的且其ID号最大的用户；
# grep "bash$" /etc/passwd | sort -n -t: -k3 | tail -1 | cut -d: -f1
4、显示/etc/rc.d/rc.sysinit文件中，以#开头，后面跟至少一个空白字符，而后又有至少一个非空白字符的行；
# grep "^#[[:space:]]\{1,\}[^[:space:]]\{1,\}" /etc/rc.d/rc.sysinit
5、显示/boot/grub/grub.conf中以至少一个空白字符开头的行；
# grep "^[[:space:]]\{1,\}[^[:space:]]\{1,\}" /boot/grub/grub.conf
6、找出/etc/passwd文件中一位数或两位数；
# grep --color=auto "\<[0-9]\{1,2\}\>" /etc/passwd

你可能感兴趣的:(正则表达式,grep,regular)

C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
wandb一直上传解决方案行业边缘的摸鱼怪 bug解决方案服务器 linux 服务器
问题描述运行带有wandb的代码时，虽然可以实现及时同步非常方便，但当设置错参数或其他原因不得不使用ctrl+C停止运行时，总会出现wandb一直上传个不停的现象，给在同一终端重新运行新的代码造成困难。解决方案运行以下代码把wandb的进程直接杀死。psaux|grepwandb|grep-vgrep|awk'{print$2}'|xargskill-9参考链接[CLI]:Ctrl+Ctokill
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
Regular Expression 正则表达式 Aimyon_36 Data Development 正则表达式 redis 数据库
RegularExpression前言1.基本匹配2.元字符2.1点运算符.2.2字符集2.2.1否定字符集2.3重复次数2.3.1*号2.3.2+号2.3.3?号2.4{}号2.5(...)特征标群2.6|或运算符2.7转码特殊字符2.8锚点2.8.1^号2.8.2$号3.简写字符集4.零宽度断言（前后预查）4.1?=...正先行断言4.2?!...负先行断言4.3?Thefatcatsaton
【显示后台运行 & 的命令】晨春计 debug linux 服务器运维
目录背景步骤详解示例背景当你在Linuxshell中使用&符号将一个命令放到后台运行时，你可以使用jobs命令来查看这些后台进程的状态。但是，jobs命令并不会直接显示进程的PID（进程ID）。它会显示一个作业列表，其中包括每个作业的状态和一个作业标识符（通常是百分号%后面跟着一个数字），但不会直接显示PID。获取后台进程的PID步骤：1、使用jobs命令查看后台作业。2、使用ps命令配合grep
Ubuntu常用命令整理十里染林
ubuntu16.04server开启ssh:使用x-shell连接主机，发现22端口没有打开，开启ssh服务：安装openssh-serversudoapt-getinstallopenssh-server检查安装是否成功sudops-e|grepssh开启ssh服务sudoservicesshstartUbuntu开启/关闭防火墙:开启防火墙sudoufwenable关闭防火墙sudoufwd
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
Nginx从入门到实践(三) 听你讲故事啊
动静分离动静分离是将网站静态资源（JavaScript，CSS，img等文件）与后台应用分开部署，提高用户访问静态代码的速度，降低对后台应用访问。动静分离的一种做法是将静态资源部署在nginx上，后台项目部署到应用服务器上，根据一定规则静态资源的请求全部请求nginx服务器，达到动静分离的目标。rewrite规则Rewrite规则常见正则表达式Rewrite主要的功能就是实现URL的重写，Ngin
CentOS7 安装MySQL5.7.44 不要Null了 java centos mysql
1.下载mysql安装包，我放在百度网盘里(下方链接)链接：https://pan.baidu.com/s/1_Mn1XW_1mWdTV4mhnLG66A提取码：s31n2.首先看看以前是否安装过mysqlrpm-qa|grep-imysql如果已经安装过mysql会提示卸载mysqlrpm-emysql-…3.使用FinallShell或者Xftp进行上传放到/usr/local/mysql，没
k8s证书过期问题处理 olina_qin kubernetes 容器云原生
k8s证书过期问题处理opensslx509-in/etc/kubernetes/pki/apiserver.crt-noout-dateskubeadmcertsrenewallsystemctlrestartkubeleopensslx509-in/etc/kubernetes/pki/apiserver.crt-noout-text|grep"NotAfter"cp/etc/kubernet
爬虫技术抓取网站数据 Bearjumpingcandy 爬虫
爬虫技术是一种自动化获取网站数据的技术，它可以模拟人类浏览器的行为，访问网页并提取所需的信息。以下是爬虫技术抓取网站数据的一般步骤：发起HTTP请求：爬虫首先会发送HTTP请求到目标网站，获取网页的内容。解析HTML：获取到网页内容后，爬虫会使用HTML解析器解析HTML代码，提取出需要的数据。数据提取：通过使用XPath、CSS选择器或正则表达式等工具，爬虫可以从HTML中提取出所需的数据，如文
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
linux的安装程序与文件相关的命令可能只会写BUG c语言 c/c++linux linux 服务器运维
软件安装卸载命令软件包介绍软件包命名格式dpkg命令apt-get命令apt-get命令压缩和解压命令压缩文件后缀压缩命令打包和解包命令tar命令文件分割命令split命令文件操作相关命令cat命令head命令tail命令more命令less命令管道命令wc命令grep命令find命令cut命令sort命令uniq命令diff命令文件属性命令chmod命令chown命令chgrp命令ln命令硬链接
linux find命令落雨无风 linux
find.-name"*.v"|xargsgrep"altera_mf"#在当前目录查找所有.v文件，并找出altera_mf的行持续更新中------
互联网 Java 工程师面试题（Java 面试题四）苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
下面列出这份Java面试问题列表包含的主题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java集合框架数组字符串GOF设计模式SOLID抽象类与接口Java基础，如equals和hashcode泛型与枚举JavaIO与NIO常用网络协议Java中的数据结构和算法正则表达式JVM底层Java最佳实JDBCDate,Time与CalendarJava处理XMLJUnit编程现在是时候给
【无标题】正则表达式笔记 qis_qis 正则表达式笔记
作用查找特殊规则的字符串编写一个正则表达式，用来查找所有以0开头，后面跟着2-3个数字，然后是一个连字号“-”，最后是7或8位数字的字符串(像010-12345678或0376-7654321)。0\d{2,3}-\d{7,8}基本匹配区分大小写cat会匹配"cat"CAt会匹配"CAt"元字符元字符是正则表达式的基本组成元素。元字符在这里跟它通常表达的意思不一样，而是以某种特殊的含义去解释。有些
麒麟桌面操作系统：查看最近安装与卸载的软件包 Seal^_^ 国产化 #麒麟OS 运维国产化操作系统麒麟桌面操作系统 kylin
麒麟桌面操作系统：查看最近安装与卸载的软件包1、查看最近安装的deb包2、查看最近卸载的deb包TheBegin点点关注，收藏不迷路在麒麟桌面操作系统中，快速查看最近安装与卸载的软件包非常简单。这里有两个快速命令，帮助你轻松完成这一任务。1、查看最近安装的deb包打开终端，输入以下命令：grep"install"/var/log/dpkg.log这个命令会列出所有最近安装的deb软件包信息。2、查
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
15：00面试，15：06就出来了，问的问题有点变态。。 2401_86640859 面试职场和发展
应该考虑进行如何测试的测试方法怎样估计测试工作量?测试设计的问题当测试过程发生错误时，有哪几种解决办法?测试执行的问题测试评估的目标如何提高测试?C/S模式的优点和缺点B/S模式的优点和缺点…Linuxgrep和find的区别?grep都有哪些用法?查看IP地址?创建和删除一个多级目录?在当前用户家目录中查找haha.txt文件?如何查询出tomcat的进程并杀掉这个进程，写出linux命令?动态
PostgreSQL进阶教程爱分享的码瑞哥 postgresql
PostgreSQL进阶教程目录事务和并发控制事务事务隔离级别锁高级查询联合查询窗口函数子查询CTE（公用表表达式）数据类型自定义数据类型数组JSON高级索引部分索引表达式索引GIN和GiST索引性能调优查询优化配置优化备份与恢复物理备份逻辑备份扩展与插件PostGISpg_cron集群与高可用StreamingReplicationPatroni事务和并发控制事务事务是一个或多个SQL语句的组合
获取image信息布丶Ding
NSData*data=UIImageJPEGRepresentation(image,1.0);CGImageSourceRefref=CGImageSourceCreateWithData((__bridgeCFDataRef)data,NULL);CFDictionaryRefdicRef=CGImageSourceCopyPropertiesAtIndex(ref,0,NULL);NSDi
Linux三剑客之grep命令详解 promise524 Linux linux 服务器 python shell bash 后端运维
grep是Linux中最常用的文本搜索工具，用于在文件或文本输出中查找与指定模式匹配的行。它支持基本正则表达式、扩展正则表达式、多文件搜索、递归搜索等多种功能，非常适合过滤、搜索和提取文本内容。1.grep的基本语法grep[选项]模式[文件...]模式：搜索的文本模式，可以是普通字符串或正则表达式。[文件...]：要搜索的文件。如果没有指定文件，grep会从标准输入中读取数据。2.常用选项-i：
linux 端口数据转发,Linux iptables 端口转发文静的妹子 linux 端口数据转发
准备：1，UDP端口范围映射2，tcp端口范围映射3，本机端口转发4，单个端口转发准备：打开转发[root@CentOS~]#cat/etc/sysctl.conf|grepnet.ipv4.ip_forwardnet.ipv4.ip_forward=1清空规则，修改默认策略，重要数据请备份[root@CentOS~]#iptables-F-tnat[root@CentOS~]#iptables-
CentOS下php安装mcrypt扩展天咋哭了
（以下步骤均为本人实际操作，可能与你的安装方法有所区别，但我会尽量排除疑惑）大致步骤（1）安装mcrypt，（2）安装php对mcrypt的扩展，（3）重启apache（1）、确认你的linux没有安装mcrypt库，如果已安装，跳过安装步骤[root@test-206~]#yumlistinstalled|grepmcryptlibmcrypt.x86_642.5.8-4.el5.centosi
剑指offer 面试题05. 替换空格 Hubhub
题目描述leetcode地址代码classSolution{public:stringreplaceSpace(strings){stringans="";for(autoe:s){if(e==''){ans+="%20";}else{ans+=e;}}returnans;}};
Linux三剑客与管道使用许琳珊
一、管道1、什么是管道linux提供管道符“|”将两个命令隔开，管道符左边命令的输出就会作为管道符右边命令的输入2、例子echo"hello123"|grep"hello"二、正则1、什么是正则正则表达式就是记录文本规则的代码2、正则的用法常用元字符代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白符\d匹配数字\b匹配单词的开始或结束^匹配字符串的开始$匹配字
搭建ftp服务器哆啦A梦_ca52
1搭建ftp服务器yuminstallvsftpd*-y安装vsftpd服务rpm-qlvsftpd|more查看安装路径systemctlrestartvsftpd.service启用vsftp服务ps-ef|grepvsftpd查看服务是否启用查看安装后的路径ftp://192.168.1.17/pub/安装好了有这个服务了修改配置文件vim/etc/vsftpd/vsftpd.confano
Java 正则表达式详解艾伦~耶格尔 Java初级 java 正则表达式开发语言学习
正则表达式(RegularExpression，简称regex)是一种强大的文本处理工具，可以用来匹配、搜索和替换文本中的特定模式。在Java中，正则表达式由java.util.regex包提供支持。1.理解正则表达式语法正则表达式使用特殊的字符和符号来定义匹配模式。一些常用的元字符如下：.:匹配任意单个字符*:匹配前面的字符零次或多次+:匹配前面的字符一次或多次?:匹配前面的字符零次或一次[]:
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite