仙女爱硬拉

三剑客（grep，awk，sed）+正则表达式

grep

grep -v 取反

除了root用户，显示其他用户

grep -m 数字多个匹配的，只取第几个

grep -i 不区分大小写

grep -c 显示过滤的个数

grep -o 只显示匹配的内容

grep -q 静默模式，不显示匹配的内容

如果想展示匹配的内容，可以将他重定向到一个新的文件中

grep -A 数字只要匹配到一个，就把后面的几行一起展示出来

grep -B 数字只要匹配到一个，就把前面的几行一起展示出来

grep -C 数字只要匹配到一个，就把前面和后面的几行一起展示

grep -e 逻辑或

grep -w 精确匹配整个单词

grep -E 使用扩展正则表达式

grep-F 不支持扩展正则表达式

grep -f 以第一个文件为参照物，匹配文件2中所有包括文件1的内容

grep -r 递归目录，但不处理软链接

grep -R 递归目录，可以处理软链接

sort

以行为单位对文件内容进行排序，也可以根据不同的数据类型来排序

sort -f 忽略大小写，默认会大写字母排在前面

sort -b 忽略每行前面的空格

sort-n：按照数字进行排序

sort -r 反向排序

sort -u 去重

sort -t 指定字段分隔符，默认使用tab键分隔

sort -k 指定排序字段

sort -o 将排序的结果转存至指定文件

uniq

uniq命令用于报告或者忽略文件中连续的重复行，常与sort命令结合使用。

uniq -c 统计连续重复的行的次数，并且合并重复的行

uniq -u显示仅出现一次的行（包括不连续的重复行）

uniq -d 仅显示重复出现的行（的重复行）

tr

常用于对来自标准输入的字符进行替换、压缩和删除

tr -c 保留字符集1的字符，其他的字符（包括换行符\n）用字符集2替换

tr -d :删除所有属于字符集1的字符

tr -s : 将重复出现的字符串压缩为一个字符串，用字符集2 替换字符集1

-t：字符集2 替换字符集1，不加也行

cut

对字段进行截取和剪裁

cut -d 指定分隔符（默认分隔符为Tab）

cut -f 按字段进行截取

以":"作为分隔符，指定第一个到第三个字段进行输出

cut -b 以字节为单位进行截取

cut -c 以字符为单位进行截取

cut –complement 排除所指定的字段

以：为分隔符，打印除了第二个字段

cut -output-delimiter 更改输出内容的分隔符

以：为分隔符，将1-5列的分隔符替换成#，并打印出来

split

split命令用于在Linux下将大文件拆分为若干小文件。

格式：split 选项参数原始文件拆分后文件名前缀

split -l 指定行数拆分

split -b 指定文件大小

paste

按照字段来进行文件的合并

paste是左右合并

cat是上下合并

paste -d用于指定文件的分隔符（默认情况下为制表符"\n"）

paste -s将列和行的内容进行互相交换

通配符

*：通配符匹配任意一个或多个字符

?：匹配一个任意字符（只能匹配一个）

[ ] 匹配列表中的任意单个字符

基本正则表示式

[a-zA-Z] #同时匹配大小写

. 匹配任意单个字符，可以是一个汉字

\. 转义字符+. 表示单个一个点

匹配空格 [[:space:]]

表示次数

* 匹配前面的字符任意次，包括0次

o不管有多少个，都能匹配出来，没有也可以匹配

.* 任意长度的任意字符,不包括0次,也就是匹配所有

o出现>=1次

\? 匹配其前面的字符出现0次或1次,即:可有可无

o只能有1个或者没有

\+ 匹配其前面的字符出现最少1次,即:肯定有且 >=1 次

o至少出现一次

\{n\} 匹配前面的字符n次

o只能出现2次

\{m,n\} 匹配前面的字符至少m次，至多n次

o出现至少2次，最多5次

\{,n\} 匹配前面的字符至多n次,<=n

g出现的次数必须小于4次，包含0次

\{n,\} 匹配前面的字符至少n次

o出现2次以上

位置锚定

^ 行首锚定, 用于模式的最左侧

grep "^root$" 过滤出只有root的这一行

过滤出不是以“#”开头的

^$ 只取空行 grep "^[[:space:]]*$"

$ 行尾锚定，用于模式的最右侧

\< 或 \b 词首锚定，用于单词模式的左侧(连续的数字，字母，下划线都算单词内部)

\> 或 \b 词尾锚定，用于单词模式的右侧

只能用于单词的匹配

分组

() 将多个字符捆绑在一起，当作一个整体处理

后面的数，是前面所要分组的字符串的倍数

\| ：或者

匹配1或者2bc，有一个即可

匹配1abc或者2abc，有一个即可

扩展正则表示式

没有\，用grep -E ，用法与基本正则表示式类似

举例

匹配座机号

025-83346023

0510-8776655

0527-9888899

匹配手机号

15251391719

18851996919

15264307896

匹配邮箱

[email protected]

sed

主要是对文件内容按照行的方式进行增删改查

工作流程

sed是一种流编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，

称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，

把缓冲区的内容送往屏幕。

接着处理下一行，这样不断重复，直到文件末尾。文件内容并没有改变，除非你使用重定向存储输出。

Sed主要用来自动编辑一个或多个文件；简化对文件的反复操作；编写转换程序等

sed 流编辑器的工作过程

sed的工作流程主要包括读取、执行和显示三个过程：

读取： sed从输入流 (文件、管道、标准输入) 中读取一行内容并

存储到临时的缓冲区中（又称模式空间，pattern space )。

执行：默认情况下，所有的sed命令都在模式空间中顺序地执行，除非指定了行的地址，

否则sed命令将会在所有的行上依次执行。

显示：发送修改后的内容到输出流。在发送数据后，

模式空间将会被清空。在所有的文件内容都被处理完成之前，上述过程将重复执行，

直至所有内容被处理完。

在所有的文件内容都被处理完成之前，上述过程将重复执行，直至所有内容被处理完。

注意：默认情况下所有的sed命令都是在模式空间内执行的，

因此输入的文件并不会发生任何变化，除非使用"sed -i"修改源文件、或使用重定向输出到新的文件中。

sed命令的常用选项

-e 或--expression=：表示用指定命令来处理输入的文本文件，只有一个操作命令时可省略，一般在执行多个操作命令使用

-f 或--file=：表示用指定的脚本文件来处理输入的文本文件。

-h 或--help：显示帮助。

-i 直接修改目标文本文件

-n 仅显示script处理后的结果

sed命令的操作符

s：替换，替换指定字符。ky27 kyy27

d：删除，删除选定的行。

a：增加，在当前行下面增加一行指定内容。

i：插入，在选定行上面插入一行指定内容。

c：替换，将选定行替换为指定内容。

y：字符转换，转换前后的字符长度必须相同。

p：打印，如果同时指定行，表示打印指定行；如果不指定行，则表示打印所有内容；如果有非打印字符，则以 ASCII 码输出。其通常与“-n”选项一起使用。

=：打印行号。

l(小写L)：打印数据流中的文本和不可打印的ASCII字符（比如结束符$、制表符\t）

r：高级正则表达式

查找

按照行号寻址打印

sed有一个默认输出，加上P，会打印两遍，因此需要加上-n，禁止默认输出

只打印第二行

只显示行号

显示行号及内容

只打印最后一行

进行行号范围区间的打印

打印1-3行

打印第二行到最后一行

打印2-4行

指定间隔打印

打印第二行和最后一行

对奇数行和偶数行的打印

打印偶数行（n：跳过第一行，打印第二行）

打印奇数行（n:打印第一行，跳过下一行，继续打印）

文本模式过滤行内容

对包含的字符串进行过滤打印

打印包含a的所有行

应用基础正则表达式进行打印

打印以root开头的行

打印以bash结尾的行

从第四行开始，一直打印到第一个以bash为结尾的所在行

使用扩展正则表达式进行打印

sed -r 支持扩展正则表达式。同时在使用{n}、{n,}、{n,m}时，括号{}前不需要加反斜杠\ 。

包含有两个99:的内容所在行

删除

通过行号进行删除

删除所有，什么也不打印

只删除第三行

删除2-4行

删除第2行到最后一行

除了2-4行，别的都删除

匹配字符串内容删除

删除包含111的行

删除包含111和222的行

除了111和222，别的行都删了

字符串搭配正则进行删除

删除空行

删除空行的三种方法

grep -v "^$" test1.txt ----过滤出非空行

cat test1.txt |tr -s "\n" ----压缩换行符

sed '/^$/d' test1.txt ----删除空行

替换

s：替换字符串（替换内容长度可不一致）

c：整行替换

y：字符替换，替换前后的字符串长度必须相同

指定第二个root，替换为了test

把所有的root改成test

把root开头的空格替换成#注释掉

把大写改成小写（l&是转换小写的一种特殊的符号，前面要加转义符“\”）

把小写改成大写（u&是转换首字母大写的一种特殊的符号，前面要加转义符“\”）

把有aaa的行全部整行替换成qzz

把单字符a和6分别替换成q和z

增加

a：在下一行添加内容

i：在上一行插入内容

r：在行后读入文件内容

在111这行下面插入three

在333的前一行插入four

先读取test1里面的内容，把他插入到test2的行后

sed命令中字符串和字符的位置交换

awk

工作原理：

sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个“字段”然后再进行处理，

且默认情况下字段的分隔符为空格或 tab 键。

awk 执行结果可以通过 print 的功能将字段数据打印显示

awk的基本格式及其内置变量:

awk 选项 '模式或条件 {操作}' 文件1 文件2...

-F “分隔符” 指明输入时用到的字段分隔符，默认的分隔符是若干个连续空白符

-v(小v) var=value 变量赋值

注意一定是单引号：'模式或条件 {操作}'

{ }外指定条件，{ }内指定操作。

用逗号指定连续的行，用 || 指定不连续的行。&&表示”且“。

内建变量，不能用双引号括起来，不然系统会把它当成字符串。

内置变量

$0:当前处理的行的整行内容

$n:当前处理行的第n个字段（第n列）

NR:当前处理的行的行号（序数）

NF:当前处理的行的字段个数。$NF代表最后一个字段

FS:列分割符。指定每行文本的字段分隔符，输入内容的分隔符，

默认为空格或制表位。与"-F"作用相同用-F可以不加单引号 -F:，用FS必须用=""

OFS:输出内容的列分隔符

FILENAME:被处理的文件名

RS:行分隔符。awk从文件中读取资料时，

将根据RS的定义把资料切割成许多条记录，而awk一次仅读入一条记录进行处理。预设值是"\n"

直接打印所有内容

取每一行的第一列

打印行号，及所有内容

打印第三行

打印2-4行

打印第2行和第4行

用正则表达式打印2-4行

打印偶数行

打印奇数行

awk的运算

可以进行小数和整数的运算，还能进行幂的计算

算100+200的和

求3的2次方

getline

getline的工作过程：

1、当getline左右无重定向符号（“<”）或者管道符号（“|”）时，

awk首先读取的是第一行，而getline获取的是光标跳转至下一行的内容（也就是第二行）。

2、当getline左右有管道符号或重定向符时，

getline则作用定向输入文件，由于文件是刚打开，并没有被awk读入一行，

而只是getline读入，所以getline返回的是文件的第一行，而不是跳转至一行输入

原因：getline运行之后awk会改变NF,NR,$0，FNR等内部变量，所以此时读取$0的行号不再为1，而是2

打印偶数行

打印奇数行

把test1的内容传给函数getline，getline获取后把他打印出来并传给test

把ls的结果传给函数getline后，赋值给变量line，并把line的值打印出来

文本内容匹配过滤打印

打印出以root开头的

打印出以bash结尾的

BEIGIN模式指定BEGIN打印模式

格式：awk 'BEGIN{...};{...};END{...}' 文件

处理过程：

1、在awk处理指定的文本之前，需要先执行BEGIN{...}模式里的命令操作

2、中间的{...} 是真正用于处理文件的命令操作

3.在awk处理完文件后才会执行END{...}模式里的命令操作。END{ }语句块中，往往会放入打印结果等语句。

x的变量范围是根据文本中内容的行数来的

对字段进行处理打印

以：为分隔符，打印第一列

-v的用法：变量赋值

将输入的时候的分隔符：改成+输出，打印第一列和第三列

以：为分隔符，换行输出

#默认就是换行输出，不需要改

BEIGIN模式指定打印内容

以：为分隔符打印第一列

条件判断打印

如果第三列uid大于500，打印出来

如果第三列uid不大于500，打印出来

awk的三元表达式与精准筛选用法

awk的三元表达式继承了java的用法，格式与Java相似

格式：awk '(条件表达式)?(A表达式或者值):(B表达式或者值)'

以：为分隔符，如果$3大于$4,则打印$3，否则打印$4

awk的精准筛选：

$n(> < ==): 用于对比数值

$n~"字符串": 代表第n个字段包含某个字符串

$n!~"字符串": 代表第n个字段不包含某个字符串

$n=="字符串": 代表第n个字段为某个字符串

$n!="字符串": 代表第n个字段不为某个字符串

$NF: 代表最后一个字段

输出第七个字段包含“bash”所在行的第一个字段和最后一个字段

输出第七个字段不包含“nologin”所在行的第一个字段和最后一个字段

输出第六个字段为/home/qiao,第七个字段为/bin/bash的这些行的第一列和最后一列

指定输出的分隔符

OFS：输出内容的列分隔符。（$n=$n用于激活，否则不生效，n必须存在）

对于输出时改变分隔符，我们常用到tr，awk，它们都可以实现在输出内容改变原本的分隔符

输出时将分隔符改成：

数组

定义数组打印

awk中的数组形成遍历,在awk中打印变量不需要加$

数组去重

索引号可以是数字，字符

统计索引号出现的次数

遍历行数

索引号是文本里面的内容，对索引号进行计数

Oracle 进阶语法实战：从多维分析到数据清洗的深度应用(第四课) AI、少年郎 oracle 数据库
在《Oracle树形统计再进阶》(第三课)基础上，我们跳出传统SQL聚合框架，探索Oracle特有的高级语法特性，包括多维分析神器MODEL子句、数据清洗利器正则表达式、PL/SQL存储过程优化，以及基于执行计划的查询调优技巧。这些技术能解决传统方法难以处理的复杂场景，如动态列生成、不规则数据清洗、批量数据处理等。一、MODEL子句：多维数据建模与动态透视业务场景：动态生成各部门全年度各季度请假类
Qt 各种功能学习笔记栈不收 qt 学习笔记
目录1.Qt关于数据库1.1Qt链接数据库1.2将数据库的模型显示在控件中2.Qt关于控件2.1用正则表达式设置输入框只能输入正浮点数2.2设置QDateTimeEdit的时间格式和设置为当前时间1.Qt关于数据库1.1Qt链接数据库基础教学：使用Qt链接MySql数据库_qt连接mysql_栈不收的博客-CSDN博客需要注意的问题：在链接MySQL的时候，首先要确保MySQL已经安装成功在目录Q
【实战演练】运维工程师初试必胜指南：解析公司笔试真题与技巧分享江湖有缘运维工程师面试专栏运维服务器 Linux 面试求职
【实战演练】运维工程师初试必胜指南：解析公司笔试真题与技巧分享一、填空题1.第1题：修改网卡IP地址2.第2题：基本文件相关命令解释3.第3题：新建用户4.第4题：设置文件权限5.第5题：路由协议RIP6.第6题：ping命令相关7.第7题：创建目录8.第8题：正则表达式9.第9题：列出文件10.第10题：如何查看系统信息11.第11题：重命名文件12.第12题：修改用户密码13.第13题：如何向
Golang动态路由实现：灵活处理URL路径 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
Golang动态路由实现：灵活处理URL路径关键词：Golang动态路由、URL路径处理、参数化路由、通配符匹配、路由算法、HTTP框架、RESTful设计摘要：本文深入探讨Golang中动态路由的实现原理与实践方法，从基础概念到复杂场景逐步解析。通过对比标准库与第三方框架的路由机制，详细讲解参数捕获、通配符匹配、正则表达式路由等核心技术。结合具体代码示例演示如何构建高性能路由系统，涵盖路由匹配算
力扣第10题-正则表达式匹配清风序来力扣算法(python)leetcode 正则表达式服务器
力扣链接：10.正则表达式匹配-力扣（LeetCode）给你一个字符串s和一个字符规律p，请你来实现一个支持'.'和'*'的正则表达式匹配。'.'匹配任意单个字符'*'匹配零个或多个前面的那一个元素所谓匹配，是要涵盖整个字符串s的，而不是部分字符串。示例1：输入：s="aa",p="a"输出：false解释："a"无法匹配"aa"整个字符串。示例2:输入：s="aa",p="a*"输出：true解
正则表达式半匹配Markdown中的图片/链接格式薄荷你玩_ 机器学习/深度学习正则表达式 Markdown 大模型
使用正则表达式匹配Markdown中的图片格式，判断文本是否是图片/链接的开头（不完整）：判断文本结尾是否符合Markdown中图片的格式要求Markdown中图片的格式：![图片描述](图片链接)正则表达式：.*\!(\[([^[\]]*(\](\([^)]*)?)?)?)?$defis_incomplete_image_markdown(s):"""检查chunk是否是图片的部分:params
Java-Matcher类 Lowjin_ Java 开发语言 java
Matcher类是Java正则表达式API的核心组件之一（位于java.util.regex包），用于执行复杂的字符串匹配操作。它与Pattern类配合使用，提供查找、替换、分组提取等功能。1.Matcher类的作用对输入字符串执行匹配操作（查找、替换等）支持分组提取（通过()捕获的子表达式）提供位置信息（匹配的起始和结束索引）支持多次匹配和重置2.创建Matcher对象Matcher对象必须通过
Java-Scanner类 Lowjin_ Java 开发语言 java
Scanner是Java中一个实用的文本扫描工具类（位于java.util包），主要用于从输入流（如键盘、文件或字符串）中解析基本数据类型和字符串。它通过正则表达式将输入分解为标记（tokens），并提供了多种方法来读取和转换这些标记。1.Scanner的核心功能功能说明读取输入从键盘、文件、字符串等来源读取数据。按类型解析自动将输入的文本转换为int、double、String等类型。分隔符控制
Python 常用正则表达式大全朱公子的Note python 爬虫正则表达式
你是否在写Python爬虫时，总是卡在“正则提取”这一步？明明页面源码已经拿到，却怎么也匹配不到目标数据……不是提取失败，就是提取不全，搞得调试半天还抓不到核心字段？别急！今天我们就来一次**“正则一网打尽”**，专为爬虫而生的表达式宝典，让你写起爬虫来如虎添翼！在当下数据驱动时代，网络数据是企业的“金矿”，而Python爬虫则是挖掘这金矿的“利器”！从电商价格到社交媒体评论，爬虫技术让数据采集变
python正则匹配11个数字_python正则表达式re.match()匹配多个字符方法的实现小馬锅 python正则匹配11个数字
1.*表示匹配任意多个字符\d*表示匹配任意多个数字字符importretext="123h1elloworld"text1="123Helloworld456"text2="helloworld"res=re.match("\d*",text)res1=re.match("\d*",text1)res2=re.match("\d*",text2)print(res.group())print(r
C++正则表达式语法 Coding小公仔 c/c++c++正则表达式开发语言
在C++中，正则表达式是处理文本模式匹配和字符串操作的强大工具。C++11及以后的标准库提供了头文件，支持正则表达式的使用。下面是C++正则表达式的核心语法规则和用法：一、基本正则表达式语法1.普通字符直接匹配自身，例如：a匹配字符a。2.元字符（需转义）具有特殊含义的字符，需用反斜杠\转义（在C++字符串中需用双反斜杠\\）。.：匹配除换行符外的任意字符。^：匹配字符串的开头。$：匹配字符串的结
Shell 编程之正则表达式与文本处理器
目录一：正则表达式二：基础正则表达式1.基础正则表达式示例（1）查找特定字符（2）利用中括号“[]”来查找集合字符（3）查找行首“^”与行尾字符“$”（4）查找任意一个字符“.”与重复字符“*”（5）查找连续字符范围“{}”2.元字符总结3.扩展正则表达式二：文本处理器1.sed工具（1）输出符合条件的文本(p表示正常输出)（2）删除符合条件的文本(d)（3）替换符合条件的文本（4）迁移符合条件的
Python编程核心技能提升指南：从第2版到第3版月末刀戈
本文还有配套的精品资源，点击获取简介：《Python核心编程中文版》详细介绍了Python的基础和高级编程主题，适合不同层次的学习者。覆盖了正则表达式的使用、网络编程基础、互联网客户端协议应用、多线程编程技巧，以及GUI编程等核心模块。本书通过丰富的实例和详细的解析，帮助读者掌握文本处理、网络通信、并发任务处理和桌面应用开发的关键技能，为深入学习和专业实践提供全面支持。1.Python编程基础1.
[特殊字符] 解释器模式：自定义语言的解析专家，让复杂语法变简单！真实的菜 java 解释器模式 python 开发语言
解释器模式：自定义语言的解析专家，让复杂语法变简单！文章目录解释器模式：自定义语言的解析专家，让复杂语法变简单！一、为什么需要解释器模式️二、解释器模式的结构2.1UML类图2.2代码实现三、解释器模式的实际应用3.1正则表达式引擎：解释器模式的典型应用3.2SQL解析器：解释器模式的实际应用四、解释器模式在Java标准库中的应用4.1Java的正则表达式4.2Java的格式化4.3Java的表达
正则表达式*用法详解小米人儿我的博客正则表达式
在使用ripgrep（或任何支持正则表达式的工具）时，*符号本身不能直接单独使用，因为它是一个量词，必须放在某个字符、字符组或子表达式之后，表示“重复前一个元素零次或多次”。以下是详细解释：1.*的正确用法a*：表示匹配字符"a"零次或多次（如："","a","aa",…）。.*：表示匹配任意字符（.）零次或多次（即匹配任意长度的字符串，包括空字符串）。2.为什么不能直接用*？如果直接写*（没有前
Unity 事件中心管理工具并一键跳转注册/触发代码行哈基咩咩 Unity 框架学习 unity 游戏引擎 c#
本人能力有限,如有不足还请斧正目录一.设计思路:工具源码二.修改思路匹配关键字修改匹配程序集修改配套事件中心源码初版演示:unity事件中心日志小工具讲解,再也不怕乱用事件中心了_哔哩哔哩_bilibili跳转功能演示视频:Unity事件中心管理小工具支持点击跳转脚本嘻嘻_哔哩哔哩_bilibili一.设计思路:1.通过过滤指定程序集和并使用正则表达式匹配事件中心的订阅和触发的关键字2.将匹配到的
数据结构与算法--Python栈栈实现综合计算器和逆波兰计算器前缀表达式中缀表达式后缀表达式逆波兰表达式 storyfull 数据结构与算法算法 python 栈逆波兰表达式逆波兰计算器
阅读目录栈实现综合计算器思路及Python实现思路Python实现模拟逆波兰计算器思路及Python实现思路Python实现正则表达式实现计算器栈实现综合计算器思路及Python实现思路先建立一个“数栈”用来压入数字，还有一个“符号栈”用来压入运算符，规定：减法从栈底向栈顶方法运算，乘除法优先级高于加减法具体操作过程：以“3+26-2”为例（1）数栈和符号栈皆为空，指针从左向右扫描表达式，数栈入栈
PHP基础3（错误处理，正则表达式，反序列化，操作mysql，cookie和session）往日情怀酿作酒yx php基础 php 开发语言
一.前言前面说了函数和流程控制那些，今天来说一些进阶一点的，错误处理之类的，上一节内容特别多，本章节内容将会少很多。二.PHP的错误处理很多时候，代码如果写的不太好，那么很容易报错。那么如果遇到了错误，我们应该想办法捕获到这个错误并记录下来，而且最好不要用户看到，不然太尴尬了，而且容易暴漏自己服务端的一些敏感信息，方便我们后续修改，并且尽量不要让整个程序因为一点小错误而崩溃。2.1配置项管理在ph
python xpath语法-Python Xpath语法 weixin_37988176
一、python数据提取xpath1.beautifulsoupxpath正则表达式2.xpath是一种在XML和HTML文档中查找信息的语言，可用来在XML和HTML中对元素进行遍历ChromeXPathHelper3.XPath语法（1）选取节点：使用路径表达式来选取文档中的节点nodename选取节点的所有子节点//div/如果是在最前面，代表从根节点选取，否则选择某节点下的某个节点一个/代
Python爬虫常用正则表达式分类与示例
Python爬虫常用正则表达式分类与示例一、基础匹配规则电话号码\b\d{3}-\d{8}\b或\b\d{4}-\d{7}\b示例：匹配010-86432100等格式。importretext="Phone:010-86432100,021-1234567"phones=re.findall(r'\b\d{3}-\d{8}\b|\b\d{4}-\d{7}\b',text)#结果:['010-864
javascript正则表达式大括号、中括号、小括号的作用以及应用场景知福致福前端学习笔记正则表达式 javascript 开发语言
在JavaScript正则表达式中，大括号{}、中括号[]和小括号()都有不同的作用和应用场景。大括号{}在正则表达式中，大括号{}表示重复次数。以下是一些常见的应用场景：{n}：精确匹配出现的次数，例如\d{3}匹配三个连续的数字。{n,}：至少匹配n次，例如\d{4,}匹配至少四个连续的数字。{n,m}：匹配n到m次，例如\w{2,4}匹配出现两到四次字母、数字或下划线。中括号[]在正则表达式
linux,1.正则表达式, 2.sed工具, 3.awk skyQAQLinux 正则表达式 linux 云计算服务器
一.正则表达式1.egrep过滤工具(输出匹配行):筛选出文本中指定条件的行(1)以行为单位,逐行进行处理,默认只"输出"与表达式相匹配的"文本行"egrep:扩展正则grep:基本正则(2)语法格式1,文件(单引号)egrep[选项]'正则'文件格式2,命令命令|egrep[选项]'正则'(3)[选项]:(1)-i:忽略大小写(2)-v:去反(3)-c:统计匹配的行数(4)-q:无任何输出,一般
正则表达式中?的用法张太行_ 正则表达式 linux
在正则表达式中，?是一个量词（Quantifier），表示前面的元素匹配0次或1次（即“可选”）。以下是具体用法和示例：1.基本用法：匹配可选字符语法：X?表示X可以出现0次或1次。示例：正则colou?r：匹配"color"（u出现0次）匹配"colour"（u出现1次）。2.与其他符号结合分组可选：(abc)?匹配整个"abc"0次或1次（如""或"abc"）。字符类可选：[ae]?匹配"a"
python常用的正则表达式及作用
Python常用正则表达式及作用正则表达式是处理字符串的强大工具，Python通过re模块提供正则表达式支持：基本匹配模式匹配数字\d：匹配任意数字，等价于[0-9]\D：匹配任意非数字，等价于[^0-9]示例：r'\d+'匹配一个或多个连续数字匹配字母和数字\w：匹配字母、数字或下划线，等价于[a-zA-Z0-9_]\W：匹配非字母、数字、下划线，等价于[^a-zA-Z0-9_]匹配空白字符\s
Python 爬虫实践-抓取小说迷路啦 Python Python 爬虫小说
网络爬虫（WebSpider），又被称为网页蜘蛛，是一种按照一定的规则，自动地抓取网站信息的程序或者脚本。爬虫流程：1，先由urllib的request打开Url得到网页html文档2，浏览器打开网页源代码分析元素节点3，通过BeautifulSoup或正则表达式提取想要的数据4，存储数据到本地磁盘或数据库（抓取，分析，存储）下面以爬取笔趣网里面的小说为例：整个逻辑我这里倒着来讲述；下图是一篇小说
JavaScript 手机号验证与倒计时功能实现荷兰小香猪_01 javascript 开发语言 ecmascript
在现代Web应用中，手机号验证和验证码发送是常见的功能需求。本文将结合一个完整的示例，详细解析如何使用JavaScript实现这一功能，并深入探讨其中涉及的关键知识点。目录一、基本功能概述二、核心知识点解析1.正则表达式验证2.DOM操作3.定时器的使用4.变量作用域与闭包三、常见问题与解决方案1.倒计时无限循环问题2.多次点击导致多个定时器问题3.页面刷新后倒计时重置问题一、基本功能概述以及完整
《精通正则表达式》精华摘要 yuanyxh 正则表达式前端 javascript
《精通正则表达式》的摘要，偏向JavaScript中的正则引擎去理解。元字符具有特殊含义的字符，表示某个规则，而不是其原来普通文本的含义。比如：.表示除换行符外的任意字符。\d表示数字（对于某些引擎来说，可能匹配除阿拉伯数字0-9外的其他数字）特殊元字符\s通常表示的是空格、制表符、换行符、回车符，部分实现可能还视为Unicode空白字符，而不仅仅是空格\p{category}表示匹配一个Unic
【正则表达式】正则表达式介绍晴雨日记 Qt基础 C++笔记正则表达式 c++
文章目录正则表达式应用在编程语言的应用表单验证文档中替换、查找符号说明元字符运算符优先级修饰符常用正则表达式引用文档正则表达式正则表达式(RegularExpression)是一种文本模式，包括普通字符（例如，a到z之间的字母）和特殊字符（称为"元字符"），可以用来描述和匹配字符串的特定模式。正则表达式是一种用于模式匹配和搜索文本的工具。正则表达式提供了一种灵活且强大的方式来查找、替换、验证和提取
ToolsSet之：正则表达式测试 BinField ToolsSet Windows应用 windows microsoft
ToolsSet是微软商店中的一款包含数十种实用工具数百种细分功能的工具集合应用，应用基本功能介绍可以查看以下文章：Windows应用ToolsSet介绍https://blog.csdn.net/BinField/article/details/145898264ToolsSet中Text菜单下的RegexTest工具是一个简单的正则表达式测试工具，可以查看常用的正则表达式，也可以对正则表达式进
【Python】正则表达式中的`^`和`[]` shengchao0920 python 正则表达式数据库
一、正则表达式：符号^^在正则表达式中有两种常见的含义，具体取决于它的位置：1.在字符集[]的开头时，表示取反（negation）。例如：[^s]：匹配任何非空白字符。[^a-z]：匹配任何不在a-z范围内的字符。2.在字符集之外时，表示字符串的开始（anchor）。例如：^https：匹配以“https”开头的字符串。^\d：匹配以数字开头的字符串。总结：在[]内：取反。在[]外：字符串开始。需
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include