jiangjqian

正则表达式

注：原文来自百度词条，此仅为阅读笔记。

一：正则表达式基础

　　一个正则表达式，就是用某种模式去匹配一类字符串的一个公式。

　　正则表达式由一些普通字符和一些元字符（ metacharacters ）组成。普通字符包括大小写的字母和数字，而元字符则具有特殊的含义。

　　元字符描述

　　匹配任何单个字符。例如正则表达式 r.t 匹配这些字符串： rat 、 rut 、 r t ，但是不匹配 root 。

　　匹配行结束符。例如正则表达式 weasel$ 能够匹配字符串 "He's a weasel" 的末尾，但是不能匹配字符串 "They are a bunch of weasels." 。

　　匹配一行的开始。例如正则表达式 ^When in 能够匹配字符串 "When in the course of human events" 的开始，但是不能匹配 "What and When in the" 。

　　匹配 0 或多个正好在它之前的那个字符。例如正则表达式 .* 意味着能够匹配任意数量的任何字符， (. 表示任何单个字符， .* 表示任意多个任意单个字符 ) 。

　　这是引用符，用来将这里列出的这些元字符当作普通的字符来进行匹配。例如正则表达式 \$ 被用来匹配美元符号，而不是行尾，类似的，正则表达式 \. 用来匹配点字符，而不是任何字符的通配符。

　　 [ ]

　　 [c1-c2]

　　 [^c1-c2]

　　匹配括号中的任何一个字符。例如正则表达式 r[aou]t 匹配 rat 、 rot 和 rut ，但是不匹配 ret 。可以在括号中使用连字符 - 来指定字符的区间，例如正则表达式 [0-9] 可以匹配任何数字字符；还可以制定多个区间，例如正则表达式 [A-Za-z] 可以匹配任何大小写字母。另一个重要的用法是“排除”，要想匹配除了指定区间之外的字符――也就是所谓的补集――在左边的括号和第一个字符之间使用 ^ 字符，例如正则表达式 [^269A-Z] 将匹配除了 2 、 6 、 9 和所有大写字母之外的任何字符。

　　 \< \>

　　匹配词（ word ）的开始（ \< ）和结束（ \> ）。例如正则表达式 \<the 能够匹配字符串 "for the wise" 中的 "the" ，但是不能匹配字符串 "otherwise" 中的 "the" 。注意：这个元字符不是所有的软件都支持的（ vim 和 grep 都支持，注意： grep 使用时，要用双引号把字串括起来，比如： grep “\<HHG” a.file ）。

　　将 $ 和 $ 之间的表达式定义为“组”（ group ），并且将匹配这个表达式的字符保存到一个临时区域（一个正则表达式中最多可以保存 9 个），它们可以用到的符号来引用。 ( 见下面例子：简单例子最后一个了解其使用 )

　　将两个匹配条件进行逻辑“或”（ Or ）运算。例如正则表达式 (him|her) 匹配 "it belongs to him" 和 "it belongs to her" ，但是不能匹配 "it belongs to them." 。注意：这个元字符不是所有的软件都支持的。 (vim 好像不支持， grep 需要用 option �CE (extend regular expression))

　　匹配 1 或多个正好在它之前的那个字符。例如正则表达式 9+ 匹配 9 、 99 、 999 、 98 、 93dsf 、 9..... 等。注意：这个元字符不是所有的软件都支持的。 (vim 好像不支持， grep 需要用 option �CE ，或者直接用 egrep)

　　匹配 0 或 1 个正好在它之前的那个字符。注意：这个元字符不是所有的软件都支持的。 (egrep 支持 )

　　 \{i\}

　　 \{i,j\}

　　匹配指定数目的字符，这些字符是在它之前的表达式定义的。例如正则表达式 A[0-9]\{3\} 能够匹配字符 "A" 后面跟着正好 3 个数字字符的串，例如 A123 、 A348 等，但是不匹配 A1234 。而正则表达式 [0-9]\{4,6\} 匹配连续的任意 4 个、 5 个或者 6 个数字字符。注意：这个元字符不是所有的软件都支持的。 (egrep 支持 )

想匹配所有 100 和 1000 的实例而排除 10 和 10000 ，可以使用： 10\{2,3\} ，这个正则表达式匹配数字 1 后面跟着 2 或者 3 个 0 的模式。在这个元字符的使用中一个有用的变化是忽略第二个数字，例如正则表达式 0\{3,\} 将匹配至少 3 个连续的 0 。

二：例子

　　简单的例子

　　 :%s/ */ /g 把一个或者多个空格替换为一个空格。 ( 严格的描述： :%s/ 两个空格 */ 空格 /g, 如果 %s/ 后面是一个空格，出现的状况是所有字符之间出现空格，请理解 * 的真实含义 )

　　 :%s/ *$// 去掉行尾的所有空格。

　　 :%s/^/ / 在每一行头上加入一个空格。

　　 :%s/^[0-9][0-9]* // 去掉行首的所有数字字符。

　　 :%s/b[aeio]g/bug/g 将所有的 bag 、 beg 、 big 和 bog 改为 bug 。

:%s/t$[aou]$g/h$t/g 将所有 tag 、 tog 和 tug 分别改为 hat 、 hot 和 hug （注意用 group 的用法和使用引用前面被匹配的字符）。

　　中级的例子（神奇的咒语）

　　例 1

　　将所有方法 foo(a,b,c) 的实例改为 foo(b,a,c) 。这里 a 、 b 和 c 可以是任何提供给方法 foo() 的参数。也就是说我们要实现这样的转换：

　　之前之后

　　 foo(10,7,2) foo(7,10,2)

　　 foo(x+13,y-2,10) foo(y-2,x+13,10)

　　 foo( bar(8), x+y+z, 5) foo( x+y+z, bar(8), 5)

　　下面这条替换命令能够实现这一魔法：

　　 :%s/foo($[^,]*$,$[^,]*$,$[^)]*$)/foo($2,$1,$3)/g

　　现在让我们把它打散来加以分析。写出这个表达式的基本思路是找出 foo() 和它的括号中的三个参数的位置。第一个参数是用这个表达式来识别的：： $[^,]*$ ，我们可以从里向外来分析它：

　　 [^,] 除了逗号之外的任何字符

　　 [^,]* 0 或者多个非逗号字符

　　 $[^,]*$ 将这些非逗号字符标记为，这样可以在之后的替换模式表达式中引用它

　　 $[^,]*$, 我们必须找到 0 或者多个非逗号字符后面跟着一个逗号，并且非逗号字符那部分要标记出来以备后用。

　　现在正是指出一个使用正则表达式常见错误的最佳时机。为什么我们要使用 [^,]* 这样的一个表达式，而不是更加简单直接的写法，例如： .* ，来匹配第一个参数呢？设想我们使用模式 .* 来匹配字符串 "10,7,2" ，它应该匹配 "10," 还是 "10,7," ？为了解决这个两义性（ ambiguity ），正则表达式规定一律按照最长的串来，在上面的例子中就是 "10,7," ，显然这样就找出了两个参数而不是我们期望的一个。所以，我们要使用 [^,]* 来强制取出第一个逗号之前的部分。

这个表达式我们已经分析到了： foo($[^,]*$ ，这一段可以简单的翻译为“当你找到 foo( 就把其后直到第一个逗号之前的部分标记为”。然后我们使用同样的办法标记第二个参数为。对第三个参数的标记方法也是一样，只是我们要搜索所有的字符直到右括号。我们并没有必要去搜索第三个参数，因为我们不需要调整它的位置，但是这样的模式能够保证我们只去替换那些有三个参数的 foo() 方法调用，在 foo() 是一个重载（ overoading ）方法时这种明确的模式往往是比较保险的。然后，在替换部分，我们找到 foo() 的对应实例，然后利用标记好的部分进行替换，是的第一和第二个参数交换位置。

　　例 2

　　假设有一个 CSV （ comma separated value ）文件，里面有一些我们需要的信息，但是格式却有问题，目前数据的列顺序是：姓名，公司名，州名缩写，邮政编码，现在我们希望将这些数据重新组织，以便在我们的某个软件中使用，需要的格式为：姓名，州名缩写 - 邮政编码，公司名。也就是说，我们要调整列顺序，还要合并两个列来构成一个新列。另外，我们的软件不能接受逗号前后面有任何空格（包括空格和制表符）所以我们还必须要去掉逗号前后的所有空格。

　　这里有几行我们现在的数据：

　　 Bill Jones, HI-TEK Corporation , CA, 95011

　　 Sharon Lee Smith, Design Works Incorporated, CA, 95012

　　 B. Amos , Hill Street Cafe , CA , 95013

　　 Alexander Weatherworth, The Crafts Store , CA , 95014

　　 ...

　　我们希望把它变成这个样子：

　　 Bill Jones , CA 95011 ,HI-TEK Corporation

　　 Sharon Lee Smith , CA 95012 ,Design Works Incorporated

　　 B. Amos , CA 95013 , Hill Street Cafe

　　 Alexander Weatherworth , CA 95014 ,The Crafts Store

　　 ...

　　我们将用两个正则表达式来解决这个问题。第一个移动列和合并列，第二个用来去掉空格。

　　下面就是第一个替换命令：

　　 :%s/$[^,]*$,$[^,]*$,$[^,]*$,$.*$/$1,$3 $4 ,$2/

　　这里的方法跟例 1 基本一样，第一个列（姓名）用这个表达式来匹配： $[^,]*$ ，即第一个逗号之前的所有字符，而姓名内容被用标记下来。公司名和州名缩写字段用同样的方法标记为和，而最后一个字段用 $.*$ 来匹配（ " 匹配所有字符直到行末 " ）。替换部分则引用上面标记的那些内容来进行构造。

　　第二个命令去掉逗号前后的所有空格：

　　 :%s/[ \t]*,[ \t]*/,/g

我们还是分解来看： [ \t] 匹配空格 / 制表符， [ \t]* 匹配 0 或多个空格 / 制表符， [ \t]*, 匹配 0 或多个空格 / 制表符后面再加一个逗号，最后， [ \t]*,[ \t]* 匹配 0 或多个空格 / 制表符接着一个逗号再接着 0 或多个空格 / 制表符。在替换部分，我们简单的我们找到的所有东西替换成一个逗号。这里我们使用了结尾的可选的 g 参数，这表示在每行中对所有匹配的串执行替换（而不是缺省的只替换第一个匹配串）。

　　例 3

　　假设有一个多字符的片断重复出现，例如：

　　 Billy tried really hard

　　 Sally tried really really hard

　　 Timmy tried really really really hard

　　 Johnny tried really really really really hard

　　而你想把 "really" 、 "really really" ，以及任意数量连续出现的 "really" 字符串换成一个简单的 "very" （ simple is good! ），那么以下命令：

　　 :%s/$really $$really $*/very /

　　就会把上述的文本变成：

　　 Billy tried very hard

　　 Sally tried very hard

　　 Timmy tried very hard

　　 Johnny tried very hard

表达式 $really $* 匹配 0 或多个连续的 "really " （注意结尾有个空格），而 $really $$really $* 匹配 1 个或多个连续的 "really " 实例。

　　困难的例子（不可思议的象形文字）

　　 Coming soon.

　　不同工具中的正则表达式

　　 OK ，你已经准备使用 RE （ regular expressions ，正则表达式），但是你并准备使用 vi 。所以，在这里我们给出一些在其他工具中使用 RE 的例子。另外，我还会总结一下你在不同程序之间使用 RE 可能发现的区别。

当然，你也可以在 Visual C++ 编辑器中使用 RE 。选择 Edit->Replace ，然后选择 "Regular expression" 选择框， Find What 输入框对应上面介绍的 vi 命令 :%s/pat1/pat2/g 中的 pat1 部分，而 Replace 输入框对应 pat2 部分。但是，为了得到 vi 的执行范围和 g 选项，你要使用 Replace All 或者适当的手工 Find Next and Replace （译者按：知道为啥有人骂微软弱智了吧，虽然 VC 中可以选中一个范围的文本，然后在其中执行替换，但是总之不够 vi 那么灵活和典雅）。

　　Sed（将来再学习）

　　 Sed 是 Stream EDitor 的缩写，是 Unix 下常用的基于文件和管道的编辑工具，可以在手册中得到关于 sed 的详细信息。

　　这里是一些有趣的 sed 脚本，假定我们正在处理一个叫做 price.txt 的文件。注意这些编辑并不会改变源文件， sed 只是处理源文件的每一行并把结果显示在标准输出中（当然很容易使用重定向来定制）：

　　 sed 脚本描述

　　 sed 's/^$/d' price.txt 删除所有空行

　　 sed 's/^[ \t]*$/d' price.txt 删除所有只包含空格或者制表符的行

sed 's/"//g' price.txt 删除所有引号

　　awk（将来再学习）

　　 awk 是一种编程语言，可以用来对文本数据进行复杂的分析和处理。可以在手册中得到关于 awk 的详细信息。这个古怪的名字是它作者们的姓的缩写（ Aho ， Weinberger 和 Kernighan ）。

　　在 Aho ， Weinberger 和 Kernighan 的书 The AWK Programming Language 中有很多很好的 awk 的例子，请不要让下面这些微不足道的脚本例子限制你对 awk 强大能力的理解。我们同样假定我们针对 price.txt 文件进行处理，跟 sed 一样， awk 也只是把结果显示在终端上。

　　 awk 脚本描述

　　 awk ' !~ /^$/' price.txt 删除所有空行

　　 awk 'NF > 0' price.txt awk 中一个更好的删除所有空行的办法

　　 awk ' ~ /^[JT]/ ' price.txt 打印所有第二个字段是 'J' 或者 'T' 打头的行中的第三个字段

　　 awk ' !~ /[Mm]isc/ {print + }' price.txt 针对所有第二个字段不包含 'Misc' 或者 'misc' 的行，打印第 3 和第 4 列的和（假定为数字）

　　 awk ' !~ /^[0-9]+\.[0-9]*$/ ' price.txt 打印所有第三个字段不是数字的行，这里数字是指 d.d 或者 d 这样的形式，其中 d 是 0 到 9 的任何数字

awk ' ~ /John|Fred/ ' price.txt 如果第二个字段包含 'John' 或者 'Fred' 则打印整行

　　grep

　　 grep 是一个用来在一个或者多个文件或者输入流中使用 RE 进行查找的程序。它的 name 编程语言可以用来针对文件和管道进行处理。可以在手册中得到关于 grep 的完整信息。这个同样古怪的名字来源于 vi 的一个命令， g/re/p ，意思是 global regular expression print 。

　　下面的例子中我们假定在文件 phone.txt 中包含以下的文本，――其格式是姓加一个逗号，然后是名，然后是一个制表符，然后是电话号码：

　　 Francis, John 5-3871

　　 Wong, Fred 4-4123

　　 Jones, Thomas 1-4122

　　 Salazar, Richard 5-2522

　　 grep 命令描述

　　 grep '\t5-...1' phone.txt 把所有电话号码以 5 开头以 1 结束的行打印出来，注意制表符是用 \t 表示的

　　 grep '^S[^ ]* R' phone.txt 打印所有姓以 S 打头和名以 R 打头的行

　　 grep '^[JW]' phone.txt 打印所有姓开头是 J 或者 W 的行

　　 grep '^....\t' phone.txt 打印所有姓是 4 个字符的行，注意制表符是用 \t 表示的

　　 grep -v '^[JW]' phone.txt 打印所有不以 J 或者 W 开头的行

　　 grep '^[M-Z]' phone.txt 打印所有姓的开头是 M 到 Z 之间任一字符的行

　　 grep '^[M-Z].*[12]' phone.txt 打印所有姓的开头是 M 到 Z 之间任一字符，并且点号号码结尾是 1 或者 2 的行

　　egrep

　　 egrep 是 grep 的一个扩展版本，它在它的正则表达式中支持更多的元字符。下面的例子中我们假定在文件 phone.txt 中包含以下的文本，――其格式是姓加一个逗号，然后是名，然后是一个制表符，然后是电话号码：

　　 Francis, John 5-3871

　　 Wong, Fred 4-4123

　　 Jones, Thomas 1-4122

　　 Salazar, Richard 5-2522

　　 egrep command Description

　　 egrep '(John|Fred)' phone.txt 打印所有包含名字 John 或者 Fred 的行

　　 egrep 'John|22$|^W' phone.txt 打印所有包含 John 或者以 22 结束或者以 W 开头的行

　　 egrep 'net(work)?s' report.txt 从 report.txt 中找到所有包含 networks 或者 nets 的行

　　正则表达式语法支持情况

　　命令或环境 . [ ] ^ $  \{ \} ? + | ( )

　　vi替换命令简介

　　 Vi 的替换命令：

　　 :ranges/pat1/pat2/g

　　其中

　　 : 这是 Vi 的命令执行界面。

　　 range 是命令执行范围的指定，可以使用百分号（ % ）表示所有行，使用点（ . ）表示当前行，使用美元符号（ $ ）表示最后一行。你还可以使用行号，例如 10,20 表示第 10 到 20 行， .,$ 表示当前行到最后一行， .+2,$-5 表示当前行后两行直到全文的倒数第五行，等等。

　　 s 表示其后是一个替换命令。

　　 pat1 这是要查找的一个正则表达式，这篇文章中有一大堆例子。

　　 pat2 这是希望把匹配串变成的模式的正则表达式，这篇文章中有一大堆例子。

g 可选标志，带这个标志表示替换将针对行中每个匹配的串进行，否则则只替换行中第一个匹配串。

三：读后总结

Source Insight 里面不区分大小写搜索， grep [Aa][Bb]… 来实现

Source Insight 里面 Whole Words Only 匹配， grep 的实现，没有简单的直接方式，但是可以根据实际情况完成。

比如： egrep ‘\<word\>’ files ，这种情况可用于搜索 C 函数，变量等。

但是对于结构成员，可能需要：

grep ‘[ .>:]word’ files

《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
2022-04-18 Apbenz
语重心长的和我说，不要老是说不行，人至而立之年危机四伏，内在的，外在的，感觉就是心力憔悴，让人无所适从。面对职场的无情，突然好羡慕干体力劳动的外卖小哥。难道命运是想让我去送外卖了吗？干体力活才能让我活下去？fastadmin打卡成功,淘宝金币任务完成。ㅏㅓㅗㅜㅡㅣㅐㅔㅑㅕㅛㅠㅢㅒㅖY行。야자여자요리우유의사얘기예
上班族可以做线上副业兼职有哪些？盘点7个适合上班族做的副业兼职！高省APP大九
对于许多上班族来说，工资往往不能满足他们的生活需求，因此许多人开始寻找副业来增加收入。以下是一些适合普通人的副业赚钱路子，希望能给您带来一些灵感。1、做好物推荐现在很多职场人其实有大量的个人时间，只不过这些个人时间比较碎片化，他们不能够很好的利用起来，其实可以利用这些碎片化的时间去做副业，比如做好物推荐。在网上有很多的平台，比如头条抖音等等都开通了一个商品的分销功能，只要你发布相关的视频或者文章，
2020年学习什么知识比较好？互联网行业依然是发展较佳编程仔
2019年余额已不足，不少职场人心里也在盘点这一年的工作得失，琢磨新一年的奋斗策略，是继续冲刺还是换个跑道？今年跳槽更难吗？image互联网行业一直以相对较丰厚的薪酬和广阔的发展前景吸引着各界人才。但最近，互联网行业寒冬、互联网企业裁员等话题再次引起热议。正在从前些年的高速发展期转向发展调整期的互联网行业真的步入了“寒冬”？该行业依旧具有吸引力吗？什么职位又最热门呢？image互联网行业仍保持较高
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
Regular Expression 正则表达式 Aimyon_36 Data Development 正则表达式 redis 数据库
RegularExpression前言1.基本匹配2.元字符2.1点运算符.2.2字符集2.2.1否定字符集2.3重复次数2.3.1*号2.3.2+号2.3.3?号2.4{}号2.5(...)特征标群2.6|或运算符2.7转码特殊字符2.8锚点2.8.1^号2.8.2$号3.简写字符集4.零宽度断言（前后预查）4.1?=...正先行断言4.2?!...负先行断言4.3?Thefatcatsaton
研究表明，中年人“失业”成为了趋势，关键原因有这4点舒山有鹿
01在职场中，一直存在这么一个定律——35岁中年失业定律。很多人都特别疑惑，35岁还未到中年期，为什么人们会把“中年”跟“失业”挂钩呢？有句话，说得很现实：“35岁之前辞职，叫跳槽；35岁之后辞职，叫失业。”一般来说，35岁失业和40岁失业的本质是差不多的。只要他们还未升到管理层，便被单位辞退，就证明他们只能“另谋出路”了。况且，随着环境的愈发复杂，行业问题的频频发生，线下商业的不景气，那中年人找
极度休闲的一天淡泊孤峰
国庆国庆，普天同庆。在家躺着看大家游山玩水，长辈走亲戚，我的微信一天没几条消息，标准结局，习惯了。哈利波特系列电影真不错，童年总幻想着像主角哈利一样，像《龙族》少年楚子航浪迹江湖，风云天下。而现在却败给华为ICT大赛题还有永无止境的代码视频，唉，真可笑！
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
40岁的java程序员，还有出路吗？ cesske java 开发语言
目录前言一、现状与挑战二、出路与机遇三、案例分析与启示四、结语前言40岁Java程序员的出路：挑战与机遇并存在科技日新月异的今天，IT行业始终保持着高速的发展态势，而Java作为其中的重要一员，其地位依然稳固且充满挑战。对于一位40岁的Java程序员而言，面对职业生涯的“中年危机”，是否还有出路？本文将从多个维度探讨这一问题，旨在为这一群体提供思考和启示。一、现状与挑战职场竞争加剧随着技术的不断发
Nginx从入门到实践(三) 听你讲故事啊
动静分离动静分离是将网站静态资源（JavaScript，CSS，img等文件）与后台应用分开部署，提高用户访问静态代码的速度，降低对后台应用访问。动静分离的一种做法是将静态资源部署在nginx上，后台项目部署到应用服务器上，根据一定规则静态资源的请求全部请求nginx服务器，达到动静分离的目标。rewrite规则Rewrite规则常见正则表达式Rewrite主要的功能就是实现URL的重写，Ngin
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
爬虫技术抓取网站数据 Bearjumpingcandy 爬虫
爬虫技术是一种自动化获取网站数据的技术，它可以模拟人类浏览器的行为，访问网页并提取所需的信息。以下是爬虫技术抓取网站数据的一般步骤：发起HTTP请求：爬虫首先会发送HTTP请求到目标网站，获取网页的内容。解析HTML：获取到网页内容后，爬虫会使用HTML解析器解析HTML代码，提取出需要的数据。数据提取：通过使用XPath、CSS选择器或正则表达式等工具，爬虫可以从HTML中提取出所需的数据，如文
2020-03-24 艺鹰空间设计
从欧美的复古奢华，到现代极简的北欧风，一个太沉闷，一个略单调，设计师梁博，在自己的作品中融入一点点的复古元素，即能保留现代风格的清爽和功能上的便利，又可以收获复古的奢华和优雅，简直是太完美的搭配！古典风格住宅，设计师重新设计，厨房和起居室结合在一起，走廊和厨房起居室之间的墙从地板到天花板变成了一个透明隔断，给空间带来了更多的空气和光线。主卧室的设计颇有高级酒店的味道，左侧设置了休闲椅，右侧则有办公
看的信息越来越多，我却越来越焦虑了…… 灰咖儿
01看的信息越多，我感到越来越焦虑不知道为什么，有了手机作为消遣，却让人越来越感到焦虑。抖音、快手、知乎、小红书、、今日头条、喜马拉雅、得到……手机里装着越来越多的APP，每一个打开都是扑面而来的信息，除了纯粹的消遣，还为了能够学点东西、提高自己。但是要学的东西实在太多了，大到国际形势、国内经济、历史人文，小到股市分析、楼市信息、潮装搭配、美妆教学、生活技巧、健身诀窍、职场生存，每一个似乎都值得一
莆田鞋十大良心微商推荐，莆田鞋推荐微商排名一览表腕表鞋屋
莆田鞋是广受欢迎的一种休闲鞋，因其舒适耐穿而备受消费者喜爱。在如今的微商市场中，有许多卖家代理莆田鞋，但是有些卖家并不那么负责，售卖的鞋子品质堪忧。因此，今天我们就来盘点一下莆田鞋的十大良心微商，为大家推荐一些靠谱的卖家。微信:726865(下单赠送精美礼品)1.小尼鞋铺小尼鞋铺是一家专注于莆田鞋销售的微商店铺，主打高品质的鞋子，深受用户好评。2.快乐小屋快乐小屋作为一个专业的莆田鞋代理店，拥有丰
手机小游戏开发红匣子实力推荐
随着智能手机的普及，手机小游戏已经成为人们日常生活中不可或缺的一部分。从简单的消除游戏到复杂的策略游戏，手机小游戏为玩家提供了丰富的娱乐体验。本文将为您介绍手机小游戏开发的基本概念、工具和技术。开发-联系电话：13642679953（微信同号）1.游戏类型手机小游戏可以分为多种类型，如益智游戏、休闲游戏、动作游戏、策略游戏等。开发者可以根据自己的兴趣和技能选择合适的游戏类型进行开发。2.开发工具手
十年坚持做一件事，是怎样一种体验作家格格
01今天，偶然看到了雨果奖得主郝景芳的故事。之前，我只觉得她是清华才女，天赋异能。今天才发现，原来她惊人的才华背后，也有不为人知的付出与汗水。许多人知道“郝景芳”这个名字，都是从2016年的雨果奖开始。但很少有人知道，在那之前，她其实已经坚持写作了十年。如果说在校读博还能为她提供比较宽松的环境（尽管她学的是和写作完全无关的经济管理），毕业后进入职场，写作便成为一桩难以继续的事情。拿着四千块的工资，
期待2021 宝藏姑娘王婷
即将到来的2021年，将是我自己坚持早起修炼硬本领的第7年。我感激这几年的清晨时光，这段时光里有我对自己的全部承诺，我立志要做的事情，都走向了趋于理想的状态，这几年拼命的硬核修炼阶段，帮助我拉开了职场中我与别人的差距，我也成了专业领域那个最年轻走向管理岗位的人。几年前我也抱怨，为什么别人会这么想我，为什么这件事情会如此理解我，利用早起时光沉淀自己，疯狂读书写作学习输入与输出，我渐渐意识到之前的所有
火箭少女Yamy出道最大敌意来自老板？遭遇职场PUA，该如何应对柔力量
01从Yamy发的微博中我们可以知道，她虽然在网上总被人说“丑”、“年纪大”，但是她都会用作品说话来肯定自己却没想到这两年来公司老板徐明朝对她的态度忽冷忽热，两极分化十分严重甚至在员工大会上背着她和其他员工对她进行人身攻击。会议内容被好心的同事偷偷录下来给Yamy后，她忍受不了提出了解约却被老板以“情况了解，不要作死”回绝了这件事持续发酵，昨日19点，老板徐明朝也在公众平台发声信中态度相当诚恳，言
致即将逝去的2020年斯丹钰
婚姻生活没有想象中那么完美…有时候特别痛恨小时候受的那些教育为什么要被灌输：结婚就好了结婚根本不是那么一件容易的事情…结婚是一种全新生活方式的开始是每一个人学习的新课程很讨厌传统思想中：女人的价值不就是为了生儿育女的吗！我觉得女人哪怕你不是想走所谓的事业型但是你一定要拥有一技之长无论你身在职场，还是想退隐江湖哪天再回来…至少你能在这个时代和这个社会生存下去那时候再来谈你的精神你要的所有其它的东西不
06月04日或许你也这样想
躺下来就已经是凌晨了，感觉真的很疲惫，还有好多好多被交代的任务没完成，大脑混乱眼皮也不听使唤耷拉下来，黑眼圈也不知道掉到哪里去了…只感觉一身的疲惫，作为一个心思敏感的职场小白我真的觉得这段时间身体是如此的煎熬精神是如此的压抑，晚上回来从八点多加班到十一点多，一整天都对着电脑脸也开始变得蜡黄剪了短发头发也油的更快了，说话也变得如此的小心翼翼，这应该是初入职场正常的状态吧，这个时候就愈发需要陪伴和沟通
职场内卷，太累了！7个方法让你“破局”（收藏）张涔汐
文|张涔汐上上个周，涔汐做了一场直播，关于个人如何快速成长的话题。涔汐实力宠粉，把直播干货分享给大家了。话不多说，上干货。我们先思考一个问题，为什么有些人在职场三年五载，还是老样子呢？因为他们总是指望别人能教他，就如同《天道》的王庙村村民，没事儿往教堂跑，指望上帝保佑发财，期待高人指点脱贫致富一个道理。如果你想要在短短时间内，获得成长。01摒弃指望别人教你成长的观念，保持成长思维很多人面试的过程中
类似拳头游戏的官网有哪些除了拳头游戏官网还有哪些好用？会飞滴鱼儿
免费在线游戏网站为我们的日常休闲娱乐提供了丰富多样的游戏体验。有些游戏平台相当优质，同时还提供实时动态、活动福利等。现在让我们一起探寻哪些免费在线游戏网站值得你投入时间和精力，沉浸在游戏的世界中，畅玩各种好玩的游戏。2024最火的免费游戏网站排行榜大全───┅┈━━━━━━━━┅┈─────────────Top1──────────游戏名字：游戏豹官网-特点-：手机游戏门户网站日活跃量：1.3w
王政君：职场大忌，你对我“好”，我便对你好沧笙踏歌Yolanda
一只是个普通人在历史这个职场上，有很多女人，混得特别好，原因主要有以下几种：1.长的美：美的惊艳了历史，参见四大美女。适合做公关，前台等工作。2.才华横溢者：李清照，鱼玄机，秦淮八艳等。适合文案，编辑类工作。3.政治手腕：吕雉，武则天，太平公主等。适合做领导，雷厉风行。4.贤良淑德：马皇后，长孙皇后等。适合做贤内助，看似温柔，实则刚强。但是对于大部分女人来说，她们可能既不太漂亮，也不太丑，更没多少
互联网 Java 工程师面试题（Java 面试题四）苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
下面列出这份Java面试问题列表包含的主题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java集合框架数组字符串GOF设计模式SOLID抽象类与接口Java基础，如equals和hashcode泛型与枚举JavaIO与NIO常用网络协议Java中的数据结构和算法正则表达式JVM底层Java最佳实JDBCDate,Time与CalendarJava处理XMLJUnit编程现在是时候给
【无标题】正则表达式笔记 qis_qis 正则表达式笔记
作用查找特殊规则的字符串编写一个正则表达式，用来查找所有以0开头，后面跟着2-3个数字，然后是一个连字号“-”，最后是7或8位数字的字符串(像010-12345678或0376-7654321)。0\d{2,3}-\d{7,8}基本匹配区分大小写cat会匹配"cat"CAt会匹配"CAt"元字符元字符是正则表达式的基本组成元素。元字符在这里跟它通常表达的意思不一样，而是以某种特殊的含义去解释。有些
Elaine 100天职场进化 | 2分钟小测试，让你知道你的能力优势！职场E姐
人们应当如何了解自己的能力优势呢？你可以通过工作观察法，从过去的工作中找到隐藏的线索。1、你最喜欢工作的哪些部分？2、最不喜欢工作的哪些部分？3、如果不考虑经济问题，你最喜欢做的三件工作或事情是什么？思考他们之间有什么共性？4、在工作中，你对什么最有兴趣去学习？并且学习得非常不错，有很明显的成果？5、在工作中，你对哪些事情感觉困难？哪些学得非常认真但总是很吃力而且掌握不好？6、除了你现在的工作，你
如何处理好同事之间的关系一米六男模
从毕业到职场的转变，就好像是走向人生的另一个模式-生存模式。同事之间的关系，关切到我们未来自身的发展。在职场上，脑子时刻处于急转弯的状态，应付着周围不同的人际关系。身在职场让我懂得一点，那就是，人与人之间的利益就是:价值等价交换。当然，只有妥善的处理好自己人际关系，才能让自己的职场之路更加的顺畅。当然，也并非都是如此。进入公司的几个月以来，大家的真诚相待，让我明白，人与人之间的相互信任，是友好相处
人在单位，要是你有这几个举动，相信你一辈子都只能身处“底层” 舒山有鹿
职场，那是每个人都避免不了的话题。你要谋生，那么你就要去给老板打工；你要成家立业，那你最基本的就是要找到工作；你要过上好日子，那你还是要去混职场。身为一个打工人，相信我们最期望的，应该就是早日升职加薪。可是，在这复杂的时代当中，升职加薪听起来很平常，可要想实现这个目标，那是很难的。你会发现，你的老板就动动嘴皮子，下面的员工就得拼死拼活为他干活；你会发现，你的老板总是提拔那些不怎么优秀的摸鱼者，却把
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

正则表达式

一：正则表达式基础

二：例子

简单的例子

中级的例子（神奇的咒语）

困难的例子（不可思议的象形文字）

Sed（将来再学习）

awk（将来再学习）

grep

egrep

vi替换命令简介

三：读后总结

你可能感兴趣的:(正则表达式,职场,休闲)

　　简单的例子

　　中级的例子（神奇的咒语）

　　困难的例子（不可思议的象形文字）

　　Sed（将来再学习）

　　awk（将来再学习）

　　grep

　　egrep

　　vi替换命令简介