胜天半月子

⭐模式匹配与正则表达式

文章目录

前言
一、普通方法查找文本
二、正则表达式查找文本
- 2.1 正则表达式
- 2.2 用正则表达式匹配更多模式
三、贪心和非贪心匹配
四、findall()方法
五、字符分类
六、建立自己的字符分类
七、插入字符和美元字符
八、通配字符
- 8.1 用点-星匹配所有字符
- 8.2 用句点字符匹配换行
九、正则表达式符号复习⭐
十、正则表达式使用
- 10.1 不区分大小写的匹配
- 10.2 用sub()方法替换字符串
- 10.3 管理复杂的正则表达式
- 10.4 组合使用re.IGNORECASE、re.DOTALL 和re.VERBOSE
习题
项目案例
- 1. 电话号码和E-mail 地址提取程序
总结

前言

一直想找个机会好好的学习正则表达式的基础知识，现在随着学习和复习Python有关知识遇到了正则表达式，在此记录，以便日后复习使用。
正则表达式的主要应用是网络爬虫，日后学习爬虫遇到新的感悟体会会不断加入到这篇博客。

一、普通方法查找文本

保存isPhoneNumber.py：在字符串中查找电话号码。例如：415-555-4242

# 不用正则表达式来查找文本模式
def isPhoneNumber(text):
    if len(text) != 12:
        return False
    for i in range(0,3):
        if not text[i].isdecimal():
            return False
    if text[3] != '-':
        return False
    for i in range(4,7):
        if not text[i].isdecimal():
            return False  
    if text[7] != '-':
        return False
    for i in range(8,12):
        if not text[i].isdecimal():
            return False 
    return True
'''  
print('415-555-4242 is a phone number:')
print(isPhoneNumber('415-555-4242'))
print('Moshi moshi is a phone number:')
print(isPhoneNumber('Moshi moshi'))   
'''
message = 'Call me at 415-555-1011 tomorrow. 415-555-9999 is my office.'
for i in range(len(message)):
    chunk = message[i:i+12]
    if isPhoneNumber(chunk):
        print('Phone number foound:'+chunk)
    # print('Done')

二、正则表达式查找文本

正则表达式，简称为regex，是文本模式的描述方法。例如，\d 是一个正则表达式，表示一位数字字符，即任何一位 0 到 9 的数字。
正则表达式可以复杂得多。例如，在一个模式后加上花括号包围的3（{3}），就是说，“匹配这个模式3 次”。所以较短的正则表达式\d{3}-\d{3}-\d{4}，也匹配正
确的电话号码格式。

2.1 正则表达式

⭐Python 中使用正则表达式有几个步骤:

用import re 导入正则表达式模块。

用re.compile()函数创建一个Regex 对象（记得使用原始字符串）。

向Regex 对象的search()方法传入想查找的字符串。它返回一个Match 对象。

调用Match 对象的group()方法，返回实际匹配文本的字符串。

创建正则表达式对象

>>> import re

向re.compile()传入一个字符串值，表示正则表达式，它将返回一个Regex 模式对象（或者就简称为Regex 对象）。
正则表达式常常使用倒斜杠，向re.compile()函数传入原始字符串就很方便，而不是输入额外得到斜杠。输入r'\d\d\d-\d\d\d-\d\d\d\d' ，比输入’\d\d\d-\d\d\d-\d\d\d\d’要容易得多。


>>> phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')

现在phoneNumRegex 变量包含了一个Regex 对象。

匹配Regex 对象

Regex 对象的search()方法查找传入的字符串，寻找该正则表达式的所有匹配。如果字符串中没有找到该正则表达式模式，search()方法将返回None。如果找到了该模式，search()方法将返回一个Match 对象。


>>> phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
>>> mo = phoneNumRegex.search('My number is 415-555-4242.')
>>> print('Phone number found: ' + mo.group())
Phone number found: 415-555-4242

变量名mo 是一个通用的名称，用于Match 对象。

2.2 用正则表达式匹配更多模式

利用括号分组

添加括号将在正则表达式中创建“分组”：(\d\d\d)-(\d\d\d-\d\d\d\d)。然后可以使用group()匹配对象方法，从一个分组中获取匹配的文本。
正则表达式字符串中的第一对括号是第1 组。第二对括号是第2 组。向group()匹配对象方法传入整数1 或2，就可以取得匹配文本的不同部分。向group()方法传入0 或不传入参数，将返回整个匹配的文本。

>>> phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d-\d\d\d\d)')
>>> mo = phoneNumRegex.search('My number is 415-555-4242.')
>>> mo.group(1)
'415'
>>> mo.group(2)
'555-4242'
>>> mo.group(0)
'415-555-4242'
>>> mo.group()
'415-555-4242'

如果想要一次就获取所有的分组，请使用groups()方法


>>> mo.groups()
('415', '555-4242')
>>> areaCode, mainNumber = mo.groups()
>>> print(areaCode)
415
>>> print(mainNumber)
555-4242

多重复制的技巧

>>> mo.groups()
('415', '555-4242')
>>> areaCode, mainNumber = mo.groups()
>>> print(areaCode)
415
>>> print(mainNumber)
555-4242

用管道匹配多个分组

字符 | 称为“管道”。希望匹配许多表达式中的一个时，就可以使用它。
例如，正则表达式r’Batman | Tina Fey’将匹配’Batman’或’Tina Fey’。

>>> heroRegex = re.compile (r'Batman|Tina Fey')
>>> mo1 = heroRegex.search('Batman and Tina Fey.')
>>> mo1.group()
'Batman'
>>> mo2 = heroRegex.search('Tina Fey and Batman.')
>>> mo2.group()
'Tina Fey'

也可以使用管道来匹配多个模式中的一个，作为正则表达式的一部分。
假设你希望’Batman’、‘Batmobile’、‘Batcopter’
和’Batbat’中任意一个。因为所有这些字符串都以Bat 开始，所以如果能够只指定一次前缀，就很方便。

>>> batRegex = re.compile(r'Bat(man|mobile|copter|bat)')
>>> mo = batRegex.search('Batmobile lost a wheel')
>>> mo.group()
'Batmobile'
>>> mo.group(1)
'mobile'

只要出现括号，就可以使用group()
⭐方法调用mo.group()返回了完全匹配的文本’Batmobile’，而mo.group(1)只是返回第一个括号分组内匹配的文本’mobile’。通过使用管道字符和分组括号，可以指定几种可选的模式，让正则表达式去匹配。

用问号实现可选匹配

字符?表明它前面的分组在这个模式中是可选的，匹配?之前的分组零次或一次

>>> batRegex = re.compile(r'Bat(wo)?man')
>>> mo1 = batRegex.search('The Adventures of Batman')
>>> mo1.group()
'Batman'
>>> mo2 = batRegex.search('The Adventures of Batwoman')
>>> mo2.group()
'Batwoman'
>>> mo2.group(1)
'wo'

正则表达式中的(wo)?部分表明，模式wo 是可选的分组。该正则表达式匹配的文本中，wo 将出现零次或一次。这就是为什么正则表达式既匹配’Batwoman’，又匹配’Batman’。
如果需要匹配真正的问号字符，就使用转义字符?

用星号匹配零次或多次

*（称为星号）意味着“匹配零次或多次”，即星号之前的分组，可以在文本中出现任意次。它可以完全不存在，或一次又一次地重复.

>>> batRegex = re.compile(r'Bat(wo)*man')
>>> mo1 = batRegex.search('The Adventures of Batman')
>>> mo1.group()
'Batman'
>>> mo2 = batRegex.search('The Adventures of Batwoman')
>>> mo2.group()
'Batwoman'
>>> mo3 = batRegex.search('The Adventures of Batwowowowoman')
>>> mo3.group()
'Batwowowowoman'

如果需要匹配真正的星号字符，就在正则表达式的星号字符前加上倒斜杠，即*

用加号匹配一次或多次

+（加号）则意味着"匹配一次或多次"，加号不同，加号前面的分组必须"至少出现一次"

在这里插入代码片>>> batRegex = re.compile(r'Bat(wo)+man')

>>> mo1 = batRegex.search('The Adventures of Batwoman')
>>> mo1.group()
'Batwoman'
>>> mo2 = batRegex.search('The Adventures of Batwowowowoman')
>>> mo2.group()
'Batwowowowoman'
>>> mo3 = batRegex.search('The Adventures of Batman')
>>> mo3 == None
True

如果需要匹配真正的加号字符，在加号前面加上倒斜杠实现转义：+。

用花括号匹配特定次数

花括号让正则表达式更简短
如果想要一个分组重复特定次数，就在正则表达式中该分组的后面，跟上花括号包围的数字.

正则表达式(Ha){3}将匹配字符串 ‘HaHaHa’，但不会匹配’HaHa’，因为后者只重复了(Ha)分组两次。

正则表达式(Ha){3,5}将匹配
‘HaHaHa’、‘HaHaHaHa’和’HaHaHaHaHa’

(Ha){3,}将匹配3 次或更多次实例，(Ha){,5}将匹配0 到5 次实例

(Ha){
     3}
(Ha)(Ha)(Ha)

(Ha){
     3,5}
((Ha)(Ha)(Ha))|((Ha)(Ha)(Ha)(Ha))|((Ha)(Ha)(Ha)(Ha)(Ha))

>>> haRegex = re.compile(r'(Ha){3}')
>>> mo1 = haRegex.search('HaHaHa')
>>> mo1.group()
'HaHaHa'
>>> mo2 = haRegex.search('Ha')
>>> mo2 == None
True

三、贪心和非贪心匹配

问题引入

在字符串’HaHaHaHaHa’中，因为(Ha){3,5}可以匹配3 个、4 个或5 个实例，你可能会想，为什么在前面花括号的例子中，Match 对象的group()调用会返回’HaHaHaHaHa’，而不是更短的可能结果。毕竟’HaHaHa’和’HaHaHaHa’也能够有效地匹配正则表达式(Ha){3,5}。
⭐Python的正则表达式默认是贪心的，这表示在有二义的情况下，它们会尽可能匹配最长的字符串。
花括号的“非贪心”版本匹配尽可能最短的字符串，即在结束的花括号后跟着一个问号

# 贪心版本
>>> greedyHaRegex = re.compile(r'(Ha){3,5}')
>>> mo1 = greedyHaRegex.search('HaHaHaHaHa')
>>> mo1.group()
'HaHaHaHaHa'
# 非贪心版本
>>> nongreedyHaRegex = re.compile(r'(Ha){3,5}?')
>>> mo2 = nongreedyHaRegex.search('HaHaHaHaHa')
>>> mo2.group()
'HaHaHa'

请注意，问号在正则表达式中可能有两种含义：

声明非贪心匹配

表示可选的分组。
这两种含义是完全无关的。

四、findall()方法

search()将返回一个Match对象，包含被查找字符串中的“第一次”匹配的文本
findall()方法将返回一组字符串列表（返回的是列表，列表内容是字符串），包含被查找字符串中的所有匹配

案例展示


>>> phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
>>> mo = phoneNumRegex.search('Cell: 415-555-9999 Work: 212-555-0000')
>>> mo.group()
'415-555-9999'

没有分组 —没有括号

findall()不是返回一个Match 对象，而是返回一个字符串列表（没有括号或只有一个括号），只要在正则表达式中没有分组。列表中的每个字符串都是一段被查找的文本，它匹配该正则表达式。

>>> phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d') # has no groups
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
['415-555-9999', '212-555-0000']

有分组 —有括号

有分组，那么findall()将返回元组的列表（多个括号[>1]的情况下）。每个元组表示一个找到的匹配，其中的项就是正则表达式中每个分组的匹配字符串

上述验证

>>> import re
# --------------只有一个括号和没有括号的情况相同-----------------------
# 1. 一个括号
>>> phoneNumRegex = re.compile(r'(\d\d\d-\d\d\d-\d\d\d\d)')
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
['415-555-9999', '212-555-0000']
>>> phoneNumRegex = re.compile(r'(\d\d\d-\d\d\d)-\d\d\d\d')
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
['415-555', '212-555']
# 2. 没有括号
>>> phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d') # has no groups
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
['415-555-9999', '212-555-0000']
-------------------------------------------------------------------------
# 3. 两个括号  返回的列表中含有元组
>>> phoneNumRegex = re.compile(r'(\d\d\d-\d\d\d)-(\d\d\d\d)')
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
[('415-555', '9999'), ('212-555', '0000')]

# 4. 三个括号  返回的列表中含有元组
>>> phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)') # has groups
>>> phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
[('415', '555', '1122'), ('212', '555', '0000')]

结论

如果调用在一个没有分组或只有一个分组的正则表达式上，例如：\d\d\d-\d\d\d-\d\d\d\d，方法
findall()将返回一个匹配字符串的列表，例如[‘415-555-9999’, ‘212-555-0000’]。

如果调用在一个有分组的正则表达式上，例如：(\d\d\d)-(\d\d\d)-(\d\d\d\d)，方法findall()将返回一个字符串的元组的列表（每个分组对应一个字符串）,例如[(‘415’,‘555’, ‘1122’), (‘212’, ‘555’, ‘0000’)]

使用findall()方法，无法使用group()函数

五、字符分类

常用字符分类的缩写代码

缩写字符分类 	表示
\d 				0 到9 的任何数字
\D 				除0 到9 的数字以外的任何字符
\w 				任何字母、数字或下划线字符（可以认为是匹配“单词”字符）
\W 				除字母、数字和下划线以外的任何字符
\s 				空格、制表符或换行符（可以认为是匹配“空白”字符）
\S 				除空格、制表符和换行符以外的任何字符

字符分类对于缩短正则表达式很有用。字符分类[0-5]只匹配数字0 到5，这比输入(0|1|2|3|4|5)要短很多。

'''
\d+\s\w+匹配的文本有一个或多个数字(\d+)，
接下来是一个空白字符(\s)，
接下来是一个或多个字母/数字/下划线字符(\w+)
'''

>>> xmasRegex = re.compile(r'\d+\s\w+')
>>> xmasRegex.findall('12 drummers, 11 pipers, 10 lords, 9 ladies, 8 maids, 7
swans, 6 geese, 5 rings, 4 birds, 3 hens, 2 doves, 1 partridge')
['12 drummers', '11 pipers', '10 lords', '9 ladies', '8 maids', '7 swans', '6
geese', '5 rings', '4 birds', '3 hens', '2 doves', '1 partridge']

findall()方法将返回所有匹配该正则表达式的字符串，放在一个列表中。

六、建立自己的字符分类

使用[ ]（方括号)定义自己的字符分类

字符分类[aeiouAEIOU]将匹配所有元音字符，不论大小写。

使用短横表示字母或数字的范围，字符分类[a-zA-Z0-9]将匹配所有小写字母、大写字母和数字。

通过在字符分类的左方括号后加上一个插入字符（^），就可以得到“非字符类”。非字符类将匹配不在这个字符类中的所有字符。

# 代码一
>>> vowelRegex = re.compile(r'[aeiouAEIOU]')
>>> vowelRegex.findall('RoboCop eats baby food. BABY FOOD.')
['o', 'o', 'o', 'e', 'a', 'a', 'o', 'o', 'A', 'O', 'O']
# 代码二  不是匹配所有元音字符，而是匹配所有非元音字符
>>> consonantRegex = re.compile(r'[^aeiouAEIOU]')
>>> consonantRegex.findall('RoboCop eats baby food. BABY FOOD.')
['R', 'b', 'c', 'p', ' ', 't', 's', ' ', 'b', 'b', 'y', ' ', 'f', 'd', '.', '
', 'B', 'B', 'Y', ' ', 'F', 'D', '.']

⭐请注意，在方括号内，普通的正则表达式符号不会被解释：例如，字符分类将匹配数字0 到5 和一个句点。你不需要将它写成[0-5.]。

七、插入字符和美元字符

插入符号（^）:表明匹配必须发生在被查找文本开始处。{⭐注意和[^字符串]区分}

美元符号($)：表示该字符串必须以这个正则表达式的模式结束。
同时使用^和$，表明整个字符串必须匹配该模式，也就是说，只匹配该字符串的某个子集是不够的。

# 代码一
>>> beginsWithHello = re.compile(r'^Hello')

# 以 Hello 开头
>>> beginsWithHello.search('Hello world!')
<_sre.SRE_Match object; span=(0, 5), match='Hello'>

# 不以 Hello 开头
>>> beginsWithHello.search('He said hello.') == None
True

# 代码二  r'\d$'匹配以数字0到9结束的字符串。
>>> endsWithNumber = re.compile(r'\d$')
>>> endsWithNumber.search('Your number is 42')
<_sre.SRE_Match object; span=(16, 17), match='2'>
>>> endsWithNumber.search('Your number is forty two.') == None
True

# 代码三 r'^\d+$'匹配从开始到结束都是数字的字符串
>>> wholeStringIsNum = re.compile(r'^\d+$')
>>> wholeStringIsNum.search('1234567890')
<_sre.SRE_Match object; span=(0, 10), match='1234567890'>
>>> wholeStringIsNum.search('12345xyz67890') == None
True
>>> wholeStringIsNum.search('12 34567890') == None
True

八、通配字符

在正则表达式中，.（句点）字符称为“通配符”。它匹配除了换行之外的所有字符。
要记住，句点字符只匹配一个字符。
要匹配真正的句点，用倒斜杠转义：\.

8.1 用点-星匹配所有字符

句点字符表示“除换行外所有单个字符”
星号字符表示“前面字符出现零次或多次”

>>> nameRegex = re.compile(r'First Name: (.*) Last Name: (.*)')
>>> mo = nameRegex.search('First Name: Al Last Name: Sweigart')
>>> mo.group(1)
'Al'
>>> mo.group(2)
'Sweigart'

点-星使用“贪心”模式，总是匹配尽可能多的文本
“非贪心”模式匹配所有文本，就使用点-星和问号

# 非贪心模式

>>> nongreedyRegex = re.compile(r'<.*?>')
>>> mo = nongreedyRegex.search(' for dinner.>')
>>> mo.group()
''
# 贪心模式
>>> greedyRegex = re.compile(r'<.*>')
>>> mo = greedyRegex.search(' for dinner.>')
>>> mo.group()
' for dinner.>'
'''
两个正则表达式都可以翻译成“匹配一个左尖括号，接下来是任意字符，接下来是一个右尖括号”。但是字符串'<To serve man> for dinner.>'对右肩括号有两种可能的匹配。
在非贪心的正则表达式中，Python 匹配最短可能的字符串：'<To serve man>'。
在贪心版本中,Python 匹配最长可能的字符串：'<To serve man> for dinner.>'。
'''

8.2 用句点字符匹配换行

点-星将匹配除换行外的所有字符。通过传入re.DOTALL 作为re.compile()的第二个参数，可以让句点字符匹配所有字符，包括换行字符。

# `search()`将返回一个Match对象，包含被查找字符串中的“第一次”匹配的文本
>>> noNewlineRegex = re.compile('.*')
>>> noNewlineRegex.search('Serve the public trust.\nProtect the innocent.
\nUphold the law.').group()
'Serve the public trust.'

>>> newlineRegex = re.compile('.*', re.DOTALL)
>>> newlineRegex.search('Serve the public trust.\nProtect the innocent.
\nUphold the law.').group()
'Serve the public trust.\nProtect the innocent.\nUphold the law.'

九、正则表达式符号复习⭐

 ?匹配零次或一次前面的分组。
 *匹配零次或多次前面的分组。
 +匹配一次或多次前面的分组。
 {
     n}匹配n 次前面的分组。
 {
     n,}匹配n 次或更多前面的分组。
 {
     ,m}匹配零次到m 次前面的分组。
 {
     n,m}匹配至少n 次、至多m 次前面的分组。
 {
     n,m}?或*?或+?对前面的分组进行非贪心匹配。
 ^spam 意味着字符串必须以spam 开始。
 spam$意味着字符串必须以spam 结束。
 .匹配所有字符，换行符除外。
 \d、\w 和\s 分别匹配数字、单词和空格。
 \D、\W 和\S 分别匹配出数字、单词和空格外的所有字符。
 [abc]匹配方括号内的任意字符（诸如a、b 或c）。
 [^abc]匹配不在方括号内的任意字符。

十、正则表达式使用

10.1 不区分大小写的匹配

要让正则表达式不区分大小写，可以向re.compile()传入re.IGNORECASE 或re.I，作为第二个参数。


>>> robocop = re.compile(r'robocop', re.I)
>>> robocop.search('RoboCop is part man, part machine, all cop.').group()
'RoboCop'

>>> robocop.search('ROBOCOP protects the innocent.').group()
'ROBOCOP'

>>> robocop.search('Al, why does your programming book talk about robocop so much?').group()
'robocop'

10.2 用sub()方法替换字符串

正则表达式不仅能找到文本模式，而且能够用新的文本替换掉这些模式。
Regex对象的sub()方法需要传入两个参数。

第一个参数是一个字符串，用于取代发现的匹配。

第二个参数是一个字符串，即正则表达式。
sub()方法返回替换完成后的字符串。

>>> namesRegex = re.compile(r'Agent \w+')
>>> namesRegex.sub('CENSORED', 'Agent Alice gave the secret documents to Agent Bob.')
'CENSORED gave the secret documents to CENSORED.'

在sub()的第一个参数中，可以输入\1、\2、\3……。表示“在替换中输入分组1、2、3……的文本”。

>>> agentNamesRegex = re.compile(r'Agent (\w)\w*')
>>> agentNamesRegex.sub(r'\1****', 'Agent Alice told Agent Carol that Agent
Eve knew Agent Bob was a double agent.')
A**** told C**** that E**** knew B**** was a double agent.'

10.3 管理复杂的正则表达式

匹配复杂的文本模式，可能需要长的、费解的正则表达式。
你可以告诉re.compile()，忽略正则表达式字符串中的空白符和注释，从而缓解这一点。
要实现这种详细模式，可以向re.compile()传变量re.VERBOSE，作为第二个参数。

phoneRegex = re.compile(r'((\d{
      3}|\(\d{
      3}\))?(\s|-|\.)?\d{3}(\s|-|\.)\d{4}
(\s*(ext|x|ext.)\s*\d{2,5})?)')
# 你可以将正则表达式放在多行中，并加上注释，像这样：
phoneRegex = re.compile(r'''(
	(\d{3}|\(\d{3}\))? 	# area code
	(\s|-|\.)? 			# separator
	\d{3} 				# first 3 digits
	(\s|-|\.) 			# separator
	\d{4} 				# last 4 digits
	(\s*(ext|x|ext.)\s*\d{2,5})? # extension
	)''', re.VERBOSE)
'''
请注意，前面的例子使用了三重引号，
创建了一个多行字符串。
这样就可以将正则表达式定义放在多行中，让它更可读。
'''

正则表达式字符串中的注释规则:
#符号和它后面直到行末的内容，都被忽略

10.4 组合使用re.IGNORECASE、re.DOTALL 和re.VERBOSE

问题引入

如果你希望在正则表达式中使用re.VERBOSE 来编写注释，还希望使用
re.IGNORECASE来忽略大小写，该怎么办？
re.compile()函数只接受一个值作为它的第二参数。可以使用管道字符（|）将变量组合起来，从而绕过这个限制。管道字符在这里称为“按位或”操作符。

# 不区分大小写，并且句点字符匹配换行
>>> someRegexValue = re.compile('foo', re.IGNORECASE | re.DOTALL)

# 使用第二个参数的全部3 个选项
someRegexValue = re.compile('foo', re.IGNORECASE | re.DOTALL | re.VERBOSE)

习题

创建Regex 对象的函数是什么？

re.compile() 函数返回Regex 对象。

在创建Regex 对象时，为什么常用原始字符串？

使用原始字符串是为了让反斜杠不必转义。

search()方法返回什么？

search() 方法返回Match 对象。

通过Match 对象，如何得到匹配该模式的实际字符串？

group() 方法返回匹配文本的字符串。

用r’(\d\d\d)-(\d\d\d-\d\d\d\d)'创建的正则表达式中，分组0 表示什么？分组1呢？分组2 呢？

分组0 是整个匹配，分组1 包含第一组括号，分组2 包含第二组括号。

括号和句点在正则表达式语法中有特殊的含义。如何指定正则表达式匹配真正的括号和句点字符？

句号和括号可以用反斜杠转义：\.、\(、\）

⭐ findall()方法返回一个字符串的列表，或字符串元组的列表。是什么决定它提供哪种返回？

如果正则表达式没有分组，就返回字符串的列表。如果正则表达式有分组，就返回字符串的元组的列表。

在正则表达式中，|字符表示什么意思？

| 字符表示匹配两个组中的“任何一个”。

在正则表达式中，?字符有哪两种含义？

? 字符可以表示“匹配前面分组0 次或1 次”，或用于表示非贪心匹配。

在正则表达式中，+和*字符之间的区别是什么？

+匹配1 次或多次。*匹配0 次或多次。

在正则表达式中，{3}和{3,5}之间的区别是什么？

{3}匹配前面分组的精确3 次实例。{3, 5} 匹配3至5次实例。

在正则表达式中，\d、\w 和\s 缩写字符类是什么意思？

缩写字符分类\d、\w 和\s 分别匹配一个数字、单词或空白字符。

在正则表达式中，\D、\W 和\S 缩写字符类是什么意思？

缩写字符分类\D、\W 和\S 分别匹配一个字符，它不是数字、单词或空白字符

缩写字符分类 	表示
\d 				0 到9 的任何数字
\D 				除0 到9 的数字以外的任何字符
\w 				任何字母、数字或下划线字符（可以认为是匹配“单词”字符）
\W 				除字母、数字和下划线以外的任何字符
\s 				空格、制表符或换行符（可以认为是匹配“空白”字符）
\S 				除空格、制表符和换行符以外的任何字符

如何让正则表达式不区分大小写？

将re.I 或re.IGNORECASE 作为第二个参数传入re.compile()，让匹配不区分大小写

字符.通常匹配什么？如果re.DOTALL 作为第二个参数传递给re.compile()，它会匹配什么？

字符.通常匹配任何字符，换行符除外。如果将re.DOTALL 作为第二个参数传入re.compile()，那么点也会匹配换行符

.*和*?之间的区别是什么？

.*执行贪心匹配，*?执行非贪心匹配

匹配所有数字和小写字母的字符分类语法是什么？

[0-9a-z]或[a-z0-9]

如果numRegex = re.compile(r’\d+’)，那么
numRegex.sub(‘X’, ‘12 drummers, 11 pipers, five rings, 3 hens’)返回什么？

‘X drummers, X pipers, five rings, X hens’

将re.VERBOSE 作为第二个参数传递给re.compile()，让你能做什么？

re.VERBOSE 参数允许为传入 re.compile() 的字符串添加空格和注释。

如何写一个正则表达式，匹配每3 位就有一个逗号的数字？它必须匹配以下数字
· ‘42’
· ‘1,234’
· ‘6,368,745’
但不会匹配：
· ‘12,34,567’ （逗号之间只有两位数字）
· ‘1234’ （缺少逗号）

re.compile（r’^\d{1,3}(,{3})*$’）将创建这个正则表达式，但其他正则表达式字符串可以生成类似的正则表达式

如何写一个正则表达式，匹配姓Nakamoto 的完整姓名？你可以假定名字总是出现在姓前面，是一个大写字母开头的单词。该正则表达式必须匹配：
· ‘Satoshi Nakamoto’
· ‘Alice Nakamoto’
· ‘RoboCop Nakamoto’
但不匹配：
· ‘satoshi Nakamoto’（名字没有大写首字母）
· ‘Mr. Nakamoto’（前面的单词包含非字母字符）
· ‘Nakamoto’ （没有名字）
· ‘Satoshi nakamoto’（姓没有首字母大写）

re.compile(r’[A-Z][a-z]*\sNakamoto’)

如何编写一个正则表达式匹配一个句子，它的第一个词是Alice、Bob 或Carol，第二个词是eats、pets 或throws，第三个词是apples、cats 或baseballs。该句子以句点结束。这个正则表达式应该不区分大小写。它必须匹配：
· ‘Alice eats apples.’
· ‘Bob pets cats.’
· ‘Carol throws baseballs.’
· ‘Alice throws Apples.’
· ‘BOB EATS CATS.’
但不匹配：
· ‘RoboCop eats apples.’
· ‘ALICE THROWS FOOTBALLS.’
· ‘Carol eats 7 cats.’

re.compile(r’(Alice|Bob|Carol)\s(eats|pets|throws)\s(apples|cats|baseballs).’,
re.IGNORECASE)

项目案例

1. 电话号码和E-mail 地址提取程序

任务描述

在一篇长的网页或文章中，找出所有电话号码和邮件地址

任务列表

从剪贴板取得文本。

找出文本中所有的电话号码和E-mail 地址。

将它们粘贴到剪贴板。

代码编写列表

使用pyperclip 模块复制和粘贴字符串。

创建两个正则表达式，一个匹配电话号码，另一个匹配E-mail 地址。

对两个正则表达式，找到所有的匹配，而不只是第一次匹配。

将匹配的字符串整理好格式，放在一个字符串中，用于粘贴。

如果文本中没有找到匹配，显示某种消息。

为电话号码创建一个正则表达式

import pyperclip, re
phoneRegex = re.compile(r'''(
	(\d{3}|\(\d{3}\))? 					# area code
	(\s|-|\.)? 							# separator
	(\d{3}) 							# first 3 digits
	(\s|-|\.) 							# separator
	(\d{4}) 							# last 4 digits
	(\s*(ext|x|ext.)\s*(\d{2,5}))? 		# extension
	)''', re.VERBOSE)

'''
电话号码从一个“可选的”区号开始,区号分组跟着一个问号。
(415) 555-4242
因为区号可能只是3 个数字（\d{3}）或括号中的3 个数字（即\(\d{3}\)）
电话号码分割字符可以是空格（\s）、短横（-）或句点（.）
接下来的几部分:3 个数字，接下来是另一个分割符，接下来是4 个数字。最后的部分是可选的分机号，包括任意数目的空格，接着ext、x 或ext.，再接着2 到5 位数字。
'''

为E-mail 地址创建一个正则表达式

emailRegex = re.compile(r'''(
    [a-zA-Z0-9._%+-]+           # username
    @                           # @ symbol
    [a-zA-Z0-9.-]+              # domain name
    (\.[a-zA-Z]{2-4})           # dot-something
)''',re.VERBOSE)

'''
E-mail地址
用户名部分 : 一个或多个字符，可以包括：小写和大写字母、数字、句点、下划线、百分号、加号或短横，放入一个字符分类：[a-zA-Z0-9._%+-]
域名和用户名用@符号分割@
域名只允许字母、数字、句点和短横：[a-zA-Z0-9.-]
“dot-com”部分（技术上称为“顶级域名”），它实际上可以是“dot-anything”。它有2 到4 个字符
'''

正则表达式中() [] {}的区别

在剪贴板文本中找到所有匹配

text = str(pyperclip.paste())
matches = []
for groups in phoneRegex.findall(text):
    phoneNum = '-'.join([groups[1],groups[3],groups[5]])
    if groups[8] != '':
        phoneNum += ' x' + groups[8]
    matches.append(phoneNum)
for groups in emailRegex.findall(text):
    matches.append(groups[0])
    
'''
1.每个匹配对应一个元组[一个括号即为一个元组，步骤一有5个括号]
  每个元组包含正则表达式中每个分组的字符串
2.对于E-mail 地址，你将每次匹配的分组0[即所有内容，格式不变]添加到列表中
3.对于匹配的电话号码，你不想只是添加分组0。虽然程序可以“检测”
 几种不同形式的电话号码，你希望添加的电话号码是唯一的、标准的格式。
 phoneNum 变量包含一个字符串，它由匹配文本的分组1、3、5 和8 构成。
（这些分组是区号、前3 个数字、后4 个数字和分机号。）
'''

所有匹配连接成一个字符串，复制到剪贴板

pyperclip.copy()函数只接收一个字符串值，而不是字符串的列表，所以你在matches 上调用join()方法。

if len(matches) > 0:
    pyperclip.copy('\n'.join(matches))
    # print(matches)
    print('Copied to clipboard:')
    print('\n'.join(matches))
else:
    print('No phone numbers or email addresses found.')

运行程序

输入文本：
[email protected]
[email protected]
[email protected]
[email protected]
800-420-7240
Python 编程快速上手——让繁琐工作自动化
415-863-9900
415-863-9950

邮箱无法识别正在查找原因！！！

总结

1. 正则表达式中`() [] {}`的区别

括号( ) ： 括号是多个匹配，它把括号内的当做一组来处理，限制一些多选的范围，比如上面的需求只能是com cn net结尾的用括号就是最好的选择。括号能提取字符串，如(com|cn|net)就可以限制，只能是com或cn或net。括号将括号里面的内容作为一组，这就是与[]不同的地方。
方括号[ ]： 方括号是单个匹配，如**[abc]他限制的不是abc连续出现，而是只能是其中一个**，这样写那么规则就是找到这个位置时只能是a或是b或是c；方括号是正则表达式中最常用的，常用的用法有：[a-zA-Z0-9]匹配所有英文字母和数字，[^a-zA-Z0-9]匹配所有非英文字母和数字。
大括号{ }：大括号的用法很简单，就是匹配次数，它需要和其他有意义的正则表达式一起使用。

[a-c]{2}意思就是匹配a-c之间的一个字母出现且只出现两次；

(com){1}意思就是com必须出现一次

\W{1,3}意思就是非字母数字最少出现一次最多出现3次。

你可能感兴趣的:(Python基础及应用,#,python爬虫,python,正则表达式,字符串,列表)

JavaScript的介绍及嵌入方式紫罗兰丶
JavaScript介绍JavaScript是运行在浏览器端的脚步语言，JavaScript主要解决的是前端与用户交互的问题，包括使用交互与数据交互。JavaScript是浏览器解释执行的，前端脚本语言还有JScript（微软，IE独有），ActionScript(Adobe公司，需要插件)等。JavaScript嵌入页面的方式1.页面script标签嵌入vara="你好!"2.外部引用
【Linux操作系统】安装VS Code LN花开富贵 Linux linux 单片机物联网嵌入式硬件学习
更新系统包列表sudoaptupdate安装依赖项sudoaptinstallsoftware-properties-commonapt-transport-httpswget添加微软GPG密钥和仓库源wget-qhttps://packages.microsoft.com/keys/microsoft.asc-O-|sudoapt-keyadd-sudoadd-apt-repository"de
Python 2和Python 3的区别？山禾家的猫
Python社区，有这么个怪问题：“学Python到底是学2还是学3？”这个问题就像月经一样每隔断时间就出现在你面前，也成了很多初学者的选择困惑，这个问题的“始作俑者”当然是Python它爹，大家众说纷纭，有说Python2是主流，大公司都在用，你应该学2。也有说Python3才是未来主流，大多数第三方框架已基本支持Python3。个人看法是Python2还会存在很长一段时间（只要那些用Pytho
Java 二维数组详解：从基础语法到实战应用，彻底掌握多维数据结构大葱白菜 java合集开发语言 java 后端学习个人开发
作为一名Java开发工程师，你一定在实际开发中遇到过需要处理表格、矩阵、图像像素、游戏地图等场景。这时候，二维数组（2DArray）就派上用场了。本文将带你全面掌握：Java中二维数组的定义与初始化方式二维数组的内存结构与访问机制二维数组的遍历、修改与扩容技巧二维数组在实际业务中的应用场景二维数组与集合类（如List>）的互转常见误区与最佳实践并通过丰富的代码示例和真实项目场景讲解，帮助你写出更高
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
HTTPS协议的应用场景分析 Arwen303 https 网络协议 http
HTTPS协议的应用场景分析一、Web服务与交互网页浏览场景：用户通过浏览器访问各类网站（如门户网站、资讯平台），传输HTML、CSS、JavaScript等静态资源。应用：主流网站普遍采用HTTPS，确保页面内容安全加载。例如，Wikipedia、新浪等站点通过HTTPS防止内容被篡改。安全需求：防止页面被中间人劫持植入恶意广告或脚本。在线表单与用户登录场景：用户提交注册表单、登录账号时传输用户
Vue3递归组件详解：构建动态树形结构的终极方案编程随想▿ Vue3 vue.js 前端 javascript 前端框架
目录一、什么是递归组件？二、Vue3递归组件实现步骤1.基础实现2.关键点解析三、动态数据实战：渲染树形菜单四、Vue3递归组件的核心注意事项五、高级技巧：异步递归组件六、常见问题排查结语一、什么是递归组件？递归组件是指在组件内部调用自身的特殊组件。它适用于处理嵌套树形数据结构的场景，例如：文件目录系统多级导航菜单组织架构图嵌套评论列表在Vue3中，递归组件通过name属性标识自身，实现模板自引用
[Python]Python中if-else的语法，用法示例 LN花开富贵 Python python 学习笔记嵌入式单片机 opencv
Python中多条件判断通过if-elif-else结构实现，elif是elseif的缩写。一、基础语法结构if条件1:#条件1为真时执行的代码块elif条件2:#条件2为真时执行的代码块elif条件3:#条件3为真时执行的代码块else:#所有条件均不满足时执行的代码块顺序判断，当第一个条件满足时其对应的代码块会被执行，后续elif的条件不在检查，如果都是if语句，那么执行完第一个if后后面的i
拼多多卖货如何才能赚佣金？拼多多挣佣金要怎么做？氧惠导师
淘宝上是有一个淘客宝的，大家可以在里面赚取佣金，其实拼多多也是有类似功能的。那么拼多多挣佣金应该怎么做?怎么通过卖货赚佣金了?文章接下来就给大家解答一下这两个问题。➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤
让爱住下渺渺量心
图片发自App过了今日，我们便别离。我还没来得及折柳相送。让时间慢些吧，把我的爱人留下。过了今晚，我们永不相见，还没来得及折完千纸鹤，九百九十九只千纸鹤，只差两只。让爱住下吧。
python源码下载
python源码下载(2010-12-1823:11)不知道python.org一直被堵在墙外…1、http://ftp.python.org/ftp/python/2、http://www.python.org/ftp/python/
Python接地气入门。
欢迎来到"鑫哆哆"编程角世界上最好的语言PYTHON?鑫哆哆跟python的机缘为什么选择python合理的设计学习计划，有助于攻略的成功合理驯服自己脑子合理骗过自己脑子合理安排反馈鑫哆哆的学习python计划基础语法缩进语句规则控制语句规则表达式规则函数规则对象规则类型规则数学运算直接觉醒！鑫哆哆的课程选取迈出第一步恭喜大家成功入门python！总结世界上最好的语言PYTHON?新的一年祝大家心
Python镜像源染诗 python
https://www.cnblogs.com/songzhixue/p/11296720.html
2011.2.26晚间日记苦之竹
90天践行活动，从早起开始起床：5:50就寝：10:40天气：小雨心情：啊这纪念日：无今天早起慢跑被雨赶回家了，不过在家多转几圈也能完成目标啊（笑）年度目标及关键点：提升能力加把小肚子减了本月重要成果：加入福建爱的今天最大的印象就是开会！！开会！！开卷有益-学习/读书喜马拉雅APP听叶武滨老师的时间管理100讲以及家慧库APP有关家庭的学习
“上市公司并购重组取消审核”是真是假？续雅蜜蜜
据了解，证监会一直在对并购重组进行简政放权。2013年10月，证监会宣布并购重组实行分道制，所谓的分道制，即按照“先分后合、一票否决、差别审核”原则，由证券交易所和证监局、证券业协会、财务顾问分别对上市公司合规情况、中介机构执业能力、产业政策及交易类型三个分项进行评价，之后根据分项评价的汇总结果，将并购重组申请划入豁免/快速、正常、审慎三条审核通道。此后，修订实行的《上市公司重大资产重组管理办法》
公路桥梁施工质量管理与控制方法分析阿卞是宝藏啊
本文还有配套的精品资源，点击获取简介：本文深入探讨了公路桥梁施工中如何实施有效的质量管理与控制，强调了质量管理的重要性，详述了质量控制的理论基础，并概述了施工前后质量策划、材料与设备质量控制、施工过程监控、质量信息管理、问题处理与改进、竣工验收及后期维护的方法。强调了全面质量管理理论与现代信息技术的应用，旨在确保工程安全、可靠与耐久。1.质量管理的重要性1.1市场竞争中的质量要素在当今竞争日益激烈
python设置国内源 twilightdream python
mkdir.pipcd.piptouchpip.confnanopip.conf贴上[global]trusted-host=mirrors.aliyun.comindex-url=http://mirrors.aliyun.com/pypi/simple
华为OD机考 2025C卷 - 围棋的气 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD机考2025C卷华为OD2025C卷
围棋的气华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述围棋棋盘由纵横各19条线垂直相交组成，棋盘上一共19x19=361个交点，对弈双方一方执白棋，一方执黑棋，落子时只能将棋子置于交点上。“气”是围棋中很重要的一个概念，某个棋子有几口气，是指其上下左右方向四个相邻的交叉点中，有几个交叉点没有棋子，由此可知：在棋
华为OD机考 2025C卷 - 对称美学 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
对称美学华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述对称就是最大的美学，现有一道关于对称字符串的美学。已知：第1个字符串：R第2个字符串：BR第3个字符串：RBBR第4个字符串：BRRBRBBR第5个字符串：RBBRBRRBBRRBRBBR相信你已经发现规律了，没错！就是第i个字符串=第i-1号字符串取反+第
华为OD机试 2025 B卷 - We are a Team (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机考2025B卷华为OD机试2025B卷华为OD机试
WeareaTeam华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：消息构成为abc，整数a、b分别代表两个人的标号，整数c代表指令c==0代表a和b在一个团队内c==1
华为OD 面试手撕真题目录无限码力华为OD面试手撕代码真题合集华为od 面试华为OD面试手撕真题
华为OD面试手撕真题目录，收集的都是实际面试出现过的手撕代码真题，对于是力扣原题的我会在对应题目博客中给出对应对应链接，推荐自己写代码去通过。华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解目录序号题目名称考点1求1-n的最小公倍数数学原理2判断是IPV4还是IPV6字符串、模拟3旋转矩阵模拟4
Python中if-else判断语句、while循环语句以及for循环语句的使用总结 bentou_
1.if-esle流程判断语句我们来直接看一个例子，如下，判断我们定义的用户名和用户输入的用户名是否一致。代码当中有几个注意点：判断的时候用双等号表示判断是否一致（三个等号表示赋值）你有没有注意到这里不是用的大括号而是用的冒号！python3对父级和子级的写法是极为严格的，就像这里的if跟else，都是父级，需要顶格写；下面的两个子级（print那里）就需要缩进一个tab。_username="b
Python库安装国内源奔跑的石头_ python python AI编程
关注公众号“码字读书会”，了解最新消息。Python国内源包括企业和高校机构打不得开源软件包资源。著名的有阿里云、华为云、清华。个人常用的有清华源临时使用命令如下：pipinstall-ittps://pypi.tuna.tsinghua.edu.cn/simple包名
Android高级技能(一)：CI/CD与自动化构建半夜偷你家裤衩子 Android android ci/cd 自动化
摘要当应用开发进入成熟阶段，手动进行构建、测试和发布将变得效率低下且容易出错。持续集成(CI)和持续部署(CD)是现代化软件开发的标准实践，能极大地提升开发效率和应用质量。本文将深入探讨如何在Android项目中实施CI/CD流程，内容涵盖Git工作流、Gradle高级自动化以及如何利用Jenkins或GitHubActions搭建自动化流水线。目录CI/CD核心理念什么是持续集成(Continu
淘宝优惠券怎么找？淘宝内部优惠券哪里领取？日常购物技巧呀
淘宝优惠券去哪里领取优惠券返利APP淘宝隐藏优惠卷怎么用？淘宝优惠券是淘宝网推出的集合众多B2C商家，淘宝拍拍卖家的优惠券和商品导购平台。淘宝优惠券以“优惠券，越用越优惠”为口号，独家与各商家洽谈后，给予消费者最大的优惠。1、手机应用商店搜索“高省”下载高省APP，注册填写高省邀请码：6686662、登录高省APP后，高省首页直接搜索想要的商品名称，即可查询全网内部优惠券及返利3、按提示点击进入领
Kotlin中let、run、with、apply及also的差别猿界新星蔡 Kotlin kotlin
在Kotlin中，let、run、with、apply和also是常用的作用域函数（scopefunctions）。它们的目的都是简化代码，使代码更加简洁，并且可以提供更好的可读性。每个函数在不同的场景下有不同的行为。下面是这5种作用域函数的简单示例代码，帮助理解它们的差异和用法。1.letlet函数接收一个对象作为参数，并返回一个值。它常用于对对象进行操作，然后返回操作的结果。示例：funmai
加拿大航空初体验 lalalayulu
刚从美国途径蒙特利尔回上海。来谈一下加拿大航空的服务和其他航空公司对比吧～首先空姐就不要期待太高了，说是空妈空婶都算是客气的了。所以记得要和空婶说话响亮些，她可能真的没听到。第二我还是很喜欢椅背后的娱乐设备系统的。它的设计和其他航空公司有一些区别。它有一个电影列表，我可以把喜欢的感兴趣的电影加入到那个列表里，然后从那个列表里面选想要看的电影。而且，它还有一些制作精致的艺术短片，可以作为厚重的亨长的
基于单片机的电子时钟设计 2301_79312104 单片机单片机嵌入式硬件
收藏和点赞，您的关注是我创作的动力文章目录概要一、设计目标二、系统电路设计2.1硬件电路的设计方案三、系统软件设计3.1主程序设计3.2仿真调试四、总结五、文章目录概要电子时钟具有长远的发展历史，它的出现使得人们对时间的概念有了进一步的认知和了解，可以说意义十分的重大。在时代的推动，以及市场的需求下，电子时钟的功能以及性能都有着质的突破，而且应用的范围也越来越广，到处都有着电子时钟的影子。电子
基于单片机直流电机调速控制系统设计
**单片机设计介绍，基于单片机直流电机调速控制系统设计一概要基于单片机直流电机调速控制系统设计是一个综合性项目，旨在利用单片机实现对直流电机转速的精确控制。以下是该设计的概要：一、系统概述该设计以单片机为核心控制器，结合适当的驱动电路和传感器，构建了一个完整的直流电机调速控制系统。通过调整单片机的输出信号，可以实现对直流电机转速的精确控制，满足不同应用场景的需求。二、硬件设计单片机选择：选用具
基于51单片机电机测速显示电路系统方案创新电子设计单片机 51单片机嵌入式硬件单片机
**单片机设计介绍，基于51单片机电机测速显示电路系统方案文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于51单片机的电机测速显示电路系统方案概要如下：一、引言本设计旨在通过51单片机为核心控制器，结合测速电路和显示电路，实现对电机转速的精确测量和实时显示。该系统可以广泛应用于需要电机转速监控的各类设备和系统中，如自动化设备、机器人、电动车等。二、系统组成51
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb