或许对了

python 正则表达式（re）

python 正则表达式（re）
96 thinkando
https://www.jianshu.com/p/39fb062abbe0
2017.12.03 23:47 字数 584 阅读 151评论 0喜欢 2
No. 目录

正则表达式概述
re模块介绍
单字符匹配
原始字符窜
多字符匹配
边界匹配
分组匹配
函数
贪婪和非贪婪
常用正则表达式
镇楼图
正则表达式概述
Regular Expression，在代码中常简写为regex、regexp或RE
正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本。
re模块介绍
2.1 re模块
re.match() 能够匹配出以xxx开头的字符串
#coding=utf-8

导入re模块

import re

使用match方法进行匹配操作

result = re.match(“hello”,“hello.cn”)

如果上一步匹配到数据的话，可以使用group方法来提取数据

print(result.group())

hello
3. 单字符匹配
字符功能
. 匹配任意1个字符（除了\n）
[ ] 匹配[ ]中列举的字符
\d 匹配数字，即0-9
\D 匹配非数字，即不是数字
\s 匹配空白，即空格，tab键
\S 匹配非空白
\w 匹配单词字符，即a-z、A-Z、0-9、_
\W 匹配非单词字符
示例1： .

import re
ret = re.match(".",“a”) # 匹配任意一个
ret.group()
‘a’
示例2：[ ]

coding=utf-8

import re

ret = re.match(“h”, “hello Python”) # 正则表达式区分大小写
ret.group()
‘h’

ret = re.match(“H”, “Hello Python”)
ret.group()
‘H’

ret = re.match("[hH]", “hello Python”) # 大小写h都可以的情况
ret.group()
‘h’

ret = re.match("[hH]", “Hello Python”)
ret.group()
‘H’

ret = re.match("[0123456789]", “7Hello Python”) # 匹配数字一
ret.group()
‘7’

ret = re.match("[0-9]", “7Hello Python”) # 匹配数字二
ret.group()
‘7’
示例3：\d

coding=utf-8

import re
ret = re.match(“嫦娥1号”,“嫦娥1号发射成功”)
print(ret.group())

嫦娥1号
ret = re.match(“嫦娥\d号”,“嫦娥1号发射成功”)
print(ret.group())

嫦娥1号
4. 原始字符窜
Python中字符串前面加上 r 表示原生字符串
如果路径很长，你一定会恨死反斜杠的
mm = “c:\a\b\c”
mm
‘c:\a\b\c’
print(mm)
c:\a\b\c
re.match(“c:\\”,mm).group()
‘c:\’
ret = re.match(“c:\\”,mm).group()
print(ret)
c:
ret = re.match(“c:\\a”,mm).group()
print(ret)
c:\a
ret = re.match(r"c:\a",mm).group()
print(ret)
c:\a
ret = re.match(r"c:\a",mm).group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
5.多字符匹配
字符功能

匹配前一个字符出现0次或者无限次，即可有可无

匹配前一个字符出现1次或者无限次，即至少有1次
? 匹配前一个字符出现1次或者0次，即要么有1次，要么没有
{m} 匹配前一个字符出现m次
{m,} 匹配前一个字符至少出现m次
{m,n} 匹配前一个字符出现从m到n次
匹配出，一个字符串第一个字母为大小字符，后面都是小写字母并且这些小写字母可有可无
ret = re.match("[A-Z][a-z]*",“Mm”)
ret.group()
‘Mm’

ret = re.match("[A-Z][a-z]",“Aabcdef”)
ret.group()
‘Aabcdef’
匹配出，变量名是否有效
ret = re.match("[a-zA-Z_]+[\w_]",“name1”)
ret.group()
‘name1’

ret = re.match("[a-zA-Z_]+[\w_]*","_name")
ret.group()
‘_name’

ret = re.match("[a-zA-Z_]+[\w_]*",“2_name”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
匹配出，0到99之间的数字

ret = re.match("[1-9]?[0-9]",“7”)
ret.group()
‘7’

ret = re.match("[1-9]?[0-9]",“33”)
ret.group()
‘33’

ret = re.match("[1-9]?[0-9]",“09”)
ret.group()
‘0’
6. 边界匹配
字符功能
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配一个单词的边界
\B 匹配非单词边界
示例1:匹配163.com的邮箱地址

正确的地址

ret = re.match("[\w]{4,20}@163.com", "[email protected]")
ret.group()
‘[email protected]’

不正确的地址

ret = re.match("[\w]{4,20}@163.com", “[email protected]”)
ret.group()
‘[email protected]’

通过$来确定末尾

ret = re.match("[\w]{4,20}@163.com$", “[email protected]”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
示例2: \b
re.match(r".*\bver\b", “ho ver abc”).group()
‘ho ver’

re.match(r".*\bver\b", “ho verabc”).group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

re.match(r".*\bver\b", “hover abc”).group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
示例3：\B

re.match(r".*\Bver\B", “hoverabc”).group()
‘hover’

re.match(r".*\Bver\B", “ho verabc”).group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

re.match(r".*\Bver\B", “hover abc”).group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

re.match(r".*\Bver\B", “ho ver abc”).group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

分组匹配
字符功能
‘|’ 匹配左右任意一个表达式
(ab) 将括号中字符作为一个分组
\num 引用分组num匹配到的字符串
(?P) 分组起别名
(?P=name) 引用别名为name分组匹配到的字符串
匹配出0-100之间的数字
#coding=utf-8

import re

ret = re.match("[1-9]?\d",“8”)
ret.group()
‘8’

ret = re.match("[1-9]?\d",“78”)
ret.group()
‘78’

不正确的情况

ret = re.match("[1-9]?\d",“08”)
ret.group()
‘0’

修正之后的

ret = re.match("[1-9]?\d$",“08”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

添加|

ret = re.match("[1-9]?\d$|100",“8”)
ret.group()
‘8’

ret = re.match("[1-9]?\d$|100",“78”)
ret.group()
‘78’

ret = re.match("[1-9]?\d$|100",“08”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

ret = re.match("[1-9]?\d$|100",“100”)
ret.group()
‘100’
匹配出163、126、qq邮箱之间的数字

ret = re.match("\w{4,20}@163.com", "[email protected]")
ret.group()
‘[email protected]’

ret = re.match("\w{4,20}@(163|126|qq).com", "[email protected]")
ret.group()
‘[email protected]’

ret = re.match("\w{4,20}@(163|126|qq).com", "[email protected]")
ret.group()
‘[email protected]’

ret = re.match("\w{4,20}@(163|126|qq).com", "[email protected]")
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
group

ret = re.match("([^-]*)-(\d+)",“010-12345678”)
ret.group()
‘010-12345678’

ret.group(1)
‘010’

ret.group(2)
‘12345678’
匹配出hh

能够完成对正确的字符串的匹配

ret = re.match("<[a-zA-Z]>\w", “hh”)
ret.group()
‘hh’

如果遇到非正常的html格式字符串，匹配出错

ret = re.match("<[a-zA-Z]>\w", “hh”)
ret.group()
‘hh’

通过引用分组中匹配到的数据即可，但是要注意是元字符串，即类似 r""这种格式

ret = re.match(r"<([a-zA-Z])>\w", “hh”)
ret.group()
‘hh’

因为2对<>中的数据不一致，所以没有匹配出来

ret = re.match(r"<([a-zA-Z])>\w", “hh”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
匹配出

www.hello.cn

ret = re.match(r"<(\w*)><(\w*)>.*", “

www.hello.cn
”)
ret.group()
‘
www.hello.cn
’

ret = re.match(r"<(\w*)><(\w*)>.*", “

www.hello.cn
”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’
匹配出
www.hello.cn
(方法二)

ret = re.match(r"<(?P\w*)><(?P\w*)>.*", “

www.itcast.cn
”)
ret.group()
‘
www.itcast.cn
’

ret = re.match(r"<(?P\w*)><(?P\w*)>.*", “

www.hello.cn
”)
ret.group()
Traceback (most recent call last):
File “”, line 1, in
AttributeError: ‘NoneType’ object has no attribute ‘group’

函数
8.1 search
匹配出文章阅读的次数
#coding=utf-8
import re

ret = re.search(r"\d+", “阅读次数为 9999”)
print(ret.group())

9999
8.2 findall
统计出python、c、c++相应文章阅读的次数

ret = re.findall(r"\d+", “python = 9999, c = 7890, c++ = 12345”)
print (ret)
[‘9999’, ‘7890’, ‘12345’]
8.3 sub 将匹配到的数据进行替换
将匹配到的阅读次数加1
#coding=utf-8
import re

ret = re.sub(r"\d+", ‘998’, “python = 997”)
print (ret)

python = 998
方法二
#coding=utf-8
import re

def add(temp):
strNum = temp.group()
num = int(strNum) + 1
return str(num)

ret = re.sub(r"\d+", add, “python = 997”)
print (ret)

ret = re.sub(r"\d+", add, “python = 99”)
print (ret)

python = 998
python = 100
8.4 split 根据匹配进行切割字符串，并返回一个列表
#coding=utf-8
import re

ret = re.split(r"? ",“info:xiaoZhang 33 shandong”)
print (ret)

[‘info’, ‘xiaoZhang’, ‘33’, ‘shandong’]
9. 贪婪和非贪婪
Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；非贪婪则相反，总是尝试匹配尽可能少的字符。
在"*","?","+","{m,n}“后面加上？，使贪婪变成非贪婪。
s=“This is a number 234-235-22-423”
r=re.match(”(.+)(\d±\d±\d±\d+)",s)
print(r.group(1))
print(r.group(2))
r=re.match("(.+?)(\d±\d±\d±\d+)",s)
print(r.group(1))
print(r.group(2))

This is a number 23
4-235-22-423
This is a number
234-235-22-423

re.match(r"aa(\d+)",“aa2343ddd”).group(1)
‘2343’

re.match(r"aa(\d+?)",“aa2343ddd”).group(1)
‘2’

re.match(r"aa(\d+)ddd",“aa2343ddd”).group(1)
‘2343’

re.match(r"aa(\d+?)ddd",“aa2343ddd”).group(1)
‘2343’

常用正则表达式
10.1 校验数字的表达式
1 数字 ¹$
2 n位的数字 ^\d{n}$
3 至少n位的数字 ^\d{n,}$
4 m-n位的数字 ^\d{m,n}$
5 零和非零开头的数字： ^(0|[1-9][0-9])$
6 非零开头的最多带两位小数的数字 ^([1-9][0-9])+(.[0-9]{1,2})?$
7 带1-2位小数的正数或负数 ^(-)?\d+(.\d{1,2})?$
8 正数、负数、和小数 ^(-|+)?\d+(.\d+)?$
9 有两位小数的正实数 ²+(.[0-9]{2})?$
10 有1~3位小数的正实数 ³+(.[0-9]{1,3})?$
11 非零的正整数 ⁴\d$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$
12 非零的负整数 ^-[1-9][]0-9"$ 或 ^-[1-9]\d$
13 非负整数 ^\d+$ 或 ⁵\d*|0$
14 非正整数 ^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非负浮点数 ^\d+(.\d+)?$ 或 ⁶\d.\d|0.\d[1-9]\d|0?.0+|0$
16 非正浮点数 ^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d.\d|0.\d[1-9]\d))|0?.0+|0$
17 正浮点数 ⁷\d.\d|0.\d[1-9]\d$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
18 负浮点数 ^-([1-9]\d.\d|0.\d[1-9]\d)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
19 浮点数 ^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d.\d|0.\d[1-9]\d|0?.0+|0)$
10.2 校验字符的表达式
1 汉字 ⁸{0,}$
2 英文和数字 ⁹+$ 或 ¹⁰{4,40}$
3 长度为3-20的所有字符 ^.{3,20}$
4 由26个英文字母组成的字符串 ¹¹+$
5 由26个大写英文字母组成的字符串 ¹²+$
6 由26个小写英文字母组成的字符串 ¹³+$
7 由数字和26个英文字母组成的字符串 ¹⁴+$
8 由数字、26个英文字母或者下划线组成的字符串 ^\w+$ 或 ^\w{3,20}$
9 中文、英文、数字包括下划线 ¹⁵+$
10 中文、英文、数字但不包括下划线等符号 ¹⁶+$ 或 ¹⁷{2,20}$
11 可以输入含有^%&’,;=? $KaTeX parse error: Expected group after '^' at position 7: "等字符 [^̲%&',;=?$ \x22]+
12 禁止输入含有~的字符 [^~\x22]+
10.3 特殊需求表达式
1 mail地址 ^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)$
2 域名 [a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL [a-zA-z]+://[^\s] 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=])?$
4 手机号码 ^(13[0-9]|14[0-9]|15[0-9]|166|17[0-9]|18[0-9]|19[8|9])\d{8}$
5 电话号码 ^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 国内电话号码 \d{3}-\d{8}|\d{4}-\d{7}
7 18位身份证号码(数字、字母x结尾) ^((\d{18})|([0-9x]{18})|([0-9X]{18}))$
8 帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线) ¹⁸[a-zA-Z0-9_]{4,15}$
9 密码(以字母开头，长度在6~18之间，只能包含字母、数字和下划线) ¹⁹\w{5,17}$
10 强密码(必须包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间) ^(?=.\d)(?=.[a-z])(?=.[A-Z]).{8,10}$
11 日期格式 ^\d{4}-\d{1,2}-\d{1,2}
12 一年的12个月(01～09和1～12) ^(0?[1-9]|1[0-2])$
13 一个月的31天(01～09和1～31) ^((0?[1-9])|((1|2)[0-9])|30|31)$
14 xml文件 ^([a-zA-Z]±?)+[a-zA-Z0-9]+.[x|X][m|M][l|L]$
15 中文字符的正则表达式 [\u4e00-\u9fa5]
16 双字节字符 [^\x00-\xff] (包括汉字在内，可以用来计算字符串的长度(一个双字节字符长度计2，ASCII字符计1))
17 空白行的正则表达式 \n\s*\r (可以用来删除空白行)
18 HTML标记的正则表达式 <(\S?)[^>]>.?|<.? /> (网上流传的版本太糟糕，上面这个也仅仅能部分，对于复杂的嵌套标记依旧无能为力)
19 首尾空白字符的正则表达式 \s*|\s* $KaTeX parse error: Expected 'EOF', got '\s' at position 3: 或(\̲s̲)|(\s$ ) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式)
20 腾讯QQ号 [1-9][0-9]{4,} (腾讯QQ号从10000开始)
21 中国邮政编码 [1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
22 IP地址 \d+.\d+.\d+.\d+ (提取IP地址时有用)
23 IP地址 ((???:25[0-5]|2[0-4]\d|[01]?\d?\d).){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))
镇楼图
这图总结的真好
参考文献
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html（图来源）
http://www.cnblogs.com/zxin/archive/2013/01/26/2877765.html（常用正则表达式来源）

0-9 ↩︎
0-9 ↩︎
0-9 ↩︎
1-9 ↩︎
1-9 ↩︎
1-9 ↩︎
1-9 ↩︎
\u4e00-\u9fa5 ↩︎
A-Za-z0-9 ↩︎
A-Za-z0-9 ↩︎
A-Za-z ↩︎
A-Z ↩︎
a-z ↩︎
A-Za-z0-9 ↩︎
\u4E00-\u9FA5A-Za-z0-9_ ↩︎
\u4E00-\u9FA5A-Za-z0-9 ↩︎
\u4E00-\u9FA5A-Za-z0-9 ↩︎
a-zA-Z ↩︎
a-zA-Z ↩︎

python笔记1 lu_32 python
1.计算面积与周长：r=8s=r*rprint("面积是")print(s)z=r+r+r+rprint("周长是")print(z)#面积是#64#周长是#322.输入圆的半径，计算出圆的面积和周长：r=input("请输入半径：")r=float(r)s=3.14*r*rprint("圆的面积：",s)r=input("请输入圆的半径")r=int(r)s=3.14*r*rprint("圆的半
python笔记：进程和线程—分布式进程 zyckhuntoria python foundation
一、分布式进程Process可以分布到多台机器上，而Thread最多只能分布到同一台机器的多个CPU上。Python的multiprocessing模块不但支持多进程，其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者，将任务分布到其他多个进程中，依靠网络通信。由于managers模块封装很好，不必了解网络通信的细节，就可以很容易地编写分布式多进程程序。二、举例实
python笔记之常用命令总结 chenlang_lbs python 笔记
1、nautilus：打开当前工作目录2、wcfiles_names：查看文件的数量3、Pycharm的常用命令ctrl+r：查找命令4、[email protected]：获得进入nb@电脑的权限5、复制很长的数据的技巧：在数据前面点击+shift+在数据后面点击+（ctrl+c），完成复制
Python笔记之多线程与多进程人间酒中仙 python笔记 python 笔记
Python笔记之多线程与多进程一、简介二、线程基础（`threading`模块）1、概念说明2、代码示例(1)创建与启动线程(2)使用`threading`模块创建多个线程三、进程基础（`multiprocessing`模块）1、概念说明2、代码示例(1)创建与启动进程(2)创建多个进程四、GIL与线程池1、概念说明2、代码示例(1)GIL影响演示(2)使用线程池管理线程五、小结一、简介本章节详
Python笔记默默前行的蜗牛 python 笔记开发语言
1.如何在windows同时存在两个版本的Python2，Python3将Python2，Python3的路径添加到path中2.如何使用指定的Python版本pippython3-mpipinstalljupyter3.jupyternotebook使用http://blog.csdn.net/lee_j_r/article/details/52791228jupyternotebook4.中文
python笔记：高级特性-迭代 zyckhuntoria python foundation
目录一、判断是否为迭代对象二、对dict进行迭代的三种情况2.1对dict中的key进行迭代2.2对dict中的value进行迭代2.3对dict中的key,value进行迭代三、对字符串进行迭代四、对list进行迭代五、练习迭代iterable（顺便一提..iterature文学）一、判断是否为迭代对象使用collections模块的Ierable类型进行判断，方法如下fromcollectio
Python----数据结构----链表----双向链表一盏偏灯 Python学习数据结构链表算法 python
Python学习之路，点击有全套Python笔记双向链表一种更复杂的链表是“双向链表”或“双面链表”。每个节点有两个链接：一个指向前一个节点，当此节点为第一个节点时，指向空值；而另一个指向下一个节点，当此节点为最后一个节点时，指向空值。步骤：is_empty()链表是否为空length()链表长度travel()遍历链表add(item)链表头部添加append(item)链表尾部添加insert
attrs学习一个哲哲哲 java 服务器 javascript
转载自：Python面向对象编程OOP(四)写类神器：attrs-阿尔法的Python笔记-SegmentFault思否使用attrs解放双手大家好，这一期我想和大家分享一个OOP编程的高效神器：attrs库首先我们来介绍下attrs这个库，其官方的介绍如下：attrs是这样的一个Python工具包，它能将你从繁综复杂的实现上解脱出来，享受编写Python类的快乐。它的目标就是在不减慢你编程速度的
pythontkinter键盘_Python笔记之Tkinter(Key键盘事件) weixin_39787594 pythontkinter键盘
一、目标学习Tkinter制作窗体软件的基础，触发键盘事件。响应特殊按键事件左shift按键响应右shift按键响应F2按键相应，F3,F4.....回车按键相应退格删除键相应二、试验平台windows7,python3.7三、直接上代码importtkinterfromtkinterimportttkdefxFunc1(event):print(f"事件触发键盘输入:{event.char},对
python笔记：format output 鬼上身的秋天
#printstringprint('thisiswhat:%s'%('Nicetest'))#printintegerprint('thefruitis%dyuan'%(100))#printfloatprint('thefruitis%.3fyuan'%(100))#printplacehoderprint('thefruitnameis%10s,weightis%5dkg,priceis%5
蓝桥杯算法之排序算法炼丹代师算法专栏 python 蓝桥杯
提示：本系列博客是对bilibili算法课程《算法很美》的python笔记总结，其中吸收不少优秀博主的原创博客，由于本人总结未附上对应的博客地址，若发现本文博客内容与您发表的博客内容吻合，请您联系作者，给您添加引用地址。bilibili课程地址蓝桥杯算法之排序前言1.冒泡排序1）原理介绍2）代码实例2.选择排序1）原理介绍2）代码实例总结前言排序算法虽然已经内置在python函数，但其排序原理的学
Python笔记之 collections.deque双端队列一起种梧桐吧 Python笔记列表队列 python
deque简介deque是一个双端列表,如果要经常从两端操作数据,选择deque就比较好,如果要实现随机访问,还是建议使用列表list.collections.deque官方说明文档操作简介append()append(x)Addxtotherightsideofthedeque.importcollectionsmydeque=collections.deque(range(3),maxlen=
python入门教程jupyter_Jupyter Notebooks的安装和使用介绍 weixin_39953618
最近又开始重新学习Python，学习中使用到了一款编辑器JupyterNotebooks，非常想安利给初学python的同学。注：本文内容仅针对windows环境下安装和配置JupyterNotebooks。1.JupyterNotebooks简介国际惯例还是来一段官方的介绍：Notebooks其实就像是你的python笔记本一样，不仅可以运行书写的python代码，同时还支持markdown格式
python笔记（3）(re库和pandas库) Techer_Y 笔记
参考链接：Python正则表达式|菜鸟教程(runoob.com)1、re库，python正则表达式正则表达式是一个特殊的字符序列它能帮助你检查一个字符串是否与某种模式匹配。re模块使python语言拥有全部的正则表达式功能。re.match尝试从字符串起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。re.match(pattern,string,flags=0)
Python笔记 Lucky_1129 笔记 python 笔记
Python笔记1.Python数组和列表的区别1.创建方式不同列表可以直接创建，数组需要引用numpy包2.存储对象不同列表可以存储任何的对象，包括数字，字符串，数组，字典等等数组只能存储单一的数据类型3.运算方式不同数组可以进行四则运算，列表只能使用加号进行拼接，拼接之后形成一个新的列表4.运算效率不同array数组是为了精确便捷的处理庞大的类似的数据而产生的，他的存储效率要比列表快着很多2.
Python笔记1.2（open、logging、os、shutil、glob、decode、encode、pickle、tqdm） qq742234984 python 笔记数据库
Python笔记1.1（datetime、argparse、sys、overwrite、eval、json、os、zfill、endswith、traceback、深浅拷贝）Python笔记2（函数参数、面向对象、装饰器、高级函数、捕获异常、dir）Python笔记1.214、withopen()asfile和open()参数详解15、logging日志的等级logging.basicConfig
Python笔记#边学边记笔记#文件和异常月吟荧静笔记 python
一、从文件读取数据1.1读取整个文件pi.digits.txt3.141592653589793238462643383279file_reader.pywithopen("pi_digit.txt")asfile_0:contents=file_0.read()print(contents)3.141592653589793238462643383279withopen("pi_digit.tx
python笔记(一)获取当前目录路径和文件（抄录） z-pan python
一、获取当前路径1、使用sys.argv[0]importsysprintsys.argv[0]#输出#本地路径2、os模块importosprintos.getcwd()#获取当前工作目录路径printos.path.abspath('.')#获取当前工作目录路径printos.path.abspath('test.txt')#获取当前目录文件下的工作目录路径printos.path.abspa
Python笔记#边学边记笔记#字典姜姜465 python 笔记
一、使用字典1.1访问字典中的值字典使用花括号；键与值之间用冒号连接；各个键-值对之间用逗号分隔。alien_0={"color":"green","point":5}print(alien_0["color"])print(alien_0["point"])green51.2添加键-值对alien_0={"color":"green","point":5}print(alien_0)alien_
Python笔记6----数组 weixin_34293911 python 数据结构与算法 c/c++
1、Python中的数组形式：用list和tuple等数据结构表示数组一维数组：list=[1,2,3,4]二维数组：list=[[1,2,3],[4,5,6],[7,8,9]]用array模块：array模块需要加载，而且运用的较少通过array函数创建数组（数组中的元素可以不是同一种类型），array.array('B',range(5))>>array('B',[1,2,3,4,5])提供a
【代码随想录python笔记整理】第一课 · A+B 问题1 南星六月雪 Python 刷题笔记笔记 python
前言:本笔记仅仅只是对内容的整理和自行消化，并不是完整内容，如有侵权，联系立删。一、数据类型Python中有一些常见数据类型，包括数字类型，布尔类型，字符串类型。其中，数字类型又分为整数类型和浮点数类型。整数类型-1、0、1浮点数类型3.14布尔类型True=1；False=0字符串类型'Hello'、"Helllo"二、输入输出1、输入：输入采用input()函数，再将变量与其建立联系。在inp
【Python笔记】向量：@classmethod与 @staticmethod。零基础万物皆可.C Python笔记 python
类成员比较@classmethod与@staticmethod共同点：两个都是装饰器，装饰的成员函数可以通过类名.方法名(…)来调用区别：最显著的特点是classmethod需要传递一个参数cls，而staticmethod不需要。因此可以访问、修改类的属性，类的方法，实例化对象等，避免硬编码；而staticmethod不行，classmethod可以判断出自己是通过基类被调用，还是通过某个子类被
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
2.25python笔记高阶编程 13351
@[TOC](2.25学堂在线python学习笔记高阶编程)#高阶编程1.利用二分法查找一个字符是否在某个字符串当中基线条件：当s=''时，返回False当len(s)=1且s==char时返回True当len(s)>1且s[mid]>char时，返回isIn(char,s[:mid])否则当s[mid]1:ifs[mid]>char:print(s)returnisIn(char,s[:mid]
Python笔记五之正则表达式后端python正则表达式
本文首发于公众号：Hunter后端原文链接：Python笔记五之正则表达式这一篇笔记介绍在Python里使用正则表达式。正则表达式，RegularExpression，可用于在一个目标字符串里对于指定模式的字符进行查找、替换、分割等操作。比如，判断某个字符串里是否都是数字，或者是否包含指定字符串，又或者更直接的例子是判断电话号码或者邮箱是否合法等。这一篇笔记里，我们将先介绍一个正则表达式的函数，并
python笔记——jieba库 Toby不写代码 python学习 python
文章目录一.概述二.jieba库使用三.实例一.概述1.jieba库概述jieba库是一个重要的第三方中文分词函数库，不是安装包自带的，需要通过pip指令安装pip3installjieba二.jieba库使用1.库函数jieba.cut(s)——精确模式，返回一个可迭代数据类型jieba.cut(s,cut_all=True)——全模式，输出文本s中可能的单词jieba.cut_for_sear
[韩顺平]python笔记超级用户 root Python python 笔记开发语言
AI工程师、运维工程师python排名逐年上升，为什么？python对大数据分析、人工智能中关键的机器学习、深度学习都提供有力的支持Python支持最庞大的代码库，功能超强数据分析：numpy/pandas/os机器学习：tensorflow/scikit-learn/theano爬虫：urllib/reques/bs4/scrapy网页开发：Django/falsk/web运维：saltstac
一文教会你，Python数据如何存储学Python的小瑜
转载自志斌的Python笔记3月28日今天呢，小瑜专门写一篇关于数据存储的文章，让大家清楚的了解数据存储的方式，以及在什么情况下，使用什么存储方式。本文将分三个方面来介绍数据存储:1.文件存储、2.关系型数据库存储、3.非关系型数据库存储。废话少说，让我们直接来看正文吧！一、文件存储1.1TXT文本将数据存储到TXT文本的操作十分简单，在之前文章已经简单介绍过，而且TXT文本基本兼容任何平台，但是
Python笔记——绘制雷达图没昔
代码#雷达图frompyechartsimportoptionsasoptsfrompyecharts.chartsimportPage,Radar#两组数据的对比v1=[[4300,10000,28000,35000,50000,19000]]v2=[[5000,14000,28000,31000,42000,21000]]#返回Radar图表对象数据处理完整之后通过雷达对象进行转换defrad
Delphi 程序直接调用 Python 的函数 pcplayer python 开发语言
在本系列的第一篇博客文章：Delphi程序员初学Python笔记-CSDN博客在这篇文章里面，我提到，一个Python的函数，我用Delphi无法直接调用它，所以我对它做了一个Python的包装。原因是，那是我第一次学习使用Python4Delphi这个控件。那时候要执行Python代码，我只会使用PythonEngine1.ExecStrings(Python代码)这样的方式。这样做，就是在De
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

python 正则表达式（re）

导入re模块

使用match方法进行匹配操作

如果上一步匹配到数据的话，可以使用group方法来提取数据

coding=utf-8

coding=utf-8

正确的地址

不正确的地址

通过$来确定末尾

不正确的情况

修正之后的

添加|

能够完成对正确的字符串的匹配

如果遇到非正常的html格式字符串，匹配出错

通过引用分组中匹配到的数据即可，但是要注意是元字符串，即类似 r""这种格式

因为2对<>中的数据不一致，所以没有匹配出来

www.hello.cn

www.hello.cn

www.hello.cn

www.hello.cn

www.hello.cn

www.itcast.cn

www.itcast.cn

www.hello.cn

你可能感兴趣的:(Python笔记)