03-web服务器v3.1--01

正则表达式

1.匹配单个字符

字符	功能
.	匹配任意1个字符（除了\n）
[ ]	匹配[ ]中列举的字符
\d	匹配数字
\D	匹配非数字，即不是数字
\s	匹配空白，即空格，tab键
\S	匹配非空白
\w	匹配单词字符，即a-z、A-Z、0-9、_
\W	匹配非单词字符

import re

# .
result = re.match(r"速度与激情.", "速度与激情%")
print(result.group())

# [ ]
result = re.match(r"速度与激情[1-8]", "速度与激情1")
print(result.group())

result = re.match(r"速度与激情[1-36-8]", "速度与激情1")
print(result.group())

result = re.match(r"速度与激情[1-36-8abc]", "速度与激情a")
print(result.group())

result = re.match(r"速度与激情[1-36-8a-zA-Z]", "速度与激情A")
print(result.group())

# \w
result = re.match(r"速度与激情[\w]", "速度与激情E")
print(result.group())

result = re.match(r"速度与激情[\w]", "速度与激情_")
print(result.group())

result = re.match(r"速度与激情[\w]", "速度与激情哈")
print(result.group())

# \d
result = re.match(r"速度与激情[\d]", "速度与激情1")
print(result.group())

# \s
result = re.match(r"速度与激情\s1", "速度与激情 1")
print(result.group())

匹配多个字符

字符	功能
*	匹配前一个字符出现0次或者无限次，即可有可无
+	匹配前一个字符出现1次或则无限次，即至少1次
？	匹配前一个字符出现1次或者0次，即要么有要么没有
{m}	匹配前一个字符出现m次
{m,n}	匹配前一个字符出现m次到n次
{m,}	匹配前一个字符出现至少m次

# {m,n}
result = re.match(r"速度与激情\d{1,2}", "速度与激情1")
print(result.group())

# {m}
result = re.match(r"021-\d{8}", "021-87634566")
print(result.group())

# {m,}
result = re.match(r"速度与激情\d{1,}", "速度与激情12")
print(result.group())

# ?
result = re.match(r"021-?\d{8}", "02187634566")
print(result.group())

result = re.match(r"\d{3,4}-?\d{7,8}", "0765-8763456")
print(result.group())

# *
result = re.match(r".*", "0765-87634df56")
print(result.group())

html_content = """kdjf
djk
djfk
kdjf
jdf
"""
result = re.match(r".*", html_content, re.S)
print(result.group())

# +
result = re.match(r".+", "df")
print(result.group())

匹配开头结尾

字符	功能
^	匹配字符开头
$	匹配字符结尾

import re

# python match 默认匹配开头
def main():
    names = ["age", "_age", "lage", "age1", "a_age", "age_1_", "age!", "a#123", "___"]
    for name in names:
        ret = re.match("^[a-z][A-Z_][a-z][A-Z0-9_]*$", name)
        if ret:
            print("变量名：%s 符合要求... 通过正则匹配出来的数据是:%s" % (name, ret.group()))
        else:
            print("变量名：%s 不符合要求" % name)

if __name__ == '__main__':
    main()

邮箱正则

import re

def main():
    email = input("请输入一个邮箱地址：")
    # 如果在正则表达式中需要用到了某些普通的字符，比如. ? 等，需要在其前面加上反斜杠\ 进行转义
    ret = re.match(r"[a-zA-Z0-9_]{4,20}@(163|126)\.com$", email)
    if ret:
        print("邮箱地址 %s 符合要求" % email)
        # 若果正则里面有小括号，匹配成功，可以用group(n) 来获取括号内的内容
        print(ret.group(1))
    else:
        print("邮箱地址 %s 有误" % email)

if __name__ == '__main__':
    main()

匹配分组

字符	功能
\|	匹配左右任意一个表达式
(ab)	将括号内字符作为一个分组
\num	引用分组num匹配到的字符串
(?P)	分组起别名
(?P=name)	引用别名为name分组匹配到的字符串

    html_str = "hello html"
    result = re.match(r"<(\w*)>.*", html_str)
    print(result.group())

    html_str = "hello html"

    result = re.match(r"<(\w*)><(\w*)>.*", html_str)
    print(result.group())

    result = re.match(r"<(?P\w*)><(?P\w*)>.*", html_str)
    print(result.group())

re的高级用法

search、findall、 sub、 split

import re


def add(temp):
    strnun = temp.group()
    num = int(strnun) + 1
    return str(num)

# 匹配出文章阅读的次数 search 不需要从头开始找，找到就返回
ret = re.search(r"\d+", "阅读次数为 9999")
print(ret.group())

# 统计出python、c、c++相应文章阅读的次数 findall 不需要从头开始找，找到返回，然后有接着找，直到结束
ret = re.findall(r"\d", "python = 9999, c = 7890, c++ = 12345")
print(ret)

# 首先正则去匹配，找到并替换后返回整个字符串
ret = re.sub(r"\d+", "998", "python = 997")
print(ret)

# sub 可以使用函数
ret = re.sub(r"\d+", add, "python = 999")
print(ret)

# splt 根据匹配进行切割字符串，并返回一个列表
ret = re.split(r":| ", "info:xiaozhang 33 shangdong")
print(ret)

03-web服务器v3.1--01

正则表达式

1.匹配单个字符

匹配多个字符

匹配开头结尾

邮箱正则

匹配分组

hello html

hello html

re的高级用法

你可能感兴趣的:(03-web服务器v3.1--01)