06-01正则match匹配单个字符,多个字符(从头开始匹配)

字符 功能
. 匹配任意1个字符(除了\n)
[] 匹配[ ]中列举的字符
\d 匹配数字,即0-9
\D 匹配非数字,即不是数字
\s 匹配空白,即 空格,tab键
\S. 匹配非空白
\w 匹配单词字符,即a-z、A-Z、0-9、_、汉字
\W 匹配非单词字符
* 匹配前一个字符出现0次或者无限次,即可有可无
+ 匹配前一个字符出现1次或者无限次,即至少有1次
? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{n} 匹配前一个字符出现n次
{m,n} 匹配前一个字符出现从m到n次
^ 匹配字符串的开始
$ 匹配字符串的结束
\ 转义符
| 匹配左右任意一个表达式
(ab) 将括号中字符作为一个分组,匹配成功默认group() ,其实每一个()是一组
\ 转义符
$ 匹配字符串的结束
\ 转义符
$ 匹配字符串的结束
\ 转义符

变量名匹配 例1:

import re


names = ["age","age1","3age","age!","a_age","a#ge","age_a_"]
for i in names:
	ret = re.match(r"^[a-zA-Z_][a-zA-Z_0-9]*$",i)
	if ret:
		print("变量名%s符合要求,通过正则匹配出来的数据是:%s" % (i, ret.group()))
	else:
		print("变量名%s不符合要求...." % i)

邮箱匹配 例2:

import re


def main():
	email = input("请输入邮箱...")
	# 在正则表达式中,如要用到这些字符,如 .,如 ?,等需要用\来转义
	ret = re.match(r'[a-zA-Z_0-9]{4,20}@126\.com', email)
	if ret:
		print("%s输入的邮箱格式正确" % email)
	else:
		print("%s输入的邮箱格式不正确,请重新输入" % email)



if __name__ == '__main__':
	main()

重点"\num" , “(?P)“和”(?P=name)”:分组 例3

import re

def main():
	html_str = "

hahahnihao

"
# 方法一使用"\num"来取匹配到的分组的值 ret = re.match(r"<(\w*)><(\w*)>.*",html_str) print(ret.group()) # 方法二 使用"(?P)"和"(?P=name)"来实现取到匹配到的分组的值 ret = re.match(r"<(?P\w*)><(?P\w*)>.*",html_str) print(ret.group()) if __name__ == '__main__': main()

你可能感兴趣的:(python)