《零基础上手Python爬虫系列》 - 10 正则表达式与JSON

本篇目前为视频学习的笔记备注,待更新,本周内会整理完毕

常规使用

正则表达式处理01

数字

正则表达式是一门专门的语言,规则是通用的

https://baike.baidu.com/item/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F/1700215?fr=aladdin

概括字符集

【abc】 a或b或c [a-c] a到c ,[0-9] 0到9

^取反

\d 数字 \D非数字

\w匹配数字和字母,相当于[A-Za-z0-9_] \W 非单词字符,包括空格

\s 匹配空白字符,空格 ,换行符\n、制表符\t

匹配3-6次


如果3个已经匹配上,就不会再继续匹配,默认是贪婪模式,加?是非贪婪模式


findall是寻找,4-8位数字

从字符串的开始到字符串到

边界匹配


【】是或关系,()是且关系

i 忽略大小写

re.sub 是re.replace的强化

把函数做为参数传递

将字符串中的数字> 6的修改成9,<的修改成0


group获取分组匹配

group(0) 永远是显示完整的


常用的正则表达式收集

https://blog.csdn.net/ZYC88888/article/details/98479629


轻量:相对xml

数据交换格式:

json : json 是一种交换格式

json字符串 : 符合json格式的字符串就是json字符串

json对象

json和javascript

将json的字符类型,转换为Python的字符类型(反序列化)


json.dumps

豆瓣API

https://www.jianshu.com/p/dffcd060c6d8

你可能感兴趣的:(《零基础上手Python爬虫系列》 - 10 正则表达式与JSON)