正则表达式和BeautifulSoup学习

正则表达式和BeautifulSoup学习_第1张图片


正则表达式和BeautifulSoup学习_第2张图片

奶斯

正则表达式和BeautifulSoup学习_第3张图片

把目标用括号阔起来

正则表达式和BeautifulSoup学习_第4张图片

.*会匹配得尽可能多


正则表达式和BeautifulSoup学习_第5张图片

.*加上?就会匹配尽可能少的字符

正则表达式和BeautifulSoup学习_第6张图片

匹配换行符


正则表达式和BeautifulSoup学习_第7张图片

加上一个匹配模式就可以了

正则表达式和BeautifulSoup学习_第8张图片


正则表达式和BeautifulSoup学习_第9张图片


正则表达式和BeautifulSoup学习_第10张图片



正则表达式和BeautifulSoup学习_第11张图片


正则表达式和BeautifulSoup学习_第12张图片

去掉re.S


正则表达式和BeautifulSoup学习_第13张图片

结果是一个列表,列表里的是元组


正则表达式和BeautifulSoup学习_第14张图片


正则表达式和BeautifulSoup学习_第15张图片


正则表达式和BeautifulSoup学习_第16张图片

替换


正则表达式和BeautifulSoup学习_第17张图片

如果不是每个标签都是一样的,那就先把不一样的去掉,再进行匹配、提取


正则表达式和BeautifulSoup学习_第18张图片

实现代码复用


正则表达式和BeautifulSoup学习_第19张图片



正则表达式和BeautifulSoup学习_第20张图片


正则表达式和BeautifulSoup学习_第21张图片

pretty()可以帮我们自动补全



正则表达式和BeautifulSoup学习_第22张图片


正则表达式和BeautifulSoup学习_第23张图片

平时都用 .text

正则表达式和BeautifulSoup学习_第24张图片


正则表达式和BeautifulSoup学习_第25张图片

.contents 可以获得所有的子节点


正则表达式和BeautifulSoup学习_第26张图片

.children 是一个迭代器,需要用for 循环打印子节点

正则表达式和BeautifulSoup学习_第27张图片

.descendants 也是一个迭代器 获得所有的子孙节点

正则表达式和BeautifulSoup学习_第28张图片

获得父节点

正则表达式和BeautifulSoup学习_第29张图片

获得所有父节点,是一个迭代器

正则表达式和BeautifulSoup学习_第30张图片


正则表达式和BeautifulSoup学习_第31张图片


正则表达式和BeautifulSoup学习_第32张图片


正则表达式和BeautifulSoup学习_第33张图片


正则表达式和BeautifulSoup学习_第34张图片



正则表达式和BeautifulSoup学习_第35张图片

作为一些内容匹配


正则表达式和BeautifulSoup学习_第36张图片


正则表达式和BeautifulSoup学习_第37张图片


正则表达式和BeautifulSoup学习_第38张图片


正则表达式和BeautifulSoup学习_第39张图片



正则表达式和BeautifulSoup学习_第40张图片


正则表达式和BeautifulSoup学习_第41张图片


正则表达式和BeautifulSoup学习_第42张图片


正则表达式和BeautifulSoup学习_第43张图片

你可能感兴趣的:(正则表达式和BeautifulSoup学习)