正则表达式解析

正则表达式解析

bs4
xpath
三种解析方式

正则表达式解析

为什么引入正则表达式?

  • 用来匹配一类具有相同规则的字符串

    规则:

  • 单字符:

         . :除换行外的所有的字符
         [] :[aoe]表示:a,o,e,任意一个;[a-w]:表示a到w之间任意一个;匹配集合中任意一个字符
         \d :数字  [0-9]:表示0到9
         \D: 非数字
         \w :数字,字母,下划线,中文
         \W :非小w
         \s :所有的空白字符
         \S :非空白
    
  • 数量修饰(控制次数):

         *   :任意多次    >=0
         +   :至少一次   >=1
         ?   :可有可无   0次或者一次
         {m}  :固定m次
         {m,}    :至少m次
         {m,n}   :m-n次
    
  • 边界:

         \b  \B  
         $   :以某某结尾
         ^   :以某某开头
    

你可能感兴趣的:(#,python基础,自动化框架搭建,爬虫,python)