python爬虫学习 任务一(补):正则表达式

正则表达式:regular expression,regex,RE,正则表达式是用来简洁表达一组字符串的表达式。

正则表达式的优势:简洁

  • 正则表达式的作用:
  1. 表达文本类型的特征(病毒、入侵等)
  2. 同时查找或者替换一组字符串
  3. 匹配字符串的全部或者部分--->主要场景
  • 正则表达式的使用
    编译:将符合正则表达式语法的字符串转换成正则表达式特征。

  • 正则表达式的语法
    正则表达式语法由字符操作符构成

经典正则表达式实例

^[A-Za-z]+$                 由26个字母组成的字符串
^[A-Za-z0-9]+$              由26个字母和数字组成的字符串
 ^-?\d+$                    整数形式的字符串
^[0-9]*[1-9][0-9]*$         正整数形式的字符串
[1-9]\d{5}                  中国境内邮政编码,6位
[\u4e00-\u9fa5]             匹配中文字符
\d{3}-d{8}|\d{4}-d{7}       国内电话号码,010-69913536

你可能感兴趣的:(python爬虫学习 任务一(补):正则表达式)