正则表达式 - (?!), (?:), (?=)

文章目录

  • 引例
  • 正则表达式 - (?!), (?:), (?=)
  • Reference

引例

  • 用规则做信息抽取时,想匹配某些动词,但是该动词可能时名词的前缀。如:发动发动机 的前缀
  • 对于句子: 奥迪汽车Q7的发动机型号是xxx,该句中 包含名词 发动机 但是不包含动词 发动,用正则的方式为:
re.findall("发动(?!机)", sentence)

正则表达式 - (?!), (?, (?=)

(?:pattern)
非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
(?=pattern)
非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
(?!pattern)
非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。
(?<=pattern)
非获取匹配,反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。
(? 非获取匹配,反向否定预查,与正向否定预查类似,只是方向相反。例如“(?

Reference

https://www.cnblogs.com/allen2333/p/9835654.html

你可能感兴趣的:(NLP)