2019-12-04

import re

a = '【买一箱送一箱咸蛋黄酥雪媚娘网红糕点零食一整箱早餐小吃休闲食品】https://m.tb.cn365/h.e-/+wz3eNe 點ゞ撃°鏈﹏接,再选择瀏覽●噐○咑№亓;或椱ァ製这句话€ulYhYCBpGiT€后咑閞淘灬寳'

pattern = re.compile(r'https://[a-zA-Z0-9\W]+')

b = pattern.findall(a)

pattern = re.compile(r'https://[0-9a-zA-Z-+./]+')

c = pattern.findall(a)

print(b)

print(c)

注意b和c输出都是同一个结果,匹配逻辑,首先找到https:,然后匹配其后面的任意小写字母、大写字母、数字、任意符号。第一种\W表示匹配任意符号,第二种表示将所有已知的符号穷举出来,放到那个匹配规则里面,表示只要符合该括号里的规则的都可以被匹配到;最后+表示匹配一项或者任意多项满足规则的。

注意findall返回结果是一个列表。

你可能感兴趣的:(2019-12-04)