有一次在处理数据的时候,需要出去文本中的全部数据。简单记录一下当时的代码
import re
str1=' join Univi at: https://univi.app”[First text t https://univi.app”ahttps://www.buymeacoffee.com/kshit3j".https://www.linkedin.com/in/deyanwickramaratna'
url_pattern = r"https?://[\w./-]+"
# 使用sub函数替换匹配到的链接为空字符串,删除全部链接
result = re.sub(url_pattern, '', str1)
https = re.findall(url_pattern, str1)
if len(https) > 0:
print('已删除文本中的链接' + ' '.join(https))
print(result)
print(https)
注:将str1改成你要去除的文本即可