小钟弟弟教你引用url

这里的url指的是你爬取并保存到本地的url文本

小钟弟弟教你引用url_第1张图片
url文本截图
#方法一
with open('02.txt', 'r', encoding='utf-8') as f:
    f = f.read()
    f=f.replace("\n", "")   #去掉换行符
    list = f.split('"')   #以"为分隔符把f转化为列表
    while '' in list:   #删除列表中所有的空元素
        list.remove('') 
    print(list)

#方法二
import re
with open('02.txt', 'r', encoding='utf-8') as f:
    f = f.read()
    pattern = re.compile('http.*?rd', re.S)  # 这里url刚好全都以#rd结尾
    a = re.findall(pattern, f)
    print(a)
    for b in a :
        print(b)

你可能感兴趣的:(小钟弟弟教你引用url)