python正则表达式去除html标签

代码实现

import pandas as pd
import re

result=pd.read_csv('egg_comment.csv')
result_text=[]
comp = re.compile(']*>')
for i in result.text:
    result_text.append(comp.sub('', i))
result.text=result_text

效果展示
清洗前
python正则表达式去除html标签_第1张图片
清洗后
python正则表达式去除html标签_第2张图片

你可能感兴趣的:(爬虫)