python去除html标签及标签里面的内容

使用正则表达式

import re

html='

\n 【#13个求职新方向#!有你心动的职业吗[并不简单]】近日,人社部、市场监管总局、统计局联合发布13个新职业,既有现在流行的人工智能、数据、云计算、物联网等工程技术人员,也有电子竞技员、无人机驾驶员等新颖工种…你心动了吗?哪些学校开设了相关专业值得关注?戳图了解↓↓转给正在求学的TA!

' pre = re.compile('>(.*?)<') text= ''.join(pre.findall(html))

 

你可能感兴趣的:(爬虫,python)