python删除html文本及子节点_python去除所有html标签的方法

python去除所有html标签的方法

本文实例讲述了python去除所有html标签的方法。分享给大家供大家参考。具体分析如下:

这段代码可以用于去除文本里的字符串标签,不包括标签里面的内容

import re

html='我们,Python学习!'

dr = re.compile(r']+>',re.S)

dd = dr.sub('',html)

print(dd)

运行结果如下:

我们,Python学习!

希望本文所述对大家的Python程序设计有所帮助。

时间: 2015-05-02

Web框架把我们从WSGI中拯救出来了.现在,我们只需要不断地编写函数,带上URL,就可以继续Web App的开发了. 但是,Web App不仅仅是处理逻辑,展示给用户的页面也非常重要.在函数中返回一个包含HTML的字符串,简单的页面还可以,但是,想想新浪首页的6000多行的HTML,你确信能在Python的字符串中正确地写出来么?反正我是做不到. 俗话说得好,不懂前端的Python工程师不是好的产品经理.有Web开发经验的同学都明白,Web App最复杂的部分就在HTML页面.HTML不仅要正

BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息.目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法. 准备 1.Beautiful Soup安装 为了能够对页面中的内容进行解析,本文使用Beautiful Soup.当然,本文的例子需求较简单,完全可以使用分析字符串的

你可能感兴趣的:(python删除html文本及子节点_python去除所有html标签的方法)