BeautifulSoup

一、强大的BeautifulSoup:BeautifulSoup是一个可以从html或xml文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。在Python开发中,主要用的是BeautifulSoup的查找提取功能,修改功能很少使用

1、安装BeautifulSoup

pip3 install beautifulsoup4

2、安装第三方html解析器lxml

pip3 install lxml

3、安装纯Python实现的html5lib解析器

pip3 install html5lib

 

二、BeautifulSoup的使用:

1、导入bs4库

from bs4 import BeautifulSoup #导入bs4库

2、创建包含html代码的字符串

html_str = """

The Dormouse's story

The Dormouse's stopy

Once upon a time there were three little sisters;and their names where

你可能感兴趣的:(BeautifulSoup)