Python爬虫之Beautiful Soup库的安装与使用

一.Beautiful Soup库的安装

在windows下以管理员身份运行CMD命令行,输入:
pip install beautifulsoup4

二.bs4库的简单使用

打开IDEL,在其中编写如下代码:

#从bs4库中引用BeautifulSoup类
from bs4 import BeautifulSoup
import requests

r = requests.get("http://www.baidu.com")
r.status_code
r.encoding = r.apparent_encoding
demo = r.text

#html.parser是HTML和XML文档解析器
soup = BeautifulSoup(demo, "html.parser")
#输出文档的头部信息
soup.head

PS:Beautiful Soup库是解析、遍历、维护标签树的功能库

你可能感兴趣的:(爬虫-python,爬虫,python)