在windows下以管理员身份运行CMD命令行,输入:
pip install beautifulsoup4
打开IDEL,在其中编写如下代码:
#从bs4库中引用BeautifulSoup类
from bs4 import BeautifulSoup
import requests
r = requests.get("http://www.baidu.com")
r.status_code
r.encoding = r.apparent_encoding
demo = r.text
#html.parser是HTML和XML文档解析器
soup = BeautifulSoup(demo, "html.parser")
#输出文档的头部信息
soup.head
PS:Beautiful Soup库是解析、遍历、维护标签树的功能库