爬虫之BeautifulSoup(一)--安装与基本语法

  1. 安装BeautifulSoup
    使用管理员模式进行pip下载安装
    pip install beautifulsoup4
    此时安装的模块所在的路径为:C:\Program Files\Python36\Lib\site-packages

  2. 导入BeautifulSoup
    from bs4 import BeautifulSoup

  3. 使用基本语句

demo = r. text   # 其中r为通过requests获取的信息
soup = BeautifulSoup(demo,"html.parser") 
print(soup.prettify())
爬虫之BeautifulSoup(一)--安装与基本语法_第1张图片
Beautiful Soup库解析器

此时soup可以作为一个BeautifulSoup类,该类作为html或者xml文档的全部内容。


爬虫之BeautifulSoup(一)--安装与基本语法_第2张图片
Beautiful Soup类的基本元素
soup.title   # soup的title标签
soup.a     # soup的a标签
soup.a.name   # 标签a的名字
soup.a.attrs     #字典格式的属性列表
soup.a.string   # 非属性字符串
# 注释中的string与一般标签相同,只显示字符串,
# 无法区分,可以使用type来区分
type(soup.a.string)   # 
type(soup.b.string)    #
爬虫之BeautifulSoup(一)--安装与基本语法_第3张图片
基本元素

你可能感兴趣的:(爬虫之BeautifulSoup(一)--安装与基本语法)