python爬虫(1)利用BeautifulSoup进行网络数据采集

   BeautifulSoup库的名字来源于路易斯.卡罗尔在《爱丽丝梦游仙境》里的同名诗歌,BeautifulSoup化平淡为神奇,它通过定位HTML标签来格式化和组织复杂的网络信息,用简单易用的Python对象为我们展现结构信息。

在我们安装完Anaconda之后就自带BS4了


首先,我们利用BeautifulSoup来得到百度的标题:
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://www.baidu.com")
Bs_html = BeautifulSoup(html)
print(Bs_html.title)

输出结果为:
python爬虫(1)利用BeautifulSoup进行网络数据采集_第1张图片

我们先用了一下这个神奇的函数,但是它的真正强大之处还远不止于此


你可能感兴趣的:(python)