BeautifulSoup4的基本使用

BeautifulSoup4的基本使用

序:BeautifulSoup是python解析html非常好用的第三方库!

安装:

    pip install beautifulsoup4

基本使用:

    from bs4 import BeautifulSoup

    html_str = """
        
    """

    soup = BeautifulSoup(html_str,'html.parser')

    #html对象  text文本去掉标签
    # print(soup)
    # print(soup.text)


    #  对象类型
    # print(type(soup))

    # 查找a标签 .text打印a的内容
    # print(soup.find('a'))
    # print(soup.find('a').text)

    # 查找a标签 class=baidu的
    # print(soup.find('a',class_='baidu'))

    # 查找id=lagou
    # print(soup.find(id='lagou'))

    # 查找title='mmm' 前边可以写具体找哪个标签
    # print(soup.find(title='mmm'))

    # find_all 找所有  返回一个list 数组类型
    # print(soup.find_all('a'))
    # print(soup.find_all('a')[0]) #第一个
    all_a = soup.find_all('a')
    for item in all_a:
        if item:
            # print(item.attrs)
            print(item.attrs['href']) #dict类型

你可能感兴趣的:(BeautifulSoup4的基本使用)