BeautifulSoup基本使用

import requests
from bs4 import BeautifulSoup
url = ''
rp = requests.get(url,)
soup = BeautifulSoup(rp.text, "lxml")

# 一种方法可以查询到标签,并指定属性

content = soup.find_all("div", attrs={'class': 'card'})
img_tag = i.find('div', attrs={'class': 'media media-piclist'})

# 一种方法可以通过select 通过css属性提取数据

print (soup.select('tr a')[0])                 #取第一条tr 中的a
print (soup.select('tr a')[0].attrs)              #取tr 中的a的标签属性
print (soup.select('tr a')[0].string)        #取tr 中的a的值(string)
 

# 选择body tr td 第二个a 标签
soup = BeautifulSoup(rp.text, "lxml")
for t in enumerate(soup.select("body tr td a:nth-child(2)")):
    print(t)

你可能感兴趣的:(python)