python3 筛选出网页代码中所有的a标签

#爬到网页代码后,获得代码中所有a标签,然后逐个输出a标签的href属性
#爬取xx网页的代码
request = requests.get(“https://www.xx.com”,headers)
request.encoding=‘utf-8’
content = request.text;

#筛选出代码中的a标签
soup = bs4.BeautifulSoup(content,“html.parser”)
linkElems = soup.select(‘h3 > a’)
for i in range(10):
print(linkElems[i].get(‘href’))

你可能感兴趣的:(python)