Python 爬虫(以赛马数据为例)之使用BeautifulSoup进行Html解析

一、BeautifulSoup的使用

find()方法和find_all()方法:find()方法查找第一个符合条件的,find_all()方法所有符合条件的,find()的结果相当于find_all()[0]。

例如,

查找所有的标签:tds = soup.find_all("td")

查找第十个标签: tds[9]

连续查找:find()和find_all()可以连续使用:table = tds[9].find("table").find_all("td")

查找指定属性的标签:

lines1 =tableElement.find_all(class_="trBgGrey")

trs = soup.find(class_="bigborder").find(cellspacing="1").find_all("tr")

获取父节点自己的(不包含子节点的)内容

第四班 -1000米 -(60-35)

获取【第四班】

         tableElement1[0].find("td").contents[0].strip()



 

获取find_all()结果中的最后一个

         tableElement1[0].find_all("td")[-1].get_text()

 

去掉find_all()结果中的前几个元素

trs = trs[3:]



最后贴上

你可能感兴趣的:(Python学习)