关于BeautifulSoup中搜寻标签的问题

使用BeautifulSoup可以完整将一个网页解析成为一个标签树,但是对于其中某个标签的寻找,一般而言可以使用find all()函数和find()函数,但是这两个函数对于参数的使用一定的要求,因此还有一种方式就是使用选择器即select()方法。

soup = BeautifulSoup(html, "html.parser")
sInfo = soup.find_all('div', attrs={'class': 'stock-bets'})
if len(sInfo) != 0:
    name = sInfo[0].find('a', attrs={'class': 'bets-name'}).text.split()
    infoDict.update({'股票名称': name[0]+name[1]})
    keyList = sInfo[0].select('dt')
    valueList = sInfo[0].select('dd')
上述代码中,sInfo[0].select()方法等效于sInfo[0].findall('dt'),但是这种寻找同时也将网页进行了一定的切片,这样的结果就可能对后面的寻找dt标签产生影响(原因是什么,目前还不是很清楚)。但是如果使用select()方法,选择器仅是将选中的结果返回,而不会对原变量地址进行修改,就不会影响后续的使用。(至少目前我认为find all()一定程度上可能会对变量地址产生影响,造成连续findall()函数报错)



你可能感兴趣的:(Python)