python xpath 提取html 中使用分割的文本

文本格式形如:

<div class="tip">
1、荷兰豆汆烫变色即可,千万不要过火,时间也就是几秒钟。
<br>
2、我用的腊肠肥肉较多,所以炒这道菜根本不用油。
<br>
3、喜欢荷兰豆的本味儿,就没放葱、姜、花椒,可加少许蒜片提香。
<br>
4、荷兰豆炒的时候也不要过火,荷兰豆才会脆嫩。
div>

提取代码:

tips_lst = []
lst = page.xpath('//div/div')
#提取 1、荷兰豆汆烫变色即可,千万不要过火,时间也就是几秒钟。
print lst[0].text
#依次提取 2, 3, 4
lst = page.xpath('//div/div[@class="tip"]/br')
for ll in lst:
    print ll.tail

你可能感兴趣的:(python)