Xpath的使用

(1)匹配id,class等

x.xpath(‘//div[@id='xxxxxx']/@href’) #div标签下,如果有的话,id=xxxxxx的href属性,也可以匹配text
x.xpath(‘//div/a/p/text()’)

(2)如果已经抓取了大的了

x.xpath(‘div/@href’) #就没有//了

(3)starts-with

x.xpath(‘//* [starts-with(@id,‘xxxxxx’)]’) 这里一定是 // ,//不行*

你可能感兴趣的:(Xpath的使用)