【scrapy】xpath

想要爬取一个网站,这个网站的不同网页的正文部分的xpath是不一样的,比如: 有个页面的正文部分是://*[@id='postmessage_32199'] 另一个是://*[@id='postmessage_32153'] ...... 它们的格式是postmessage_xxxxx,x为数字。
我的问题是:xpath中可以使用用正则表达式吗?如果不能那怎么匹配这么多不同的xpath?

ps:我是用的是python的scrapy框架

解决方式:

//*[starts-with(@id,"postmessage_")] 或者 doc.xpath(r'//*[re:match(@id,"postmessage_d+")]', namespaces={"re":"http://exslt.org/regular-expressions"})

你可能感兴趣的:(【scrapy】xpath)