Scrapy框架中利用xpath解析网页时出现的几种错误

1.网页源代码与用‘’inspect in firepath ”看到的网页标签不一样,造成拿到的数据为空或者报“IndexError: list index out of range”的错误

    (1)inspect in firepath看到的源代码

          Scrapy框架中利用xpath解析网页时出现的几种错误_第1张图片

     ( 2)网页源码

   

   (1)和(2)经过对比可以看出:(2)中标签少了,只有,response.xpath('

//div[@id="pic_con"]/div/img[@id="imgis"]/@src
')这样写才正确,不能加上标签。因为ID是唯一的,所以此问题只需response.xpath('//img[@id="imgis"]')即可。

   总结:当利用xpath取数据为空或者出错时,先检查xpath写的是否正确,如果xpath写的没问题,那就再看源代码是否与

firepath一样。

你可能感兴趣的:(Xpath)