python PyQuery 使用

doc = pq(html)
    items = doc("#plist .gl-item").items()
    for item in items:
        # print(item)
        strItem = str(item).replace('xmlns', 'xmlns1')
        item = pq(strItem)
        priceItems = item.find('.p-price strong i')
        product = {
            'url': item.find('.p-img a').attr("href"),
            'image_url': item.find('.p-img a img').attr("src"),
            'title': item.find('.p-name a em').text(),
            'price':pq(item.find('.p-price strong i')[0]).text()
        }
        print(product)
 

1.用到了for循环,如果有xmlns有时候解析出错,replace下, 然后是如果有2个只用到第一个用[0]重新解析下, 得到内容字符串是text(), 属性是attr里面带.

 

http://www.codeblogbt.com/archives/105447

 

你可能感兴趣的:(python)