doc = pq(html)
items = doc("#plist .gl-item").items()
for item in items:
# print(item)
strItem = str(item).replace('xmlns', 'xmlns1')
item = pq(strItem)
priceItems = item.find('.p-price strong i')
product = {
'url': item.find('.p-img a').attr("href"),
'image_url': item.find('.p-img a img').attr("src"),
'title': item.find('.p-name a em').text(),
'price':pq(item.find('.p-price strong i')[0]).text()
}
print(product)
1.用到了for循环,如果有xmlns有时候解析出错,replace下, 然后是如果有2个只用到第一个用[0]重新解析下, 得到内容字符串是text(), 属性是attr里面带.
http://www.codeblogbt.com/archives/105447