使用 lxml 的 xpath 功能

import requests
from lxml import etree
 
# requests 包
testurl = "http://www.cnblogs.com/chenyansu/"
s = requests.get(testurl)
 
# lxml 无法处理响应文件,用 .content 输出正文
s = s.content
 
# lxml 包
# 将对象转化为 html
s = etree.HTML(s)
 
# html 拥有 xpath 方法
x = s.xpath('//*[@id="main"]/div[3]/div[2]')
print(x)
 
print('---------------------------')
# 循环输出x内容
for child in x:
    print(child.text)

你可能感兴趣的:(使用 lxml 的 xpath 功能)