网络爬虫——xpath使用

from lxml import etree

wb_data = """
        
        """
#解析字符串为html对象,自动补全html。body
html=etree.HTML(wb_data)

#解析数据,a标签的文本
#写法一:text属性
data1 = html.xpath('/html/body/div/ul/li/a')
for i in data1:
    print(i.text)

#写法二

你可能感兴趣的:(爬虫)