这个方法使用前提是,你想要获取的多个href标签,它们单独所属的xpath位置有一定规律。
这里吐槽一下,类似”/@href“的写法在很多场景都难以试用。
m=0 url_num=edge.find_elements('xpath','//ul[@id="content_listContainer"]/li/div/h3/a') # 这里是对整个所需要的href所在位置进行寻找存储为列表格式 #(href在a标签位置下,此处举例是以li为href变化的序列) for j in url_num: m+=1 print(m) # 记录一共有多少个href需要进行抓取 for i in range(1,m+1): url_get=edge.find_element('xpath','//ul[@id="content_listContainer"]/li[{0}]/div/h3/a'.format(i)).get_attribute('href') print(url_get)
# for循环输出每一个li标签下的href标签