先安装python第三方库selenium
安装之后需要安装浏览器驱动 我使用的是谷歌,驱动下载地址:http://chromedriver.storage.googleapis.com/index.html
我谷歌浏览器版本为
所以我下载的是
下载好之后exe放在目录下
from selenium import webdriver
import re
def getdata(url):
wd = webdriver.Chrome() # 实例化
wd.get('https://sou.zhaopin.com/?jl=801&kw='+url+'&kt=3&sf=0&st=0') # 在浏览器中输入百度网址
pagesource = wd.page_source
wd.close()
reste = """([\s\S]*?)
"""
regex = re.compile(reste, re.IGNORECASE)
mylist = regex.findall(pagesource)
for mylisto in mylist:
print(mylisto)
print(getdata(".net"))