from selenium import webdriver #导入selenium库webdriver功能 from time import sleep #导入time库sleep功能
#模拟浏览器exe 路径 executable_path="D:/Program Files/JetBrains/chromedriver.exe" # 实例化一个启动参数对象 chome_options=webdriver.ChromeOptions() # 使用add_argument()方法添加启动参数 chome_options.add_argument('--headless') # 一定要把chrome_options配置来构造谷歌浏览器对象【必须匹配对应驱动的路径】 browser = webdriver.Chrome(executable_path=executable_path, options=chome_options)
#在模拟浏览器中打开指定的网址 browser.get('https://www.walmart.com/reviews/product/491437894?filter=5') #让程序暂停15S模拟浏览器缓存状态 sleep(10) data=browser.page_source #获得正确的网页代码,直接返回页面源码 print(data) #打印源代码