诡异的验证码和微信扫码登录着实让爬虫难堪,那是否可以在已经打开的浏览器基础上,继续运行自动化脚本?通过手工登录后,再让脚本执行程序,这样可以解决很大的一个痛点。
复制“起始位置”路径。
插句话:点击“打开文件夹所在路径”,你会看到一个msedge.exe
,后面有用
搜索“环境”,进入“编辑系统环境变量”。
点击“环境变量”。
在“系统变量”,找到“path”,双击进入编辑区域。
把起始位置路径粘贴进去,点击确定。
打开cmd输入命令启动Edge浏览器
--remote-debugging-port
是指定运行端口,只要没被占用就行--user-data-dir
指定运行浏览器的运行数据,不影响系统原来的数据按“ctrl+r”,在对话窗口输入“cmd”,回车。
在控制台输入,
msedge.exe --remote-debugging-port=9222 --user-data-dir="D:\python\seleniumEdge"
注意:
from selenium.webdriver import Edge
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
#用于选择登录端口
from selenium.webdriver.edge.options import Options
#造浏览器配置对象
Edge_op = Options()
#配置浏览器
#"127.0.0.1:9222"其中,9222是浏览器的运行端口
Edge_op.add_experimental_option("debuggerAddress","127.0.0.1:9222")
#让浏览器带着这个配置运行
web = Edge(options=Edge_op)
#测试环节
#通过百度页面,搜索烤鸭
web.find_element(by=By.XPATH,value='//*[@id="kw"]').send_keys("烤鸭",Keys.ENTER)
效果:“Edge正由自动测试软件控制”没有出现,和真人登录一样
有点小缺陷,每次运行都需要进入控制台输入指令。但是,可以尝试使用os模块执行打开浏览器的流程。
虽然但是,selenium还是挺香的!!!