使用Selenium控制已打开的浏览器和网页

使用Selenium控制已打开的浏览器和网页
之前遇到一个需求,就是需要登录某一个网站然后需要通过selenium从网页上自动获取一些信息;该网站需要通过手机验证码登录,通过selenium自动化登录网页固然可以,但是终究还是需要手动输入手机验证码,所以不如在自动获取信息之前,我们先手动登录网站;即我们后续的操作都在一个已打开的浏览器上操作;

我们可以使用Chrome DevTools协议,使用selenium控制已打开的浏览器,它允许客户检查和调试Chrome浏览器;

首先右击Chrome浏览器,打开“属性”,选择快捷方式Tab页,然后在目标原有内容之后添加如下内容:

[--headless] --remote-debugging-port=9222 --user-data-dir="D:\Chrome"
添加后完整的内容为:

"C:\Program Files\Google\Chrome\Application\chrome.exe" [--headless] --remote-debugging-port=9222 --user-data-dir="D:\Chrome"

使用Selenium控制已打开的浏览器和网页_第1张图片

打开cmd,在命令行中输入如下命令,先进入chrome.exe存放的文件目录,然后打开chrome浏览器:

  1. cd C:\Program Files\Google\Chrome\Application\

  2. chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"

使用Selenium控制已打开的浏览器和网页_第2张图片

 

当然,也可以直接先在环境变量的path中配置好chrome.exe路径, 之后可以直接执行chrome.exe xxx 命令;

 
  

 

然后运行如下python代码即可打开你想要打开的网站,并进行一些操作;下面是一个打开网站的例子:

from selenium.webdriver.chrome.options import Options
from selenium import webdriver

from time import sleep
# 导入按钮
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
load_wait_short = 2
load_wait_middle = 4
load_wait_long = 6

#C:\Users\ADMIN\AppData\Local\Google\Chrome\Application>chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"
def getChromeBrowser():
    chrome_options = Options()
    chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
    chrome_driver = r"H:\sore\pythont\chromedriver.exe"
    browser = webdriver.Chrome(chrome_driver, options=chrome_options)
    return browser


def openBrowserWebsite(url):
    browser = getChromeBrowser()
    browser.get(url)
    browser.implicitly_wait(load_wait_short)
    print('web title:', end='')
    print(browser.title)
    for i in range(10000): # 刷新次数
        print(i)

        sleep(15) # 五秒一次
        browser.refresh()  # 刷新网页
        #above = browser.find_element_by_link_text("重新推送")
        #btn = browser.find_element_by_css_selector('div.title > button.ant-btn ant-btn-primary')
        #https://blog.csdn.net/weixin_43775400/article/details/121623860
        browser.find_element_by_xpath('//*[@id="rc-tabs-0-panel-2"]/div/div/div[1]/div[1]/button').click()
        btn=browser.find_element_by_xpath('//*[@id="rc-tabs-0-panel-2"]/div/div/div[1]/div[2]/div/form/div[5]/div[3]/div[3]')
        btn.click()
        #btn = driver.find_element_by_css_selector('div.ant-popover-buttons')
        #print(btn.text, ':', btn.get_property('ant-btn ant-btn-primary ant-btn-sm'))
        #btn.click()
        print(browser.title)


if __name__ == '__main__':
    openBrowserWebsite(url='https://open-dev.dingtalk.com/v1/fe/old#/appMgr/provider/h5/69841/2')

如果后面需要在打开的浏览器上操作,即可按上述做法举一反三进行操作,大同小异;比如我们可以在这个打开的浏览器上登录网站,然后再通过selenium自动获取数据;

 

你可能感兴趣的:(python,selenium,chrome,前端)