CentOS 7 python3+selenium调用谷歌浏览器

记录于2021-02-22,OS为阿里云轻量应用服务器CentOS 7.3

1 安装谷歌Browser(google-chrome-stable)和WebDriver(chromedriver )
    1.1安装google-chrome-stable
        1.1.1适用OS:RHEL、CentOS、Amazon Linux versions 6.X and 7.X
        1.1.2适用OS:RHEL、CentOS、Amazon Linux versions 7.X
        1.1.3测试google-chrome-stable
    1.2安装chromedriver 
2 安装python3和selenium
3 测试代码

selenium简单来说,就是人将命令(java、python等语言编写)发送给WebDriver(网络驱动器),再由WebDriver操作Browser(浏览器)。想看复杂的点这里
selenium只对谷歌浏览器实现了全版本支持。selenium支持的浏览器
使用时需要注意WebDriver和Browser的版本是否匹配。下载对应Browser的WebDriver

1安装谷歌Browser(google-chrome-stable)和WebDriver(chromedriver )

服务器是阿里云的轻量应用服务器,OS是CentOS 7.3
首先看看是否能用yum直接安装,可惜并不行:

[root@iZbp112i9bshiu2ybihp3mZ admin]# yum list | grep google-chrome-stable
[root@iZbp112i9bshiu2ybihp3mZ admin]# yum list | grep chromedriver 
chromedriver.x86_64                      87.0.4280.88-1.el7            epel    

1.1安装google-chrome-stable

参考:A Universal Installation Script for Google Chrome on Amazon Linux and CentOS 6

1.1.1适用OS:RHEL、CentOS、Amazon Linux versions 6.X and 7.X

curl https://intoli.com/install-google-chrome.sh | bash
确实只要运行这一行就安装完毕了,牛的一匹。

1.1.2适用OS:RHEL、CentOS、Amazon Linux versions 7.X

创建文件/etc/yum.repos.d/google-chrome.repo,包含如下内容:

[google-chrome]
name=google-chrome
baseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearch
enabled=1
gpgcheck=1
gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pub

运行sudo yum install google-chrome-stable,然后就安装完成了。

参考文章中还提供了一种困难的方法,用来说明安装脚本的原理,是真的难。

1.1.3测试google-chrome-stable

root用户执行google-chrome-stable --no-sandbox --headless --disable-gpu --screenshot https://www.baidu.com
普通用户执行google-chrome-stable --headless --disable-gpu --screenshot https://www.baidu.com
可以在当前目录获得一张图片:

用其他网站做测试也是这样,中文显示不出来,英文正常。

1.2安装chromedriver

[root@izbp112i9bshiu2ybihp3mz admin]# google-chrome-stable --version
Google Chrome 88.0.4324.182

yum可以安装87版本的chromedriver,而浏览器的版本是88,这里尝试下载88版本的chromedriver并安装。
官方地址:https://chromedriver.storage.googleapis.com
国内镜像:https://npm.taobao.org/mirrors/chromedriver/
wget https://npm.taobao.org/mirrors/chromedriver/88.0.4324.96/chromedriver_linux64.zip
unzip chromedriver_linux64.zip

运行解压后得到的chromedriver

服务器使用IPV4网络的话,可以不用管bind() failed。想解决此错误,可以参考:
https://www.jianshu.com/p/65cd4b138ee8

2 安装python3和selenium

yum -y install python3
pip3 install selenium

3 测试代码

[root@izbp112i9bshiu2ybihp3mz test]# cat test.py 
# -*- coding:utf-8 -*-
from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
options.add_argument('--no-sandbox')
driver = webdriver.Chrome(executable_path="/home/admin/test/chromedriver", chrome_options=options)
driver.get("https://www.baidu.com")
# 网页源代码
# print(driver.page_source)
# 从浏览器的地址栏中读取当前URL
print(driver.current_url)
# 从浏览器中读取当前页面标题
print(driver.title)
driver.quit()
[root@izbp112i9bshiu2ybihp3mz test]# python3 test.py 
https://www.baidu.com/
百度一下,你就知道
[root@izbp112i9bshiu2ybihp3mz test]#

测试代码需要调用chromedriver,那么解释器如何知道chromedriver的路径?
不使用executable_path参数,解释器会在环境变量所包含的路径中寻找chromedriver并执行,如果找不到会报错。
使用executable_path参数,表示chromedriver的绝对路径,解释器只会根据此路径调用chromedriver,如果不存在会报错。注意:就算在此路径下找不到,也不会在环境变量中寻找

你可能感兴趣的:(CentOS 7 python3+selenium调用谷歌浏览器)