服务器 配置ubuntu18.04 + selenium + firefox, 无界面读取网页

1. 服务器端安装firefox

sudo apt-get install firefox

如安装失败,请先更新

sudo apt-get update
sudo apt-get upgrade

2. 安装selenium

pip install selenium

3. 安装geckodriver驱动

驱动地址:https://github.com/mozilla/geckodriver/

下载后解压,上传到服务器,然后移动到/usr/local/bin

sudo mv geckodriver /usr/local/bin

4. 测试安装是否完成

这里直接使用无界面的方式,即不跳出浏览器

from selenium import webdriver
import time

url = 'https://www.baidu.com'

# 设置无界面模型
option = webdriver.FirefoxOptions()
option.add_argument('--headless')

driver = webdriver.Firefox(firefox_options=option, executable_path='/usr/local/bin/geckodriver')
driver.get(url)

print(driver.title)

5. 报错处理

 'geckodriver' executable may have wrong permissions

由权限问题导致,需提升geckodriver权限

sudo chmod +x /usr/local/bin/geckodriver

 

你可能感兴趣的:(web)