splash 的使用

docker 安装

Mac 安装

brew cask install docker

ubuntu 安装

  1. 安装
wget -qO- https://get.docker.com/ | sh

  1. 启动
sudo service docker start
  1. 修改仓库源
  2. 配置 /etc/docker/daemon.js
{ 
“registry-mirrors”: [“https://registry.docker-cn.com“] 
}
  1. 重启
# 机器重启
sudo reboot

splash 安装

  • 拉取镜像
sudo docker pull scrapinghub/splash

运行 splash

sudo docker run -p 8050:8050 scrapinghub/splash

scrapy 使用 splash

  1. 配置之前先得安装
pip install scrapy-splash
  1. 配置settings.py
# 添加 splash 服务器地址
SPLASH_URL = 'http://127.0.0.1:8050'

# 配置下载中间件
DOWNLOADER_MIDDLEWARES = {
   # 'github.middlewares.SeleniumMiddleware': 543,
   'scrapy_splash.SplashCookiesMiddleware': 723,
   'scrapy_splash.SplashMiddleware': 725,
   'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware': 810,
}
  1. 使用 splash 提供的请求对象

你可能感兴趣的:(splash 的使用)