Splash使用记录

文章目录

  • 一、介绍
  • 二、知识点
    • 1. Lua脚本
      • 1.1 介绍
      • 1.2 使用
    • 2. Splash API
      • 2.1 介绍
      • 2.2 使用
        • 1.render.html
        • 2.render.png
        • 3.execute

一、介绍

1.提供JavaScript渲染服务
2.带有HTTP API的轻量级浏览器
3.对接了Python中的Twisted和QT库

Splash文档:传送门

二、知识点

1. Lua脚本

1.1 介绍

Lua 是一种轻量小巧的脚本语言,用标准C语言编写并以源代码形式开放, 其设计目的是为了嵌入应用程序中,从而为应用程序提供灵活的扩展和定制功能。

1.2 使用

Splash Lua脚本的入口函数和返回值:

function main(splash, args)
  assert(splash:go(args.url))
  assert(splash:wait(0.5))
  return {
    html = splash:html(),
    png = splash:png(),
    har = splash:har(),
  }
end

2. Splash API

2.1 介绍

Python等编程语言可以通过API调用Splash渲染页面,抓取JavaScript渲染的页面。

2.2 使用

1.render.html

此接口用于获取JavaScript渲染的页面的HTML代码,接口地址就是Splash的运行地址加此接口名称。

示例:

import requests
SPLASH_ADDRESS='http://localhost:8050/'
render_url='www.baidu.com'
url=SPLASH_ADDRESS+'render.html?url='+render_url
response=requests.get(url)
html=response.text()

2.render.png

3.execute

使用此接口可实现Python与Splash Lua脚本的对接。

你可能感兴趣的:(数据处理,分析)