Headless无头浏览器的入门使用

无头浏览器即headless browser,是一种没有界面的浏览器。既然是浏览器那么浏览器该有的东西它都应该有,只是看不到界面而已。
浏览器内核

Webkit:目前最主流的浏览器内核,webkit是苹果公司开源的浏览器内核,其前身是KHTML。基于Webkit的浏览器很多,比如Safari,Chrome,Opera

Gecko:是Firefox浏览器的内核

Trident:是IE浏览器的内核

Blink:是webkit的一个分支版本,由google开发

一、Headless Chrome

  截止目前最新的Chrome版本在Mac\Linux\Windows上都可以使用headless模式

  调用方式:a、使用命令行进行调用

            首先需要把chrome的安装路径添加到系统路径下面,调用方式如下
           chrome --headless http://www.baidu.com
          b、通过selenuim进行调用(目前java\python等主流语言都支持selenuim)

Headless无头浏览器的入门使用_第1张图片

二、Headless Firefox

  截止目前最新的Chrome版本在Mac\Linux\Windows上都可以使用headless模式

  调用方式:a、使用命令行进行调用
        firefox -headless http://www.baidu.com
            b、通过selenuim进行调用

Headless无头浏览器的入门使用_第2张图片

三、 PhantomJS

  调用方式:a、使用命令行进行调用                 

            首先在官方网站下载最新的phantomJS版本,并把安装目录的路径添加到系统路径
            下,然后在命令行打开,使用命令 phantomJS  xx.js url 运行JS脚本。

            PhantomJS脚本参考:

Headless无头浏览器的入门使用_第3张图片

         b、在nodejs中使用phantomjs,需要用到phantomjs中的一个Child Process模
         块,介绍在这里http://phantomjs.org/api/child_process/。github已经有对
         phantomjs的node支持库,项目地址在这里https://github.com/amir20
         /phantomjs-node


         c、通过selenuim进行调用(目前已经不支持了)

你可能感兴趣的:(爬虫,自动化测试)