Nightmare 是一个基于 Electron 的框架,利用了 Electron 提供的 Browser 的环境,用于 Web 自动化测试和爬虫(其实爬虫这个是大家自己给这个框架加的功能),可以在页面上模拟用户的行为触发一些异步数据加载。
具体的安装使用方法见官网http://www.nightmarejs.org/ 。
二进制的 Electron 依赖有点大,安装时间比较长,可以参照https://blog.tomyail.com/install-electron-slow-in-china/ ,加速electron在国内的下载速度。
var Nightmare = require('nightmare');
var nightmare = Nightmare({ show: true });
nightmare
.goto('https://duckduckgo.com')
.type('#search_form_input_homepage', 'github nightmare')
.click('#search_button_homepage')
.wait('#zero_click_wrapper .c-info__title a')
.evaluate(function () {
// 该环境中能使用浏览器中的任何对象window/document,并且返回一个promise
return document.querySelector('#zero_click_wrapper .c-info__title a').href;
})
.end()
.then(function (result) {
console.log(result);
})
.catch(function (error) {
console.error('Search failed:', error);
});
由于在实际做爬虫项目时,发现框架自带的浏览器有兼容性导致页面无法正常加载,就没有采用这个框架,这里只做简单介绍,有兴趣的同学可以去官网详细了解。
Nightwatch.js是一个使用Node.js编写的,用于Web应用程序和网站的自动化测试框架,和nightmare.js的不同之处在于它使用W3C WebDriver API来驱动浏览器,以便对DOM元素执行命令和断言。
在大多数情况下,Nightwatch至少需要向WebDriver服务器发送2个请求才能执行命令或声明,第一个请求是在给定CSS选择器(或Xpath表达式)的情况下定位元素的请求,下一个要执行的请求给定元素上的实际命令/声明。
Nightwatch有两种方式去调起浏览器跑测试
1、通过Selenium,调各个浏览器的webDriver唤起浏览器。这个需要安装java、Selenium、webDriver
2、直接通过各家浏览器的webDriver调起对应的浏览器
我选择了第二种,这里就需要去安装的chrome的webDriver,npm i -D chromedriver
具体的安装使用配置方法见官网https://nightwatchjs.org/ 。
module.exports = {
'step one': function(browser) {
browser
.url('https://www.facebook.com/')
.waitForElementVisible('#login_form')
.setValue('#email', '[email protected]')
.setValue('#pass', 'pyhwuf-8camMu-novcof')
.click('#loginbutton')
.waitForElementVisible('#userNav')
},
'step two': function(browser) {
browser
.url('https://www.facebook.com/search/groups/?q=vaping&epa=SERP_TAB')
.waitForElementVisible('#BrowseResultsContainer', 5000, 'the page is loaded')
.timeoutsAsyncScript(600000, function(result) {
console.log(result);
})
.executeAsync(function(successResults, done) {
new Promise(function(resolve, reject) {
if (/* 异步操作成功 */) {
resolve();
}
}).then(function(){
//处理一些数据 data
});
done(data);//异步操作结束执行
}, [successResults], function(results) {
//results.value === data;
});
},
'step three': (browser) => {
browser.end();
}
};
this.demoTest = function (browser) {
browser.execute(function(arg1, arg2,) {
//......
return data;
}, [arg1, arg2,], function(result) {
// result.value === data
});
}
this.demoTest = function (browser) {
browser.executeAsync(function(arg1, arg2, done) {
setTimeout(function() {
done(data);
}, 500);
}, [arg1, arg2], function(result) {
// result.value === data
});
}
execute(script, args, [callback] ) executeAsync( script, args, [callback] ) 这两个api 注入的JavaScript代码是运行在浏览器端的,而浏览器端和客户端的通信很有必要,比如我们可能需要使用在客户端声明的全局变量,以及把在浏览器端得到的数据传递给客户端。
args会以数组的形式把来自客户端的变量作为参数传递给script 函数体作为参数使用,并且该函数体返回的值将返回给客户端。
不同点在于,executeAsync( )执行的是异步脚本,script函数体将done回调作为参数接收,异步操作完成后需要调用该回调。传递给done回调的值将返回给客户端,具体使用方法见上面的示例代码。
这里我只是简单介绍一下nightwatch,更加详细具体的使用还是需要参考[官方文档](https://nightwatchjs.org/](https://nightwatchjs.org/)。
怎么修改浏览器的默认行为(比如弹出的订阅通知弹窗)还尚待解决,欢迎了解的小伙伴伴留言哈。