cdp4j is a web-automation library for Java. It can be used for automating the use of web pages and for testing web pages. It use Google Chrome DevTools Protocol to automate Chrome/Chromium based browsers.
简单来说cdp4j就是一款在java端通过代码直接驱动谷歌浏览器的工具,我们可以用它来实现一些自动化测试或爬虫。
这里我们用它来实现淘宝的自动化登陆。
先说明一下,cdp4j操控浏览器,浏览器是无法检测出是不是自动化工具的。
而selenium操控浏览器,是会被识别出来的。
所以我们如果用selenium操作浏览器进行淘宝登陆,是无法登陆的。除非使用代理软件修改淘宝js文件,当然这是后话。
不清楚cdp4j为啥不会被检测出来,但是cdp4j功能还是比较少的,远小于selenium。
所以cdp4j模拟登陆的失败率较高,往往程序需要执行多次才可登陆成功,如上图:
但即使这样,这也是可以接受的。
整个淘宝登陆过程差不多分为下面5个阶段。
接下来,我们对于这五个阶段来进行编码。
使用cdp4j需要电脑安装了谷歌浏览器,然后在项目中添加cdp4j的依赖即可使用。
io.webfolder
cdp4j
3.0.0
Launcher launcher = new Launcher();
SessionFactory factory = launcher.launch();
Session session = factory.create();
String url = "https://login.taobao.com/member/login.jhtml?style=mini_top";
session.navigate(url).waitDocumentReady();
session.click("#TPL_username_1").sendKeys(username);
session.click("#TPL_password_1").sendKeys(password);
注意:cdp4j不支持操控鼠标进行滑动。所以我们这里使用java的robot类来操作鼠标进行滑动。
Robot robot = new Robot();
//设置操作延时 避免操作太快
robot.setAutoDelay(800);
//鼠标移动到某个点
robot.mouseMove(900, 266);
//使用左键按压住
robot.mousePress(InputEvent.BUTTON1_MASK);
//移动到某个点
robot.mouseMove(1060, 266);
//释放按压
robot.mouseRelease(InputEvent.BUTTON1_MASK);
代码很通俗易懂,难点在于那两个点的坐标。这坐标是你电脑屏幕里某个点的x,y坐标。
怎么找到?
可以通过软件获取。但是软件获取的也不太精确,所以还需要自己判断。。
session.click("#J_SubmitStatic");
基本上通过上述流程就可以实现淘宝的登陆。
这里简单描述一下这种方法实现登陆的优缺点:
优点:
缺点: