使用网页自动化解决CAPTCHA

使用网页自动化解决CAPTCHA_第1张图片
对用户而言,CAPTCHA不再是陌生的术语。CAPTCHA是全自动公共图灵测试的缩写,用来区分计算机和人类。CAPTCHA是一种基本的计算机程序,旨在区分人与机器,以防止垃圾程序和恶意爬虫采集网页数据。CAPTCHA的整个概念是基于这样的假设,即只有一个人可以通过此测试,而自动程序或自动脚本将失败。

绕过验证码的需求

现在,人们可能出于非法或合法目的使用自动验证码解决方案。垃圾邮件发送者使用CAPTCHA解决方案来提取用户的电子邮件地址,以便能够生成尽可能多的垃圾邮件。合法的示例是新客户或业务合作伙伴加入您并需要访问您的应用程序编程接口(API)的场景,由于某些安全问题或滥用该API可能会导致应用程序编程接口(API)尚未准备就绪或无法与之共享。在这种情况下,您只能使用自动脚本绕过验证码。当开发人员社区需要访问系统服务时,一种非常常见的绕过方法是使用Python或Java或C ++程序自动进行CAPTCHA解决。

有不同类型的验证码,基于文本的验证码,基于图像的验证码,reCAPTCHA和数学验证码。随着CAPTCHA和reCAPTCHA中使用的技术变得越来越智能,解决一个人有时可能会面临很大的挑战。

自动化的CAPTCHA解决技术

有几种CAPTCHA解决技术可供用户用来解决CAPTCHA和reCAPTCHA。两种最常见的策略是:

启用了OCR(光学字符识别)的机器人

在这种方法中,使用启用了光学字符识别(OCR)的机器人自动解决了验证码问题。

基于人的CAPTCHA解决服务

该服务具有不断在线解决CAPTCHA的人工人员。当您发送验证码时,公司会将其转发给解决该问题的员工,然后将其发送回解决方案。

支持OCR的软件的优点适用于需要解决大量琐碎验证码的情况,而事实证明这是一种经济高效的解决方案。但是,在Google发布ReCaptcha V3之后,情况很少。因此,OCR机器人并不是为对抗Google,Facebook或Twitter等大男孩使用的CAPTCHA而打造的。那将需要更高级的验证码解决方案。因此,逻辑上和未来的选择将是采用第二种技术,该技术具有更高的精度并且也绕过了复杂的解决方案。

通过OCR进行在线反验证码服务的优点:
• 正确解决方案的百分比更高(OCR
对真正复杂的验证码提供了极高的错误答案;更不用说,至少到目前为止,根本无法使用OCR解决某些验证码)
• 快速适应新增加的复杂性,可以连续不断地进行完美无暇的工作。
• 具有成本效益,资源有限,维护成本低,因为没有软件或硬件问题;您真正需要的只是互联网连接,以通过反验证码服务的API发送简单的请求。

在线解决方案服务中的重要参与者

现在,我们已经掌握了解决您的验证码的更好技术的知识。让我们看一下提供精确解决方案,API支持以及对我们的请求的快速响应的服务。我们拥有2captcha,Deathbycaptcha,Anticaptcha等组织。

2CAPTCHA是我使用的最佳平台之一。它们具有快速的响应时间,并且具有很好的准确性。他们有一个基于人的团队可以在线解决CAPTCHA。他们以合理的价格为所有主要的验证码提供解决方案。这是我们将用来绕过验证码的一种。这就是2captcha在其同时代产品中占据上风的原因:

解决方案的速度极快(正常的(图形和文本)验证码为17秒,ReCaptcha的为23秒)

它支持几乎所有流行的编程语言,并提供其就绪库的全面文档。

固定价格(不会随服务器负载的增加而变化)

高精度(最高可达99%,取决于验证码类型)

退款保证提供正确答案

能够解决大量验证码(每分钟超过10,000个) 。

集成2captcha API的说明

现在是最好的部分,在这里我们将学习使用2CAPTCHA服务进行Web自动化。

2CAPTCHA服务要求我们提供一些参数:

  1. 服务密钥2.谷歌密钥
  2. pageurl 4.方法

在2CAPTCHA上进行注册,您将获得一个API服务密钥,该密钥可让您自动将软件与2个CAPTCHA服务集成在一起。

现在转到站点页面,并使用开发人员工具获取数据站点密钥属性值。现在,我们使用Python(或任何其他语言)脚本使用上述参数向2CAPTCHA服务发出GET或POST请求。

2CAPTCHA服务以OK | CAPTCHA_ID的形式呈现响应,其中CAPTCHA_ID –是系统中reCAPTCHA的ID。

现在我们需要等到工作人员解决reCAPTCHA并google将有效令牌返回给服务为止。为此,我们可以每5秒向2CAPTCHA服务发出一次请求,直到获得有效令牌为止。请参阅带有参数的res.php端点请求:

http://2CAPTCHA.com/res.php?key=SERVICE_KEY&action=get&id=CAPTCHA_ID

现在,我们使用g-reCAPTCHA-response令牌提交表单。

在目标站点(服务器端),将检查此令牌。该网站的脚本向Google发送了一个请求,以检查验证码响应令牌的有效性。在2CAPTCHA测试场,在提交表单之前会检查此令牌。这是通过将令牌通过ajax(XHR)请求传递给proxy.php来完成的,而proxy.php则向Google查询该网站是否经过验证并返回google的响应。

https://2captcha.com/zh

结论

是的,我们可以使CAPTCHA绕过过程自动化。通常有两种方法可以做到这一点,其中在线反验证码服务更成功。这种验证码解决方案技术有不同的服务提供商,但到目前为止,我还是建议使用2CAPTCHA。脚本可以用C#,javascript,java和python编写。2CAPTCHA提供的服务超快,解决方案准确。

在这里…

你可能感兴趣的:(Web自动化,网页验证码,网页抓取,Web自动化,验证码,anticaptcha,captcha,2captcha)