selenium淘宝登陆备忘

selenium淘宝登陆备忘

    • 前言
    • 一、当然是先写失败的过程总结
    • 二、成功

前言

本文章只是记录自己的技术实践思路,绝无破坏网站运行的想法,如若被他人用于商业用途,与本人无关。

忽然想玩电商爬虫了。。
这个淘宝登陆还是19年6月份做的,当时写论文没啥数据就瞄了几个资源网站,淘宝其中之一。。。这个登陆9月份还试过还有用,昨天搞了下发现失效了。。本着备忘的原则,记录一下处理过程

一、当然是先写失败的过程总结

1.登陆界面的很多元素都更新了,比如登陆按钮以前是有个id为J_SubmitStatic的,现在木了,后改为通过class_name为password-login执行点击事件。

2.拖动滑块一直报错,猜测是加上了高大上的识别,拖动滑块时一定要贴近人工滑动轨迹,中间延迟时间也要设置随机数,于是乎傻乎乎把之前极验的滑块轨迹搬过来试了一下,还调了挺长时间,失败。。。

3.通过测试偶然发现有些时候人工输入账密居然不会出现滑块,于是猜测会不会是帐号输完没有按tab键直接开始输入密码导致被淘宝检测,然后在中间加上了个send_keys(Keys.TAB),失败。。。

4.于是往前定位到输帐号时的动作,因为send_keys中间没有任何停顿且就算有间隔时间也是一模一样的,人类不可能达到这种境界,于是我又将一个帐号拆分为三次输入,每次随机停顿,后。。失败。。。。

5.失败是成功的妈妈,盲生,你终于发现了华点。再往上定位就到了最基本的模拟器send_keys本身的问题,在一番屏蔽selenium被识别的操作之后,终于,又失败了。。。

二、成功

selenium登陆被识别那就不用selenium输入账密,pymouse与pykeyboard也是香的,先是定位到输入框,再执行键盘事件输完账密,最后再通过selenium点击登陆按钮成功登陆。。。。

你可能感兴趣的:(爬虫)