python学习—week15

week14总结:

围绕selenium学了不少东西,起初的想法很简单:通过selenium做一个自动化的脚本,能看看文章和视频就可以,但实际操作起来发现没那么简单……

首先是登陆问题,通过保存加载cookies的方法行不通,因为目标网站的cookies有效时间很短,因此每次只能通过扫二维码登陆,但是如何获取二维码有花了不少时间:

     一是二维码存在另一个Frame里,需要切换过去才行,即:

    知道了以后很简单,但是当时怎么也想不明白;

    二是二维码指向的不是一个图片地址,而是一段以‘data:image/png;base64,’开头的代码,查了查才知道,这是一种base64的编码,用起来很方便,通过python自带的base64库可解码:

    解码后即常规的二进制内容。

至此获取到了二维码,通过扫码登陆后自动获取cookies。

其实有更优的解法,不过还是这么做了权当是熟悉selenium操作。

成功登陆后,开始浏览文章,发现每篇文章的url很难定位,不如直接通过selenium的click()点击功能打开新页面:

关键是要切换句柄,否则无法实现对页面的操作。


week15任务:

1.开始觉着整个脚本实现起来并不复杂,但实际实现起来发现有很多坑,走了很多弯路,所以这一周还是进一步完善吧,把看视频的功能完善起来。

2.数据处理numpy+matplotlib

你可能感兴趣的:(python学习—week15)