APP爬虫环境搭建:Appium+Mitmproxy+夜神模拟器+AndroidSDK一条龙安装教程

目录

背景

需要安装的软件

软件的作用介绍&个人使用测评

爬虫的大致逻辑

安装&配置教程


背景

接下来介绍的是全自动app爬虫,适用于找不到数据接口规律、需要爬取大量数据的爬虫。在部署好全自动爬虫只需要打开这堆软件,运行代码,然后再睡一觉等数据爬好了。

但并不是所有的爬虫都适用于这样的,如果可以找到数据接口的规律,就可以直接在python里面像写网页端的普通抓包爬虫就行,如果只需要少量数据,就可以连接真机,手控屏幕滑动,这两种情况appium、安卓模拟器、sdk都显得duck不必了。

 

需要安装的软件

  • jdk
  • python
  • AndroidSDK
  • appium
  • 安卓模拟器
  • mitmproxy

 

软件的作用介绍&个人使用测评

AndroidSDK+安卓模拟器是提供一个“手机”。这里有非常多的替代方式,比如直接下载AndroidStudio,可以在里面安装SDK和AVD(安卓模拟器);安卓模拟器也不止是夜神模拟器,还有雷电模拟器之类的;甚至你可以不用安卓的模拟器,下载苹果的也可。但是根据我个人的使用,还是强烈安利安装AndroidSDK和夜神模拟器的,夜神模拟器安装起来非常方便+快速,用起来也非常流畅,AndroidStudio里面的模拟器不知道是什么版本的安卓,感觉很奇怪,我不太会用。

appium配合Python可以实现用的代码控制手机,这一步主要就是解放你的双手,不然就要自己抱着手机一顿狂刷,这样也有好处,会比程序控制的稳定很多。

mitmproxy是一个代理,介于客户端和服务器端,说白了就是你的手机和部署app的服务器,代理的作用就是介于二者中间,抓包获取数据。charles和fiddler都是app抓包工具,但是!!!mitmproxy有一个非常厉害的功能,就是可以直接将抓包获得的数据用Python代码处理,所以我强烈安利,但是mitmproxy(右图)也有一个不好的地方,就是当你在筛选这些数据包的时候,这些数据包是按照时间先后排序的,非常乱七八糟的,找数据包太费神了,charles(左图)就会把他们根据url分类,大大提高筛选数据包的效率,所以我两个都安装上了。

APP爬虫环境搭建:Appium+Mitmproxy+夜神模拟器+AndroidSDK一条龙安装教程_第1张图片          APP爬虫环境搭建:Appium+Mitmproxy+夜神模拟器+AndroidSDK一条龙安装教程_第2张图片

 

爬虫的大致逻辑

AndroidSDK和安卓模拟器是提供一个“手机”,以爬取抖音数据为例,通过在这个手机上安装抖音,然后一顿狂刷,会和抖音的服务器交互产生非常多的数据,通过代理(mitmproxy)将数据抓包,并将抓到的数据用python进行解析和处理,这里呢,为了解放双手,一顿狂刷的事情就交给Python和appium,可以写程序控制手机操作(点击,上刷,下刷...)。最后,获取数据,处理数据,一气呵成。

 

安装&配置教程

这里我就不赘述安装过程了,整理了一些安装教程,都是我安装时亲测有效的。

jdk:https://blog.csdn.net/konggu_youlan/article/details/79942800

python:https://blog.csdn.net/ITLearnHall/article/details/81708148

mitmproxy:https://cuiqingcai.com/5391.html

androidSDK:https://zhuanlan.zhihu.com/p/37974829

appium:https://www.jianshu.com/p/145dd466f04d

夜神模拟器:直接去官网下载,然后直接安装即可。

你可能感兴趣的:(软件安装教程,appium,mitmproxy,爬虫,androidSDK,夜神模拟器)