抖音app爬取、最简单测试一下爬取app的赶脚

注明:这个目的只是检测你的app爬取环境,用一个最简单的案例测试一下,体验一下爬取app的赶脚。

1、需要工具:charles抓包工具,pycharm

2、配置好相关环境,打开手机抖音app,点击一位用户头像,https://aweme-hl.snssdk.com中post就出现一个,点击post,可以看到JavaScript中有她的全部信息显示,由于看的不是太整体化,复制粘贴到json在线视图查看器中,如下图:可以看到有16个视频的详细信息

抖音app爬取、最简单测试一下爬取app的赶脚_第1张图片

 

抖音app爬取、最简单测试一下爬取app的赶脚_第2张图片

 

 

 

 

 

 

抖音app爬取、最简单测试一下爬取app的赶脚_第3张图片

3、在pycharm中写代码,注意get_url()里面要改成自己想爬取的那位,就是第一张图的path,复制到

https://api.amemv.com/的后面,将我的那部分替换,参考了一位写的代码https://www.jianshu.com/p/7858aacf3930,可以去看看,当时我也是抱着试试的态度。
import requests
import urllib.request
import urllib3
def get_url(url):
    headers = {'user-agent': 'mobile'}
    #requests.packages.urllib3.disable_warnings()
    req = requests.get(url, headers=headers, verify=False)
    data = req.json()
    for data in data['aweme_list']:
        name = data['desc'] or data['aweme_id']
        url = data['video']['play_addr']['url_list'][0]
        urllib.request.urlretrieve(url, filename=name + '.mp4')
        print(name, url)

if __name__ == "__main__":
    get_url('https://api.amemv.com/aweme/v1/aweme/post/?max_cursor=0&sec_user_id=MS4wLjABAAAAnsfVdSNpR5jmjrVdW4iuWN-iAJowyvcMwMPkXw8YUFk&count=20&retry_type=no_retry&iid=87317341127&device_id=66867626703&ac=wifi&channel=ame_nubiamm&aid=1128&app_name=aweme&version_code=810&version_name=8.1.0&device_platform=android&ssmix=a&device_type=NX531J&device_brand=nubia&language=zh&os_api=23&os_version=6.0.1&openudid=3a25b00cb96f5147&manifest_version_code=810&resolution=1080*1920&dpi=480&update_version_code=8102&_rticket=1569418930996&mcc_mnc=46011&ts=1569418929&app_type=normal')

4、执行完上面的代码,可以看到打印出来的信息,一共有17个,跟第一张图片一样,都是17个。并且在文件夹中也能看到下载出来呢。点击其中任意一个url,就会跳转到浏览器进行播放了。点击的是第二个,与抖音app里的视频是一样的。

抖音app爬取、最简单测试一下爬取app的赶脚_第4张图片

抖音app爬取、最简单测试一下爬取app的赶脚_第5张图片

抖音app爬取、最简单测试一下爬取app的赶脚_第6张图片

5、到这里抖音的最基本的测试已完成,有点小鸡冻,害怕忘记,在这里记录一下。

你可能感兴趣的:(爬虫)