爬取快手视频案例学习笔记

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 一、导入模块
  • 二、抓包分析
  • 三、请求数据
  • 四、解析数据、下载视频
  • 总结


一、导入模块

import requests
import json

二、抓包分析

url = "https://www.kuaishou.com/graphql"  

三、请求数据

headers = {
        'content-type': 'application/json',  #互联网媒体类型,image/gif代表GIF图片,本例代表JSON类型
        'Cookie': '网站为了维持当前会话而存储在用户本地的数据',
        'Host': 'www.kuaishou.com',
        'Origin': 'https://www.kuaishou.com',
        'Referer': '防盗链',
        'User-Agent': '操作系统、浏览器版本等信息'
        }
data = {
        'operationName': '伪代码',
        'query': '伪代码',
        'variables': '伪代码'
        }
data = json.dumps(data)
r = requests.post(url, data = data,headers = headers)
json_data = r.json()
#print(json_data)        

四、解析数据、下载视频

feeds = json_data['data']['visionProfilePhotoList']['feeds']
for feed in feeds:
        video_title = feed['photo']['caption'].split('#')[0]
        video_url = feed['photo']['photoUrl']
        video_data = requests.get(video_url).content
        with open(video_title + '.mp4','wb') as f:
                f.write(video_data)
        print(video_title,'下载成功!')

总结

1.CTRL + R 进行(.*?): (.*) 搜索,用'$1': '$2'替换(点亮Regex)。

你可能感兴趣的:(python,json,爬虫)