前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542

前文内容

Python爬虫新手入门教学（一）：爬取豆瓣电影排行信息

Python爬虫新手入门教学（二）：爬取小说

Python爬虫新手入门教学（三）：爬取链家二手房数据

Python爬虫新手入门教学（四）：爬取前程无忧招聘信息

Python爬虫新手入门教学（五）：爬取B站视频弹幕

Python爬虫新手入门教学（六）：制作词云图

Python爬虫新手入门教学（七）：爬取腾讯视频弹幕

Python爬虫新手入门教学（八）：爬取论坛文章保存成PDF

Python爬虫新手入门教学（九）：多线程爬虫案例讲解

Python爬虫新手入门教学（十）：爬取彼岸4K超清壁纸

Python爬虫新手入门教学（十一）：最近王者荣耀皮肤爬取

Python爬虫新手入门教学（十二）：英雄联盟最新皮肤爬取

Python爬虫新手入门教学（十三）：爬取高质量超清壁纸

Python爬虫新手入门教学（十四）：爬取有声小说网站数据

Python爬虫新手入门教学（十五）：爬取某音乐网站的排行榜歌曲

Python爬虫新手入门教学（十六）：爬取网站音乐素材

基本开发环境

Python 3.6
Pycharm

一、确定需求

爬取搞笑趣味栏目的视频内容。

二、网站数据分析

首先需要明确一点，好看视频网站加载方式是懒加载的方式，需要你下滑网页才会加载出新的内容

加载出来的内容里面有音频播放地址以及标题。

内容比较简单，看代码就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
    title = index['title']
    play_url = index['play_url']
    video_content = requests.get(url=play_url, headers=headers).content
    path = 'video\\'
    if not os.path.exists(path):
        os.mkdir(path)
    with open(path + title + '.mp4', mode='wb') as f:
        f.write(video_content)
        print('正在保存：', title)

Python爬虫新手入门教学（十七）：爬取好看视频小视频

前言

前文内容

基本开发环境

相关模块的使用

一、确定需求

二、网站数据分析

你可能感兴趣的:(Python爬虫新手入门教学（十七）：爬取好看视频小视频)