机器学习笔记 - 使用3D卷积神经网络进行视频分类

1、导入相应的库

        3D CNN 使用三维滤波器来执行卷积。内核能够在三个方向上滑动,而在 2D CNN 中它可以在二维上滑动。

机器学习笔记 - 使用3D卷积神经网络进行视频分类_第1张图片

        首先安装并导入必要的库,用于处理ZIP文件内容的Remotezip 、用于使用进度条的tqdm 、用于处理视频文件的OpenCV 、用于执行更复杂的张量操作的einops,以及用于在 Jupyter Notebook 中嵌入数据的库。

import tqdm
import random
import pathlib
import itertools
import collections

import cv2
import einops
import numpy as np
import remotezip as rz
import seaborn as sns
import matplotlib.pyplot as plt

import tensorflow as tf
import keras
from keras import layers

2、加载和预处理视频数据

        定义了辅助函数,用于从 UCF-101 数据集中下载数据片段,并将其加载到tf.data.Dataset。如果要处理自己的数据集,可以阅读并参考。

def list_files_per_class(zip_url):
  """
    列出给定 zip URL 的数据集每个类中的文件。

    A

你可能感兴趣的:(视频分类和动作识别,深度学习从入门到精通,cnn,人工智能,神经网络,3D,CNN,视频分类,keras)