基于pytorch实现的视频分类——C3D模型论文复现

最近在学习视频分类任务,想要跑通一个更换数据集用到自己的课题上。

看到了这篇文章及代码

论文链接:http://vlg.cs.dartmouth.edu/c3d/c3d_video.pdf

代码链接:https://github.com/jfzhang95/pytorch-video-recognition

贴一下学习这个代码的原博。

代码真的很适合新手入门pytorch 。

C3D模型pytorch源码逐句详析(一)_zzh1370894823的博客-CSDN博客

C3D模型pytorch源码逐句详析(二)_zzh1370894823的博客-CSDN博客

C3D模型pytorch源码逐句详析(三)_zzh1370894823的博客-CSDN博客

代码很友好,只需要修改mypath中的路径和train.py里面的

num_classes = 3

改变分类类别,以及添加新的label.txt

报错处理:路径错误,这个地方很奇怪,dateset.py需要../ultrsound

train.py需要把root_dir=./ultrasound 

基于pytorch实现的视频分类——C3D模型论文复现_第1张图片

运行dateset.py会生成一个path文件夹,里面是处理好的数据。

dateset的处理逻辑是对于每一个视频,确定隔几帧取一帧,至少取16帧。

运行train会生成run文件夹,存放这一次训练的权重。

最后跑出来的效果还是不错的,但好像存在过拟合(存疑),留待日后解决。

你可能感兴趣的:(pytorch,python,深度学习,分类,计算机视觉)