计算机视觉入门笔记,未完待续……

计算机视觉入门笔记

  • 概述
    • pytorch入门
    • 卷积神经网络
    • 分割

概述

计算机视觉主要是使用的深度学习,机器学习的方法来解决一些图像问题。由于输入进计算机的图像都是矩阵、数字的形式,于是我们需要通过一些方法让计算机识别这些图像,从而实现一些辅助效果。
基本入门分为CNN(卷积神经网络)主要是分类,包括(AlexNet,VGG,ResNet,DenseNet),
分割(UNet,FCN)
GAN(对抗生成网络),CAM和Grad-CAM(CNN可视化方法),注意力机制。

pytorch入门

莫烦python:https://morvanzhou.github.io/

卷积神经网络

这一部分需要了解基本的卷积层,池化层等基本概念就可以试着跑一跑CNN的网络了。(AlexNet,VGG,ResNet,DenseNet)这四种网络结构,尤其是residual block和dense block需要理解原理并且了解代码结构。

分割

先看FCN,再看UNet

你可能感兴趣的:(神经网络,卷积,计算机视觉)