MMLAB-AI训练营笔记——Day2

1. 图像分类

  • 任务目标:给定一张图片,识别图片中的物体是什么;
  • 数学表示:图像X属于R(H,W, 3),类别为1,2,3,。。,K。从X映射到{K}
  • 步骤:1.收集数据,2.定义模型,3.训练,4.预测
  • 机器学习的局限:机器学习善于处理低维、分布相对简单的数据
  • 传统方法(设计图像特征):图像通过人工设计的方法变为特征向量,经过机器学习进行分类
  • 使用深度学习:学习如何产生适合分类的特征
  • 层次化特征的实现方式:卷积实现一步特征提取;多头注意力实现一步特征提取
  • 课程内容:1.模型设计:设计适合图像的函数;2.模型学习:监督学习和自监督学习

2.图像分类

  • AlexNet: 5个卷积层,3个全连接层,共有60M个可学习的参数
    使用和ReLU函数;实现并开源了CUDA并行运算
  • VGG-19;
  • VGG(2014):网络层数11,13,16,19;3by3卷积配合1像素的边界填充;
  • GoogLeNet

你可能感兴趣的:(人工智能,深度学习)