OpenMMLab(2)

图像分类与基础视觉基础

OpenMMLab(2)_第1张图片

卷积神经网络

AlexNet

是第一个成功实现大规模图像的模型,在ImageNet数据集上达到~85%的top-5准确率;5个卷积层,3个连接层,共有60M个可学习参数;使用ReLU激活函数(其他的还有tanh),大幅提高收敛速度;实现并开源了cuda-convnet,在GPU上训练大规模神经网络在工程上成为可能。

随着后续不断发展,ResNet在视觉领域成为影响力最大、使用最广泛的模型结构。

更强的图像分类模型

例如2016年的神经结构搜索,2022年的ConvNeXt

模型训练过程中需要注意

学习率与优化器策略
数据增强
丢弃层
随机深度

MMClassification

介绍了该包的使用,以及在python中调用的展示。

你可能感兴趣的:(人工智能,深度学习,python,人工智能)