近年来,MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域,MATLAB提供了丰富的算法库和工具箱,极大地推动了人工智能技术的应用和创新。
系统学习机器学习和深度学习的理论知识及对应的代码实现方法,掌握图像处理的基础知识,以及经典机器学习算法和最新的深度神经网络、迁移学习、对抗生成网络等算法的基本原理及其MATLAB编程实现方法。采用“理论讲解+案例实战+动手实操+讨论互动”相结合的方式,抽丝剥茧、深入浅出分析图像处理、机器学习和深度学习在应用时需要掌握的经验及编程技巧。
1、MATLAB 基础操作:包括矩阵操作、逻辑与流程控制、函数与脚本文件、基本绘图等
2、文件导入:mat、txt、xls、csv、jpg、wav、avi等格式
3、MATLAB编程习惯、编程风格与调试技巧
4、MATLAB数字图像处理入门
5、案例讲解:基于手机摄像头的心率计算
6、实操练习
1、统计数据的描述与可视化(数据的描述性统计:均值、中位数、众数、方差、标准差、极差、四分位数间距等;条形图、直方图、散点图、箱线图)
2、概率分布与统计推断(离散概率分布:二项分布、泊松分布;连续概率分布:正态分布、均匀分布、指数分布;点估计与区间估计;最大似然估计与贝叶斯估计;假设检验:t检验、卡方检验、F检验;P值与显著性水平等)
3、回归分析(多元线性回归模型;最小二乘法估计;变量选择与模型优化;多重共线性与解决方法;Ridge回归;LASSO回归;ElasticNet回归等)
4、案例讲解与实操练习
1、人工智能基本概念辨析(回归拟合问题与分类识别问题;有监督(导师)学习与无监督(无导师)学习;训练集、验证集与测试集;过拟合与欠拟合)
2、BP神经网络的工作原理
3、数据预处理(归一化、异常值剔除、数据扩增技术等)
4、交叉验证与模型参数优化
5、模型评价与指标的选择(回归拟合问题 vs. 分类识别问题)
6、案例讲解:
1)手写数字识别
2)人脸朝向识别
3)回归拟合预测
1、支持向量机的基本原理(支持向量的本质、核函数的意义、SVM的启示等)
2、决策树的基本原理(微软小冰读心术的启示;什么是信息熵和信息增益?ID3算法和C4.5算法的区别与联系)
3、随机森林的基本原理(为什么需要随机森林算法?广义与狭义意义下的“随机森林”分别指的是什么?“随机”提现在哪些地方?随机森林的本质是什么?)
4、知识扩展:支持向量机、决策树除了建模型之外,还可以帮我们做什么事情?怎样解读随机森林的结果?
5、案例讲解:
1)鸢尾花Iris分类识别(SVM、决策树)
2)基于随机森林的乳腺癌良性/恶性肿瘤智能诊断模型
6、实操练习
1、变量降维(Dimension reduction)与特征选择(Feature selection)在概念上的区别与联系
2、主成分分析(PCA)的基本原理
3、偏最小二乘法(PLS)的基本原理
4、PCA与PLS的代码实现
5、PCA的启发:训练集与测试集划分合理性的判断
6、经典特征选择方法
1)前向选择法与后向选择法
2)无信息变量消除法
3)基于二进制遗传算法的特征选择
7、SHAP法解释特征重要性与可视化(Shapley值的定义与计算方法、SHAP值的可视化与特征重要性解释)
8、案例演示与实操练习
1、深度学习与传统机器学习的区别与联系(神经网络的隐含层数越多越好吗?深度学习与传统机器学习的本质区别是什么?)
2、卷积神经网络的基本原理(什么是卷积核?CNN的典型拓扑结构是怎样的?CNN的权值共享机制是什么?CNN提取的特征是怎样的?)
3、LeNet、AlexNet、Vgg-16/19、GoogLeNet、ResNet等经典深度神经网络的区别与联系
4、MATLAB深度学习工具箱简介
5、deepNetworkDesigner交互式设计工具演示
6、预训练模型(Alexnet、Vgg-16/19、GoogLeNet、ResNet等)的下载与安装
7、案例讲解:
1)CNN预训练模型实现物体识别
2)利用卷积神经网络抽取抽象特征
3)自定义卷积神经网络拓扑结构
4)1D CNN模型解决回归拟合预测问题
8、实操练习
1、网络拓扑结构优化
2、优化算法(梯度下降、随机梯度下降、小批量随机梯度下降、动量法、Adam等)
3、调参技巧(参数初始化、数据预处理、数据扩增、批量归一化、超参数优化、网络正则化等)
4、案例讲解:卷积神经网络模型优化
5、实操练习
1、迁移学习算法的基本原理(为什么需要迁移学习?为什么可以迁移学习?迁移学习的基本思想是什么?)
2、基于深度神经网络模型的迁移学习算法
3、案例讲解:猫狗大战(Dogs vs. Cats)
4、实操练习
1、循环神经网络(RNN)的基本原理
2、长短时记忆神经网络(LSTM)的基本原理
3、RNN与LSTM的区别与联系
4、案例讲解:
1)时间序列预测
2)序列-序列分类
5、实操练习
1、时间卷积网络(TCN)的基本原理
2、TCN与1D CNN、LSTM的区别与联系
3、案例讲解:
1)时间序列预测:新冠肺炎疫情预测
2)序列-序列分类:人体动作识别
4、实操练习
1、生成式对抗网络GAN(什么是对抗生成网络?为什么需要对抗生成网络?对抗生成网络可以帮我们做什么?GAN给我们带来的启示)
2、GAN的基本原理及GAN进化史
3、案例讲解:GAN的MATLAB代码实现(向日葵花图像的自动生成)
4、实操练习
1、什么是目标检测?目标检测与目标识别的区别与联系
2、YOLO模型的工作原理
3、从YOLO v1到v5的进化之路
4、案例讲解:
1)使用预训练模型实现图像、视频等实时目标检测
2)训练自己的数据集:新冠疫情佩戴口罩识别
5、实操练习
1、语义分割(Semantic Segmentation)简介
2、U-Net模型的基本原理
3、案例讲解:基于U-Net的多光谱图像语义分割
4、实操练习
1、自编码器的组成及基本工作原理
2、自编码器的变种(栈式自编码器、稀疏自编码器、去噪自编码器、卷积自编码器、掩码自编码器等)及其工作原理
3、案例讲解:基于自编码器的图像分类
4、实操练习
1、什么是模型可解释性?为什么需要对CNN模型进行解释?
2、常用的可视化方法有哪些(特征图可视化、卷积核可视化、类别激活可视化等)?
3、CAM(Class Activation Mapping)、LIME(Local Interpretable Model-agnostic Explanation)、GRAD-CAM等方法原理讲解
4、案例讲解
5、实操练习
1、如何查阅文献资料?(你会使用Google Scholar、Sci-Hub、ResearchGate吗?应该去哪些地方查找与论文配套的数据和代码?)
2、如何提炼与挖掘创新点?(如果在算法层面上难以做出原创性的工作,如何结合自己的实际问题提炼与挖掘创新点?)
3、相关学习资料分享与拷贝(图书推荐、在线课程推荐等)
4、建立群,便于后期的讨论与答疑