Python多元线性回归、机器学习、深度学习在近红外光谱分析中的应用

导师:郁磊副教授,主要从事MATLAB 编程、机器学习与数据挖掘、数据可视化和软件开发、人工智能近红外光谱分析、生物医学系统建模与仿真,具有丰富的实战应用经验,主编《MATLAB智能算法30个案例分析》、《MATLAB神经网络43个案例分析》相关著作。已发表多篇高水平的国际学术研究论文。

基于Python多元线性回归、机器学习、深度学习在近红外光谱分析中的实践应用

一章:Python入门基础

1、Python环境搭建( 下载、安装与版本选择)。

2、如何选择Python编辑器?(IDLE、Notepad++、PyCharm、Jupyter…)

3、Python基础(数据类型和变量、字符串和编码、list和tuple、条件判断、循环、函数的定义与调用等)

4、常见的错误与程序调试

5、第三方模块的安装与使用

6、文件读写(I/O)

7、实操练习

第二章:Python进阶与提高

1、Numpy模块库(Numpy的安装;ndarray类型属性与数组的创建;数组索引与切片;Numpy常用函数简介与使用)

2、Pandas模块库(DataFrame数据结构、表格的变换、排序、拼接、融合、分组操作等)

3、Matplotlib基本图形绘制(线形图、柱状图、饼图、气泡图、直方图、箱线图、散点图等)

4、图形的布局(多个子图绘制、规则与不规则布局绘制、向画布中任意位置添加坐标轴)

5、Scikit-Learn模块库简介、下载与安装

6、实操练习

第三章:多元线性回归及其在近红外光谱分析中的应用

1、多元线性回归模型(工作原理、最小二乘法)

2、岭回归模型(工作原理、岭参数k的选择、用岭回归选择变量)

3、LASSO模型(工作原理、特征选择、建模预测、超参数调节)

4、Elastic Net模型(工作原理、建模预测、超参数调节)

5、多元线性回归、岭回归、LASSO、Elastic Net的Python代码实现

6、案例演示:近红外光谱回归拟合建模

第四章:BP神经网络及其在近红外光谱分析中的应用

1、BP神经网络的基本原理(人工智能发展过程经历了哪些曲折?人工神经网络的分类有哪些?BP神经网络的拓扑结构和训练过程是怎样的?什么是梯度下降法?BP神经网络建模的本质是什么?)

2、怎样划分训练集和测试集?为什么需要归一化?归一化是必须的吗? BP神经网络的常用激活函数有哪些?如何查看模型的参数?

3、BP神经网络参数的优化(隐含层神经元个数、学习率、初始权值和阈值等如何设置?什么是交叉验证?)

4、值得研究的若干问题(欠拟合与过拟合、泛化性能评价指标的设计、样本不平衡问题等)

5、极限学习机(Extreme Learning Machine, ELM)的基本原理(ELM的基本算法,“极限”体现在哪些地方?ELM 与 BP 神经网络的区别与联系)

6、BP神经网络、极限学习机的Python代码实现

7、案例演示:

1)近红外光谱回归拟合建模;

2)近红外光谱分类识别建模

第五章:支持向量机(SVM)及其在近红外光谱分析中的应用

1、SVM的基本原理(什么是经验误差最小和结构误差最小?SVM的本质是解决什么问题?SVM的四种典型结构是什么?核函数的作用是什么?什么是支持向量?)

2、SVM扩展知识(如何解决多分类问题?SVM除了建模型之外,还可以帮助我们做哪些事情?SVM的启发:样本重要性的排序及样本筛选)

3、SVM的Python代码实现

4、案例演示:近红外光谱分类识别建模

第六章:决策树、随机森林、Adaboost、XGBoost和LightGBM及其在近红外光谱分析中的应用

1、决策树的基本原理(微软小冰读心术的启示;什么是信息熵和信息增益?ID3算法和C4.5算法的区别与联系)

2、决策树的启发:变量重要性的排序及变量筛选

3、随机森林的基本原理与集成学习框架(为什么需要随机森林算法?广义与狭义意义下的“随机森林”分别指的是什么?“随机”提现在哪些地方?随机森林的本质是什么?)

4、Bagging与Boosting集成策略的区别

5、Adaboost算法的基本原理

6、Gradient Boosting Decision Tree (GBDT)模型的基本原理

7、XGBoost与LightGBM简介

8、决策树、随机森林、Adaboost、XGBoost与LightGBM的Python代码实现

9、案例演示:近红外光谱回归拟合建模

第七章:遗传算法及其在近红外光谱分析中的应用

1、群优化算法概述

2、遗传算法(Genetic Algorithm)的基本原理(什么是个体和种群?什么是适应度函数?选择、交叉与变异算子的原理与启发式策略)

3、遗传算法的Python代码实现

4、案例演示:基于二进制遗传算法的近红外光谱波长筛选

第八章:变量降维与特征选择算法及其在近红外光谱分析中的应用

1、主成分分析(PCA)的基本原理

2、偏最小二乘(PLS)的基本原理(PCA与PLS的区别与联系;PCA除了降维之外,还可以帮助我们做什么?)

3、近红外光谱波长选择算法的基本原理(Filter和Wrapper;前向与后向选择法;区间法;无信息变量消除法等)

4、PCA、PLS的Python代码实现

5、特征选择算法的Python代码实现

6、案例演示:

1)基于L1正则化的近红外光谱波长筛选

2)基于信息熵的近红外光谱波长筛选

3)基于Recursive feature elimination的近红外光谱波长筛选

4)基于Forward-SFS的近红外光谱波长筛选

第九章:Pytorch环境搭建与编程入门

1、深度学习框架概述(PyTorch、Tensorflow、Keras等)

2、PyTorch简介(动态计算图与静态计算图机制、PyTorch的优点)

3、PyTorch的安装与环境配置(Pip vs. Conda包管理方式、验证是否安装成功)

4、张量(Tensor)的定义,以及与标量、向量、矩阵的区别与联系)

5、张量(Tensor)的常用属性与方法(dtype、device、requires_grad、cuda等)

6、张量(Tensor)的创建(直接创建、从numpy创建、依据概率分布创建)

7、张量(Tensor)的运算(加法、减法、矩阵乘法、哈达玛积(element wise)、除法、幂、开方、指数与对数、近似、裁剪)

8、张量(Tensor)的索引与切片

9、PyTorch的自动求导(Autograd)机制与计算图的理解

10、PyTorch常用工具包及API简介(torchvision(transforms、datasets、model)、torch.nn、torch.optim、torch.utils(Dataset、DataLoader)

第十章:卷积神经网络及其在近红外光谱分析中的应用

1、深度学习与传统机器学习的区别与联系(神经网络的隐含层数越多越好吗?深度学习与传统机器学习的本质区别是什么?)

2、卷积神经网络的基本原理(什么是卷积核?CNN的典型拓扑结构是怎样的?CNN的权值共享机制是什么?CNN提取的特征是怎样的?)

3、卷积神经网络参数调试技巧

4、卷积神经网络的Python代码实现

5、案例演示:基于卷积神经网络的近红外光谱建模

第十一章:迁移学习及其在近红外光谱分析中的应用

1、迁移学习算法的基本原理(为什么需要迁移学习?为什么可以迁移学习?迁移学习的基本思想是什么?)

2、常用的迁移学习算法简介(基于实例、特征和模型,譬如:TrAdaboost算法)

3、基于卷积神经网络的迁移学习算法

4、迁移学习的Python代码实现

5、案例演示:基于迁移学习的近红外光谱的模型传递(模型移植)

第十二章:自编码器及其在近红外光谱分析中的应用

1、自编码器(Auto-Encoder的工作原理)

2、常见的自编码器类型简介(降噪自编码器、深度自编码器、掩码自编码器等)

3、自编码器的Python代码实现

4、案例演示:

1)基于自编码器的近红外光谱数据预处理

2)基于自编码器的近红外光谱数据降维与有效特征提取

第十三章:复习

1、课程复习与总结(知识点梳理)

2、资料分享(图书、在线课程资源、源代码等)

3、科研与创新方法总结(如何利用Google Scholar、Sci-Hub、ResearchGate等工具查阅文献资料、配套的数据和代码?如何更好地撰写论文的Discussion部分?如果在算法层面上难以做出原创性的工作,如何结合实际问题提炼与挖掘创新点?)

Python多元线性回归、机器学习、深度学习在近红外光谱分析中的应用_第1张图片


 

你可能感兴趣的:(深度学习,遥感,医学影像,python,线性回归,深度学习)