光谱定性分析流程与实现---基于OpenSA开源库完成

系列文章目录

“光晰本质,谱见不同”,光谱作为物质的指纹,被广泛应用于成分分析中。伴随微型光谱仪/光谱成像仪的发展与普及,基于光谱的分析技术将不只停留于工业和实验室,即将走入生活,实现万物感知,见微知著。本系列文章致力于光谱分析技术的科普和应用。


文章目录

  • 系列文章目录
  • 前言
  • 一、光谱数据读入
    • 1.1 光谱数据读入
    • 1.2 光谱可视化
  • 二、定性分析模型建立
    • 2.1 光谱定性分析模块
    • 2 .2 光谱定性模块的使用实列
  • 总结


前言

典型的光谱分析模型(以近红外光谱作为示意,可见光、中远红外、荧光、拉曼、高光谱等分析流程亦相似)建立流程如下所示,在建立过程中,需要使用算法对训练样本进行选择,然后使用预处理算法对光谱进行预处理,或对光谱的特征进行提取,再构建校正模型实现定量分析,最后针对不同测量仪器或环境,进行模型转移或传递。因此训练样本的选择、光谱的预处理、波长筛选、校正模型、模型传递以及上述算法的参数都影响着模型的应用效果。

光谱定性分析流程与实现---基于OpenSA开源库完成_第1张图片
针对光谱分析流程所涉及的常见的训练样本的划分、光谱的预处理、波长筛选、校正模型算法建立了完整的算法库,名为OpenSA(OpenSpectrumAnalysis)。整套算法库的架构如下所示。
光谱定性分析流程与实现---基于OpenSA开源库完成_第2张图片
样本划分模块提供随机划分、SPXY划分、KS划分三种数据集划分方法,光谱预处理模块提供常见光谱预处理,波长筛选模块提供Spa、Cars、Lars、Uve、Pca等特征降维方法,分析模块由光谱相似度计算、聚类、分类(定性分析)、回归(定量分析)构建,光谱相似度子模块计算提供SAM、SID、MSSIM、MPSNR等相似计算方法,聚类子模块提供KMeans、FCM等聚类方法,分类子模块提供ANN、SVM、PLS_DA、RF等经典化学计量学方法,亦提供CNN、AE、Transformer等前沿深度学习方法,回归子模块提供ANN、SVR、PLS等经典化学计量学定量分析方法,亦提供CNN、AE、Transformer等前沿深度学习定量分析方法。模型评估模块提供常见的评价指标,用于模型评估。自动参数优化模块用于自动进行最佳的模型设置参数寻找,提供网格搜索、遗传算法、贝叶斯概率三种最优参数寻找方法。可视化模块提供全程的分析可视化,可为科研绘图,模型选择提供视觉信息。可通过几行代码快速实现完整的光谱分析及应用(注: 自动参数优化模块和可视化模块暂不开源,等毕业后再说)


本篇针对OpenSA的定性分析模块进行演示,展示如何快速的构建光谱定性分析模型。

一、光谱数据读入

提供一个为公开定性分析数据集,本章仅以公开定量分析数据集作为演示,该数据集为4分类的开源药品的数据集。

1.1 光谱数据读入

# 分别使用一个回归、一个分类的公开数据集做为example
def LoadNirtest(type):

    if type == "Rgs":
        CDataPath1 = './/Data//Rgs//Cdata1.csv'
        VDataPath1 = './/Data//Rgs//Vdata1.csv'
        TDataPath1 = './/Data//Rgs//Tdata1.csv'

        Cdata1 = np.loadtxt(open(CDataPath1, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)
        Vdata1 = np.loadtxt(open(VDataPath1, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)
        Tdata1 = np.loadtxt(open(TDataPath1, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)

        Nirdata1 = np.concatenate((Cdata1, Vdata1))
        Nirdata = np.concatenate((Nirdata1, Tdata1))
        data = Nirdata[:, :-4]
        label = Nirdata[:, -1]

    elif type == "Cls":
        path = './/Data//Cls//table.csv'
        Nirdata = np.loadtxt(open(path, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)
        data = Nirdata[:, :-1]
        label = Nirdata[:, -1]

    return data, label

1.2 光谱可视化

    #载入原始数据并可视化
   data1, label1 = LoadNirtest('Cls')
   plotspc(data1, "raw specturm")

采用的开源药品光谱如图所示:
光谱定性分析流程与实现---基于OpenSA开源库完成_第3张图片

二、定性分析模型建立

2.1 光谱定性分析模块

提供常见的定性分析模型,包括ANN、SVM、PLS_DA、RF、CNN、SAE等等,同时将定性分析模型与预处理模块,波长筛选模块,数据集划分模块进行了封装,仅需要一行代码即可快速建立定性分析模型。

"""
    -*- coding: utf-8 -*-
    @Time   :2022/04/12 17:10
    @Author : Pengyou FU
    @blogs  : https://blog.csdn.net/Echo_Code?spm=1000.2115.3001.5343
    @github : https://github.com/FuSiry/OpenSA
    @WeChat : Fu_siry
    @License:Apache-2.0 license

"""

from Classification.ClassicCls import ANN, SVM, PLS_DA, RF
from Classification.CNN import CNN
from Classification.SAE import SAE

def  QualitativeAnalysis(model, X_train, X_test, y_train, y_test):

    if model == "PLS_DA":
        acc = PLS_DA(X_train, X_test, y_train, y_test)
    elif model == "ANN":
        acc = ANN(X_train, X_test, y_train, y_test)
    elif model == "SVM":
        acc = SVM(X_train, X_test, y_train, y_test)
    elif model == "RF":
        acc = RF(X_train, X_test, y_train, y_test)
    elif model == "CNN":
        acc = CNN(X_train, X_test, y_train, y_test, 16, 160, 4)
    elif model == "SAE":
        acc = SAE(X_train, X_test, y_train, y_test)
    else:
        print("no this model of QuantitativeAnalysis")

    return acc

2 .2 光谱定性模块的使用实列

在example.py文件中,提供了光谱定性分析模块的使用方法,具体如下,仅需要一行代码即可实现所有常见的光谱定性分析。
示意1:利用OpenSA实现SNV+RF的光谱定性分析

 ## 载入原始数据并可视化
    data1, label1 = LoadNirtest('Cls')
    plotspc(data1, "raw specturm")
    # 光谱定性分析演示
    # 示意1: 预处理算法:SNV, 波长筛选算法: 不使用, 全波长建模, 数据集划分:随机划分, 定性分析模型: RF
    acc = SpectralQualitativeAnalysis(data1, label1, "SNV", "None", "random", "RF")
    print("The acc:{} of result!".format(acc))

结果如下:
光谱定性分析流程与实现---基于OpenSA开源库完成_第4张图片
可以看到采用SNV预处理和RF建立定性分析模型后,预测准确率在72.58%左右
示意2:利用OpenSA实现MSC预处理+Lars波长筛选+SVM的光谱定性分析

    ## 载入原始数据并可视化
    data1, label1 = LoadNirtest('Cls')
    #plotspc(data1, "raw specturm")
    # 光谱定性分析演示
    # 示意1: 预处理算法:MSC , 波长筛选算法: Lars, 数据集划分:随机划分, 定性分析模型: PLS_DA
    acc = SpectralQualitativeAnalysis(data1, label1, "MSC", "Lars", "random", "PLS_DA")
    print("The acc:{} of result!".format(acc))

在这里插入图片描述
可以看到采用MSC预处理+Lars波长筛选+SVM建立定性分析模型后,预测准确率在75.80%左右

总结

利用OpenSA可以非常简单的实现对光谱的定性分析,完整代码可从获得GitHub仓库 如果对您有用,请点赞!
代码现仅供学术使用,若对您的学术研究有帮助,请引用本人的论文,同时,未经许可不得用于商业化应用,欢迎大家继续补充OpenSA中所涉及到的算法,如有问题

你可能感兴趣的:(近红外光谱学习,高光谱,机器学习笔记,算法)