泰迪教育

基于深度学习的岩石样本智能识别研究——第九届“泰迪杯”挑战赛B题优秀作品

1 前言

1.1 研究背景

岩石是现代建筑业和制造业的重要原材料，除了作为原材料使用以外，还可以对其进行勘探开发挖掘岩油气藏，若能智能且准确地识别岩石岩性、计算岩石含油量，这将会是一笔巨大的社会财富。
天然岩石有多种来源和用途，根据其不同的特征，可分为火成岩、沉积岩和变质岩三类。岩石的探测与识别是地质调查研究和矿产资源勘查的基础工作，岩石的精准识别与分类对地质的探测与识别极为重要，一般可通过多种方式进行鉴定，例如重磁、测井、地震、遥感、电磁、地球化学、手标本及薄片分析方法等方法。而现场的工作条件通常仅限于目视方法，包括对细粒岩石使用放大镜，视觉检测评估诸如颜色、成分、粒度和结构等属性。
近些年来，卫星和遥感技术的进步推动了多光谱遥感技术的发展，以分类不同类型的地物，包括岩石。但是，利用遥感技术在野外获取超高分辨率岩石图像的成本很高。因此，利用无人机和卫星携带的高光谱技术进行数据采集的高成本往往阻碍了岩石岩性识别的自动化。
而图像采集和计算机图像模式识别技术的迅速发展，使得从野外采集的图像中识别岩石的自动系统得以发展。这些技术为辅助地质学家判断和识别岩石岩性提供了极大的便利，也极大推进了深度学习算法在这一方向的落地可能。

1.2 研究任务

利用图像处理技术和深度学习算法解决以下两个任务：
（1）岩性识别与分类
以白光环境下拍摄的岩石样本图像数据为基础，设计合适的机器学习或深度学习算法，构建岩石样本岩性智能识别模型。
（2）计算岩石含油面积百分含量
以荧光环境下拍摄的岩石样本图像数据为基础，借助石油在紫外线的照射下具有发光的特性，设计合适算法计算图像中岩石的含油面积百分比含量。

2 数据探索

2.1 类别不平衡问题

所提供的岩石样本数据中，存在着严重的类别不平衡问题，如图 2‑1所示。其中浅灰色细砂岩样本数量最多，占全体数据的26.98%；深灰色泥岩次之，占比23.81%；灰色细砂岩的样本数量最少，仅有5.72%，不足浅灰色细砂岩的四分之一。

如此类别不平衡的数据集，模型很容易过度拟合样本更多的类别，同时忽视对小样本类别的学习。因此类别不平衡问题是模型训练时不可忽视的重要问题。传统的处理类别不平衡问题的方法主要是重采样，重采样可划分为两类，一是对数量多的类别欠采样，二是对数量少的类别过采样。重采样后的数据集具有平衡的类别，但数据集中包含的信息并不会因此增加，故而可能会导致模型欠拟合于数量少的类别而过拟合数量多的类别。因此，可换个角度，从损失函数方面考虑类别不平衡问题的处理。

2.2 数据质量问题

经观察发现，样本中提供的七类岩石的类内差异较大，同时也可能混杂有标注错误的样本。以深灰色粉砂质泥岩为例，抽选编号为73、81、137的样本，如图 2‑2第一行所示。从中可见，同一类岩石的颜色、形态可能大相径庭，这无疑加大了分类的难度。图 2‑2按列展示了不同类别岩石可能存在的相似情况，在缺乏专业知识的人眼中，每一组图片可能相差无几（可能是错误标记）。此外，如此巨大的类内差异和微小的类间差异很容易掩盖错误标注的样本，从而误导模型训练时优化的方向，降低模型识别能力。

众所周知，拍摄环境对照片呈现的内容影响极大。如果按干燥程度区分，可将环境简单分为干燥、潮湿、有水三类；按光照情况划分，则可分为光照好和光照差两类。
以灰黑色泥岩为例，选取五个不同环境下拍摄的典型样本进行展示，如图 2‑3。对比40号和51号图像，可见越潮湿的岩石颜色越深。结合309号和198号图像，可发现当岩石间有水时，水面的反光甚至会掩盖岩石的纹理细节，即使在光照不好的情况下也不例外。整体上看，光照情况越好的图像的纹理细节越清晰，对岩石颜色的反映越真实。

此外在部分的岩石样本数据中，还存在着掺杂其他类别岩石或杂物的情况。以类别为浅灰色细砂岩的235号照片为例，如图 2‑4所示。图像混杂了大量橙色、褐色和黑色的小石块，同时落入一片树叶，遮挡将近八分之一的区域。如此杂乱的数据无疑是对数据预处理和模型提取特征能力的一大挑战。

2.3 图像格式问题

样本图像中存在bmp和jpg两种格式，且两种格式的图像大小和风格均有巨大差异。bmp格式图像无明显背景，大小为3000x4096（像素）。此类照片受环境因素影响大，光照、潮湿程度各异，且往往混有其他岩石或物体。jpg格式图片存在显著蓝色背景、大小为2048x2448（像素）。此类照片光照差异不大，岩石中的杂物也不多，但其中的岩石多为细小的碎块，难以提取纹理特征。

3 数据预处理

由于数据集中照片的分辨率较高且样本数较少，可选择通过裁切图像的方式增加样本数量。根据不同的模型特点，本文有针对性地使用了随机裁剪和网格裁剪这两种略有不同的增强方式，其示意图如图 3‑1。
其中随机裁剪即在原图上随机剪出预设大小的小块图像作为全新的样本，这种方式的优点在于生成的样本数量多，模型有机会学习到原始图像的所有信息。但由于该方式的随机性较强，难以预料裁剪出的内容，因此当数据质量不高时，依靠随机裁剪扩增的样本中可能包含大量的噪声。
而网格裁剪即按照预设的网格，将图像裁剪为相同尺寸的小块。使用网格裁剪扩增的样本具有固定的数量和内容，虽然会损失一部分横跨网格的信息，但更便于进行数据分析和预处理，从而剔除噪声数据。

通过前文的探索性数据分析，常发现某不知名红褐色石头混杂在样本中，且不属于任何一类。因此在裁剪后，选择计算红色和橙色在样本中所占的比例，通过实验确定阈值，从而剔除以红褐色岩石为主体的样本。此外，根据前文可知同一类岩石可能因光照、潮湿程度等环境因素改变颜色、纹理。因此为了增加模型的鲁棒性，选择采用随机增强策略对样本进行随机变换。
图像增强是一项通过简单图像变换使数据特征更明显的技术，现已逐渐推广到数据扩增用途。而随机增强即预先选择多种图像变换方案，并以一定概率随机组合这些变换，使得样本图像千变万化，从而训练模型提取图像中最关键的特征信息，使模型具有更强的泛化能力。为对抗样本中存在的光照、潮湿等环境因素的影响，选择水平翻转、垂直翻转、随机饱和度调节、随机亮度调节、随机对比度调节五种基础增强方案，并在训练模型时随机组合这些基础方案。以16号样本为例，五种基础增强方案的示意图如图 3‑2。

综上所述，数据预处理技术路线图如下图 3‑3。

4 基于DCNN的岩性智能识别与分类

经过一系列的探索性数据分析，发现除轮廓、色彩等信息对岩石分类有帮助外，岩石的局部纹理特征也对分类效果起着至关重要的作用。因此，本文构建了全局-局部模型，用以提取图像全局和局部的纹理特征，再使用精心设计的融合模块将两种特征合并，馈入前馈神经网络，得到分类结果。
除此之外，注意到所提供的岩石图像中可能混入了其他种类的岩石，这会在一定程度上影响模型分类结果。因此本文基于EfficientNet-B3和MobileNet-V3构建了两个仅关注局部纹理的岩性识别与分类模型，借助置信学习剔除噪声数据，并提出了滑动窗口预测法以综合考量图像主体所属的类别，进一步削弱由图像数据质量问题带来的负面影响。
最后，再以“硬投票（Hard Voting）”的方式对三个模型的预测结果进行融合，从而得到更为鲁棒且精确的预测结果。

4.1 基于随机裁剪数据的图像分类模型

本节基于ResNeXt-50进行改进，充分融合图像的全局与局部信息，采用随机裁剪与图像缩放得到的图像作为训练集进行模型训练，得到最终的“全局-局部模型”。

4.1.1 ResNeXt网络构架

随着计算机硬件设备的不断升级，计算机视觉领域迅猛发展，用于图像识别的网络架构层出不穷。众所周知，网络的深度是决定模型性能的关键因素。理论上可以通过增加网络的层数，让模型获得提取更复杂、更有效的特征的能力，从而使得模型获得更好的性能。但2016年何凯明等人在ResNet 一文中指出网络的层数与模型的性能并非成正比的关系，深度高的模型甚至比深度低的模型效果可能更差，即网络退化。因此，何凯明团队提出“残差结构”来解决网络退化问题，如下图 4‑1所示。

当输入为 $x$ 时，网络学习到的特征为 $H (x)$ ，由于存在网络退化现象，ResNet 在原来的模块中增加一个旁路（shortcut），此时模型学习到的原始特征为 $F (x) + x$ ，网络便只需学习 $H (x) - x = F (x)$ 的残差信息，这与直接学习原始特征的网络相比更为简单且有效。此外，当残差为0时，该堆叠模块仅做了简单的恒等映射，不会使模型的性能下降，从而解决了模型层数越多，网络性能越差的问题。

ResNeXt 是由Facebook在2017年提出的一种基于ResNet改进的网络架构。ResNeXt将ResNet网络中的“直线式”残差结构改为多分支的同构结构，其与ResNet的区别如图 4‑3所示。

下图 4‑4为一个没有偏置项的线性激活神经元，它是一个最简单的“split-transform-merge”结构，它将输入的 $m$ 个元素，分配到 $m$ 个分支进行权重加权，最后对所有的支路求和。由此神经网络的一个单元可以如下式所示：
$F(x)=\sum_{i=1}^{m}{w_i}*x_i\\$

而ResNeXt就是借鉴了“split-transform-merge”想法，将原本的残差模块分成多个小组（即多种特征）进行独立的同构变换，最后再对其进行特征融合。ResNeXt的残差结构可以用如下公式表示：
$y=x+\sum_{i-1}^{C}{T_i(x)}\\$
其中，C 表示每个残差模块中的分组个数， $T_i$ 表示特征 $x$ 的任意变换。
与ResNet相比，ResNeXt在相同参数的情况下，错误率更低，模型性能更好，故选择ResNeXt-50作为以下模型的主干网络。

4.1.2 逐步细化模型

本次岩石总共分为7个类别，分别为黑色煤、深灰色泥岩、深灰色粉砂质泥岩、灰黑色泥岩、浅灰色细砂岩、灰色泥质粉砂岩以及灰色细砂岩。根据岩石特征以及类别，可将其大致划分为黑色煤、泥岩以及砂岩三类，然后再针对泥岩和砂岩这两类岩石进行类别细分。因此可针对不同的岩石类型以ResNeXt-50为主干网络分别训练三个模型，并将其组合成一个模型来逐步的对岩石进行分类，如图 4‑5所示。

逐步细化模型中的三个子模型分别对应三个任务，期望通过多模型学习不同的特征达到正确分类的目标。但是，该模型存在一个缺点，即Model2与Model3是建立在Model1的划分基础上，一旦Model1分类错误，就意味着Model2、Model3的性能无论多好，都无法改变图像的大类，因此这张图片的预测类别肯定与真实类别不符。也就是说Model1的分类准确度决定了整个模型的性能上限。整个模型的准确率是Model2、Model3的准确率与Model1准确率的乘积之和。

4.1.3 全局-局部模型

由于逐步细化模型会出现准确率严重受限于以ResNeXt-50为主干的Model1，因此本文基于逐步细化模型作进一步改进。
逐步细化模型的主要思想是先分大类再细分小类。由于煤、砂岩和泥岩这三个大类别之间的差异较大，用于区分它们的模型（Model1）通常只需要对图像整体的色彩、结构有一定把握即可，我们把这样大尺度的信息称为全局特征。而进一步细分泥岩或砂岩的Model2、Model3则需要学习图像细节的纹理特征，才能更好地区分差异不大的子类别，我们把这样细粒度的特征称为局部信息。如下图 4‑6所示，逐步细化模型其实是全局信息与局部信息的“串联式”结构连接。

在串联式结构中，Model1有绝对的话语权，控制了模型的上限。为解决这一问题，本文选择将Model1提取的全局特征与Model2提取的局部特征进行“并联”，构造全局-局部模型。该模型使得两模块并重，不再受限于单一模型，如图 4‑7所示。

其中，Model1与Model2都是以ResNeXt-50为主干的模型架构。一般而言，ResNeXt-50网络只需要尺寸为224x224的输入即可。而赛题提供图像的两种分辨率（3000x4096、2048x2448）非常大，这就为多样化的预处理方式提供了基础。为了使全局-局部模型中的子模型各司其职，可以对图片进行不同的处理，从而使模型学到不同尺度的纹理特征。
首先，将整张图片直接缩放到448x448，再对其进行中心裁剪，得到分辨率为224x224的图像。处理过后的图像与原图相比损失了部分细节的纹理信息，但是图像的全局信息仍被保留了下来。将这一类图像放入到Model1中训练，可以使网络很好地学习到图像的全局信息。
其次，对原图像进行随机裁剪，同样得到一张448x448的图像，随后在将其缩放到224x224。与之前不同，这张图像虽然也是224x224的大小，但因其是先在原图上进行裁剪，再进行缩放，所以图像虽然损失了全局信息，但其很好的保存了局部的纹理细节，因此Model2能够很好的学习图像的局部信息。

最后，本文将Model1与Model2的最后一层全连接层移除，即移除类别输出层，此时的模型便成为了特征提取器。再将提取到的全局信息的特征与局部信息的特征拼接起来，馈入一个逐点卷积层，从而深度融合全局、局部信息，让全局-局部模型具有更好的性能。此外，全局-局部模型的并联式结构特点类似于ResNeXt中的“split-transform-merge”模式，这表明以ResNeXt-50为主干构建的全局-局部模型是合理、可行的。

4.2 基于网格裁剪数据的图像分类模型

不同于4.1节，本节将使用网格裁剪得到的数据作为训练集进行模型训练，并采用EfficientNet-B3和MobileNet-V3两个不同的主干网络进行训练，得到两个图像分类模型。
同时，为降低标签错误、数据质量等问题带来的模型分类能力影响，此节通过置信学习对初始数据进行清洗，剔除错误标签的数据。将清洗后的数据划分为训练数据和验证数据，再载入EfficientNet-B3（MobileNet-V3）进行训练，并以验证数据的分类准确度高低作为模型是否完成训练的标准。完成模型训练后，根据训练得到的权重载入模型，以滑动窗口预测的方式投票得到最终预测结果，以Efficienet-B3为例，其流程如图 4‑9所示（MobileNet-V3的流程类同）。

4.2.1 EfficientNet简介

EfficientNet 由Google于2019年提出，分为B0至B7八个版本，其中EfficientNet-B0最为基础、也是参数量最少的版本。EfficientNet的核心在于混合缩放，区别于传统的缩放方式，混合缩放通过定义混合缩放系数 $\phi$ ，根据式4-2-1同时实现深度 $d$ 、宽度 $w$ 、分辨率 $r$ 三个维度的动态缩放。
$d=\alpha^\phi,w=\beta^\phi,r=\lambda^\phi\tag{4-2-1}$
上式满足约束条件 $\alpha\ \cdot\ \beta\ \cdot\ \lambda\approx2$ 且 $\alpha\geq1,\beta\geq1,\lambda\geq1$ 。
混合缩放形式如图 4‑10（e）所示。

4.2.2 MobileNet-V3简介

MobileNet-V3 是Google基于MobileNet-V1和MobileNet-V2进行改进后的MobileNet网络系列又一力作，其使用NAS算法搜索得到大体的网络结构，继而使用NetAdapt算法确定卷积层的通道数目，最后进行人工的细微调整，得到网络的最终结构，并且为适应不同的算力场景，推出了Large和Small两个版本以匹配不同算力资源的设备（本文采用Large版本）。
此外，MobileNet系列的网络一直以能够部署在移动端，并能够拥有快速准确的模型预测结果为目的。而MobileNet-V3考虑到Sigmoid函数在移动端设备的计算成本很高，因而改用h-swish激活函数（式4-2-3）近似swish激活函数（式4-2-2）。
$swish(x)=x\cdot \sigma(x)\tag{4-2-2}$
$h-swish[x]=\frac{x(ReLU6\cdot(x+3))}{6}\tag{4--3}$
其中 $\sigma(\cdot)$ 为Sigmoid函数，ReLU6为ReLU6激活函数。

4.2.3 置信学习

置信学习是基于剪枝、计数和排序噪声数据，对噪声标签进行表征识别和学习的方法，其利用概率和带噪标签对非标准化的置信联合矩阵进行检验，估计联合分布，并借此对噪声数据进行剪枝。置信学习不需要超参数，只需要输入样本外预测概率和与噪声标签相关的数组，根据标签噪声概率输出有序样本以消除错误标签样本，流程如图 4‑12所示。

4.2.4 滑动窗口预测

考虑到岩石图像的数据质量问题，对于单标签的图像，其图像内部可能掺杂了其他类别的信息，但是经过综合考量，多数图像数据中的大部分内容能够对应标签信息，因此可视作图像内部存在“噪声”。
为尽可能降低此类数据质量带来的“噪声”问题，本文提出单张图像以滑动窗口方式进行预测的方法，从而得到单张图像不同位置的多个预测结果，这也正对应了模型训练时所采取的数据处理策略，最终取预测结果中的众数作为实际输入单张图像的最终预测结果，如图 4‑13所示。
若选用滑动距离 s 为窗口大小，则退化为对图像进行切块预测。

4.2.5 TTA

TTA 全称Test Time Augmentation，即测试时增强，旨在模型预测阶段，将待预测的原始图片进行水平翻转、垂直翻转、旋转等数据增强操作，得到多张图并分别预测，再对多个结果进行综合，进而得出最终输出结果，如图 4‑14所示。在测试时，利用TTA能够更好地增强模型预测效果，提高模型预测稳定性。因此，本文将采用TTA预测策略提高模型的岩性识别与分类能力。

4.3 训练策略

4.3.1 数据集划分

针对本章的岩石岩性识别与分类任务，将利用所提供的数据集中的白光环境图像数据进行模型训练、验证及测试。
经过多次模型的反复训练，发现训练数据的多少并不影响模型的识别能力，即训练数据多时的模型分类准确率与训练数据少时的模型分类准确率并无明显差异，受启于CBLoss 一文，这或许是因为样本中的“有效样本数”较少所导致，即样本数量上的“多”并不对应图像信息上的“多”，因此过多的训练集无法从实质上给模型提供过多的有效信息。
故此减少训练集数量以加快模型训练速度。本文通过分层抽样，将315张白光环境图像数据划分为152张训练集、93张验证集和70张测试集。其中，训练集用于模型训练，验证集用于判断模型是否完成训练及判断过拟合点，测试集用于说明模型的岩性识别与分类能力。

4.3.2 Adam

在优化器选择方面，选用Adam 优化器，Adam由Diederik等人于2015年提出，其结合了Monument、AdaGrad和RMSProp三种优化算法的优点，通过计算梯度的一阶矩估计和二阶矩估计，为不同的参数设计独立的自适应性学习率，具有实现简单、计算高效、对内存需求少、适用于不稳定目标函数等优点。

4.3.3 OneCycleLR

在学习率调整方面，选择使用OneCycleLR 方法，即在初始训练过程先提高学习率以让模型学习地更快，在训练到某一阶段时缓慢降低学习率以让模型找到全局最优解，学习率曲线示意图如图 4‑15所示。

4.3.4 Focal Loss

经数据探索得出数据存在类别不平衡问题的结论，故此使用Focal loss作为损失函数，以解决类别不平衡问题。Focal Loss 由Facebook于2017年提出，在交叉熵损失函数（式4-3-1）基础上引入超参数 $\gamma$ ，以减少易分类样本的权重，使得模型在训练时更专注于难分类的样本（式4-3-2）。
$CE(p,y)=CE(p_t)=-log(p_t) \tag{4-3-1}$
$FL(p_t)=-(1-p_t)^\gamma log(p_t)\tag{4-3-2}$
式4-3-1和式4-3-2中，
$p_t=\begin {cases} p,&y=1\\1-p,&otherwise \end {cases}$

4.4 模型融合

考虑到不同的模型训练方式、不同的骨干网络会得到不同的模型识别能力，即前文4.1节和4.2节得到的三个不同模型在进行岩性识别与分类时，所关注的侧重点（图像区域）会有所不同，进而对于不同岩性类别的岩石分类能力也有所差异、各有所长。
因此为得到更为鲁棒、准确的岩性分类结果，本文基于取长补短、群策群力的原则，借助集成学习的思想，在结果测试时对三个模型的预测结果采用“硬投票（Hard Voting）”的方式输出得到最终的预测结果，其示意图如图 4‑16所示。

若是出现三个模型的预测类别完全不一致的情况，即三个模型预测出三种岩石类别，则采取随机原则，随机选择其中一个模型的预测结果作为最终的集成结果（此类情况极少，在所用70张测试集数据中仅出现一例）。

5 岩石含油比例计算

在紫外线的照射下，石油会发出绿色或黄色的光芒，这是石油的发光特征。因此可以借助荧光环境下的图像数据，计算图像中黄绿色光点面积占岩石总面积的百分比，从而估计岩石的含油量。
由2.3节知，提供的数据中以bmp格式存储的照片无明显背景，岩石能够占满整幅画面，可以近似地把照片面积看作岩石面积；以jpg存储的照片有明显的蓝色背景，需要设计算法将蓝色背景剔除。因此对两种格式图像数据分别设计算法计算含油比例，技术路线图如图 5‑1所示。

5.1 荧光区域分割

5.1.1 颜色空间转换

在计算机中，照片以矩阵的形式存储，其尺寸可记为(W,H,C)，其中W和H即照片的宽和高，以像素为单位，而C表示通道数。使用目前应用最广泛的RGB颜色模式存储的照片的通道数C=3。这是因为RGB颜色模式通过混合红、绿、蓝三原色模拟其他的颜色，故需要三个通道分别表示对应三原色之一的强度。RGB颜色模式示意如图 5‑2所示。

使用RGB标准几乎可以模拟人类肉眼可以感知到的所有颜色，但RGB色彩空间内的颜色大多是不连续的，难以通过限定色彩范围提取具有指定颜色的像素。因此，首先将RGB图像映射至HSV空间——一种依靠色调（Hue）、饱和度（Saturation）、明暗程度（Value）表示颜色的标准。借助HSV空间，可轻松地将颜色与色调（Hue）、饱和度（Saturation）、明暗程度（Value）的关系表示为下图 5‑3中的三维图像。可见在HSV颜色空间里，相近的颜色往往是相邻的，只需要规定H、S、V三轴的取值范围，即可筛选出想要的颜色。

5.1.2 石油荧光分割

根据上述原理编写程序，效果如图 5‑4所示。其中最左侧的窗口中的白点即表示当前色彩范围提取到的石油光斑，中间窗口显示了荧光灯下拍摄的原照片。通过拖动右侧窗口的滑块，可以调节色彩空间范围，从而观察并分析HSV色彩范围对石油光斑分割的效果。为了减少石油的误判和漏判，经过大量实验分析，最终确定石油光斑颜色在HSV空间的下限为(26,43,47)，上限为(77,255,255)。

5.2 轮廓检测

对于有明显背景的图片，需要设计算法找出岩石所在的区域，从而剔除背景，正确计算岩石面积。针对数据特点，本文设计了一个准确高效的轮廓检测流程。该流程可分为图像降噪、Canny边缘检测、形态学处理、轮廓检测四个步骤，技术路线图如下图 5‑5所示。

5.2.1 图像降噪

由于所提供的图像数据是高分辨率的，包含许多细节纹理信息，然而任务目标为轮廓检测，只需要关注岩石堆的边缘即可，岩石内部的细节信息只会对轮廓检测带来负面影响。因此使用 $3\times3$ 大小的高斯滤波器对图片迭代处理两次，效果示意图如下图 5‑6所示。

5.2.2 Canny边缘检测

Canny边缘检测算法是目前最为常用的边缘检测算法之一。该算法于1986年由John F. Canny提出，具有低漏判率、低误判率等优良性质。Canny边缘检测算法需要设定两个阈值超参数 $t_1$ 和 $t_2(t_1t2(t1<t2)$

STEP1：图像灰度化；
STEP2：计算图像中每个像素点的梯度强度和方向；
STEP3：通过非极大值抑制（Non-Maximum Suppression），得到初步的边缘划分;
STEP4：删除梯度低于 $t_1$ 的边缘，把梯度位于 $t_1$ 和 $t_2$ 之间的边缘记为弱边缘；
STEP5：抑制孤立的弱边缘。
根据上述五个步骤即可得到图像可能的边缘，效果示意图如下图 5‑7所示：

5.2.3 形态学处理

通过Canny边缘检测得到粗糙的岩石边缘，并对图像进行放大后仔细观察，发现这样提取到的岩石边缘的一些部分是非闭合的，会影响轮廓检测的准确性。因此需要对提取出的边缘进行额外的形态学处理。
形态学图像处理是一种使用结构元（Structuring Elements）处理图像的技术，类似于滤波或卷积。其中腐蚀、膨胀、开操作、闭操作是形态学图像处理的基本操作。为了封闭岩石的边缘形成轮廓，使用尺寸为 $3\times3$ 的全 $1$ 矩阵作为结构元，对边缘进行形态学处理，效果如下图 5‑8所示。可见经处理后，边缘形成了封闭的轮廓，便于进行进一步的检测。

5.2.4 轮廓检测

选用Suzuki 提出的基于拓扑结构分析的轮廓检测方法，对前文提取的边缘特征进行处理。除了图像最外围的一圈像素以外，每个像素点周围都有8个像素点，这被称为该像素的临近像素。Suzuki方法通过迭代判断像素点与其临近非零像素（边缘）的拓扑学关系，从而推断像素是否属于轮廓的一部分。这一方法不需要设定超参数，简单易用，同时具有快速、稳定、准确等优良特性，是一种广泛应用于工业的轮廓检测算法。该算法的效果示意图如下图 5‑9所示。

5.3 计算岩石含油比例

如前文所述，将对两种不同类型的照片使用不同的处理方法，从而尽可能准确地计算岩石含油比例。为了方便描述，将图像数据表示为像素点的集合 $G=\{P_{11},P_{12},...,P_{WH}\}$ ，其中 $P_{ij}$ 表示照片中第 $i$ 行 $j$ 列的像素。故经5.1节分割得到的荧光区域可表示为集合 $B$ 。此外，定义运算 $∣ G ∣$ ，表示集合 $G$ 中包含元素的数量。
对于无明显背景的照片，岩石面积几乎等同于整张图像的面积，岩石含油比例 $p$ 可以通过下式计算：
$p=\frac{|B|}{|G|}$
对于有明显背景的照片，首先使用5.2节描述的技术寻找岩石的外轮廓，得到岩石区域 $C$ 。可以写出岩石含油比例计算公式：
$p=\frac{|B\cap C|}{|C|}$
其中 $B\cap C$ 表示对5.1节分割得到的荧光区域 $B$ 与5.2节寻找到的岩石区域 $C$ 取交集，从而剔除轮廓外检测到的荧光内容。此运算对荧光分割结果做出了校正，使得岩石含油比例不再受背景影响，从而得到更加准确且稳定的结果。

6 实验结果分析

6.1 实验环境

实验的硬件环境、软件环境分别如表 6‑1和表 6‑2所示。
表 6‑1 实验硬件环境

表 6‑2 实验软件环境

6.2 评价指标

针对岩石样本的岩性识别与分类任务（即任务一），采用准确率accuracy进行评价：
$accuracy=\frac{TP+TN}{TP+FP+TN+FN}$
其中， $T P$ 表示预测为正、实际也为正的次数， $T N$ 表示预测为负、实际也为负， $F P$ 表示预测为正、而实际为负的次数， $F N$ 预测为负、而实际为正的次数。

6.3 实验结果

6.3.1 任务一

通过第四章一系列的模型训练、验证过程，得到最终的模型岩石岩性识别与分类的结果，并为更详细地比较各模型的性能优劣，按照岩石岩性类别将模型岩石岩性分类准确度汇总至下表 6‑3。
表 6‑3 按类别的模型分类准确度

其中，Ensemble-Model由全局-局部模型、EfficientNet-B3、MobileNet-V3三个模型通过“硬投票”方式集成而来（详见4.5节）。
通过上表 6‑3，可以发现“全局-局部模型”在“浅灰色细砂岩”和“灰色细砂岩”上的识别效果非常好，达到100.00%的准确率，但在“深灰色粉砂质泥岩”和“灰色泥质粉砂岩”两个类别上的识别能力较差，仅为33.33%。而“EfficientNet-B3”在“深灰色粉砂质泥岩”和“灰色泥质粉砂岩”两个类别上的识别能力比较好，分别为66.67%和100.00%，恰好能够一定程度上弥补“全局-局部模型”的识别能力缺陷，因此可在集成后实现“取长补短”的效果，这便是本文选择做模型融合的重要原因。
另一方面，“EfficientNet-B3”和“MobileNet-V3”虽然都是基于网格裁剪数据所训练出来的，但是由于主干网络的差异，其在各岩石类别的识别能力也有所不同（这一点可以通过表 6‑3得到证实），因此能够达到进行模型融合的前提，即单个模型之间存在差异、各有优缺。
也正如我们所设想的一样，集成后的模型结果明显优于单个模型的分类结果，并且在各类别上的识别准确度都有明显优势，并且表现的更为均衡，达到了我们所希望的鲁棒且准确的分类效果。但与此同时，受单个模型的识别能力影响——三个模型在“黑色煤”这一类别上的识别能力都比较差，也造成了集成后的模型对“黑色煤”的识别效果较差。
进一步地，可视化上述模型各自的混淆矩阵，如图 6‑1所示，其中的横纵坐标类别（0,1,…,6）分别对应着上表 6‑3“类别”一栏的顺序。

通过图 6‑1不难发现四个模型存在一个共性：“黑色煤”经常被错误预测为“深灰色泥岩”。同时，不知是巧合与否，被错误预测的“黑色煤”样本均为jpg格式的图像数据（如下图 6‑2第一行所示）。为此，找到同为jpg格式但被正确预测的“深灰色泥岩”图像数据（如下图 6‑2第二行所示）以及唯一一张被错误预测为“黑色煤”的“深灰色泥岩”图像数据（如下图 6‑2第三行所示）进行比较，分析其原因。

通过上图 6‑2被错误预测的黑色煤样本和被正确预测的深灰色泥岩样本的比较可以发现，被错误预测为深灰色泥岩的黑色煤样本的整体颜色偏深，而被正确为深灰色泥岩的样本的整体颜色偏淡（包括背景颜色），除去视觉上的颜色差异，二者在形状、纹理、大小等特征上的差异极小。
同时，被错误预测为黑色煤的深灰色泥岩样本（上图 6‑2第三行）在肉眼看来，无论是颜色上，还是形状、纹理、大小等方面，的确和黑色煤样本更为相似（这里不排除是因为标签错误的原因），这或许就是模型“错分”65-1.bmp样本的根本原因。
为更清晰地比较其内在的岩石纹理、形状、大小等特征，选取展示上述图像的[700:1000,700:1000]区域，如下图 6‑3所示。

通过上图 6‑3更为局部的细节比较，可以发现7张图像数据的光照条件存在明显差异，这会在一定程度上影响图像的颜色深浅程度表现，导致光照条件好的图像看起来颜色偏淡，而光照条件差的图像看起来颜色偏深。故此时的图像特征“颜色”不应是岩石岩性分类的第一优选项，或可能成为误导模型分类的干扰项，因此，此时模型便不再从“颜色”这一维度切入，去进行岩性的分类。
若是抛开颜色这一特征，从其他特征方面去进行分析，这将进一步证实了我们的猜想——除去视觉上的颜色差异，二者在形状、纹理、大小等特征上的差异极小。所以，这将成为模型分类岩石的重大困难，也因如此，模型选择将上述三个“黑色煤”样本预测为相较更有把握的“深灰色泥岩”。
综合来看，最终所获得的模型性能还是比较好的，其能够在数据质量不佳的情况下，实现80%以上的分类准确率，已然具备一定的岩石岩性识别与分类的能力。饮水思源，数据便是模型的根本和源头，脱离数据，再强大的模型和训练策略都是空谈。若是数据质量得到提高，模型分类能力想必能够获得进一步提升，实现质的飞跃。
6.3.2 任务二
通过荧光区域分割、演示轮廓检测等步骤（详见第5章），得到各样本的含油面积百分比，部分结果如表 6‑4（详细结果见上传附件）。
表 6‑4 任务二部分结果

以编号270的样本为例，对荧光区域分割和轮廓检测结果进行可视化分析，如图 6‑4所示。可见本文所用方案得到的荧光区域十分准确，即使是微弱的荧光也可以被识别。

对于存在明显背景的图像，需要额外进行岩石轮廓检测，以精准确定岩石实际所占面积，保证所计算的含油面积百分比的准确性。以编号为342的样本为例（图 6‑5），可见所提取岩石区域面积没有受到背景上的白色污渍干扰，能较好地分割出正确的岩石区域，从而保证含油量结果更贴合实际情况。

7 总结与展望

7.1 总结

本文介绍了当前岩石样本探测的重要意义及其现有的探测手段，阐述了岩石分类智能化的研究价值。通过图像处理技术和深度学习算法，结合数据特点，设计出有效的模型，识别出岩石样本的岩性类别及含油气情况，实现岩石样本智能识别分类。所做工作包括以下方面：
一、任务一

针对图像数据进行探索性分析，发现数据存在类别不平衡、标签错误、图像信息杂乱、数据格式差异等问题；
针对数据探索发现的问题采取针对性策略，包括使用Focal Loss损失函数解决类别不平衡问题、利用置信学习剔除标签错误数据、借用裁剪图像的颜色占比减少类别外的干扰信息、通过轮廓检测和闭环处理精确JPG格式图像的岩石面积等；
针对训练样本数过少的问题采用多种数据增强方法，并利用图像高分辨率特性进行随机裁剪和网格裁剪，得到实际所用训练数据，并基于两种不同的裁剪策略搭建不同的分类模型，使得不同的模型具备不同的识别能力，以满足模型融合的前提；
针对随机裁剪得到的训练数据，基于ResNeXt-50进行改进，分别搭建识别全局信息和局部信息的架构，提出“并联式”模块融合全局信息和局部信息，有效解决“串联式”模块存在的问题，有效提升了岩石分类准确性；
针对网格裁剪得到的数据，通过置信学习剔除错误标签数据以提高数据质量，再将筛选后的数据分别输入到以EfficientNet-B3与MobileNet-V3为主干的模型中进行训练，在测试阶段结合TTA策略进行滑动窗口预测，通过单张图像多个区域的预测结果进行投票得到最终预测结果，有效避免图像信息杂乱等问题带来的类别预测干扰；
针对不同训练策略的三个模型进行“硬投票”集成获得更为鲁棒的岩石分类效果，集成后的模型结果明显优于单个模型的分类结果，并且在各类别上的识别准确度都有明显优势，并且表现的更为均衡，实现所希望的鲁棒且准确的分类效果目标。
二、任务二
考虑到数据格式差异问题，将任务目标“计算岩石含油面积百分比”分解为荧光区域分割、岩石区域分割两个步骤；
针对荧光区域的面积计算，选择将图像映射至HSV空间，利用交互式的可视化方法确定最佳阈值，由此根据HSV空间的色调、饱和度以及明暗程度快速地对荧光区域进行分割，计算分割出的荧光区域面积；
针对岩石区域的面积计算，考虑到JPG格式图像的背景问题，即图像大小并非岩石的实际面积大小，故应勾勒出岩石实际所在区域，使得所计算出的岩石面积更贴近于实际。对此，首先采用高斯滤波器对数据进行降噪处理，以减少岩石内部的细节信息对轮廓检测的影响，再者根据Canny边缘检测勾勒出岩石的粗糙边界，最后通过形态学图像处理的方法，对Canny检测中未封闭的区域进行封闭处理，根据所分割出的荧光面积和岩石面积，计算实际的岩石石油含量面积百分比。

7.2 展望

由于缺少地质学有关专业知识，在所提供数据存在标签错误问题的情况下，只能依靠一些简单的观察和带噪学习算法剔除部分错误数据，这不能完全保证所训练数据或测试数据的标签一定正确。
故此，可能导致出现模型实际预测正确，却因数据被错误标记，而使得模型从结果上看起来预测“错误”的情况，致使所计算出的岩石岩性分类准确率比实际偏低（如6.3.1节中所示的65-1.bmp样本）。
因为时间有限，该任务仍有诸多思路未能够得到一一尝试和比较，仍存在诸多细节需要继续完善和改进。期待未来能有更高质量的数据图像及标签，本文所用模型和方法应该能够达到更好的效果。

你可能感兴趣的:(泰迪杯论文,深度学习,人工智能,机器学习,图像识别,图像处理)

机器学习--实现多元线性回归 y江江江江机器学习机器学习线性回归人工智能
机器学习—实现多元线性回归本节顺延机器学习--线性回归中的内容，进一步讨论多元函数的回归问题y′=h(x)+w⊤∙x+by^{\prime}=h(x)+w^\top\bulletx+by′=h(x)+w⊤∙x+b其中,wT⋅x就是W1X1+w2X2+w3X3+⋯+wNXN\text{其中,}w^\mathrm{T}\cdotx\text{就是}_{W_1X_1}+w_2X_2+w_3X_3+\cd
【人工智能】人工智能学习基础知识汇总奋力向前123 人工智能 python 开发语言人工智能
第1章初识人工智能本章主要介绍人工智能的概念、诞生和发展历程。具体包括人工智能概念的提出和涉及的相关重要人物，以及人工智能发展过程中的几个阶段，包括诞生、两次浪潮与寒冬、稳健阶段和ABC新时代。本章的主要知识点如下：人工智能概念1.人工智能英文名为“ArtificialIntelligence”,简称Al。它是用人工的方法在机器(计算机)上实现的智能；或者说是人们使机器具有类似于人的智能。2.人工
Python+DeepSeek，奔跑吧大模型 Bj陈默 python 开发语言
在当今数字化浪潮中，人工智能与编程语言的融合正以前所未有的速度重塑着技术生态。Python作为最受欢迎的编程语言之一，以其简洁易读的语法、丰富的库和广泛的应用场景，成为了无数开发者的首选。而DeepSeek，作为人工智能领域的一颗新星，凭借其强大的大模型能力，为开发者们打开了一扇通往全新世界的大门。当Python遇上DeepSeek，一场技术的盛宴就此拉开帷幕。一、为什么选择Python与Deep
线性代数导引：张量与张量空间 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
线性代数，张量，张量空间，深度学习，机器学习，人工智能1.背景介绍在现代人工智能领域，深度学习和机器学习算法的蓬勃发展，使得对数据的高效处理和表示能力提出了更高的要求。线性代数作为数学基础，为理解和构建这些算法提供了坚实的基础。而张量，作为一种高维数组的表示形式，成为了深度学习和机器学习的核心数据结构。本篇文章将从线性代数的角度出发，深入探讨张量与张量空间的概念，并阐述其在深度学习和机器学习中的重
备战蓝桥杯 Day4 差分爱coding的橙子蓝桥杯蓝桥杯算法 c++
差分(修改区间后查询)1.要点a[0]=0;for(inti=1;iusingnamespacestd;typedeflonglongll;constintN=1e5+9;lla[N],b[N],bdiff[N];//b[N]为位置查询次数数组.bdiff[N]为位置查询次数差分数组intmain(){ios::sync_with_stdio(false),cin.tie(0),cout.tie(
蓝桥杯 Java B 组之总结与模拟题练习计算机小白一个蓝桥杯 java 职场和发展数据结构
蓝桥杯JavaB组-第七天：周总结与模拟题练习Day7：周总结与模拟题练习在这一周的学习中，我们已经接触了动态规划的基本概念和常见应用。今天，我们将通过刷一些蓝桥杯的模拟题，来熟悉并巩固所学的知识，特别是动态规划的问题。一、模拟题：Fibonacci数列求余题目描述：给定正整数n，求斐波那契数列的第n项，并计算其对一个数m的余数。即：f(n)f(n)%m例如：输入n=10，m=100输出：f(10
【C/C++】后缀表达式蓝桥杯/ACM备赛奇变偶不变0727 c语言 c++开发语言蓝桥杯算法
核心考点：1.栈的应用2.字符串处理题目描述所谓后缀表达式是指这样的一个表达式：式中不再引用括号，运算符号放在两个运算对象之后，所有计算按运算符号出现的顺序，严格地由左而右新进行（不用考虑运算符的优先级）。本题中运算符仅包含+-*/+-*/。保证对于//运算除数不为0。特别地，其中//运算的结果需要向0取整（即与C++/运算的规则一致）。如：3*(5-2)+73*(5-2)+7对应的后缀表达式为：
智能图像处理平台：技术融合与实践的结晶顾北辰20 智能图像处理平台图像处理人工智能
目录项目目标项目功能用户模块图像处理模块异步任务模块技术栈数据库设计核心功能实现方式图片上传图片处理异步任务项目扩展近日DeepSeek很火，我让他给我出了个小项目练练手，带大家一起做一下，可做为毕业设计参考。在当今数字化时代，图像处理技术广泛应用于各个领域，从医学影像到社交媒体，其重要性不言而喻。本文将介绍一个智能图像处理平台的练手项目，旨在巩固Java、MySQL、SpringBoot、Red
List把特定元素排在第一位 inner_peace8 Java 总结集合 List把特定元素排在第一位
人工智能，零基础入门！http://www.captainbed.net/inner有的时候会有这样的需求，就是从数据库查出来的list要做一些处理，比如部门成员列表，产品要求你把部门经理排在第一位，这个时候就可以用集合工具类下的自带方法，做法：需要遍历集合，找到这个元素在集合中的位置，然后使用Collections.swap(list,o,i)（O：为元素目前所在位置，i：为要放置的位置）方法来
每天五分钟深度学习框架pytorch：搭建谷歌的Inception网络模块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 网络人工智能机器学习 Inception
本文重点前面我们学习了VGG，从现在开始我们将学习谷歌公司推出的GoogLeNet。当年ImageNet竞赛的第二名是VGG，而第一名就是GoogLeNet,它的模型设计拥有很多的技巧，这个model证明了一件事：用更多的卷积，更深的层次可以得到更好的结构GoogLeNet的网络结构如图所示就是GoogLeNet的网络结构，在这个网络结构中我们可以看到红色框起来的地方，他就是Inception块，
AIGC从入门到实战：揭秘 Midjourney 的提示词写作技巧 AI架构设计之禅 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIGC从入门到实战：揭秘Midjourney的提示词写作技巧作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，人工智能生成内容（AIGC）逐渐成为可能。AIGC指的是利用人工智能技术自动生成文本、图像、音乐等内容。在AIGC领域，Midjourney是一个备受关注的技术，它能够根据用户输入的提示
基于Java的自助多张图片合成拼接实战夜郎king java Java多图片合成 Java图片合成实战
目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前言在当今数字化时代，图像处理技术在各个领域都发挥着至关重要的作用。从社交媒体到电子商务，从在线教育到虚拟现实，图像的展示和处理方式直接影响着用户体验和信息传递的效率。而图片合成拼接技术作为图像处理中的一个重要分支，其应用范围广泛，需求也日益增长。在实际开发中，图片合成拼接的需求多
DeepSeek对AI领域的变革性影响分析报告芝士AI吃鱼人工智能 DeepSeek OpenAI
一、引言近年来，人工智能（AI）技术加速演进，而中国开源大模型DeepSeek的崛起，标志着全球AI竞争进入新阶段。其凭借低成本、高性能、开源生态三大核心优势，迅速成为行业焦点。本报告从技术、产业、投资、就业及未来趋势等维度，全面解析DeepSeek对AI领域的深远影响，为集团战略布局提供参考。二、技术突破：算法效率与成本革命架构创新：MOE与MLA技术优化DeepSeek采用混合专家系统（MoE
使用opencv实现深度学习的图片与视频的超分辨率人工智能研究所人工智能之计算机视觉 opencv 深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同，本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR：EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
强化学习原理与代码实战案例讲解 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1什么是强化学习？强化学习（ReinforcementLearning,RL）是机器学习的一个重要分支，它关注的是智能体（Agent）如何在环境中通过与环境交互来学习最优的行为策略。与其他机器学习方法不同，强化学习并不依赖于预先标注的数据，而是通过试错的方式来学习。想象一下，你正在训练一只小狗学习坐下。你不会给它看成千上万张“坐下”的照片，而是会给它一些指令，比如“坐下”，如果它照
OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP 村北头的码农 OpenCV opencv 机器学习人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::ml::ANN_MLP是OpenCV库中的一部分，用于实现人工神经网络-多层感知器（ArtificialNeuralNetwork-Multi-LayerPerceptron,ANN-MLP）。它提供了一种方式来创建和训练多层感知器模型，以解决分类、回归等
Pytorch实现mnist手写数字识别 Zn要学习 python
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**我的环境：语言环境：Python3.8编译器：JupyterLab深度学习环境：torch==1.12.1+cu113torchvision==0.13.1+cu113一、前期准备1.设置GPU如果设备上支持GPU就使用GPU,否则使用CPUimporttorchimporttorch.nnasnnimpo
《DeepSeek训练算法：开启高效学习的新大门》人工智能深度学习
在人工智能的浪潮中，大语言模型的发展日新月异。DeepSeek作为其中的佼佼者，凭借其独特的训练算法和高效的学习能力，吸引了众多目光。今天，就让我们深入探究DeepSeek训练算法的独特之处，以及它是如何保证模型实现高效学习的。一、独特的架构基础DeepSeek以Transformer架构为基石，但并非简单沿用，而是进行了深度创新。Transformer架构的核心是注意力机制，这让模型在处理序列数
运用python制作一个完整的股票分析系统大懒猫软件 python 开发语言 django beautifulsoup
使用python制作一个股票分析系统，可以通过股票价格走势动态界面，实时动态监测不同类型股票的变化情况。以下是一个完整的股票分析系统开发指南，包括股票价格走势动态界面和实时监测功能。这个系统将结合网络爬虫、数据分析、机器学习和可视化技术，帮助你实时监测不同类型股票的变化情况。1.系统功能概述数据采集：使用网络爬虫技术从财经网站采集股票数据。数据处理：计算技术指标（如KDJ、BOLL）并进行数据预处
《探秘AI绿色计算：降低人工智能硬件能耗的热点技术》程序猿阿伟人工智能
在人工智能飞速发展的当下，其硬件能耗问题愈发凸显。据国际能源署预测，人工智能的能源消耗可能大幅增长。因此，降低人工智能硬件能耗，实现绿色计算，已成为行业关键课题。以下是一些正在崭露头角的热点技术。新型硬件架构与材料计算随机存取内存（CRAM）：明尼苏达大学的研究团队开发的CRAM，能让数据完全在内存阵列内处理，无需离开计算机存储信息的网格，打破了传统冯·诺依曼体系结构中计算与内存之间的壁垒，可将人
Google Cloud技术学习总结谭俊杰Jerry 人工智能
GoogleCloudPlatform（GCP）是由Google提供的一套云计算服务，帮助企业和开发者利用Google的基础设施来构建、部署和扩展应用程序。GCP提供了广泛的服务，涵盖计算、存储、数据分析、机器学习和网络等领域。以下是GoogleCloud的技术总结：核心服务计算服务GoogleComputeEngine：提供虚拟机（VM）实例，支持自定义配置，适合各种工作负载。GoogleKub
本地部署DeepSeek模型技术指南 Evaporator Core apache Doris 人工智能 deepseek
DeepSeek模型是一种先进的深度学习模型，广泛应用于自然语言处理、计算机视觉等领域。为了充分利用DeepSeek模型的强大功能，许多开发者和研究人员选择在本地环境中部署该模型。本文将详细介绍如何在本地环境中部署DeepSeek模型，包括环境准备、模型下载、配置、优化以及代码实现等内容。通过本文的指导，您将能够在本地成功部署并运行DeepSeek模型。1.环境准备在部署DeepSeek模型之前，
使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南 m0_57781768 python langchain easyui
使用Python中的LangChain库优化消息长度：从聊天历史到模型性能的全面指南在现代人工智能应用中，大语言模型（LLM）扮演着越来越重要的角色，尤其是在对话系统、智能助理和其他自然语言处理任务中。然而，所有的模型都有一个有限的上下文窗口，意味着它们可以处理的输入令牌（tokens）数量是有限的。当我们需要处理较长的对话历史或复杂的任务链时，如何管理传递给模型的消息长度变得至关重要。在这篇文章
DeepSeek R1蒸馏版模型部署的实战教程 herosunly DeepSeek从入门到精通 deepseek 大模型人工智能实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
如何在Java中设计大规模稀疏数据处理架构省赚客app开发者 java 架构开发语言
如何在Java中设计大规模稀疏数据处理架构大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在大数据时代，稀疏数据在各个领域变得越来越常见，例如推荐系统、自然语言处理、图像处理等。稀疏数据通常包含大量零值或空值，直接使用传统的数据处理架构可能导致效率低下，内存和计算资源浪费。因此，设计一个高效的稀疏数据处理架构成为Java开发者面临的关键挑战。本文将探讨如何在Java中
【信息系统项目管理师】高分论文：论信息系统项目的整合管理（移动警务通系统）数据知道软考高级高项备考高项信息系统项目管理师备考信息系统项目管理师项目整合管理
更多内容请见：备考信息系统项目管理师-专栏介绍和目录文章目录正文1、制定项目章程2、制定项目管理计划3、指导与管理项目工作4、管理项目知识5、监控项目工作6、实施整体变更控制7、结束项目或阶段正文2022年2月，我有幸作为项目经理参加了“某市公安移动警务通系统”项目的建设工作，该项目投资675万元，建设工期为1年，该项目是公安部“金盾工程”重点项目。该项目充分利用公安信息资源，以移动通信网络为依托
Open3D(C++) 可视化绘制平面模型后端架构魔术师 c++平面开发语言编程
Open3D(C++)可视化绘制平面模型Open3D是一个现代化的3D图像处理引擎，它包含很多常用的3D操作，如点云分割、重构、配准等。其中，在可视化方面Open3D也提供了一系列方便易用的函数和接口。在本篇文章中，我们将介绍如何使用Open3D绘制一个简单的平面模型并进行可视化展示。下面是完整的源代码：#include#includeintmain(){//创建平面顶点std::vectorve
DeepSeek R1 vs ChatGPT o1 实测 7 大场景终极对决网络安全我来了人工智能 AI chatgpt
R1vso1：7大场景终极对决引言你需要的不是「最好」，而是「最合适」想象一下，你面前有两把瑞士军刀：一把刀锋锐利但功能单一，另一把功能繁多但需要时间磨合。你会怎么选？人工智能模型的选择也是如此。DeepSeekR1和ChatGPTo1就像这两把军刀，它们的胜负不在绝对强弱，而在场景适配。根据实测数据，我们将通过编程、教育、创意等7个战场，解剖这两大AI巨头的真实战斗力。一、语言战场当AI成为「读
【AI日记】24.10.30 做项目的一些前期准备工作 AI完全体 AI日记人工智能机器学习自然语言处理 langchain 日记读书学习资源
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】工作工作1内容：看AI大佬访谈B站地址：SamAltman最新5月播客长篇访谈|@All-In播客2024.5.11时间：1.5小时评估：继续工作2内容：思考如何开始自己的RAG项目时间：0.5小时决定：采用搭积木的方法来做自己的RAG项目。从最基础的开始，不断学习各种RAG和NLP相关的技术，然后不断加入到自己的项目中，而不
计算机视觉如何快速入门? Frunze软件开发日常问题回答开发语言计算机视觉工业异常检测论文
目录1.明确研究方向2.学习基础知识3.掌握核心算法4.实践项目5.阅读文献6.复现经典论文7.改进与创新总结计算机视觉（ComputerVision）是一个复杂且广泛的领域，尤其是工业异常检测这种特定方向，需要结合理论知识和实践技能。以下是一些具体的、可操作的建议，也是个人实际路径的一个总结，希望可以帮助到你快速入门并完成一篇论文。1.明确研究方向-工业异常检测的核心是识别图像或视频中的异常区域
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开