_晟_

X-ray 综述

Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imag

面向自动的危险品检测：X 射线安检图像中深度学习进展的调查

论文链接

Abstract

X-ray被广泛应用于维护航空、运输安全，这篇综述旨在将该领域分为机器学习和深度学习来回顾X-ray的发展历程，第一部分为机器学习方法，第二部分为深度学习方法，其中深度学习中又分为监督学习和无监督学习，依次探讨了对象的分类，检测，分割和异常检测任务。最后，讨论了X-ray的数据集并提供了性能指标，以及未来的发展趋势和方向。

1. Introductionf

这段就是说，X-ray检测很重要，以前人们使用图片分析法和机器学习方法，现在开始用深度学习了，下图是调查结果：

本文的主要贡献

分类——X 射线安检图像中经典机器学习和当代深度学习的概述（图 2）。
数据集——用于在该领域训练深度学习方法的大型数据集的概述。
开放性问题——根据计算机视觉领域的当前趋势讨论开放性问题、当前挑战和未来方向。

后面内容：

第 2 节简要介绍了 X 射线成像的原理。
第 3 节和第 4 节介绍了用于衡量性能的数据集和评估标准。
第 5 节和第 6 节探讨了传统的图像分析和机器学习算法。
第 7 节回顾了深度学习算法在 X 射线安检图像中的应用。
第 8 节讨论了未解决的问题、当前的挑战
第 9 节最后总结了本文。

2. Background: X-ray Imaging

X 射线成像的主要原理是 X 射线管产生穿透扫描对象的光束。

如图 3A 所示，X 射线成像的主要原理是 X 射线管产生穿透扫描对象的光束。根据其材料密度，物体会衰减 X 射线信号。该衰减公式为 $I_x=I_0e^{\mu x}$ ，其中是 cm 处的强度，是初始强度， $\mu$ 是基于材料的线性衰减系数。这个公式表明材料密度和测量强度成反比——例如，高密度材料产生高衰减和低测量强度。

现代 X 射线机配备了多个能量 (m) ，可通过不同的能量产生 m 个 X 射线图像（图 3B），识别物体的密度和有效原子序数 ( $Z_{eff}$ )。估计的强度和 $Z_{eff}$ 值通过查找表 [29] 转换为伪彩色图像。除了多个能级之外，最先进的机器还从多个视点生成 X 射线扫描，以从各个角度查看感兴趣的对象（图 3C）。

3. Datasets

3.1. Durham Baggage (DB) Patch/Full Image Dataset

3.2. GDXray

3.3. UCL TIP

3.4. SIXray

3.5. Durham Baggage Anomaly Dataset –DBA

3.6. Full firearm vs Operational Benign –FFOB

3.7. Compass - XP Dataset

3.8. OPIXray Dataset

4. Evaluation Criteria

true positives (TP), false positives (FP), true negatives (TN) and false negatives (FN).

准确率。 (ACC) 定义为预测样本中预测正确数占所有样本数的比例

$ACC=\frac{TP+TN}{TP+TN+FP+FN}$

真阳性率。 (TPR)是正确预测的正样本的比例

$TPR =\frac{TP}{TP+FN}$

假阳性率。 (FPR) 计算为预测为正的负样本的比率

$FPR = \frac{FP}{FP + TN}$

均值平均精度。 (mAP) 定义为平均精度的平均值，这是一个由精度和召回曲线下面积评估的指标，其中精度为 TP/(TP + FP)，以及
召回率是 TP/(FN + TP)。

mAP = 所有类别的平均精度求和除以所有类别

曲线下面积。 (AUC) 是receiver operating characteristics (ROC) 曲线下的面积，
ROC曲线的横坐标为FPR(False Positive Rate), 纵坐标为TPR(True Positive Rate)。

5. Conventional Image Analysis

本节探讨执行图像增强和危险性图像投影的传统图像分析技术。

5.1. Image Enhancement

预处理输入数据对于产生更高质量的图像起着重要作用，从而提高了筛查仪和计算机的可读性。
文献中常用的方法是融合低能和高能 X 射线图像并应用背景减法来降噪，其次是手动或自适应阈值选择。
另一种增强技术是伪着色，可以对灰度 X 射线图像进行着色，提高检测性能和操作人员的警觉性水平。

5.2. Threat Image Projection

危险图像投影 (TIP)（危险品图像注入）是另一种可以归类为传统图像分析的方法。

TIP 用于生成合成数据集以训练人工筛选器或机器/深度学习模型。
一种常见的 TIP 方法是通过乘法将二进制危险掩码投影到良性输入 X 射线图像上，从而生成带有危险项目的输出 X 射线图像。
仿射或对数变换的应用将各种危险投影添加到良性图像上。

6. Machine Learning Approaches in X-ray Security Imaging

6.1. Object Classification

在深度学习在该领域占据主导地位之前，视觉词袋（BoVW）方法很普遍。
常见的方法是：
(i) 通过检测器/描述符执行特征提取，(ii) 通过 k-means 对特征进行聚类，(iii) 用 RF、SVM 或 sparse-representation 进行分类。

另外，其他计算机视觉/机器学习技术：
利用结构估计和分割以及通用跟踪算法来检测 X 射线对象。也有基于 k-NN 的稀疏表示，实现了 GDXray 数据集上的深度模型相当的精度。

6.2. Object Detection

与第 6.1 节类似，传统的检测算法也主要采用视觉词袋（BoVW）方法。

各种特征描述符表明，稀疏强度域图像描述符（SPIN）实现了最高的检测性能（mAP：46.1%）。

利用多视图图像，多视图成像有助于人类操作员和机器提高检测性能。 [48,50,52,112] 的工作中提出的通用多阶段方法最初通过特征描述符和 k-NN 分类器 [113] 执行特征提取。从不同视图匹配的特征由 k-NN 分类器[113]（95.7% 精度）进行分类。

6.3. Object Segmentation

本节探讨文献中提出的各种分割技术。
[58, 59] 研究了具有固定绝对阈值和区域分组的简单的基于像素的分割
[13、19、20、60、61] 随后的工作，更多地关注通过最近邻、重叠背景去除和最终分类的预分割
另一种方法是利用基于图的算法进行分割。
[61, 114] 早期的工作集中在属性关系图之间的模糊相似性距离上，而最近研究了光谱聚类和变分图像分割 [115]。

7. Deep Learning in X-ray Security Imaging

本节回顾了利用深度学习算法的x射线安检应用。将算法分类为有监督（分类、检测和分割）和无监督（异常检测）方法。

7.1. Supervised Approaches

监督方法分为分类、检测和分割任务，其中模型分别使用ground-truth、bounding-box和pixel-wise labels。

7.1.1. Classification

简单的说就是深度学习比传统方法好。

[66]中探索使用双能 X 射线图像进行自动危险品检测。
作者研究了应用于不同变换，通过双能 X 射线机拍摄的 X 射线图像。使用 UCL TIP 数据集，通过 256 × 256 的滑动窗口生成 640,000 个图像块。使用具有不同输入通道的固定 VGG-19 网络训练该数据集，包括单通道 (H)、双通道({H, − log H}, {− log H, − log L}) 和四通道 ({− log L, L, H, − log H}) 表明双通道和四通道始终比它们的单通道变体实现卓越的检测性能（ACC：95%–双通道 vs 90%–单通道）。

受 X 射线数据集有限可用性的启发，
[69] 提出了一种三阶段算法。第一阶段通过从输入图像中提取的前景对象的角度信息对输入的 X 射线数据集进行分类和标记。第二阶段通过对抗网络生成新的 X 射线对象。最后，用小型分类网络分类。

后续[101] 进一步研究改进 GAN 训练以产生更好的 X 射线图像的方法。

[71] 引入一个模型（CHR）来分类/检测来自 SIXray 的 X 射线图像。该模型通过从三个连续层中提取图像特征来解决类别不平衡和杂乱问题，
其中后续层被上采样并与前一层连接。
在 SIXray 上与 ResNet-101 一起使用时，使用建议的损失训练模型会产生 2.13% 的 mAP 改进（36.01 与 38.14）。

[96] 引入了一个即插即用模块，该模块利用边缘和材料信息通过注意力机制定位对象。
研究了使用 CNN 进行爆炸物检测的任务。初始阶段通过固定图像大小、裁剪 $Z_{eff}=0$ 的不相关背景对象并应用数据增强变换来处理输入数据。
随机初始化与 VGG19、Xception 上的预训练的评估，和 InceptionV3 网络表明，随机初始化的模型在二元分类任务中实现了卓越的准确性。
为了研究强度和 Z-eff 值对性能的影响，作者在强度和 Z-有效、仅强度和仅 Z-有效方面训练了三个 VGG-19 网络。
仅使用 Z-eff 训练模型可以产生最高的准确度。
最后一组实验通过热图研究定位，并表明预训练网络实现了卓越的性能，因为随机初始化的网络往往会在小数据集上过拟合。

[67] 研究使用来自各种扫描仪的不同数据集训练的模型的泛化能力。
作者从单个或多个域创建训练和测试，以研究在其他模型之间转换的影响。

7.1.2. Detection

本节通过分类单视图和多视图目标检测来探索基于 CNN 的目标检测算法。

单视图检测。

[72] 在 DBF2/6 数据集上训练基于滑动窗口的 CNN、Faster RCNN 和 R-FCN 模型，用于枪支和多类检测问题。实验表明，带有 VGG16 的 Faster RCNN 在 6 类 DBF6 数据集上产生 88.3% 的 mAP，而带有 ResNet101 的 R-FCN 在 2 类（枪与无枪）DBF2 数据集上实现了最高性能（96.3 mAP）。

[129] 利用对抗域适应技术来匹配相当大的 unlabelled stream of commerce (SoC) 数据集的背景分布。
这样做有助于通过在小型标记数据集上训练 Faster RCNN 来检测 SoC 数据集中的对象。

[77] 在 SIXray10 数据集上训练 SSD 和 RetinaNet，分别达到 60.5% 和 60.9%。

[75] 通过 YOLOv2 执行目标检测，以检测 SASC 数据集上的剪刀和气溶胶。
训练 YOLO v2 进行 6000 次迭代可产生 94.5% 的平均精度和 92.6% 的召回率，运行速度为 68 FPS。

[76] 认为 RetinaNet 实现了相当的检测性能，使用 5000 个 X 射线货物集装箱和 544 支枪械通过 TIP 合成生成的 30,000 张图像进行训练时，比传统的滑动窗口分类要快得多。

[74] 提出了一种目标检测算法，其中 RoI 是通过级联多尺度结构张量生成的，该张量基于目标方向的变化进行提取。
然后将提取的 RoI 传递到 CNN，其在 GDXray 和 SIXray 数据集上的定量和计算性能优于 RetinaNet、YOLOv2 和 F-RCNN。

[78, 132] 中的方法生成基于轮廓的目标候选框，随后将其前向传递到 CNN，在 SIXray10 数据集上实现 96% 的 mAP。

由于部分数据集缺乏标记信息
[70] 利用注意力机制来定位危险物品。
第一阶段前向传递输入并找到相应的类概率。反向传播时识别在输出类决策期间激活的互连神经元。生产第一个卷积层激活生成的热图。
最后阶段将前一层激活后进行归一化来细化激活图。所提出的方法在不需要边界框信息的情况下实现了出色的检测。
与传统的反卷积方法（mAP：34.3%）这个篇文章：（56.6%）。

[82]研究了CNN的泛化能力。通过在不同数据集上训练/验证 CNN（DBF3 (88% mAP) → SIXray (85% mAP)）。

多视图检测。 有许多论文利用多视图 X 射线图像来提高其模型的检测性能。

多视图优于单视图，

[100. 2018] 探索了 F-RCNN、R-FCN 和 SSD 在单视图/多视图 X 射线图像中的性能。通过合并来自单个视图的目标检测输出，利用 OR-gate 检测，表明多视图优于单视图（使用 R-FCN 和 ResNet-101 训练时为 0.938 对 0.798）。

[133] Two-stage, 首先提取前景物体，随后利用 F-RCNN 检测 32、253 张地铁 X 射线图像，6 个物体类别的 mAP 为 77%。

[80] 通过在包含 4 个危险品类别的数据集上进行训练来探索 SSD 和 F-RCNN，每个危险品类别包含大约 3、400 张图像。
具有 Inception ResNetv2 主干的 F-RCNN 产生最高的 mAP（在单视图和多视图图像上分别为 92.2 和 97.7）。

[79] 通过修改 F-RCNN 来利用多视图。多视图池化层构造从卷积层中提取的 3D 特征 2D。3D 区域提议网络生成 RoI。在 3D RoI 池化层之后执行分类和边界框预测。实验表明，与单视图图像相比，多视图产生了改进（95.56% 对 91.23%）。

[81] 通过利用 X 射线图像多视图的对极约束来训练 YOLOv3 [117] 检测器，其性能优于单视图 2.2%（图 4C）。

R-FCN 和 ResNet-101 单视图0.798，多视图0.938

Two-stage 方法[Deep Convolutional Neural Network Based Object Detector for X-Ray Baggage Security Imagery,2019], mAP 为 77%

Toward Automatic Threat Recognition for Airport X-ray Baggage Screening with Deep Convolutional Object Detection，2019， 4 个危险品类别的数据集，以Inception ResNetv2 主干的 F-RCNN ，单视图92.2 ；多视图97.7

Multi-view Object Detection Using Epipolar Constraints within Cluttered X-ray Security Imagery，2020，
多视图 YOLOv3，多视图优于单视图 2.2%

7.1.3. Segmentation

由于具有像素级注释的数据集稀缺，分割任务在该领域内的研究不足。（2019）

[83] 将分割和异常检测任务一起解决，其中双 CNN 管道最初通过 Mask RCNN 分割 RoI，并通过 ResNet-18 将区域分类为良性/异常，达到 97.6%分割 mAP 和 66.0% 的异常检测精度（图 4D）。

134]提出了三阶段方法，其中（i）通过使用Mask RCNN 实现对象级分割，（ii）通过超像素分割对子组件区域进行分割，以及（iii）最终对象分类是通过细粒度的 CNN 分类执行的，总体上对 7, 878 个电子项目产生 97.91% 的异常检测准确率。

[135]提出了一种在编码器-解码器分割网络中利用双重注意机制的分割模型。前一个注意模块对 RoI 进行分类，而后者则对对象进行定位。在 PASCAL 类似的结构化 X 射线数据集上进行的实验包含来自 7 个类别的 7、532 张增强图像，产生 99.3 的准确度和 68.3 的平均交叉联合 (mIoU)。

7.2. Unsupervised Approaches

本节探讨无监督深度学习模型，其中提出的算法主要研究异常检测任务。

[86]以无监督的方式采用稀疏前馈自动编码器来学习正常和异常数据的特征编码。然后，SVM 将图像分类为异常或良性。对 MNIST 和货运集装箱数据集（空与非空）的验证表明，从自动编码器中提取的隐藏层表示对于检测图像中的异常具有重要意义。当与原始输入和残差融合时，来自隐藏层的特征编码会产生更好的检测性能。
后续工作利用从 UCL TIP 数据集的补丁中提取的强度、对数强度和 VGG-19 特征，并通过随机分裂树异常检测器的森林训练正常图像。在正常 + 异常数据上测试模型产生 64% AUC。

[89]其中图像和潜在向量空间针对异常检测进行了优化，利用了对抗网络，使得生成器包括编码器-解码器子网络。该模型的目标是最小化真实/生成图像及其潜在表示之间的距离，总体上在统计和计算上都优于以前的最新技术（UBA：64.3%，FFOB：88.2% – AUC ）。

[90] 通过 (i) 利用生成器网络中的跳跃连接来处理更高分辨率的图像，以及 (ii) 学习鉴别器网络中的潜在表示，进一步提高 [89] 的性能（UBA：94.0% , FFOB: 90.3% – AUC)。

[91] (i) 首先从 Inception v3类似网络中提取正常图像的特征，(ii) 随后训练多元高斯模型以捕获 CAST 数据集的正态分布。测试样本的异常分数基于其相对于模型的可能性，总体产生 92.5% AUC。

8. Discussion and Future Directions

数据集。缺乏大型数据集，这限制了深度模型训练。因此必须构建大型、同质、现实和公开可用的数据集，
可以通过 (i) 在实验室环境中手动扫描具有不同对象和方向的行李箱 (ii) 通过算法生成合成数据集来扩充。但消耗人力和时间

合成数据集的方法，TIP或GAN,
TIP 会影响真实示例的检测
GAN 无法生成完整的 X 射线图像，生成的图像质量不真实。

需要进行进一步的研究。通过使用当代 GAN 算法创建更逼真的 X 射线图像。

利用多视图信息。多视图比单视图检测性能更好，需要进一步研究利用多视图图像的其他方法。

X 射线扫描仪之间的域自适应。由于扫描仪的未知内在特性，在不同扫描仪之间传输模型可能具有挑战性。
未来的工作将利用域适应，其中源域包含来自一个扫描仪的图像，而目标域将是另一个 X 射线扫描仪的图像。即使使用不平衡的数据集进行训练学习，也可以从一个映射到另一个。

改进无监督异常检测方法。 7.2节中的方法在实际场景中部署时有一定的限制。

材料信息的使用。在双能X-ray系统中，高能和低能在不同材料上的衰减并不相同，应进一步研究不同材料信息对于能量衰减的反应

9. Conclusion

本文对 X 射线安检图像中使用的传统机器和现代深度学习算法进行分类。
传统方法包括图像增强、危险性图像投影、分割、特征提取、分类和检测。
深度学习方法包括在该领域应用的分类、检测、分割和无监督异常检测算法。

未来发展方向的几个结论。尽管最近出现了数据集，但缺乏大型、平衡的数据集，限制了深度学习算法的设计，这些算法具有足够的通用性，可以部署在实时环境中。此外，由于公共数据集大多来自具有不同内在特性的各种机器，因此使用领域适应技术可以提高算法的泛化能力。

与传统机器学习中的大量研究不同，最近的大多数方法都没有充分利用 X 射线成像，例如多视图几何和高低能量。尽管存在一些研究，但仍有进一步研究的空间。此外，无监督学习的研究可以进一步利用现有的未标记且未使用的 X 射线数据集。

多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
「源力觉醒创作者计划」_文心大模型开源：开启 AI 新时代的大门小黄编程快乐屋人工智能
在人工智能的浩瀚星空中，大模型技术宛如一颗璀璨的巨星，照亮了无数行业前行的道路。自诞生以来，大模型凭借其强大的语言理解与生成能力，引发了全球范围内的技术变革与创新浪潮。百度宣布于6月30日开源文心大模型4.5系列，这一消息如同一颗重磅炸弹，在AI领域掀起了惊涛骇浪，其影响之深远，意义之重大，足以改写行业的发展轨迹。百度这次放大招，直接把文心大模型4.5开源了，这操作就像往国内AI圈子里空投了一个超
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
mediapipe流水线分析三江太翁 Android NDK 人工智能 mediapipe android
目标检测Graph一流水线上游输入处理1TfLiteConverterCalculator将输入的数据转换成tensorflowapi支持的TensorTfLiteTensor并初始化相关输入输出节点，该类的业务主要通过interpreterstd::unique_ptrtflite::Interpreterinterpreter_=nullptr;实现类完成数据在cpu/gpu上的推理1.1Tf
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
使用大模型预测胃穿孔的全流程系统技术方案大纲
目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。