龙腾亚太

基于迁移学习和注意力机制的伪装图像分割

源自：系统工程与电子技术

作者：吴涛王伦文朱敬成

摘要

不同于常规目标, 伪装目标特征模糊、尺度信息复杂多变、检测和分割难度更高。在现有伪装数据集基础上, 提出了一种结合迁移学习和有效通道注意力的UNet网络伪装图像分割方法。首先, 针对伪装目标特征模糊难以有效提取的问题, 在UNet的下采样和上采样过程中, 引入一种有效通道注意力机制, 在不增加网络参数的同时, 提高有效区域的特征权重; 并将在ImageNet预训练好的视觉几何组(visual geometry group, VGG)系列网络迁移到UNet网络中, 实现特征迁移和参数共享, 提高模型的泛化能力, 降低训练效果对数据集的依赖, 减少训练成本; 在训练过程中引入FocalLoss函数, 增加难挖掘样本权重, 提高对困难样本关注度; 最后通过解码网络得到分割结果。在CHAMELEON、CAMO和COD10K数据集上进行了测试, 相比原始算法, 性能指标有显著提升。

关键词

伪装图像 ; 图像分割 ; 注意力机制 ; 迁移学习

引言

自然界中, 伪装是一些动植物赖以生存的基本技能。变色龙被认为是自然界里的伪装高手; 枯叶蝶在处于危险中时, 会将自己藏于植物叶片中, 宛似一片干枯的叶子。许多动物为了躲避捕食, 会将自己很好地融入于周围的环境中, 使之不易被察觉和发现, 从而躲避被捕食的命运。颜色、整体形状和纹理, 是伪装的重要特征[1], 利用好这些特征, 就能实现与周围环境的有效融合。伪装是自然界动植物能够长久安全生存的有力武器, 被用来说明自然选择的力量[2]。第二次世界大战期间, 英军狙击手将颜料涂在作训服上, 实现自己的伪装。二战后, 德国人首先设计并研制出一种迷彩装饰衣, 在作战中发挥了较好的伪装效果[3]。作战人员伪装、作战装备伪装愈来成为军事中不可或缺的一环, 也是非常关键的一环。

对伪装的研究由来已久, 但大多是对伪装产生的机理进行研究, 与基于深度学习的目标检测和分割研究不同, 两者的侧重点不一样。在计算机视觉领域, 伪装研究, 就是从背景中识别出伪装目标的存在, 对图像进行逐像素的分类标记, 并识别出每个分割区域的语义信息, 具有重要的理论意义和实践价值。例如，在医学检测中, 对病变器官的分割等, 虽然不是属于直接的伪装范畴, 但是与伪装图像在本质上有很多相似之处; 在稀有物种检测和发掘中, 以及军事上都有着巨大的应用价值。

语义分割[4]的方法有很多, 传统的目标检测分割算法包括基于区域的分割方法、基于边缘检测的分割方法、基于阈值的分割方法[5]等。传统的分割算法虽然计算不复杂、效率高, 但是选取的特征较为简单, 大多是一些浅层的特征, 缺乏对样本数据特征的深入挖掘, 分割效果往往不是十分理想; 细节信息捕捉不够, 分割结果较为模糊; 传统分割方法还有一个较为明显的局限性，即对噪声十分敏感, 因此传统分割方法并不适用于伪装目标的研究。随着深度学习的不断发展, 利用卷积神经网络进行目标分割的研究越来越多, 并取得较好的分割效果。Carreira等人[6]在2012年提出了采用CPMC(constrained parametric minCut)进行候选区域划分的提议, 取得了较好的分割结果。后续的Girshick等人[7]、Hariharan等人[8]提出了相应的分割算法或在前者工作上进行了改进提高。由于基于候选区域的提议分割结果缺少空间信息, 小物体的分割效果不理想, 为很好地解决这个问题, Long等人[9]提出了完全卷积网络(fully convolutional networks，FCN)分割网络模型, 语义分割精度得到了很好地提升; 在FCN基础上, 许多对称分割网络被提出来, 例如SegNet[10]、UNet[11]等。

1 算法描述

本文提出的算法包括2个框架1个模块: ①利用视觉几何组(visual geometry group, VGG)迁移网络进行模型的前半部分训练, 去掉全连接层的VGG网络的下采样部分与Unet的编码网络进行了有效衔接与对应; 网络的后半部分是Unet的上采样过程, 恢复原始图像尺寸并进行预测; ②嵌入了有效通道注意力(effective channel attention, ECA) 机制模块, 对提取到的有效特征进行加权处理, 提高有效特征在网络中的权重值。

1.1 UNet网络结构

UNet是一种十分对称的端到端的分割算法, 包含了编解码2个模块。编码阶段是一段连续的下采样过程, 用于不断提取更深层次的特征信息。下采样过程主要是通过3×3的卷积层和2×2的最大池化层来实现的, 图像的尺寸不断被压缩, 特征通道数不断增加, 提取到的特征更抽象, 更丰富, 对目标的表达能力更强, 更具有鲁棒性能。但是, 由于对图像的不断压缩, 许多目标的细节信息存在丢失的问题, 所以在解码阶段, 通过上采样或反卷积的手段, 逐像素还原原图像精度, 恢复细节信息。图 1展示了UNet的网络结构, 分为编码和解码两个部分, 左侧部分用于编码, 右侧部分用于解码。

图1 UNet网络模型结构

1.2 迁移学习

迁移学习在大量的实验中被证明是一种有效的模型改进方式, 尤其是当目标数据不足时, 迁移的方式能够在小样本的情况下获得比较好的训练结果, 提升模型的训练精度和鲁棒性能。迁移学习是模型训练效果的一种泛化, 文献[12]从模型复杂性和学习算法的稳定出发, 导出了模型泛化的理论边界。

对于假设空间Φ, 定义对称差假设空间ΦΔΦ为

(1)

式中：⊕表示异或函数。则在不同分布DS, DT之间的对称差距离定义为

(2)

式中: AΦΔΦ是空间Φ的子集合。

在实际模型训练过程中, 会产生源数据训练误差和目标数据验证误差两个方面的误差。假设已知N个源域, 所有源域数据规模的总大小为m。源域j对应的数据规模为mj=βjm, 其中βj为源域j数据规模在所有数据中的占比, 且有
。在实际数据中, 不同标记在所有标记中的权重不尽相同, 所产生的误差对结果具有不同的影响。为了正确衡量误差, 使用非负向量α代表权重, 且有
。因此函数h带有权重的加权误差为

(3)

则最小风险误差为

(4)

式中: Φ是假设空间。由此, 可得出在较为理想的情况下迁移学习的理论边界:

(5)

式(5)表明迁移学习泛化边界函数收敛, 存在上边界, 说明迁移学习应用到模型训练中是可行的且有效的。

1.3 ECA注意力机制

注意力机制被广泛用在自然语言处理、计算机视觉等任务中, 是一种能提高特征权重的有效手段, 在许多实验中都表现出较好的性能[13-16]。注意力是模仿人类大脑处理大量信息时的一种机制, 即关注重点区域, 而忽视不重要的部分, 这样做的目的就是增加了有用特征的权重, 从而获得更多待分割目标的细节信息, 提高分割精度。

ECA_Net[17]提供了一种十分有效的产生特征权重的方式, 在不增加模型复杂度的情况下, 能够获得十分明显的性能增益。与SENet[18]等其他注意力机制不同的是, ECA采用不降维的方式产生权重, 避免降维对利用注意力机制学习特征十分重要; ECA利用1×1的卷积实现局部交叉通道交互策略, 卷积核的大小为k, 代表了局部通道交互的覆盖率, 这是一个超参数, 但ECA实现了对k的自适应调节。ECA网络模块如图 2所示。

图2 ECA注意力机制模块

从图 2可以看出, ECA是一种通道维度上生成特征权重的方式, 首先将输入的特征图进行全局自适应平均池化, 与SENet不同之处在于, SENet会先进行降维操作, 降低通道数量为原来的1/r。ECA避免了降维这一操作, 直接生成一组特征向量:

ECA利用1×1的卷积实现局部通道之间的交互, 卷积核的大小k_size代表了交互的覆盖率。这是一个超参数, 但ECA实现了对k的自适应调节。

(6)

对W的构造中, 有两种较为常见的方式:

(7)

在第一种方式中采用的是对角矩阵的方式, 第二种则是一个完全矩阵。这两种方式的区别在于第二种矩阵权重之间存在交互, 采用对角矩阵的方式则权重之间相对独立。如果卷积核大小设置为k, 则经过卷积之后得到的向量为

(8)

2 网络结构

2.1 迁移学习网络

深度学习需要大量高质量的标注数据, 可以通过迁移学习[19]的方式, 在已有的大规模优质数据集上进行预训练, 将预训练的结果迁移到待分割的网络中, 可以实现特征迁移和参数共享, 提高模型的泛化能力, 降低训练结果对数据集的依赖, 减少训练成本, 并通过微调的方式, 将部分网络层加入到新的网络中进行训练, 以更好适应新网络特性。

观察VGG[20]网络结构可知, VGG系列网络与Unet网络具有十分类似的上采样结构, 可以不改变Unet网络的基本结构而进行网络的迁移学习。VGG系列包含了VGG11、VGG13、VGG16和VGG19等。VGG相较于AlexNet[21], 采用了连续的小卷积核代替大卷积核, 大大减少了训练参数, 保证了在增加网络深度时仍具有很好的学习能力。VGG网络结构如表 1所示(不包含全连接层)。

表1 VGG系列模型各层结构及参数

2.2 模型改进

由于伪装目标特征模糊, 与背景融合度较高, 目前运用深度神经网络进行伪装图像分割的研究较少, 伪装图像分割任务的准确程度还不是很高。本文将经典的基于深度卷积神经网络的算法在伪装图像分割中进行了诸多尝试, 并对其中的UNet模型进行了相关改进, 以适应伪装目标分割任务, 提高分割精度，如图 3所示。

图3 改进后的模型

本文对于UNet的改进点在于:

(1) 针对伪装目标特征模糊的问题, 本文在网络编码-解码阶段均引入了有效通道注意力ECA, 将其嵌入到UNet的采样过程中, 贯穿模型训练全过程, 使模型在训练过程中能始终关注目标区域, 很大程度上克服了伪装图像因其目标“被伪装”而带来分割上的困难;

(2) 利用在大型数据集ImageNet上预训练的VGG模型, 将其训练参数和训练特征迁移到伪装目标分割网络, 实现特征迁移和参数共享, 提高网络的泛化能力, 减小模型对训练样本的依赖, 降低训练成本。

3 实验过程及结果分析

3.1 实验条件设置和数据集

实验计算机配置如下: Intel® Core™ i7-9700 CPU @3.00 GHz, GeForce 1060Ti GPU (6 GB显存) 的Windows操作系统。实验采用pytorch架构, 在训练过程中, 采用AdamW优化器进行优化, 采用FocalLoss损失函数。具体实验细节如表 2所示。

表2 实验参数

本次实验采用公开的COD10K[22]数据集, 该数据集是专门针对伪装目标研究而制定的, 包含了海洋生物、陆地生物、两栖动物以及飞禽等共69个类别, 物种丰富, 涵盖范围广泛; 其中训练数据集6 000张, 测试数据集4 000张, 为提高算法模型的鲁棒性, 数据集中还包括非伪装目标数据4 934张。表 3和图 4展示了训练集和测试集中伪装目标和非伪装目标的统计情况。

表3 训练和测试数据集统计信息

图4 数据集种类与尺度大小分布

同时, 算法还在其他2个公开数据集上进行测试。其中CHAMELEON[23]数据集共有图片76张, CAMO[24]数据集共有图片2 500张。图 5是伪装数据的部分展示。

图5 部分伪装数据集

3.2 FocalLoss损失函数

FocalLoss[25]不同于交叉熵损失, 通过添加系数调节难易样本的损失权重。在类别不平衡问题中, 交叉熵损失对所有样本赋予相同的关注, 使得一些难分、错分的样本很难被挖掘出来。FocalLoss通过添加调节系数, 降低易分样本的权重, 提高难分、错分样本的损失值比重, 使得模型在训练时对这类样本赋予更多的关注。伪装目标在检测过程中, 由于特征模糊, 难分错分的概率非常大, 因此实验中采用FocalLoss作为损失函数, 对难例样本进行挖掘。

(9)

式中: αt和γ是权重调节系数, 通过改变调节系数可增加对难挖掘样本的关注程度。pi 表示分类概率, pi越大, 表示样本被正确分类的概率越大, 1-pi 就会越小, 所以αt和γ对权重起到了很好的调节作用, 可以控制样本分类比重。

3.3 评价指标

为了更好对比不同算法之间的性能, 对改进后的模型进行合理正确的评估，我们在CHAMELEON、CAMO、COD10K3个数据集下采用以下指标进行衡量。

混淆矩阵: 混淆矩阵是具有特定布局的统计类表格(见表 4), 所有其他评价指标都是基于混淆矩阵基础上的衍生。

表4 混淆矩阵

TP: 真阳性, 表示标签是伪装图像, 且预测为伪装图像的像素点数;

FP: 假阳性, 表示标签是背景, 但预测为伪装图像的像素点数;

TN: 真阴性, 表示标签是背景, 且预测为背景的像素点数;

FN: 假阴性, 表示标签是伪装图像, 但预测为背景的像素点数。

可以计算出, TP+TN是表示正确分类的像素总数量, TP+FN表示图像像素的总数量, FP+TN表示背景像素的总数量。通过以上计算可以得出以下衍生指标:

像素精度(pixel accuracy, PA): 像素精度是衡量分割效果的最直接的衡量指标, 代表的含义是分类正确的像素数量之和在所有像素数量中的占比。像素精度一定程度上能够反映出衡量的好坏, 但存在一个明显的问题，当图像中正负样本极不均衡, 负样本的数量远远大于正样本数量时, 就会出现在完全预测为负样本的情况下有很高的像素精度值的情况, 所以PA存在很高的下限值。计算公式如下:

(10)

也可以写成如下形式:

(11)

式中: k表示所有待分割的对象的类别; pii表示正确分类的像素; 图片表示所有被正确分类的像素数量之和; pij表示类别是i但对分割像素的预测结果为j, 表示所有像素的数量之和。实验中, 只包含伪装目标这一语义分割对象, 分割结果单一, 所以对k的取值为1。

敏感度(Sensitivity): 在分割任务中, 可以用敏感度表示召回率, 两者具有相同的含义。

(12)

重合率(Dice): 重合率是衡量分割性能好坏的合理有效的指标, 是两个物体重合度的一种测量, 表示两个物体相交的面积占总面积的比值, 是交并比(intersection over union, IoU)的另一种表达形式。

(13)

为了保证Dice的值域在0到1之间, 添加了调节系数2, 计算后得到的结果就能确保落在0到1之间。

本文通过上述指标对比分析所提算法预测的值与真实标签值之间的差异, 上述指标值愈大, 预测的精度越高, 性能越好。

3.4 实验及结果分析

3.4.1 Canny检测算法

本文首先基于传统算法—Canny算法[26]对伪装目标进行检测。在给定的伪装图像数据集中, 部分显著图像轮廓十分清晰, 与背景的区分度比较大, 使用传统的边缘检测算法能够取得比较好的检测效果。首先对图像进行灰度化处理, 得到原图的灰度图; 然后通过降噪处理, 传统的检测算法受噪声影响普遍较大, 所以为了得到较好的检测处理效果, 先需要进行降噪处理; 接着, 检测图像的边缘, 图像的边缘是图像中梯度下降最快的地方; 最后通过设置不同的阈值对检测的像素进行阈值筛选, 低阈值取50, 高阈值取150, 筛选出图像中目标的强边缘像素, 即大于高阈值的边缘像素, 对低于低阈值的边缘像素进行剔除。对显著和伪装目标的分割结果如图 6所示。

图6 传统算法检测显著与伪装目标效果对比

从图 6中可以看到, Canny算法对显著图像的检测效果十分理想, 能够十分清晰地勾勒出目标的轮廓; 但对于伪装目标而言, 传统的算法难以有效发挥其检测性能, 由于伪装目标与周围环境高度融合, 背景噪声大, 特征模糊难以提取, Canny算法并不能很好地提取目标的位置信息和轮廓信息, 说明了伪装目标相对于显著目标, 检测难度更大。

3.4.2 γ取值对结果的影响

FocalLoss中不同值代表了赋予样本损失值不同的权重, 值越大, 表明对困难样本的关注程度更高, 本文探究了不同的γ对伪装目标分割精度的影响。

从表 5和图 7中可以看出, 当在训练过程中提高困难样本的权重时, 能够一定程度上提高模型对伪装目标的分割效果。相较于其他数值, 当γ=2时分割效果较好。

表5 不同γ在测试集上的定量评测结果

图7 不同γ对于分割结果的影响

3.4.3 改进模型的实验结果

同时, 对VGG系列VGG11、VGG13、VGG16和VGG19等4种不同深度的网络进行了实验, 这4种网络都在大型数据集ImageNet上进行了预训练, 对这4种网络进行迁移学习, 共享其参数和特征。实验对比结果如表 6所示。

表6 不同迁移模型的定量评测结果

实验结果表明, 在这4种VGG模型中, 19层的模型结构对伪装图像的分割效果优于其他模型，如图 8所示。

图8 不同的迁移模型对分割结果的影响

在上述对比结果下, 本文模型选用了权重系数γ为2, 迁移模型选用VGG19, 并在CHAMELEON、CAMO、COD10K 3个数据集上分别进行了验证, 与FCN8s、SegNet、UNet模型对PA、Dice和Sensitivity指标值进行了定量对比分析。实验结果如表 7和图 9所示。

表7 不同模型的定量评测结果

图9 不同模型在3个验证数据集上的Dice和Sensitivity

从表 7和图 9中可以看出, 改进后的模型相较于改进前的模型, 在性能上具有大幅度提升, 相较于其他模型, 部分数据集上具有较大提升，说明了改进后的模型的有效性。图 10和图 11展示了不同模型的分割结果图, 改进后的模型具有更好的分割效果, 分割结果的细节信息更加明显。

图10 不同模型的分割结果对比

图11 选择的部分分割结果

4 结论

基于UNet基础模型, 提出了一种结合迁移学习和注意力机制的UNet分割方法。在伪装目标分割研究中, 迁移学习的方式, 能够实现参数共享和特征迁移, 减小训练结果对样本数据的依赖, 降低训练成本; 在网络的上采样过程中嵌入注意力机制, 能够提高有效特征权重, 提高模型分割精度。改进后的模型在一定程度上能够实现对伪装目标的分割。通过对实验数据的分析得知, 与改进前的UNet相比, 在CAMO、CHAMELEON和COD10K上进行验证, 改进后的模型在Dice和Sensitivity指标上有了显著提升。

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨，并不意味着支持其观点或证实其内容的真实性。版权归原作者所有，如转载稿涉及版权等问题，请立即联系我们删除。

【Java】已解决java.sql.SQLRecoverableException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
IT 行业深度洞察：从技术革命到产业重构的全景图谱 XQR.小白重构
摘要本文系统梳理IT行业的发展脉络，深入剖析云计算、人工智能、大数据、物联网等核心技术的演进逻辑与协同效应，揭示IT产业在数字化转型浪潮中的生态重构与价值创造。通过典型案例分析与数据支撑，探讨行业面临的技术挑战、伦理困境与全球化竞争格局，展望IT技术如何持续驱动社会变革与产业升级。全文结合2025年最新技术动态与市场趋势，为从业者、投资者与研究者提供兼具理论深度与实践指导的行业参考。目录摘要一、I
探索Gemini Balance：Google Gemini API的代理与负载均衡解决方案几道之旅人工智能智能体及数字员工负载均衡运维人工智能
引言在人工智能领域，API的高效使用和管理至关重要。尤其是当涉及到Google的GeminiAPI时，为了实现更稳定、更高效的服务，我们需要一个强大的代理和负载均衡工具。今天，我们就来深入了解一下GeminiBalance这个开源项目，它为GeminiAPI的使用提供了全面而灵活的解决方案。项目概述GeminiBalance是一个基于PythonFastAPI构建的应用程序，主要用于提供Googl
意识边疆保卫战：22：47深圳AI-BioFab人机融合危机全息实录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《意识边疆保卫战：22：47深圳AI-BioFab人机融合危机全息实录》副标题：机械义肢产线惊现神经突触叛乱，中国科学家激活甲骨文量子纹重写人类认知主权2025年7月2日22：47光明科学城脑机接口中心急电负五层神经植入舱突爆血雾！为边防军人陈默安装的AI机械臂在神经接驳瞬间剧烈震颤，量子脑电图
时空屏障崩塌：14:28深圳AI-BioFab平行宇宙保卫战全纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《时空屏障崩塌：14:28深圳AI-BioFab平行宇宙保卫战全纪实》副标题：抗癌疫苗冷链门关闭前3秒遭量子生物武器袭击，中国科学家启动长城时空盾改写人类文明存续方程2025年7月2日14:28:57光明科学城虫洞警报第184支疫苗即将注入液氮罐的刹那，B3层量子钟突现重影！14:28/15:4
实时直击：全球首座AI-BioFab工厂72小时全息记录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《实时直击：全球首座AI-BioFab工厂72小时全息记录》副标题：2025年7月2日深圳现场——癌症疫苗11天定制神话如何改写万亿生物经济规则本报深圳2025年7月2日电（记者徐远舟）此刻，位于光明科学城负三层的无菌车间内，液态机器人正将第4,817管CRISPR编辑液注入微流控芯片。墙上的量
生命制造的读秒革命：全球首个AI-BioFab工厂72小时全息记录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生命制造的读秒革命：全球首个AI-BioFab工厂72小时全息记录》副标题：2025年7月2日14：04深圳现场——癌症疫苗定制最后3分钟如何改写万亿生物经济规则光明科学城2025年7月2日电（记者直击）负三层B区微流控平台红光闪烁，液态机械臂正将第9,217管CRISPR编辑液注入芯片。量子
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
千亿参数大模型轻量化实战：手机端LLM推理加速300%方案
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《千亿参数大模型轻量化实战：手机端LLM推理加速300%方案》副标题：2025实测骁龙8Gen4+FP4稀疏量化技术，70B模型推理延迟低至127ms，重构移动端AI天花板封面图：[高通骁龙8Gen4芯片显微照片与Llama3-70B手机端运行界面对比图，右上角标注「实测延迟：127ms/tok
多模态进化论：GPT-5V图文推理能力在工业质检中的颠覆性应用 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《多模态进化论：GPT-5V图文推理能力在工业质检中的颠覆性应用》副标题：2025年实测报告显示误检率降至0.0038%，重构制造业质量标准体系封面建议：GPT-5V识别微米级电路板缺陷的对比图，背景显示传统AOI与GPT-5V的误检率曲线一、工业质检的范式革命▶︎传统视觉检测的三大死穴传统AO
《脑机接口：意识数字化的奇点何时到来？》 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《脑机接口：意识数字化的奇点何时到来？》展开全景式论述。文章结合2025年最新科研突破与伦理实践，以“技术裂变-意识革命-文明跃迁”为逻辑主线，揭示神经科学与人工智能融合如何重绘人类存在的边界：脑机接口：意识数字化的奇点何时到来？副标题：从神经解码到意识上传，一场重塑人类本质的技术奇袭作者：意识
【硬核拆解】英伟达Blackwell芯片架构如何重构AI算力边界？ HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站一、Blackwell诞生的算力危机（2025现状）graphTDA[2025年AI算力需求]-->B[千亿参数模型训练能耗>20GWh]A-->C[10万亿参数模型涌现]A-->D[传统架构内存墙：数据搬运耗能占68%]行业拐点事件：2025年3月：OpenAI宣布训练125万亿参数MoE模型
成像光谱遥感技术中的AI革命：ChatGPT在遥感领域中的应用科研的力量人工智能 ChatGPT chatgpt 人工智能
课程将最新的人工智能技术与实际的遥感应用相结合，提供不仅是理论上的，而且是适用和可靠的工具和方法。无论你是经验丰富的研究人员还是好奇的从业者，本课程都将为分析和解释遥感数据开辟新的、有效的方法，使你的工作更具影响力和前沿性。遥感技术主要通过卫星和飞机从远处观察和测量我们的环境，是理解和监测地球物理、化学和生物系统的基石。ChatGPT是由OpenAI开发的最先进的语言模型，在理解和生成人类语言方面
解锁AI新世界：ModelGate携手Cherry Studio，开启智能之旅
解锁AI新世界：ModelGate携手CherryStudio，开启智能之旅在人工智能技术飞速发展的当下，我们的工作与生活正被AI深刻改变。你是否渴望拥有一个强大的工具，帮你轻松驾驭各类AI应用，提升效率与创造力？今天，就为大家介绍一对黄金搭档——ModelGate与CherryStudio，它们将带你进入AI应用的全新境界。CherryStudio堪称AI桌面生态的“集大成者”，是一款支持多家主
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
AI人工智能 Agent：在节能减排中的应用 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1全球气候变化与节能减排随着工业化进程的加速和人口的不断增长，全球气候变化问题日益严峻。温室气体排放导致的全球变暖、极端天气事件频发等问题，已经对人类的生存环境和社会经济发展造成了严重威胁。因此，节能减排已成为全球共识，各国政府和企业都在积极探索和实施各种节能减排措施。1.2人工智能技术的兴起近年来，人工智能（AI）技术发展迅猛，并在各个领域取得了显著成果。AI技术具有强大的数据分
CLIP之后，多模态模型将如何进化？三大技术路径解析老周聊AI AI大模型人工智能 MCP 机器学习神经网络深度学习 AI大模型大模型训练框架
多模态学习的革命：CLIP技术深度解析关注老周不迷路本文较长，建议点赞收藏以免遗失。由于文章篇幅有限，更多涨薪知识点，也可在主页查看最新AI大模型应用开发学习资料免费领取引言：多模态学习的时代来临在人工智能领域，多模态学习正成为最具前景的研究方向之一。传统AI系统通常专注于单一模态（如纯文本或纯图像），而人类认知的本质却是多模态的——我们通过视觉、听觉、触觉等多种感官协同理解世界。OpenAI于2
华为认证二选一：物联网 VS 人工智能，你的赛道在哪里？博睿谷IT99_ 物联网人工智能华为华为认证
一篇不讲情怀只讲干货的科普指南一、华为物联网&人工智能到底在搞什么？华为物联网（IoT）的核心是“万物互联”。通过传感器、通信技术（如NB-IoT/5G）、云计算平台（如OceanConnect），将物理设备（车、路灯、工厂机器）连入网络，实现数据采集、远程控制和智能决策。大白话就是：它让哑巴设备学会“说话”。华为人工智能（AI）的核心是“让机器学会思考”。聚焦大模型训练、部署与应用（如昇腾AI解
结构性变革与新兴机遇倒霉男孩经济学
近年来，全球就业市场正经历深刻的结构性变革。受技术进步、产业升级、人口结构变化及全球经济格局调整的影响，传统就业模式被重塑，新的职业机会不断涌现。本文将分析当前就业市场的主要趋势，并探讨其对劳动者、企业和政策制定者的启示。###**一、技术驱动下的就业结构变化**1.**人工智能与自动化替代部分传统岗位**-麦肯锡全球研究院预测，到2030年，全球约14%的劳动者（3.75亿人）可能因自动化技术而
大数据未来发展的趋势与挑战倒霉男孩大数据
随着信息技术的飞速发展，大数据已经成为推动社会进步和产业变革的重要力量。从商业决策到医疗健康，从智慧城市到人工智能，大数据技术的应用无处不在。未来，随着5G、物联网（IoT）、人工智能（AI）等技术的深度融合，大数据的发展将迎来更广阔的空间，同时也面临诸多挑战。本文将探讨大数据未来的发展趋势、应用前景以及可能面临的问题。一、大数据未来的发展趋势数据量持续爆发式增长随着5G网络的普及和物联网设备的广
Python知识点：如何使用Nvidia Jetson与Python进行边缘计算杰哥在此 Python系列 python 边缘计算开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用NvidiaJetson与Python进行边缘计算NvidiaJetson平台是专为边缘计算设计的一系列AI计算机，它们能够处理和分析来自物联网(IoT)设备和边缘节点的数据。这些设备小巧、节能且功能强大，非常适合用于执行机器学习、计算机视觉和自然语言处理等任务。Python
未来运维，绝绝AI 必备 AI_运维_攻城狮 ai 运维人工智能
在当今数字化时代，运维工作对于企业的稳定运行至关重要。随着科技的不断进步，人工智能（AI）和自动化技术正逐渐改变着运维行业的面貌。本文将分析运维行业的未来发展方向，探讨人工智能在运维中的应用前景、自动化运维的发展趋势，并对未来的运维工作模式和技能需求进行预测和分析，以帮助读者更好地规划自己的职业发展。一、运维行业现状目前，运维工作主要包括服务器管理、网络管理、数据库管理、应用程序监控等方面。运维工
AI人工智能领域：Bard的崛起之路 AIGC应用创新大全人工智能 bard ai
AI人工智能领域：Bard的崛起之路关键词：Bard、GoogleAI、大语言模型、对话式AI、自然语言处理、生成式AI、AI竞争摘要：本文深入探讨GoogleBard的发展历程、技术架构及其在AI领域的地位。我们将从Bard的诞生背景开始，分析其核心技术原理，比较与其他大语言模型的异同，并通过实际案例展示其应用场景。最后展望Bard的未来发展方向及面临的挑战。背景介绍目的和范围本文旨在全面解析G
AI人工智能领域深度学习的跨模态检索技术 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能深度学习 ai
AI人工智能领域深度学习的跨模态检索技术关键词：跨模态检索、深度学习、多模态学习、特征提取、相似度计算、注意力机制、Transformer摘要：本文深入探讨了AI领域中基于深度学习的跨模态检索技术。我们将从基础概念出发，详细分析跨模态检索的核心算法原理、数学模型和实际应用。文章包含完整的Python实现示例，展示如何构建一个跨模态检索系统，并讨论当前的技术挑战和未来发展方向。通过本文，读者将全面理
机器视觉：ransac算法详解无水先生数字图形和图像处理算法计算机视觉
目录一、说明：二、算法步骤三、算法代码四、其它补充一、说明：RANSAC是一种常用的参数估计方法，全称为RandomSampleConsensus（随机抽样一致性）。它通过随机选择数据中的一部分，然后根据这些数据拟合模型，统计模型与其他数据的偏差，最终筛选出符合一定阈值的数据，用于估计参数。RANSAC可以应用于很多领域，如计算机视觉、机器人和地理信息系统等。其优点在于对噪声数据和异常值有很强的鲁
Python程序设计第6章：函数和函数式编程若北辰 Python程序设计 python 开发语言
Python程序设计Python是全球范围内最受欢迎的编程语言之一，学好Python将对个人职业生涯产生很大的助力，Python在机器学习、深度学习、数据挖掘等领域应用极为广泛。在数据科学家/数据分析师、人工智能工程师、网络安全工程师、软件工程师/全栈工程师、自动化测试工程师等岗位，年入50万，很普遍，学好Python，高薪就业不是问题，因此推出Python程序设计系列文章：Python程序设计第
半监督学习+迁移学习：低成本构建高精度AI模型 AI智能探索者 AI Agent 智能体开发实战人工智能学习迁移学习 ai
半监督学习+迁移学习：低成本构建高精度AI模型关键词：半监督学习、迁移学习、低成本、高精度AI模型、数据利用摘要：本文主要探讨了如何通过半监督学习和迁移学习相结合的方式来低成本构建高精度的AI模型。首先介绍了半监督学习和迁移学习的背景知识，然后详细解释了这两个核心概念及其相互关系，接着阐述了相关算法原理、数学模型，还给出了项目实战案例，分析了实际应用场景，推荐了相关工具和资源，最后探讨了未来发展趋
什么是神经网络和机器学习？【云驻共创】一键难忘人工智能机器学习深度学习神经网络网络
什么是神经网络和机器学习？一.背景在当今数字化浪潮中，神经网络和机器学习已成为科技领域的中流砥柱。它们作为人工智能的支柱，推动了自动化、智能化和数据驱动决策的进步。然而，对于初学者和专业人士来说，理解神经网络和机器学习的本质是至关重要的。在本文中，我们将深入探讨这两个概念的内涵、工作原理以及彼此之间的联系。二.神经网络和机器学习简介神经网络和机器学习都是人工智能领域中的重要概念，它们通常用于解决各
AI人工智能与OpenCV：实现智能图像编辑功能 AI智能探索者 AI Agent 智能体开发实战人工智能 opencv 计算机视觉 ai
AI人工智能与OpenCV：实现智能图像编辑功能关键词：人工智能、OpenCV、图像处理、计算机视觉、深度学习、智能编辑、图像增强摘要：本文深入探讨如何结合人工智能(AI)和OpenCV实现智能图像编辑功能。我们将从基础概念出发，详细介绍核心算法原理，展示实际代码实现，并分析典型应用场景。文章将涵盖从传统图像处理技术到深度学习方法的演进，重点讲解如何利用OpenCV和AI模型实现自动化的图像增强、
Orangepi Zero2 全志H616开发学习会学嵌入式 ARM Linux全志平台开发学习 linux 开发语言服务器
一.简介1.1为什么学学习目标依然是Linux系统，平台是ARM架构·蜂巢快递柜，配送机器人，这些应用场景用C51,STM32单片机无法实现·第三方介入库的局限性，比如刷脸支付和公交车收费设备需要集成支付宝SDK，提供的libalipay.so是Linux的库，设备必须跑Linux系统·图像识别，音频，视频等领域的技术支撑也无法脱离Linux系统·人工智能型设备通常需要更好的系统和更高的算力，所以
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

基于迁移学习和注意力机制的伪装图像分割

你可能感兴趣的:(迁移学习,计算机视觉,人工智能)