渔歌畅晚

论文解读《Co-Correcting:Noise-tolerant Medical Image Classification via mutual Label Correction》

论文解读《Co-Correcting:Noise-tolerant Medical Image Classification via mutual Label Correction》

论文解读：协同校正:通过相互标签校正的抗噪声医学图像分类

期刊名： IEEE TRANSACTIONS ON MEDICAL IMAGING （医学影像学报）
期刊名缩写： IEEE T MED IMAGING
国际刊号： 0278-0062
2021年影响因子/JCR分区： 10.048/Q1
CCF： B区
代码： 代码地址
论文地址： 论文地址

一、摘要：
深度学习需要大量带有标签的数据。在深度学习中处理标签噪声的方向没有被医学图像所注意到。

1）双网络互学习、2）标签概率估计、3）课程标签“校正”。
两个医学图像数据集，测试了6种最新的带噪声标签学习方法，并进行了比较研究。
实验表明，在不同的任务条件下，在不同的噪声比下，Co-Correcting 都能获得最佳的精度和泛化效果。

二、介绍：
2.1医学图像分类在临床治疗和教学任务中起着至关重要的作用。医学图像的自动分类是一个研究热点。由于病变外观的细粒度变化，这是一个挑战。最近，从早期筛选到确定子类别，使用深度学习的方法已经取得了令人印象深刻的效果，而且往往是前所未有的表现。

2.2 深度学习的成功归功于越来越多的大型和不断增长的数据集，以及更强大的计算硬件。大数据和可靠的标签有利于深度神经网络对参数的训练。医学图像采集困难，面临数据隐私问题，又需要专家耗时间去分析。

1）收集更多的数据，现有的临床报告。
2） 少量标签来提高性能，半监督学习和伪标签。伪标签的数据受到标签噪音的影响。

伪标签学习：在标签数据上训练模型，然后使用经过训练的模型来预测无标签数据的标签，从而创建伪标签。此外，将标签数据和新生成的伪标签数据结合起来作为新的训练数据。不需要手动标记不加标签的数据，而是根据标签的数据给出近似的标签。

2.3 嘈杂的标签破坏了ground-truth（标准）标签，降低了分类器的准确性。深度神经网络先记忆清晰简单的实例，随着训练时间延长逐渐适应困难实例

2.4 医学图像数据集小，获取成本高。带噪声标签包含学习信息。其次，即使标签完美，也很难对医学图像分类。
专门为医学应用设计的抗噪声方法不足，在医学应用中，标签需要领域专业知识，错误的预测可能直接影响医生决策。

2.5 提出了一种用于医学图像分类的端到端且噪声容忍深度学习框架。该框架受Co-teaching+的启发，采用了同时训练两个网络的思想。它由三个核心组件组成:
1）双网络架构
2）一种新的概率模型
3） 一个课程式学习框架

2.6 提出的Co-Correcting框架可以利用噪声标签，并处理严重的噪声情况。在ISIC-Archive和PatchCamelyon，两个公共医学图像数据集上进行了实验。与目前最先进的方法相比，在噪声比为5% ~ 40%的情况下，Co-Correcting的精度模型最高。贡献如下:
(1) 基于互学习和标注校正的抗噪深度学习医学图像分类框架
(2) 双网络结构的基础上，新的标签概率模型
(3) 基于深度特征的无监督聚类学习的标签校正课程
(4)两个医学图像数据集ISIC-Archive和PatchCamelyon上，实现了最新的噪声标签学习方法。与最先进的方法相比，Co-Correcting在嘈杂的医疗数据集上获得了最高的精度。

三、相关工作
A：基于cnn的医学图像分类：
基于cnn的方法有各种策略来提高小数据集上的图像分类性能，研究了数据增强在图像分类中的有效性。一种具有前景的研究方向是通过自动化系统，在很少或没有人工监督的情况下，对大量数据集进行标记。然而，使用这些方法收集的实例通常存在较高的标签噪声，因此它们在医学成像中的适用性有限。因此，需要进一步努力研究处理嘈杂医疗数据集的方法。

B.带噪声标签的深度学习：
深度卷积神经网络过拟合损坏标签的能力会导致非常差的泛化性能。为了处理损坏的标签，一些基于深度学习的方法在损失函数中添加了正则化。利用正则化偏差来克服标签噪声问题。然而，它们永久地引入偏差，使得学习后的分类器几乎不能达到最优性能。其他方法估计的转移矩阵不引入正则化偏差，从而提高了分类器的精度。

表一在两个维度上比较了最新的LNL（ learning with noisy labels噪声标签学习）方法:有没有累积错误和标签是否正确。
1）MentorNet为StudentNet提供了一个课程集中在标签的样本可能是正确的。它采用自定进度的方式来学习课程，并具有样本选择偏差造成的累积误差的负面属性。
2）Co-teaching同时对两个深度神经网络进行训练，并让它们在每个小批量（Mini-batch）下相互进行教学。在这个交换过程中，可以通过对等网络相互减少错误流。
3）Co-teaching+通过使用“不一致更新（Update by disagreement）”策略来改进Co-teaching，通过两个模型没有达成一致的数据来更新模型参数。几乎没有利用损坏标签中的信息。
4）PENCIL以一种端到端的方式完成同样的工作。该算法通过大量的训练以避免拟合噪声标签。但容易引入样本选择偏差，积累误差。
5）DivideMix利用半监督学习技术来学习带有噪声的标签。
C 带有噪声标签的医学图像分类：
尽管已经考虑了一些方法来解决噪声标签问题。事实上，关于医学图像噪声标签问题的研究并不多。其中一个是将一般的LNL（噪声标签学习）方法应用于乳房x线分类任务，但它严重依赖于噪声标签分布假设。

四、Co-Correcting:医学图像分类框架
4.1 本文提出的Co-Correcting最初是为医学图像分类任务而设计的。
A:双网络架构、B：课程学习模块、C：标注纠错模块

图1所示。Co-Correcting包括:双网络模块、课程学习模块、标签更新模块。PCA（Principal Component Analysis）是一种常见的数据分析方式，常用于高维数据的降维，可用于提取数据的主要特征分量。

4.2 在Co-Correcting中，使用标签分布y^d来处理标签的不确定性。根据观察，在两个网络上的相互训练保持较好的对标签预测。可以更新标签分布y ^d后，从而可以对噪声进行概率校正。在更新网络参数的同时，网络会学习 概率标签分布。

4.3 引入了课程学习的概念。将样本投影到嵌入空间中，并根据所连接的特征进行聚类，之后这些类别按密度降序排列。随着步数的增加，逐渐添加要更新的标签组。

第一阶段:热身阶段，在模块A上进行相互学习。
第二阶段:计算模块B的课程。
第三阶段:在模块A和C上，学习参数并更新标签分布。
第四阶段:在模块A上使用修正后的标签对网络进行微调。

warm-up stage（热身阶段）：刚开始的学习率应当设置得很低很低，这样可以保证网络能够具有良好的收敛性。较低的学习率会使得训练过程变得非常缓慢，因此这里会采用以较低学习率逐渐增大至较高学习率的方式实现网络训练的“热身”阶段，称为 warm-up stage。

4.4 A 双重网络体系结构：
在带噪声标签的学习研究中，一个具有挑战性的问题是设计可靠的标准来选择干净的样本。

Co-Correcting训练两个结构相同的网络。ResNet（残差网络）或DenseNet。
1）在正向传播中，两个网络分别对同一图像数据进行训练。2）在反向传播中，根据一致更新原理，利用预测结果相同的样本所产生的梯度来更新参数。
算法倾向于先学习简单数据，然后再拟合标签噪声。因此，将损失较小的实例视为干净的实例，并在出现一致时收集它们的梯度。预测一致的样本具有更大的可信度，有利于噪声数据的筛选和校正。
与Co-teaching或Co-teaching+不同的是，Co-Correcting将计算潜在噪声样本的损失值（loss），在更新分类模型时，它们的梯度设置为零，这些损失值（loss）用于更新标签分布。

图4所示。两个CNN更新了标签分布。蓝线表示向前传播路径，橙色虚线表示向后传播路径。使用标签分布y^d 来代替有噪声的标签，并通过网络预测和y^d 计算分类损失。

B.标签概率建模与更新：
提出了深度标签分布学习算法来处理标签的不确定性。更新标签分布，噪声可以概率纠正。灵感来自PENCIL算法，用于一个包含n个图像样本的数据集。对于每个图像xi, Co-Correcting保持一个标签分布:

其中i为样本序号, i ∈[0, n)。它是对标签是否无噪声的概率估计。Yid被当作一个伪标签，用于计算损失值。

在图4中， Co-Correcting算法 同时训练两个网络来估计和更新y^d （标签分布）。两个网络之间的相互学习不会累积误差，从而最大限度地避免了噪声标签的干扰。辅助变量y~来辅助标签更新，有噪声的标签y^乘以一个常数K进行热编码。

将标签校正与双网络结构相结合，有利于在两种网络损耗较大的医学图像中学习无噪声的困难样本。

C.标签矫正课程

4.5 困难样本与有噪声样本参杂在一起一直是有噪声标签学习中的一个难题。影响有：不准确的标签修改容易出错。无噪声的困难样本可能一直修正不正确，这对模型的准确性产生负面影响。
4.6 课程学习，从简单的例子开始，逐渐处理较难的例子。处理大量嘈杂的标签。
课程网络（CurriculumNet）通过测量数据的复杂性来设计学习课程。Co-Correcting提出了一种新的标签纠错课程（novel label correction curriculum），以避免标签的过早修改。它设计了一种按难度递增的标签纠错策略，纠错顺序是由易到难。

因此，目标是将整个训练集分解成多个子集，将子集从简单到复杂进行排序。

第二阶段学习课程（Curriculum module）根据课程设置，Co-Correcting纠正简单的错误。Co-Correcting将更新数据的范围扩展到比上层更困难的样本。这一程序在**第三阶段（label update module标签更新模块）**迭代，直到处理完所有课程。

五、实验与分析

5.1、实验装置
在ISIC-Archive和PatchCamelyon，两个医学图像数据集上进行了对比实验。
破坏标签来模拟真实情况。随机翻转标签来添加噪声。在训练集上加入所有的噪声模拟。测试集中都使用原标签。

我们选择了6种最新的带噪音标签学习(Learning-with-Noisy-Labels )分类方法作为基线。我们首先将基线方法应用于ISIC-Archive和PatchCamelyon上的医学图像分类任务。然后在相同的环境下，在不同的噪声比(5% ~ 40%)下，将Co-Correcting方法与之前提过方法进行比较。

5.2. ISIC档案的实验
1）ISIC-Archive数据集:ISIC-Archive数据集来自国际皮肤成像合作组织发起的黑色素瘤项目。该档案共有23906张皮肤病变图像。大多数图像是通过皮肤镜获得的。在实验中，我们选取了3324个样本，这些样本的注解经过病理学家的进一步确认。所选择的样本在积极和消极方面是平衡的。这是一个挑战，因为确认的样本通常很难被人区分。我们按照6:3:1的比例将它们分成训练集、测试集和验证集，以确保测试数据足够。所有图像的大小都被调整到224x224，并通过随机采用水平翻转、垂直翻转或图像旋转来扩充。
2)实施细节:ISIC-Archive上的所有实验都选择了ResNet-50作为骨干网。我们选择SGD作为优化器，其动量为0.9，权值衰减为0.001。由于GPU内存空间的限制，我们将最大批处理大小设置为32，训练步数设置为320。

3)结果与分析: 表三显示了ISIC-Archive上所有比较方法的分类精度。

图7所示。ACCclass在ISIC-Archive和Patch-Camelyon上的各种噪声比。在不同的噪声比下，Co-Correcting的精度最高。

在LNL（噪声标签学习）方法中，在不同的噪声比下，Co-Correcting的精度最高。PENCIL位居第二。
1) 由于数据有限，Joint Optim的网络在第一阶段可能无法学习到一个好的模型。
2) Joint Optim会累积误差，导致医学图像分类准确率较低。

干净的标签上，大多数LNL（噪声标签学习）方法的准确性也超过了标准。实验中，Co-Correcting的准确率为78.83%，比标准在清洁标签上的准确率高22.6%。
1） 标准标签中可能存在模糊、不准确的标注。
2）所提出的LNL机制抑制了网络对少量困难样本的早期过拟合，从而提高了模型的泛化程度。
3） Co-Correcting可以更准确地表示标签分布。

5.3 在图10中，红点代表噪声样本，蓝点代表困难样本。

5.4 时间消耗分析: 训练时间和测试时间比Co-teaching、Co-teaching+、DivideMix更短。

六、结论
提出了一个在医学图像数据集上使用噪声标签进行学习的框架，命名为Co-Correcting。该框架由三个模块组成:
1)双网络架构，重点防止网络受到噪声标签的影响;
2)标注概率模块，对标注错误的数据进行校正;
3)标签矫正课程，提高标签矫正的稳定性。
ISIC-Archive医学图像数据集上测试和验证了所提出的方法。
在所有数据集的不同噪声比/类型下，Co-Correcting获得了最好的结果。作为未来的工作，本文提出的方法可以**调整以适应不平衡数据（即存在清晰干净样本和困难识别的样本）**的需要。

四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
使用大模型预测胃穿孔的全流程系统技术方案大纲
目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
表观遗传风暴：深圳AI-BioFab终极防御战全纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站⚡《表观遗传风暴：深圳AI-BioFab终极防御战全纪实》副标题：抗癌疫苗灌装倒计时90秒惊现组蛋白叛乱，中国启动虫洞计算化解文明级生物危机2025年7月2日14:26光明科学城急电当第184支抗癌疫苗注入冷链罐的瞬间，B3层突爆刺眼蓝光！培养舱内数千细胞染色体疯狂解旋，量子钟在14:26:03
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

论文解读《Co-Correcting:Noise-tolerant Medical Image Classification via mutual Label Correction》

你可能感兴趣的:(深度学习,人工智能,机器学习)