Debroon

【牛B得一塌糊涂】窗口归一化技术，改进医学图像的分布外泛化能力

窗口归一化技术，改进医学图像的分布外泛化能力

提出背景

WIN、WIN-WIN、无参数归一化、特征级别数据增强

如何提升分布外的泛化？

总结

子问题1: 医学图像中的局部特征表示不足

子问题2: 训练数据与新场景数据分布不一致

子问题3: 模型在分布外数据上泛化能力不足

子问题4: 训练与评估时的不一致性问题

子问题5: 传统数据增强方法不适用于医学图像

提出背景

论文：https://arxiv.org/pdf/2207.03366.pdf

代码：https://github.com/joe1chief/windowNormalizaion

窗口归一化（WIN）是一种为了提高深度学习模型在处理分布外数据时泛化能力的归一化技术。

分布外数据，指的是在模型训练阶段未曾见过的，分布与训练数据不同的新数据。

对于医学图像来说，这种情况尤为常见，因为不同的医疗设备、扫描协议或者病人的生理差异都可能导致测试时的图像与训练集在分布上有所差异。

上图是，7 个青光眼检测数据集的特征的 t-SNE 可视化。

t-SNE技术降低数据的维度，将高维数据集可视化为二维空间。

每种颜色代表来自不同数据集的数据，表明每个数据集捕获了整体数据分布的独特子集。

这表明任何两个数据集之间都存在分布偏移，这对机器学习模型在这些数据集之间泛化是一个挑战。

WIN、WIN-WIN、无参数归一化、特征级别数据增强

传统方法：

假设我们有一个由多个医院的医学图像构成的数据集，用于训练一个模型以检测肺部X光图像中的结节。

由于这些图像来自不同的X光机器，它们在亮度、对比度和噪声等方面存在差异。

传统的归一化方法，如批归一化（BN），可能会使用所有训练图像的平均亮度和对比度进行归一化。

当模型遇到新的医院提供的数据时，这些数据可能与训练数据在统计特性上有显著不同，导致模型性能下降。

WIN方法：

在同样的情景下，使用窗口归一化（WIN）技术，我们不是使用整个数据集的统计特性，而是在每个图像的局部区域内计算统计特性。

这意味着WIN可以考虑到图像中的局部特征和变异，从而使模型更加鲁棒，即使是在面对从未见过的、与训练数据分布不同的新图像时也能保持性能。

WIN-WIN 方法：
在分类任务中，比如将MRI图像分类为正常或含有肿瘤的类别，WIN-WIN方法通过在训练时考虑两种模式。

使用WIN进行特征归一化的模式和使用全局统计数据的模式。

在评估时，WIN-WIN强迫模型输出在这两种模式下保持一致，进一步增强了模型对新医院数据的适应性。

特征级别数据增强:

传统的数据增强技术可能包括在图像层面上应用变换，如旋转、缩放或添加噪声。

这对于自然图像来说可能很有效，但医学图像通常需要更细致的处理，因为它们包含重要的临床信息，而且可能会受到设备差异的影响。

使用WIN技术，数据增强发生在特征层面。

例如，对于从不同扫描仪来的CT扫描图像，WIN通过在每个图像的随机局部窗口内进行归一化来增强数据，而不是简单地应用全局变换。

这样可以模拟来自不同设备和条件的图像，增加数据的多样性，提高模型的泛化能力。

无参数归一化技术:

传统的归一化技术，比如BN，需要为每个特征通道学习一组参数来进行缩放和平移。

这可能会导致模型在面对分布偏移时变得不稳定。

相比之下，WIN作为一种无参数归一化技术，不需要额外的参数学习。

它只依赖于输入数据本身的统计特性。

这样一来，模型不会过分适应训练数据的特定特性，从而在应对新的、不同分布的测试数据时更加稳健。

WIN 和 WIN-WIN 方法通过在特征级别上引入局部统计信息和自我蒸馏机制，克服了传统归一化方法在医学图像分布外泛化上的不足。

这使得模型能够更好地适应新场景，提高了在实际临床应用中的可用性。

WIN、WIN-WIN、无参数归一化、特征级别数据增强的关系：

窗口归一化（WIN）:
- 它是一种归一化技术，通过计算图像或特征映射中的小窗口内的局部统计量（平均值和方差）来代替传统的全局统计量。
- WIN是一个无参数的方法，因为它不需要像传统归一化方法（如批归一化）那样为每个特征通道学习额外的缩放和偏移参数。
- 这种方法可以被视为一种特征级别的数据增强技术，因为它通过在训练过程中使用不同窗口的统计量来引入变异性，这有助于模型学习到在面对新的、未见过的数据分布时也能保持性能的特征表示。
WIN-WIN:
- WIN-WIN建立在WIN的基础上，是一种自我蒸馏方法。在训练过程中，模型会有两次前向传播，一次使用WIN的局部统计量，另一次使用全局统计量。
- WIN-WIN通过最小化两次前向传播结果之间的差异来增强模型的泛化能力，这个过程称为一致性约束。
- WIN-WIN进一步提升了模型在分布外数据上的性能，因为它鼓励模型在不同的统计视角下产生相似的输出。
无参数归一化:
- WIN作为一种无参数归一化技术，意味着它不依赖于训练期间学习的参数来执行归一化操作。
- 无参数归一化减少了模型的复杂性，避免了在新数据集上应用模型时可能出现的过拟合问题。
特征级别数据增强:
- WIN和WIN-WIN都利用了特征级别的数据增强。这种增强不是在输入图像上直接进行（如旋转、缩放、剪切等），而是在模型的内部特征表示上进行，通过改变特征的统计属性来实现。

WIN是一个无参数的归一化和特征级数据增强方法，而WIN-WIN是一个在WIN基础上进一步通过自我蒸馏提高模型泛化能力的方法。

如何提升分布外的泛化？

子问题1: 医学图像数据稀缺和异质性导致的分布外泛化问题

子解法1: 窗口归一化（WIN）
- 原因: 传统归一化方法，如BN和IN，在分布偏移下的训练-测试统计不一致性问题上存在基本缺陷。
- WIN 通过在每个实例中引入基于随机窗口的统计扰动（即噪声注入），实现特征级别的数据增强，从而提高模型对分布外数据的泛化能力。
- WIN作为一种无需调参的归一化技术，直接作为归一化层使用，既简化了模型设计又提升了分布外泛化性能，特别是在异质性医学图像数据上。

上图(a)展示了批归一化（BN），(b)展示了实例归一化（IN）。

而©展示了所提出的窗口归一化（WIN）。

立方体中的蓝色方块表示聚合计算均值和方差以进行归一化的像素。

子图(d)是WIN-WIN方法的示意图，演示了它如何在训练期间应用WIN技术，并在评估期间切换到全局统计。

窗口采样是窗口归一化（WIN）技术中的一个关键步骤：

上图是窗口采样的算法描述，用于数据增强。

算法通过重复选择一个随机大小和位置的窗口，直到其面积超过了特定阈值τ（窗口大小）。

选择局部区域：窗口采样算法定义了如何在图像或特征映射上选择局部区域。这通常涉及到随机选择一个窗口的大小和位置，以便在该窗口内计算统计量。
计算局部统计量：在所选的窗口内，计算像素或特征值的局部平均值和方差。
数据增强：通过使用不同窗口的局部统计量进行标准化，模型能够学习到更加泛化的特征表示，从而提高对新见（未在训练集中出现）数据的泛化能力。

这个过程对于实现窗口归一化（WIN）来说是关键，它使得在特征空间内可以对特征进行局部化的归一化处理。

山兔是，在CIFAR-10-C数据集上，使用不同归一化方法（BN、IN、WIN）得到的t-SNE特征可视化图。

子问题2: 现有归一化技术在医学图像分布外泛化上的不足

子解法2: WIN-WIN自我蒸馏方法
- 原因: 传统归一化技术如批归一化（BN）和实例归一化（IN）在处理医学图像分布偏移时存在局限性。
- WIN-WIN 通过两次前向传递和一致性约束来充分利用WIN，提供了一种简单扩展现有方法的方式，进一步提升模型在分类任务中的分别外泛化能力。

子问题3: 数据增强方法在医学图像分别外泛化上的限制

子解法3: 特征级别数据增强
- 原因: 传统的数据增强方法主要针对自然图像，对于医学图像这样的具有大域间差异的数据，效果不佳且可能增加计算负担和阻碍模型收敛。
- 通过在CNN的必要归一化层实施特征级别的数据增强，WIN方法避免了额外的计算开销，有效提升了分布外泛化能力。

这个研究提出的解决方案，聚焦于通过窗口归一化（WIN）和 WIN-WIN 自我蒸馏方法，解决医学图像数据在分布外场景下泛化能力不足的问题，通过特征级别数据增强和无参数归一化技术，简化模型设计的同时提高泛化性能。

不过新方法，也会遇到新问题：

子问题1: 在一致性背景下模型性能下降

子解法1: Block策略
- 原因: 对于具有一致性背景的图像（如染色体图像），WIN通过计算多个小窗口内的统计量来增强模型的泛化能力。
- 这种策略有效避免了零方差问题，并通过引入更多样化的扰动来提升模型性能。

传统方法：

考虑用于细胞分类的医学图像集，这些图像可能都有相似的背景，但细胞类型各不相同。

如果使用传统的归一化技术，如批归一化（BN），它可能会将背景的一致性误认为是一个有用的特征，而不是专注于细胞本身的变异性。

当模型遇到具有不同背景特征的新图像时，其性能可能会下降，因为模型已经适应了训练集中背景的统计特征。

Block策略：

使用Block策略，我们可以将每个图像分成多个块，然后在这些块的基础上独立计算局部统计信息。

在细胞分类的例子中，这意味着即使背景相同，模型也可以通过专注于每个块中细胞的特征来提高其区分不同细胞类型的能力。

这种方法提高了模型对背景变化的鲁棒性，因此在新的图像集上表现更好，即使这些新图像的背景与训练数据不同。

子问题2: 训练和评估统计不一致导致的泛化能力下降

子解法2: WIN-WIN 自我蒸馏
- 原因: 为了解决训练和评估时使用不同统计量导致的模型泛化能力下降问题，提出WIN-WIN自我蒸馏方法。
- 该方法通过两次前向传递 —— 一次使用混合统计量（训练模式），另一次使用全局统计量（评估模式）
- 并通过最小化两者之间的 Jensen-Shannon 散度和交叉熵损失来鼓励模型在不同视图之间保持一致性，从而提高模型在分布外数据上的泛化能力。

子问题3: 如何选择WIN中的统计量µ和σ以提升分布外泛化能力?

子解法3: 统计量混合
- 原因: 统计量混合有利于改善分布外泛化性能。
- 单独使用局部统计量会显著降低分布外泛化能力，而通过混合全局和局部统计量，可以在保持IND数据性能的同时提升分布外数据的泛化能力。

在心脏病变检测的任务中，训练数据可能主要来自一个地区的患者，这些患者的图像具有相似的成像特征。

传统方法可能会仅使用这些图像的全局统计量进行归一化处理，导致模型对于具有不同成像特征的其他地区患者的心脏图像泛化能力不足。

而WIN方法则会混合使用全局统计量和每个患者图像局部区域的统计量（例如，心脏特定区域的亮度和对比度），这样的混合策略能够让模型在遇到分布外的数据时，仍能准确识别病变。

子问题4: WIN中的不同局部统计计算方法对模型性能的影响

子解法4: 窗口和块（Window and Block）方法
- 原因: 窗口和块方法作为计算局部统计的最佳实践，相比于使用全局统计（如IN）或其他局部统计（如像素或掩膜）方式，这两种方法能更有效地改善分布外泛化能力。

假设一个用于皮肤病诊断的模型，传统方法可能会在全图像上计算统计量，而忽略了皮肤病征兆通常只出现在皮肤的小部分区域这一点。

相比之下，WIN方法使用窗口和块策略，专注于这些小区域内的统计量，使得模型能够更加精细地捕捉皮肤病变的特征，即使在病变特征在图像中占比非常小的情况下也能有效工作。

子问题5: 训练和评估不一致导致模型性能下降

子解法5: 统计混合与一致性约束的结合
- 原因: 单独移除统计混合或一致性约束只能边际性地帮助分布外泛化。
- 结合这两种机制可以互补地提升模型的分布外泛化能力，因为它们共同促进了训练和评估阶段特征的一致性。

设想一个在多个医院间部署的肺部CT扫描分类模型，这些医院使用不同的扫描设备。

传统方法可能会导致模型在面对一个新医院的扫描图像时性能下降。

传统方法：

由于设备差异，图像的分布可能有所不同。

如果在训练和评估时仅依赖于全局统计信息，如实例归一化（IN），模型可能无法很好地泛化到新数据集。

WIN-WIN 自我蒸馏：

在WIN-WIN方法中，模型在训练过程中使用两种归一化策略：

一种侧重于训练数据的局部统计特征（WIN）
另一种则使用更全面的全局统计信息

这使得模型在实际部署时，能够更好地适应新医院的数据分布，因为它已经学会了如何处理来自不同统计分布的数据。

子问题6: WIN和WIN-WIN策略的超参数敏感性

子解法6: 超参数调整
- 原因: 分布外泛化性能主要受窗口比例阈值τ的影响，而对δ（用于平衡交叉熵损失和Jensen-Shannon散度损失）不太敏感。
- 合理选择 τ （窗口大小的比例）可以优化模型性能，而 δ 的选择对性能的影响较小。

通过细粒度地探索统计量的选择、局部统计的计算方法以及WIN-WIN中的关键机制，研究人员能够明显提高模型对分布外数据的泛化能力。

同时，通过超参数的敏感性分析，确定了影响模型性能的关键因素，为进一步优化提供了方向。

比如，在对磁共振成像（MRI）进行肿瘤分割的任务中，训练数据集的大小可能会影响模型学习的统计特性。

传统方法可能会在固定的超参数设置下运行，而不考虑不同大小数据集的特性。

而WIN方法通过调整窗口比例阈值τ，能够根据数据集的特点优化性能，例如，小数据集可能需要更大的窗口来捕捉足够的上下文信息，而大数据集则可能需要较小的窗口以避免过拟合。

总结

子问题1: 医学图像中的局部特征表示不足

子解法1: 局部统计计算
- 原因: 传统归一化技术往往采用全局统计量，可能忽略了图像中的局部特征差异，这在医学图像中尤为重要，因为它们通常包含具有关键诊断信息的细微局部特征。

子问题2: 训练数据与新场景数据分布不一致

子解法2: 动态窗口采样
- 原因: 医学图像可能来自不同的设备或条件，这导致新场景（分布外）数据的分布与训练数据不同。动态窗口采样允许模型学习更通用的特征，使其对于分布变化更加鲁棒。

子问题3: 模型在分布外数据上泛化能力不足

子解法3: 统计量混合
- 原因: 单一来源的统计量可能会导致模型过度适应训练数据，而混合不同来源（如局部与全局）的统计量可以提高模型对未见过数据的适应能力。

子问题4: 训练与评估时的不一致性问题

子解法4: WIN-WIN自我蒸馏
- 原因: 训练与评估时使用不同的统计量可能导致模型的不一致性，WIN-WIN通过在训练过程中强制一致性，减少了这种不一致性，提高了模型的泛化能力。

子问题5: 传统数据增强方法不适用于医学图像

子解法5: 特征级数据增强
- 原因: 医学图像的关键信息通常位于小的局部区域，传统的像素级数据增强可能破坏这些关键信息。特征级数据增强通过在特征表示上实施增强，保留了这些关键局部信息。

【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
Python/Java/Php/C#/Go/C/C++这几个主力语言，谁到底真的不行 dotNET跨平台 java c#开发语言
1.前言阿里最近又进行了史诗级的大裁员，IT行业肉眼可见的持续性衰退与没落。当潮水退却，才能看出谁在裸泳。作为当今计算机编程界的几大主力语言，谁才真正的裸泳者呢？2.描述1.Python:Python作为一款解释性的动态语言，它很早就诞生了。它的第一个发行版1991年出世，比Java还要早四年。可惜命运不济，一直没有大的作为。到了2014年人工智能的风口悄然兴起，Python一路高歌猛进。到了20
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
昇腾AI生态组件全解析：与英伟达生态的深度对比
随着人工智能技术的快速发展，国产AI芯片的崛起正在改变全球计算产业的格局。华为昇腾（Ascend）系列AI处理器凭借自主创新的达芬奇架构，构建了完整的软硬件生态体系。本文将从核心组件对比、显卡性能对标两个维度，深入剖析昇腾与英伟达（NVIDIA）生态的技术差异与适用场景。一、昇腾核心组件与英伟达对标分析1.推理引擎：MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
媒体AI关键技术研究阿维同学大模型应用开发人工智能研究报告媒体人工智能 ai AIGC
一、引言随着人工智能技术的迅猛发展，媒体行业正经历前所未有的变革。AI技术不仅重塑了内容生产和传播模式，更为媒体创意发展提供了全新可能。在数字化、移动化和信息爆炸的大背景下，传统媒体面临巨大挑战，而AI技术为行业带来了新的机遇。媒体行业正从搜索驱动向AI驱动的内容发现转变，通过新兴技术的融合创造全新的内容消费体验[[1]]。这种转变不仅提高了内容生产效率，也为受众提供了更加个性化的媒体体验。人工智
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
利用人工智能做python爬虫
在Python爬虫领域，人工智能（AI）可以从多个维度赋能，提升爬虫的效率、智能性和应对复杂反爬策略的能力。下面从数据提取、反反爬、自动化脚本生成等方面，介绍如何结合AI技术实现更强大的Python爬虫：一、利用大语言模型辅助爬虫开发1.代码生成与优化大语言模型（如GPT系列、文心一言、通义千问等）可以根据自然语言描述快速生成Python爬虫代码。例如，你可以向模型输入“写一个Python爬虫，抓
蜂鸟云平台大更新：地图空间定价重塑与功能全面升级蜂鸟视图fengmap 信息可视化蜂鸟云地图编辑器地图绘制工具室内外地图一体化智慧园区蜂鸟视图
1.引言随着云计算、大数据以及人工智能技术的快速发展，企业对云平台的需求日益增长。蜂鸟云平台作为一款创新性的地图服务平台，已逐渐成为众多企业、政府及科研机构的核心依赖。为了更好地满足用户需求，提高平台的市场竞争力，蜂鸟云平台定期进行功能更新与优化。2024年9月21日，蜂鸟云平台将在晚上20:00至24:00进行一轮重要的系统更新。本次更新的核心内容包括地图空间的重新定价与功能优化，涉及制图、微程
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

【牛B得一塌糊涂】窗口归一化技术，改进医学图像的分布外泛化能力

窗口归一化技术，改进医学图像的分布外泛化能力

提出背景

WIN、WIN-WIN、无参数归一化、特征级别数据增强

如何提升分布外的泛化？

总结

子问题1: 医学图像中的局部特征表示不足

子问题2: 训练数据与新场景数据分布不一致

子问题3: 模型在分布外数据上泛化能力不足

子问题4: 训练与评估时的不一致性问题

子问题5: 传统数据增强方法不适用于医学图像

你可能感兴趣的:(#,人工智能)