通街市密人有

Medical Diffusion - Denoising Diffusion Probabilistic Models for 3D Medical Image Generation

论文链接：https://arxiv.org/abs/2211.03364

摘要

计算机视觉的最新进展已经在图像生成方面显示出有希望的结果。扩散概率模型尤其从文本输入中生成了真实的图像，如DALL-E 2、Imagen和Stable Diffusion所示。然而，它们在医学中的应用尚未得到系统评估，因为医学中的图像数据通常包括三维体积。合成图像可能在保护隐私的人工智能中起着至关重要的作用，也可以用于增强小数据集。这里我们展示了扩散概率模型可以合成高质量的医学成像数据，我们展示了磁共振图像（MRI）和计算机断层扫描（CT）图像。我们通过与两位医学专家的读者研究，对合成图像的质量进行了三个分类：真实图像外观、解剖正确性和切片之间的一致性，从而对其性能进行了定量测量。此外，我们证明了合成图像可以用于自我监督的预训练，并在数据稀缺的情况下提高乳房分割模型的性能（dice score 0.91 vs. 0.95 without vs. with synthetic data）。

介绍

深度学习（DL）在医学成像中的作用正在稳步增加¹。DL可以解决的一个典型问题涉及图像的分类，即将图像中包含的高维数据浓缩为单个类。相反的作用，即从低维非图像输入生成医学图像的研究较少，但具有巨大的潜力：合成图像可以用于在站点之间共享受保护的数据，或用于教育目的，甚至可以用于预测射线照相中的医学疾病进展^2，3。这些研究是在二维（2D）图像上进行的，但不是三维（3D）体积⁴。然而，现代医学中最重要的诊断成像方式，磁共振成像（MRI）或计算机断层扫描（CT）可以产生3D数据。因此，对2D数据的集中是一个严重的限制，它基本上忽略了可用于提高这些图像的手动或自动评估的性能和弹性的有用数据。因此，需要生成合成3D数据的方法。

先前的工作已经采用了生成对抗网络^5，6（GAN），但这种技术存在严重的局限性：首先，这些模型的训练很困难，模式崩溃是一个常见问题⁷，这意味着神经网络无法生成不同的样本。第二，即使没有发生模式崩溃，这些模型生成的图像的多样性也是有限的⁸。第三，GAN和类似模型只关注图像域，从文本生成图像或反之亦然并不简单。另一方面，扩散模型在非医学领域取得了巨大成功，因为它能够生成多种多样的图像，并将图像和非图像数据^9，10链接起来。尽管扩散模型的性能大大提高，但尚未系统地用于医学中的3D图像生成。

在这项工作中，我们检查了在医学中是否存在用于生成3D数据的扩散模型的潜力。我们提出了一种适用于潜在空间的扩散模型的新架构，并在四个公开可用的数据集上对其进行训练，这些数据集包括来自广泛解剖范围的数据：大脑MRI、胸部MRI、乳房MRI和膝关节MRI。我们在用户研究中调查这些图像对医学专家来说是否合理，并根据结构相似性指数定量检查其多样性。最后，为了弥合与医学应用的差距，我们研究了对生成的合成图像进行预训练是否有助于在有限的数据设置中改进分割模型。

结果

Medical Diffusion Models can be Robustly Trained

我们在四个不同解剖领域的公开可用数据集上训练扩散模型：阿尔茨海默病神经成像倡议（ADNI）的脑部MRI检查、癌症成像档案（LIDC）的胸部CT检查、杜克大学（Duke）的乳房MRI检查和斯坦福大学（MRNET）的膝盖MRI检查。为了展示我们的方法的能力，即使是小数据集，这四个模型仅在1250（膝盖MRI）、998（脑部MRI）、1844（胸部MRI）和1010（胸部CT）图像上进行了训练。

尽管数据集相对较小，但每个模型都会收敛并生成真实的合成图像，而无需微调任何超参数（图1）。特别是，我们没有在任何训练课程中观察到模式崩溃。此外，模型架构能够适应多种分辨率，包括分辨率为64x64x64体素的脑MRI、分辨率为128x128x128的胸部CT以及分辨率为256x256x32体素的各向异性乳腺和膝关节MRI。在四个数据集中的每一个中，都可以生成真实的三维数据（图1）。

Medical Diffusion Models can Generate High Quality Medical 3D Data

我们根据三个不同的类别评估了人类专家的合成图像：1）整体图像外观的质量，2）切片之间的一致性，3）解剖正确性。两名分别具有9年（读者A）和5年（读者B）经验的放射科医生被要求对四个数据集中的每一个数据集的50幅图像进行Likert评分，见表1。

经验更丰富的放射科医生5对200项检查中的189项进行了评分，认为总体上真实，只有较小的不真实区域或更好（ADNI为50/50，LIDC为40/50，DUKE为50/60，MRNET为49/50）。200项检查中有191项被评定为在大多数切片中显示出切片之间的一致性（ADNI为50/50，LIDC为41/50，DUKE为50/60，MRNET为50/40），185/200项仅显示出轻微或无解剖不一致性（ADNI为50/50，LIDC为40/50，DUKE为50/40，MRNET为45/50）。具有5年经验的放射科医生对类似评分进行了分配（图2）。这些数据一起表明，我们的架构可以生成合成图像，对该领域的专家来说，这些图像看起来很逼真。

The Dimension of the Latent Space is Important for High Quality Image Generation

为了分析潜在维度对图像生成质量的影响，我们使用两种不同的压缩因子训练VQ-GAN自动编码器。我们发现，当将每个空间维度压缩8倍（即，256x256x32大小的图像的潜在维度为32x32x4）时，相关的解剖特征会丢失（图3）。当使用较小的压缩因子4训练VQ-GAN自动编码器时（即，尺寸为256x256x32的图像具有64x64x8的潜在尺寸），解剖特征被更精确地重建。对于所有四个数据集，我们发现最大压缩因子4（即，与图像的原始维度相比，潜在空间中的每个维度都小了四倍）包含了正确的解剖细节，如放射学专家在每个数据集的20个样本图像的测试集中所评估的。

Medical Diffusion Models outperform GANs in Terms of Image Diversity

为了将我们的扩散模型与已建立的GAN进行比较，我们遵循Kwon等人的工作⁵，并选择具有梯度惩罚（WGAN-GP）的Wasserstein GAN作为基线。由于我们在使用更高分辨率的图像训练WGAN-GP时发现了差异行为，因此我们限制了对生成的64x64x64大小的脑MRI图像的比较。我们通过对同一数据集的1000个合成样本对的结果进行平均，根据多尺度结构相似性度量¹⁸（MS-SSIM）对两个模型进行了比较。因此，较高的MS-SSIM得分表明模型之间更为相似，而MS-SSIM评分越低则表示相反。我们发现，GAN模型无法生成不同的图像，如其0.9996的高MS-SSIM评分所示，导致合成图像通常相同。相比之下，扩散模型的MS-SSIM得分为0.8557，更接近原始数据的MS-SSI得分（0.8095）。总之，这些数据表明，扩散模型能够生成代表原始数据分布的更多样的样本，因此这些模型可能更适合后续项目，例如用于分类模型的训练。

Synthetic Data can be Used to Train Neural Networks

在机构a希望与机构B合作以提高神经网络性能而不共享任何原始数据的情况下，我们评估了合成数据的可用性。为此，我们使用在DUKE数据集上训练的扩散模型生成了2000张合成图像，并在合成数据的自我监督设置中预先训练了Swin UNETR¹⁹。然后，我们利用来自机构B的可用分割数据对预先训练的网络进行微调，以在MRI扫描中分割乳房区域。为了展示有限数据环境下的绩效提升，我们进行了多次培训，其中我们使用了来自机构B的越来越多的可用数据（5%、10%、20%、40%、80%和100%）。为了进行比较，当没有使用合成数据进行预训练时，我们训练相同的神经网络来执行相同的任务。我们发现，使用另一机构的合成数据进行预训练可以在很大程度上提高骰子得分方面的分割性能，尤其是在可用标记训练较少的情况下（0.91没有预训练，0.95有5%可用数据的预训练，见图4和图5）。

讨论

随着非医学领域生成模型质量的提高，医学数据的合成成为一个可实现的目标，在教育、数据匿名化、数据扩展和开发新的DL算法^3，12。特别是扩散模型已被证明可以与人类在图像生成方面的能力相媲美^9，10。

在这项工作中，我们首次对MRI和CT数据进行了潜在扩散模型的大规模评估。我们证明，这种模型可以生成真实的3D体积数据，该数据在连续3D结构的合成中是一致的，并且能够准确反映人体解剖结构。我们表明，即使在大约1000个样本的相对较小的数据集上进行训练，这种复杂数据的训练对于我们的模型也会稳健地收敛。

这与通常需要大量超参数调整和大型数据集才能成功训练的GAN形成对比。更重要的是，即使可以成功地训练GAN，我们发现我们的扩散模型能够更准确地涵盖医疗实践中遇到的图像的多样性。这对于在AI方法的开发中使用这种合成图像非常重要。我们还通过在合成数据上预训练用于人类乳房MRI检查的分割模型，证明了潜在扩散模型的潜在医学应用，并表明这种预训练可以帮助使分割模型更健壮。

我们的工作有局限性：首先，我们在大约1000次考试的相对较小的数据集上评估了我们的模型。这部分是出于设计-在有限的数据可用时展示潜在扩散模型的可能性-部分是由于有限的计算资源。可以预期，当在更大的数据集上训练时，相似的模型可以生成更逼真、分辨率更高的图像¹³。其次，生成的3D体积不具有完整的诊断分辨率。这是由于可用的公共数据在分辨率上是有限的，并且在所有情况下都不能反映图像分辨率的最新水平。我们证明了图像质量和图像分辨率之间存在权衡，并且潜在空间的压缩因子对于获得真实图像至关重要。如果大型数据集可用于训练此类扩散模型，例如通过使用联合方法20，我们的实验表明，如果不将潜在空间中的压缩选择得太高，则可以提高图像分辨率。

总之，我们已经证明，与GAN相比，潜在扩散模型是生成合成3D医学数据的一种优越方法，并且可以为开发合成MRI或CT数据的AI方法奠定基础。

Online Methods

数据集说明

为了证明医学扩散模型的性能和稳健性，我们在四个不同的公开数据集上对其进行训练：MRNet²¹数据集包含来自1199名患者的1250次膝关节MRI检查，每个检查都包含轴向、矢状和冠状面扫描。为了演示的目的，我们只在脂肪饱和的矢状面T2扫描上训练我们的模型。阿尔茨海默病神经成像倡议（ADNI）²²数据集包含2733名患者的脑部MRI扫描。ADNI于2003年启动，由首席研究员Michael W。

ADNI的主要目标是测试序列磁共振成像（MRI）、正电子发射断层扫描（PET）、其他生物标志物以及临床和神经心理学评估是否可以结合起来测量轻度认知障碍（MCI）和早期阿尔茨海默病（AD）的进展。我们在998个标记为认知正常（CN）的3D MP RAGE序列上训练我们的模型。此外，我们在从922名乳腺癌患者获取的乳腺癌MRI数据集²³上评估了我们的模型，其中我们使用了每个患者的非脂肪饱和T1加权序列。为了证明我们的模型的通用性，我们还训练医学扩散模型来合成CT图像。为此，我们使用了来自肺图像数据库联盟（LIDC）和图像数据库资源倡议（IDRI）24的1010（n=1010名患者）低剂量肺CT。我们还使用了200（n=200名患者）T1加权乳腺MRI的内部数据集和相应的乳房区域地面真实掩模，以评估在自我监督的预训练方法中合成乳腺图像的使用。

数据预处理

通过将高分辨率图像平面缩放到256x256像素并对图像应用基于直方图的强度归一化²⁵，对来自MRNet数据集的膝关节MRI扫描进行预处理。该程序由数据集提供者²¹执行。此外，我们将每个图像中心裁剪为256x256x32（高度、宽度、深度）的统一形状。对来自ADNI数据集的脑MRI序列进行预处理，以去除MRI图像的非脑区域。此过程由数据集提供程序完成。为了在扩散模型和GAN之间进行比较，我们遵循了Kwon等人的方法⁵，在将大脑MRI输入神经网络之前，将其大小调整为64x64x64。来自乳腺癌数据集的图像通过首先将所有图像重采样到公共体素间距（0.66mm、0.66mm和3mm），然后使用勾勒出乳房轮廓的相应分割掩模裁剪出感兴趣的区域来进行预处理。然后，这些图像被分成两半，这样左乳房和右乳房就在不同的图像上。最后，将图像大小调整为256x256x32的均匀形状。因此，首先对肺CT进行重新采样，使其在所有方向上的公共体素间距为1mm。随后，将像素值转换为Hounsfield单位，并将图像中心裁剪为320x320x320的形状，然后再调整为128x128x128。将所有数据集的图像最小值最大值归一化为-1和1之间的范围。此外，我们在训练期间通过垂直翻转图像来增强所有数据集，概率为50%。

Architecture

医学扩散架构基于两步方法，我们首先将图像编码到低维潜在空间，然后根据数据的潜在表示训练扩散概率模型。在下文中，我们首先提供矢量量化自动编码器的背景信息，特别是VQ-GAN¹⁵和去噪扩散概率模型²⁶：

VQ-GAN

为了将图像编码为有意义的潜在表示，矢量量化自动编码器被证明是一种可行的选择，因为它们缓解了可变自动编码器^27、28中输出模糊的问题。它们通过将自动编码器瓶颈中的潜在特征矢量映射到从学习的码本中获取的量化表示来操作。Esser等人提出的VQ-GAN架构¹⁵可以看作是一类矢量量化的自动编码器，其图像重建质量通过在其输出端施加鉴别器损失而进一步提高。更准确地说，图像被输入编码器以构建潜在代码 $z_{e} \in \mathbb{R}^{(H / s) \times(W / s) \times(k)}$ 。其中H表示高度、W表示宽度、C表示通道数、k表示潜在特征图数和s表示压缩因子。在矢量量化步骤中，通过将每个潜在特征矢量替换为其最接近的对应码本矢量来量化潜在特征矢量 $e_n$ 包含在学习的码本Z中。然后通过将量化的特征向量馈入解码器G来重建图像。学习目标被定义为重建损失 $L_{rec}$ 、码本损失 $L_{codebook}$ 和承诺损失 $L_{commit}$ 的最小化。正如原作者所定义的，我们使用感知损失作为重建损失，并使用直通估计器来克服不可微分量化步长。承诺损失被定义为未量化的潜在特征向量与相应的码本向量之间的均方误差。注意，仅针对连续潜在特征向量计算梯度，以强制更接近量化码本向量。可学习码本向量通过在映射到它的所有潜在向量上保持指数移动平均来优化。此外，在输出端使用基于块的鉴别器以获得更好的重建质量。为了扩展此架构以支持3D输入，我们遵循Ge等人²⁹的方法，并用3D卷积替换2D卷积。此外，我们将原始VQ-GAN模型中的鉴别器替换为切片鉴别器和3D鉴别器，前者将图像体积的随机切片作为输入，后者将整个重建体积作为输入。我们还遵循他们的方法添加特征匹配损失以稳定GAN训练。

Diffusion Models

扩散模型是一类生成模型，通过潜在变量上的马尔可夫链定义 $x_1,...,x_T$ ²⁶。主要思想是，从图像 $x_0$ 开始，我们通过在若干时间步长T内增加方差的高斯噪声来连续扰动图像。然后训练以时间步长t和时间步长本身的图像的噪声版本 $p\left(x_{t-1} \mid x_{t}\right)$ 为条件的神经网络，以学习用于干扰图像的噪声分布。当变得足够大时，我们可以通过先验分布 $\mathcal{N}(0,I)$ 进行近似 $p(x_t)$ ，从该分布中采样，然后反向遍历马尔可夫链，这样我们就可以从学习的分布中采样新的图像 $p_{\theta}\left(x_{0}\right):=\int p_{\theta}\left(x_{0: T}\right) d x_{1: T}$ 。用于建模噪声的神经网络通常被选择为U-Net30。为了支持3D数据，我们将U-Net中的2D卷积替换为3D卷积。此外，我们遵循Ho等人的方法³¹，仅在高分辨率图像平面上使用卷积（即核大小为 $3 \times 3 \times 1$ ），然后在该高分辨率平面上使用空间关注块（因此将深度维度视为批量大小的扩展），以提高计算效率。空间关注块之后是深度关注块，其中高分辨率图像平面轴被视为批次轴。

Putting It All Together

在第一步中，我们在整个数据集上训练VQ-GAN模型，以学习数据的有意义的低维潜在表示。由于馈入扩散模型的输入应归一化为-1和1之间的范围，我们必须保证图像的潜在表示也在该范围内26。假设VQ-GAN模型中的矢量量化步骤强制学习的码本矢量接近量化前的潜在特征矢量，我们通过学习码本中的最大值来近似未量化特征表示的最大值。类似地，我们在学习的码本中用最小值近似未量化特征表示的最小值。因此，通过对未量化的特征向量执行简单的最小-最大归一化，我们获得了值接近范围-1和1的潜在表示。然后可以使用这些值来训练3D扩散模型。然后，我们可以从从标准高斯采样的噪声开始，通过反向扩散过程来生成新的图像。然后使用VQ-GAN的学习码本对该过程的输出进行量化，并随后馈送到解码器中以生成相应的图像。所有型号均在配备24GB GPU RAM的NVIDIA Quadro RTX6000上进行训练，每种型号大约需要7天。有关每个模型的训练设置的更多详细信息，请参见补充表1。

数据可用性

我们对公众可访问的数据进行了扩散模型实验，以允许其他小组复制和测试我们的结果。只有用于测试合成数据的医学适用性的乳房分割模型依赖于私人数据。该数据可根据作者的要求与书面合作和数据保护协议提供。LIDC-IDRI和乳腺MRI（DUKE）数据集可在癌症成像档案馆（TCIA）³²获得。ADNI数据集可在图像和数据档案馆（IDA）³³免费获得。MRNet数据集可直接从数据集提供商处获得²¹。
协议提供。LIDC-IDRI和乳腺MRI（DUKE）数据集可在癌症成像档案馆（TCIA）³²获得。ADNI数据集可在图像和数据档案馆（IDA）³³免费获得。MRNet数据集可直接从数据集提供商处获得²¹。

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
Spring AI Alibaba 支持国产大模型的Spring ai框架程序员老陈头面试学习路线阿里巴巴 spring 人工智能 java
总计30万奖金，SpringAIAlibaba应用框架挑战赛开赛点此了解SpringAI：java做ai应用的最好选择过去，Java在AI应用开发方面缺乏一个高效且易于集成的框架，这限制了开发者快速构建和部署智能应用程序的能力。SpringAI正是为解决这一问题而生，它提供了一套统一的接口，使得AI功能能够以一种标准化的方式被集成到现有的Java项目中。此外，SpringAI与原有的Spring生
技术调研：时序数据库（一） myskybeyond 时序数据库时序数据库数据库
选择时序数据库时，选择当下主流的解决方案。目前主流的开源解决方案有InfluxDB、TDengine和TimescaleDB。下文从多个维度对比分析，最终根据需求做出选型决策。1.核心架构与设计理念数据库架构特点核心优势InfluxDB-专为时序数据设计的分布式数据库-基于时间线（TimeSeries）模型-开源版（OSS）与商业版（Cloud/Enterprise）功能差异大高写入吞吐量、原生支
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
009 【入门】单双链表及其反转-堆栈诠释要天天开心啊算法专栏算法链表
链表与堆栈系统详解|[数据结构]-[中级]-[通用]一、基础概念与内存模型1.按值传递vs按引用传递|[Java]-[基础]-[内存]//[典型错误示例]-Java中的引用传递陷阱voidmodify(Nodenode){node=node.next;//[警告]错误！仅修改局部引用的指向，不影响原始链表}//[正确做法]-通过引用修改对象内部状态voidrealModify(Nodenode){
实现网页中CSS图片3D旋转效果 Kiki-2189
本文还有配套的精品资源，点击获取简介：CSS是一种用于定义文档呈现方式的技术，通过CSS3的3D转换功能，能够在二维平面上展示三维对象，让网页元素具有立体感。本文详细介绍了实现CSS图片3D旋转效果所需的CSS属性，如transform,perspective,transition,以及:hover选择器，并提供了一个简单的代码示例。同时，文章也提到了兼容性问题以及提供回退方案的重要性。1.CSS
炫酷3D圆环动态照片墙：打造个性化展示新体验姚芝舒
炫酷3D圆环动态照片墙：打造个性化展示新体验【下载地址】3D圆环动态照片墙HTML文件本资源提供了一个精美的3D圆环动态照片墙HTML文件，用户可以通过鼠标自由拖拽照片墙，实现动态展示效果。该文件在某社交平台爆火，内置了30张高质量的JPG图片，用户只需在浏览器中直接打开即可体验，操作简单易上手。效果精致，适合用于个人展示或简单玩乐项目地址:https://gitcode.com/open-sou
GEO引领品牌大模型种草：迈向Web3.0与元宇宙的认知新空间 GEO科技经验分享
在数字技术的演进历程中，我们正经历着从Web2.0到Web3.0、从平面互联网到沉浸式元宇宙的范式转变。这一转变不仅重塑了数字空间的形态和交互方式，更深刻改变了品牌与用户的连接模式和价值创造逻辑。而在这个新兴的数字疆域中，生成式引擎优化（GEO）正展现出前所未有的战略价值和应用潜力，成为品牌构建元宇宙和Web3.0存在的关键能力，特别是在“品牌大模型种草”场景下，品牌如何被理解、记住、推荐，正成为
使用CSS和HTML实现3D图片环绕效果码力无边-OEC css html 3d web 前端
使用CSS和HTML实现3D图片环绕效果在本篇博客中，将介绍如何使用HTML和CSS实现一个3D图片环绕效果。这个效果不仅具有视觉吸引力，而且具有高度的互动性，鼠标悬停时动画会暂停。接下来将一步步讲解这个效果的实现过程。1.效果2.页面结构与布局首先，我们来看一下HTML的基本结构。该效果的核心是一个元素，它包含了多个图片的，每个div中都设置了不同的背景图片。HTML代码：3D图片环绕效果</
html 照片环 - 图片的动态3D环绕 das白 #javascript html 3d javascript 照片环 3D环绕
html照片环-图片的动态3D环绕引言一、源码二、图转base64参考链接引言效果展示：一、源码原始图片的base64编码字符太多了，博客放不下，将图片缩小后的加入html的源码如下：猫咪body{background-color:black;text-align:center;color:#FFF;}.jc{/*设置宽*/width:140px;/*设置高*/height:200px;/*设置背
高斯混合模型GMM&K均值（十三-1）——K均值是高斯混合模型的特例 phoenix@Capricornus 模式识别与机器学习均值算法机器学习算法
EM算法与K均值算法的关系K均值可以看成是高斯混合模型的特例。对K均值算法与EM算法进行比较后，可以发现它们之间有很大的相似性。K均值算法将数据点硬（hard）分配到聚类中，每个数据点唯一地与一个聚类相关联，而EM算法基于后验概率进行软（soft）分配。事实上，可以从EM算法推导出K均值算法。考虑一个高斯混合模型，其中混合分量的协方差矩阵由σ2I{\sigma^2}Iσ2I给出，其中σ2{\sig
深入剖析Redis高性能的原因，IO多路复用模型，Redis数据迁移，分布式锁实现
一、深入剖析Redis单线程处理命令仍具备高性能的原因Redis虽然是单线程处理命令的（主线程负责网络I/O和命令处理），但它依然具备百万级QPS的吞吐能力。这个看似矛盾的现象，其实是Redis高性能架构设计和底层实现精妙配合的结果。下面我们从架构、内核原理、操作系统机制、与其他系统对比等多维度深入剖析，为何Redis单线程却读写性能极高。1.Redis是“单线程处理命令”，但不是完全单线程模块是
基于灰色马尔科夫模型预测人口数量，是一种结合灰色系统理论（处理少数据、不确定性）与马尔科夫链（描述随机波动）的融合预测方法
利用灰色模型捕捉人口变化的总体趋势，再通过马尔科夫链修正因随机因素导致的预测偏差，从而提高预测精度。一、模型理论基础灰色系统理论原理（核心：处理少数据、部分信息未知的系统）差异信息原理：系统内外的差异是信息源，人口数据的时间序列差异蕴含变化规律。解的非唯一性原理：信息不完全时，预测结果存在多个可能区间（与马尔科夫状态划分契合）。最小信息原理：仅需少量历史数据（通常≥4个）即可建模，适合人口统计资料
深入剖析Nginx架构及其不同使用场景下的配置 LiRuiJie Nginx Nginx 系统架构反向代理
一、Nginx整体架构概览1.Nginx简介Nginx是采用C语言编写的高性能Web服务器、反向代理服务器及邮件代理服务器，特点是：高并发、高可用、低内存占用、模块化设计。架构核心理念：Master-Worker多进程模型事件驱动（Event-Driven）+异步非阻塞高度模块化设计2.进程模型Nginx的进程模型非常轻量，通常包含：1.Master进程启动时由shell进程fork出来主要负责：
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
TensorFlow Serving学习笔记3: 组件调用关系
一、整体架构TensorFlowServing采用模块化设计，核心组件包括：Servables：可服务对象（如模型、查找表）Managers：管理Servable生命周期（加载/卸载）Loaders：负责Servable的初始化状态管理Sources：提供新版本Servable的LoaderAspiredVersions：Servable的期望状态集合Core：连接所有组件的核心枢纽APIs：gR
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
C# 中 EventWaitHandle 实现多进程状态同步的深度解析 Leon@Lee c#开发语言
在现代软件开发中，多进程应用场景日益普遍。无论是分布式系统、微服务架构，还是传统的客户端-服务器模型，进程间的状态同步都是一个关键挑战。C#提供了多种同步原语，其中EventWaitHandle是一个强大的工具，特别适合处理跨进程的同步需求。本文将深入探讨EventWaitHandle的工作原理、使用场景及最佳实践。一、EventWaitHandle基础原理EventWaitHandle是.NET
64、Delphi系统架构与线程模型详解 g8f9d0s1a2 深入解析Delphi 6开发者指南 Delphi 系统架构线程模型
Delphi系统架构与线程模型详解1系统架构概述Delphi作为一款强大的集成开发环境（IDE），其系统架构设计不仅体现了高效性，还融合了灵活性和可扩展性。理解Delphi的系统架构是掌握其核心功能和开发技巧的关键。本文将详细介绍Delphi的系统架构及其各组成部分的交互方式，帮助开发者更好地利用这款工具。1.1Delphi系统架构的基本组成部分Delphi的系统架构主要包括以下几个关键部分：编译
Redis网络通信模块深度解析：单线程Reactor到多线程IO的架构演进
一、核心架构：单线程Reactor模型Redis网络模块采用经典Reactor模式，核心流程如下：voidaeMain(aeEventLoop*eventLoop){while(!eventLoop->stop){//前置钩子（集群心跳/数据持久化）if(eventLoop->beforesleep)eventLoop->beforesleep(eventLoop);//事件分派：I/O复用+定时
【安装Stable Diffusion以及遇到问题和总结】岁月玲珑 AI stable diffusion AI编程 AI作画
在本地安装部署StableDiffusion，需要准备好硬件环境，安装相关依赖，然后配置模型。下面为你详细介绍安装部署的步骤：一、硬件要求显卡：需要NVIDIAGPU，显存至少6GB，推荐8GB及以上。系统：Windows10/11、Linux（Ubuntu等）或macOS（需要Rosetta2）。内存：至少16GBRAM。存储空间：准备10GB以上的可用空间。二、软件准备首先要安装Python和
css同心圆扩散 weixin_43966308 css布局
同心圆扩散要点：定位：每个圆形定位要相同，因为为了达到同心圆扩散的效果有一个定宽定高的圆形，剩下的圆形通过缩放和透明的改变而改变，因此必须保证定位的位置相同为了达到垂直居中的效果，可以通过transfrom(-50%,-50%),但是因为需要通过transfrom的缩放来达到扩散的效果，因此会发现之前水平垂直的效果没有达到，因为被动画中的trasnfrom缩放的语句覆盖了可以通过margin负值宽
基于SIP的视频会议系统研究 weixin_33921089 数据库
摘要根据IETFSIPPING工作组提出的集中式会议模型，设计并实现了基于SIP的视频会议系统。该系统各部分可分别设计，具有良好的可扩展性。详细介绍了此系统的结构和工作原理。关键词SIP视频会议会议控制服务器会场控制媒体服务器0前言近几年来，随着计算机技术、通信技术和互联网技术的飞速发展，视频会议的应用范围正逐渐从传统的专业领域、大型企业等高端用户向中小企业等普通用户和个人用户拓展。据有关机构的分
css3 圆形水波纹特效程序媛之博客 css3 前端 css
需求描述：需要制作一个动画，特效从圆心开始往外扩散，然后又往回收。效果图：实现代码：.circle{width:100rpx;height:100rpx;background-color:#FF4C4C;border-radius:50%;/*圆形*/box-shadow:inset00010rpxrgba(255,255,255,0.5),/*内阴影，初始半透明圆*/inset00020rpxr
使用html+css+jquery实现3D轮播图 mini_055 jquery html css
还是先来看看效果图：通过效果图我们先理一下思路：首先就是需要几张图片，但只有一张是显示在我们眼前的第二步：把一张图片分成几等份，这样点击转换的时候就会分开转第三步：就是实现点击按钮切换下一张。HTML部分HTML部分首先我们需要一个盒子显示图片，然后在盒子里装入图片，你想装几张图片就可以写几个li,除了图片我们还需要一个按钮来点击。一个li的图片效果如图所示：div是当你点击下一张的时候一个div
大模型笔记10：LoRA微调 errorwarn 笔记
LoRA微调的原理矩阵的秩矩阵的秩代表一个矩阵中所含信息的大小。行秩：矩阵中互相不重复、不依赖（即线性无关）的行的最大数目。列秩：矩阵中互相不重复、不依赖的列的最大数目。事实上，行秩和列秩总是相等的，因此我们通常直接称之为“矩阵的秩”。Transformer中微调哪些参数：LoRA的改进版本
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
MongoDB与Redis有哪些区别相遇在春风里经验分享
MongoDB和Redis是两种不同类型的数据库，它们存在以下区别：一、数据模型MongoDBMongoDB是一个文档型数据库，它使用BSON（BinaryJSON）格式存储数据。数据以类似JSON的文档形式组织，每个文档可以有不同的结构（即模式自由）。例如，在一个存储用户信息的集合中，一个用户文档可能包含姓名、年龄、地址等字段，而另一个用户文档可能还包含额外的兴趣爱好字段。这种数据模型非常适合处
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

Medical Diffusion - Denoising Diffusion Probabilistic Models for 3D Medical Image Generation

Medical Diffusion - Denoising Diffusion Probabilistic Models for 3D Medical Image Generation

摘要

介绍

相关工作

结果

Medical Diffusion Models can be Robustly Trained

Medical Diffusion Models can Generate High Quality Medical 3D Data

The Dimension of the Latent Space is Important for High Quality Image Generation

Medical Diffusion Models outperform GANs in Terms of Image Diversity

Synthetic Data can be Used to Train Neural Networks

讨论

Online Methods

数据集说明

数据预处理

Architecture

VQ-GAN

Diffusion Models

Putting It All Together

数据可用性

你可能感兴趣的:(扩散模型,医学图像重建,3d,深度学习)