通街市密人有

Score-based diffusion models for accelerated MRI

基于分数的加速MRI扩散模型

摘要

基于分数的扩散模型提供了一种使用数据分布梯度对图像进行建模的强大方法。利用学习到的分数函数作为先验函数，这里我们介绍了一种从给定测量值的条件分布中采样数据的方法，以便该模型可以很容易地用于解决成像中的逆问题，特别是用于加速MRI。简言之，我们训练了一个连续的时间相关的分数函数和去噪分数匹配。然后，在推理阶段，我们在数值SDE求解器和数据一致性步骤之间迭代以实现重构。我们的模型只需要用于训练的图像，但能够重建复杂值数据，甚至可以扩展到并行成像。所提出的方法不受子采样模式的影响，并且具有良好的泛化能力，因此它可以用于任何未用于训练数据的身体部位的任何采样方案。此外，由于其生成性，我们的方法可以量化不确定性，这在标准回归设置中是不可能的。除了所有优点之外，我们的方法还具有非常强的性能，甚至超过了在完全监督下训练的模型。通过大量的实验，我们验证了我们方法在质量和实用性方面的优越性。

1. 介绍

近年来，磁共振成像（MRI）的亚采样测量重建方法取得了很大进展。正则化重建方法利用手工制作的先验数据的稀疏性以及数据的一致性来得出解决方案（Donoho，2006），但先验的构造是十分重要的，并且没有一种方法能够正确地建模MRI扫描的实际复杂数据分布 $p_{data}$ 。数据驱动的深度学习方法可以直接（Wang等人，2016）或间接（Oh等人，2020；Yaman等人，2020）训练模型，但这些方法严重依赖于精心策划的k空间数据大型数据库的监督，这很难获得。

最近，基于分数的模型（Hyvärinen和Dayan，2005；Song和Ermon，2019）和去噪扩散概率模型（DDPM）（Sohl Dickstein等人，2015；Ho等人，2020）作为一种新的生成模型获得了广泛的兴趣，这种模型在没有对抗性训练的情况下实现了惊人的高样本质量（Song等人，2021b；Nichol和Dhariwal，2021；Dhariwal和Nichol，2021）。在许多著作中，Song等人（2021b）将离散分数匹配程序一般化为连续随机微分方程（SDE），事实上，该方程也将扩散模型纳入同一框架。我们指的是基于分数的SDE作为基于分数的扩散模型，强调我们提出的方法可以灵活地用于两个模型类的任何实现：基于分数的生成模型和扩散模型。

基于分数的扩散模型根据前向SDE通过注入高斯噪声来扰动数据分布，从而获得可处理的分布（例如各向同性高斯分布）。为了从数据分布中采样，可以训练神经网络来估计对数数据分布的梯度（即， $_ x log p（x）$ ），并使用它数值求解反向SDE。使用这些基于分数的扩散模型从 $p （ x ）$ 无条件生成样本已发现其在图像（Song等人，2021b；Nichol和Dhariwal，2021；Dhariwal和Nichol，2021）、音频（Kong等人，2021）和偶数图（Niu等人，2020）合成中的应用。在众所周知的计算机视觉问题背景下，也研究了 $p （ x ∣ y ）$ 的条件生成：绘画（Song和Ermon，2019；Song等人，2021b）、超分辨率（Choi等人，2021；Saharia等人，2021）和图像编辑（Meng等人，2021）。

在这项工作中，我们提出了一个普遍适用于解决成像中的逆问题的框架，特别是针对MRI重建任务。值得注意的是，我们的方法只需要使用幅度图像训练单个分数函数。使用使用去噪分数匹配损失的训练分数模型，我们从方差爆炸（VE）-SDE（Song等人，2021b）构建了反向SDE的求解器，这使得我们能够从分布 $p （ x ∣ y ）$ 测量y为条件。这是通过在无条件更新步骤之后的每次迭代中强制执行数据一致性步骤来完成的。

尽管没有训练分数函数来解决图像重建任务，但我们的方法实现了最先进的性能，甚至优于专门针对复杂图像的图像重建任务以监督方式训练的模型。此外，我们的模型与加速过程中使用的子采样模式无关，而监督模型在每次设计新的采样方案时都需要重新训练。此外，所提出的方法可以扩展到使用以前从未见过复值数据的单个网络重建复值MR图像采集。更重要的是，我们的方法可以很容易地应用于具有相同得分函数的实际多线圈设置，其中通过得分函数的更新可以并行应用于每个线圈图像。值得一提的是，训练后的分数函数的泛化能力要大得多。事实上，当我们尝试重建严重超出训练数据分布的数据（例如，不同的对比度，甚至不同的解剖结构）时，我们仍然能够实现高保真度重建。

最后，所提出的方法本质上是随机的，因此，我们可以从同一测量向量y中对多个重建结果进行采样。这特别有用，因为我们能够量化不确定性，而无需任何特定处理（例如，蒙特卡罗 dropout （Gal和Ghahramani，2016），直接估计神经网络的方差（Kendall和Gal，2017））。我们观察到，在低加速因子下，后验样本之间的偏差不大，这意味着网络的可信度很高。随着加速因子被推到更高的值，方差逐渐增加，这可能有助于从业者的决策。

2. 背景

2.1. Score-based SDE

我们可以用 $x (t)$ 构造一个连续扩散过程 ${x(t)}^t_{t＝0}∈R^n$ ，其中 $t \in [0 ， T]$ 是级数的时间索引，n表示图像维度。我们选择 $x(0)∼ p_{data}$ 和 $x(T)∼ p_T$ ，其中 $p_{data}$ ， $p_T$ 分别指感兴趣的数据分布和可用于采样的先验分布（例如球形高斯分布）。然后，可以将随机过程构造为以下SDE的解:

可以通过为f和g选择不同的函数来构造不同的SDE:

其中0<β（t）<1是噪声尺度的单调递增函数，可以实现方差保持（VP）-SDE（Ho等人，2020）。在这种情况下，信号的幅值衰减为0，方差保持为固定常数 $t \to \infty$ . 事实上，VP-SDE可以被视为DDPM的连续版本（Song等人，2021b；Kingma等人，2021）。因此，虽然DDPM是在一个单独的变分框架中开发的，但它也可以被视为SDE的一个真实化。

另一方面，方差爆炸（VE）SDE选择

其中 $σ (t) > 0$ 再次是单调递增函数，通常选择为几何级数（Song和Ermon，2019；Song等人，2021b）。与VP-SDE不同，VE-SDE以非常大的方差扩散信号，随着时间的推移$t→ ∞ $, 因此得名。

经验上，我们发现使用VE-SDE通常会导致更高的样本质量，因此我们将重点放在以后在VE-SDE的基础上开发我们的方法。然而，我们注意到，在我们的框架下，VP-SDE（包括在变分框架下开发的DDPM家族）的使用也是直接的。

有趣的是，（1）的逆过程可以用另一个随机过程构建（Song等人，2021b）：

其中dt是无穷小的负时间步长，而 $\widetilde{w}$ 又是标准n−维度布朗运动向后运行。最后一个等式是插入等式（3）至等式（4）。

为了解（4），我们必须知道所有t的分数函数。我们可以用时间条件神经网络 $s_θ(x(t),t)≃∇_xlogp_t(x(t))$ ，并将该项重新放置在（4）中。由于我们不知道真实分数，我们可以使用去噪分数匹配（Vincent，201 1），在这里我们替换未知 $_xlogp_t(x$ 与 $_x logp_{0 t}(x(t)|x(0))$ ，其中 $p_{0t}$ 是高斯摄动核，它摄动概率密度 $p_0(x)$ 到 $p_t(x)$ 。在某些正则性条件下，用去噪分数匹配训练的 $s_θ$ 将满足 $s_{θ∗} (x(t),t)=∇_xlogp_t(x)$ 几乎可以肯定（Song等人，2020）。

其中，λ（t）是一个适当的加权函数，例如Song等人（2021a）的似然加权，它根据时间t进行不同的强调。在高斯摄动的情况下，摄动核的梯度可以用公式表示： $_x logp_{0 t}(x(t)|x(0))=(x(t)−x(0))/σ$ 。直觉上，我们也可以理解（5）为训练神经网络去噪 $x (t)$ ，它是通过将噪声加到 $x (0)$ 上而构建的。

在Song和Ermon（2019）中，通过一个示例性的玩具示例显示，当你将高斯噪声添加到随机变量中时，你基本上得到了原始密度的模糊版本，这实际上来自于两个随机变量的相加对应于两个密度的卷积的性质（Loeve，2017）。因此，当训练分数函数以跨多个噪声尺度对给定数据进行降噪时，可以使用纯噪声开始扩散过程，并根据数据密度的梯度信息逐渐降低噪声。所以，我们可以得出数据分布的高密度模式。

一旦用（5）训练了网络，我们就可以插入近似 $s_θ(x(t),t)≃∇_xlogp_t(x(t))$ 来求解等式（4）中的反向SDE：

然后，我们可以用数值方法求解SDE，例如，使用Euler-Maruyama离散化（Song等人，2021b）。这包括将范围 $[0 ， 1]$ 中的t均匀地分解为N个区间，使得 $0=t_00=t0<t1<⋅⋅<tN=1$

3. 主要贡献

3.1. Forward Measurement Model

在加速MRI中，我们考虑以下测量模型:

其中 $y∈C^m$ 是测量值， $x∈C^n$ 是潜像，参数化正向测量矩阵 $a∈C^{m×n}$ 定义为:

其中 $S := [S (1) ； \dots ； S (c)]$ 是c个不同线圈的灵敏度图， $\mathcal{F}$ 表示傅立叶变换， $P_{\Omega}$ 是一个具有0和1的对角矩阵，表示具有给定采样模式的子采样算子 $\Omega$ 。灵敏度图S是标准化的

在单线圈采集的情况下，S简化为单位矩阵，使得 $A_{(sc)}＝P_{\Omega}\mathcal{F}$

3.2. 用于加速MRI重建的反向SDE

找到等式（7）的解的经典方法是解决以下约束优化问题：

其中 $\Psi(.)$ 是从压缩感知（CS）理论（Donoho，2006）中导出的稀疏性促进正则化器，例如L1小波（Lustig等人，2007）和总变化（TV）（Block等人，2007年）。求解等式（10）通常涉及近端算法，例如变量分裂（Boyd等人，201 1）或凸集投影（POCS）（Samsonov等人，2004），这些算法消除了先验项和前向一致性项的优化。然后，可以交替解决这两个子问题，以达到最佳效果。

从贝叶斯的角度来看，我们马上就看到了 $\Psi(x)$ 等式（10）中的（x）是数据的先验模型，即 $p (x)$ 。因此，我们可以想象，通过更准确地估计复杂的先验数据分布，可以获得更高质量的样本。

也就是说，与经典方法相比，提出的方法的一个重要区别是，我们利用随机样本，而不是建模先验分布 $p (x)$ 。具体而言，来自先前分布的样本可以可从等式（4）中的反向SDE获得，如算法1所示:

然后，（10）中约束的数据一致性映射可以通过:

对于 $λ \in [0 ， 1]$ ，其中 $A^∗$ 表示A的厄米伴随。

与我们的伴随工作（Chung等人，2021）类似，我们对算子A施加约束，使得 $I− λA^∗A)$ 是非扩张映射（Bauschke等人，201 1）：

例如，（Tang等人，201 1；Fan等人，2017）中的凸集投影（POC）或具有受控步长的标准梯度下降的一次迭代（Jalal等人，2021；Ramzi等人，2020）对应于非扩展数据一致性映射。

在下文中，（9）中的标准化步骤对于确保（I）− λA∗A）确实是不可扩展的：

其中 $(a) (b)$ 是二次采样算子 $P_{\Omega}$ ， $(c)$ 来自傅立叶变换的正交性， $(d)$ 来自（9）。因此，我们有

这就是证明。

公式的应用。（11）和（12）对应于预测器步骤。当使用算法1中的附加校正步骤时，也可以对离散校正步骤进行相同的处理

其中 $\epsilon{i}$ 是第i次迭代的步长。迭代应用预测器和校正器步骤，如PC算法中的步骤，产生了推理算法，该算法在算法2中进行了正式描述

其中λ=1。

不幸的是，只有当我们先验地知道信号仅包含实值时，才能使用该算法，并且必须小心，因为在MRI重建的大多数实际情况下，我们想要重建的信号是复杂的。由于基于分数的SDE的原始理论（Song等人，2021b）没有考虑复杂信号，因此在使用分数函数重建数据时，这引入了一个警告。

一种可行的方法是训练分数函数，使其处理复杂信号，这是在（Ramzi等人，2020年）中提出的。在实现方面，这对应于将信号的实部和虚部视为单独的通道，并应用去噪分数匹配目标来处理2×H×W大小的图像，其中H和W分别是图像的高度和宽度。然而，我们根据经验发现，这种处理降低了网络训练的稳定性，也损害了使用算法2进行重建的性能。我们进一步注意到，这种处理方式限制了实用性，因为模型现在需要原始k空间数据进行训练。

为了克服这些限制，我们对算法2提出了一个简单的修正，该算法提供了一种仅使用幅度图像训练的分数函数sθ，并将其用于重建复杂图像的方法。该方法在算法3中给出

其中我们将图像分成实部和虚部，并分别对每个部分应用预测-校正步骤。因此，我们可以使用与用mag-nitude图像训练的相同的得分函数，以无缝的方式处理复杂的图像数据。这种简单的修复方法效果出人意料地好，我们在第5.2节中表明，使用算法3重建复值线圈数据甚至优于经过显式监督训练的标准前馈神经网络。由于我们只能使用DICOM数据来训练神经网络，因此能够利用仅用幅度数据训练的得分函数来重构复值数据是一个很大的优势。这是有利的，因为过多的MR扫描以DICOM的形式存在（Zbontar等人，2018），而原始k空间数据通常由于其过大的内存大小而被丢弃。

3.3. Diffusion model meets Parallel Imaging (PI)

虽然所提议的基于分数的复杂值数据重建框架非常有用，但大多数现代MRI扫描仪（Zbontar等人，2018年）都有多个接收器线圈，它们以不同的灵敏度捕获信号。自PI（Deshmane等人，2012年）出生以来，文献中提出了许多重建真实潜在信号的技术，其中最突出的两种是SENSE（Pruessmann等人，1999年）和GRAPPA（Griswold等人，2002年）。前一种方法需要估计或校准线圈灵敏度图，这些图与（7）中规定的正向模型相结合。相反，后一种方法通过简单地取每个重建线圈图像的平方根和（SSOS），从而减少了对灵敏度图的需要（Roemer等人，1990）。这种方法是临床实践中使用最广泛的方法之一，因为它具有一些优点，包括易于实现。在这里，我们展示了基于分数的方法可以无缝地集成到SSOS类型的方法中。

具体而言，如算法4所述:

我们的目标是逐个线圈重建数据线圈。对于PI，为了简洁起见，我们将数字校正步长设置为1，即M=1。更具体地说，与GRAPPA不同，我们只需将算法3单独应用于每个线圈图像，而不是估计GRAPPA核，如图2（a）所示。值得注意的是，尽管我们的得分函数估计 $s_θ(x(t),t)≃∇_xlogp_t(x(t))$ 未使用单独的线圈图像进行训练，因为独立线圈图像的分布与 $p (x)$ 相差不大，因此简单地将算法3应用于每个线圈图像可获得非常精确的重建。

算法4的一个缺点是线圈重建之间不存在串扰。这可能是次优的，因为重建过程没有考虑到所有线圈图像都来自同一图像。相反，为了更好地利用不同线圈图像之间的相关性，我们通过结合SENSE类型约束，在算法5中额外实现了混合类型方法。

具体来说，对于每m个单独线圈更新步骤，我们使用以下更新强制线圈之间的依赖关系：

其中λ∈ [0，1]决定了数据一致性的强加程度， $A_{(mc)}$ 是（8）中定义的标准多线圈正向测量矩阵。一旦完成，我们就可以通过SSOS操作得出最终结果。如图2（b）所示。

通过在迭代过程中应用更新步骤（16），并线性减小λ值，我们可以观察到性能的提高和更清晰的重建。

在不同的采样模式中，我们看到算法5通常在1D采样模式下表现更好，而算法4对2D图案执行得更好。因此，我们报告了使用算法5进行1D欠采样的重建，以及使用算法4进行2D欠采样的重构。SSOS类型和混合类型方法的一个警告是推理速度慢。与单线圈重建相比，天真地实现这些算法将导致c倍的计算时间。但是，这可以通过对每个线圈数据执行并行计算而大大减轻，因为不需要在线程之间共享计算。给定足够的GPU资源，我们预计PI重建所需的计算时间将减少到单线圈重建所需时间。

4. 方法

4.1. 实验数据

主要实验（包括分数函数的训练）是使用fastMRI膝关节数据集（Zbontar等人，2018）进行的，该数据集是公开的。我们使用320×320大小的目标图像大小训练网络，给出了关键reconstruction_esc ，但我们在性能上没有发现显著差异。

在973卷训练数据中，我们删除了每个卷的第一个和最后五个切片，以避免使用仅含噪声的数据训练模型。这将产生大约25k条训练数据。为了进行测试，我们从验证集中随机抽取了30个卷，并从每个卷中删除了第一个和最后5个切片。对于PI实验，由于计算的限制，我们使用了10个体积。

4.2. 实施详细信息

我们按照（Song等人，2021b）中建议的类似程序训练VE-SDE。具体来说，我们使用等式（5）中给出的目标训练网络，设置 $λ (t) = σ$ 。插入加权函数，我们可以用以下成本训练模型：

设置为 $\epsilon$ =10−5来规避数字问题。

步长 $\epsilon_{i}$ 在Langevin MC校正器步骤中使用，我们遵循（Song等人，2021b）中的建议，并设置

其中r＝0.16被设置为恒定值。对于噪声方差计划，我们确定 $σ_{min}=0.01，σ_{max}=378$ ，类似于（Song和Ermon，2020）技术中的修正，然后采用以下形式的几何级数：

我们取批量大小为1，并使用Adam优化器优化网络（β1=0.9，β2=0.999）。我们使用线性热身计划优化的前50 0步的参数，在第50 0步达到2e-4。我们应用最大值为1.0的梯度剪裁（Arjovsky等人，2017）。指数移动平均率0.999应用于参数。

优化进行了100epoches，用一个RTX 3090 GPU训练分数函数大约需要3周。

所有代码都在PyTorch中实现（Paszke等人，2019）。

对于所有算法，我们使用N＝20 0 0，M＝1迭代作为参考，除非另有规定。对于混合型算法5，我们从λ=1开始。在第一次迭代中为0，并且lin-早期将值减小到λ=0。在最后一次迭代时为2。预测器和校正器步骤都需要单次向前通过sθ，使用普通GPU大约需要150ms。

综上所述，这导致实值图像的重建时间约为10分钟，复值图像的重构时间约为20分钟。我们在第6.1节中讨论了加快推理的方法，以及未来研究的一些潜在方向。

4.3.模型架构

我们以（Song等人，2021b）中建议的时间相关分数函数模型ncsnpp 2的实现为基础。模型架构源自U-Net（Ronneberger等人，2015年），组成U-Net的子块取自BigGAN的剩余块（Brock等人，2019年）。剩余块中的跳过连接按1/缩放√ 2（Karras等人，2017；2019；2020）。对于池和非池，我们采用了抗混叠池（Zhang，2019）。由此产生的U-Net具有4个不同级别的规模，每个级别有4个剩余网络。使用傅立叶特征（Tancik等人，2020）对具有时间索引t的网络进行调节，其中条件特征被添加到编码器特征中。有关详细信息，请参见附录。

4.4.比较研究

为了验证优于当前标准的优势，我们使用（Zbontar等人，2018年）中使用的基线方法进行比较研究。我们选择总变异（TV）重构（Block et al，2007）作为代表性的CS重构方法，其中我们使用sigpy.mri.app中的实现。TotalVariationRecon 3.我们对超参数lambda执行网格搜索，并只报告其中的最佳结果。

对于具有代表性的深度学习方法，我们使用U-Net进行基于监督学习的重构（Zbontar等人，2018）。

虽然我们可以使用开源的4预训练模型，但我们重新实现了该模型以获得更好的性能。

我们还与最先进的监督方法进行了比较。对于实值模拟研究和单线圈实验，我们将其与DuDoRNet（Zhou和Zhou，2020）进行比较。

我们使用官方实现5，有4个重复块和默认参数。我们使用相同的质子密度（PD）/质子密度脂肪抑制（PDFS）图像作为先验信息。对于最先进的并行成像方法，我们使用端到端变分网络（E2E varnet）（Sriram等人，2020），该网络同时估计灵敏度图。我们使用官方fastMRI github和fastMRI膝盖数据集建议的默认参数。对于所有深度学习比较研究，我们使用高斯1D随机采样掩码训练网络。

4.5重建质量的测量

为了量化重建与目标的接近程度，我们使用标准度量-峰值信噪比（PSNR）和结构相似性指数（SSIM）。我们使用MedCalc软件（Schoonjans等人，1995年），使用重复测量方差分析（RM-ANOVA）进一步测试差异的统计学意义。虽然这是社区中使用最广泛的两个指标，但众所周知，这些指标几乎与放射科医生对图像质量的评分不符（Mason等人，2019年）。

为了充分发挥所提方法的优势，我们将重点放在这样一个事实上，即良好的重建是可以用于准确诊断的重建。如果重建质量与地面真实情况紧密匹配，则下游任务的性能不应退化-在我们的案例诊断中。为了与地面真实情况、每次重建的诊断能力进行比较，我们利用了最新的fastMRI+（Zhao等人，2021）数据集。对于fastMRI膝关节数据，fastMRI+注释提供了病理区域周围的边界框。我们使用地面实况（完全采样）图像训练标准对象检测模型，并使用该网络比较模型在病理检测和使用不同方法重建方面的表现。通过这样做，我们可以测量每种重建方法所发生的分布偏移量。性能差异越小，我们得出的结论是，完全采样数据的分布偏移越小。有关详细的实验程序，请参阅下一节，即第4.6节。从实验中，我们量化了物体检测文献中的三个标准度量-平均精度（mAP）、精度和召回率。

4.6.病理检测

对于对象检测模型，我们使用最先进的YOLO v5 6。我们使用YOLOv5m的默认配置，这是一个中型模型，当您没有足够的数据量时，通常建议将其作为基线模型。当我们试图适应更大版本的模型时，即YOLOv5l、YOLO5x等，我们发现会出现过度拟合，性能会下降一小部分。

对于YOLOv5模型的训练数据，我们在fastMRI+中使用了所有带注释的训练数据。我们不会在训练集中包含任何没有注释的图像。为了进行测试，我们从验证集中随机选择了15个案例。

模型权重从开源预训练模型中进行了微调，并使用16个批次大小进行了300个时期的训练。训练在2×2080Ti GPU上花费了大约一天的时间。

4.7.对不同解剖和对比的概括

可以观察到的一点是，所提出的方法利用分数函数作为算法的主要工作负载，对分布偏移具有鲁棒性。否则，算法3、4、5一开始就不会起作用，因为训练数据分布和推理数据分布是不同的。随后，人们可能会想，我们能在多大程度上推动这一差异，同时仍能取得令人满意的结果。为了进一步研究该方法的泛化能力，我们使用从不同解剖和对比中收集的数据进行了广泛的实验。为了实现最大的多样性，我们收集了来自各种开放源代码的数据数据库，包括mridata Flynn等人，人类连接体项目（HCP）MRI数据集（http://db.humanconnectome.org，http://github.com/hkaggarwal/modl，和MASSIVE 7（http://massive-data.org/index.html）。对于实验，所有数据都是从完全采样的k空间中进行回顾性下采样的。

5. Results （不展示）

5.1. Real-valued Simulation study

5.2. Complex-valued Single-coil Reconstruction

5.3. Complex-valued Multi-coil Reconstruction

5.4. Pathology detection

5.5. Quantifying uncertainty of the prediction

5.6. Reconstruction out-of-distribution (OOD) data

6. 讨论

6.1. 加快推理速度

使用基于分数的扩散模型进行图像重建的一个明显限制是推理所需的时间。像如第4.2节所述，使用N＝20 0 0离散化步骤需要大约10分钟的推理时间。一种快速推理的新方法是减少离散化步骤的数量，我们在图10中提供了图像质量与步骤之间的权衡。在这里，我们观察到，对离散化步骤进行新的交织效果很好，图像质量的折衷最小。这尤其是在低加速因子（例如，×4）的情况下，在这种情况下，我们只需50次迭代就能实现高精度重建。随着加速因子变得越来越强，我们的方法通常需要更多的迭代来获得最大的性能。然而，从图中我们可以看到，性能上限约为N=500。根据手头的加速程度，可以随时将其调整为一个超参数。

我们还可以采用最先进的扩散模型加速策略来解决反问题，称为“更接近-扩散更快”（CCDF），这是我们公司最近提出的（Chung等人，2021）。具体而言，CCDF表示无需使用完全反向扩散程序。相反，可以从更好的初始化开始应用前向扩散图像的反向扩散，以实现一个或更好的重建性能。由此产生的短部分时间范围显著加快了重建时间。该策略得到了使用随机收缩理论的严格证明。读者可参考Chung等人（2021）。

更具体地说，指定一个非常短的时间步长t0 $N^‘:=t_0N$

然后，在一个步骤中，用预刻划的正向SDE对初始重建x0进行正向扩散。对于VE-SDE，这对应于

然后可以按照相反的SDE进行 $t∈ [0，t_0]$ 如算法2,3,4,5。为了简单起见，这里我们给出了算法2采用的CCDF，如算法6所示。

对于 $x_0$ 的初始化，我们重新排序到U-Net。通过这种预先训练的饲料的简单组合前向神经网络，我们观察到可以使用40次迭代（对应于0.02×NFE ），具有类似或更好的性能，如表3所示

6.2.使用扩散模型的条件生成

基于分数的扩散模型现在是图像合成中最流行的方法之一，与最先进的GANs的图像保真度相匹配（Dhariwal和Nichol，2021），并在各种数据集上实现最先进的对数似然（Kingma等人，2021；Kim等人，2021）。使用这些模型生成条件图像的兴趣也在增加。

Song和Ermon（2019）首次提出使用经过离散去噪分数匹配训练的分数模型进行图像修复。这在（Song等人，2021b）中得到进一步发展，用于使用连续时间分数模型进行图像着色和类条件图像合成。同一组发表了一篇使用VE-SDEs的图像编辑工作（Meng等人，2021），该工作使用了与中使用的图像修复类似的算法（Song和Ermon，2019；Song等人，2021b）。ILVR（Choi等人，2021）采用扩散模型（Ho等人，2020）进行图像超分辨率和图像翻译。所有这些工作都需要训练与实际目标任务无关的分数模型，因此是灵活的。尽管如此，所有先前的工作都集中于条件也停留在图像域中的应用，这使得问题更容易解决。

我们的方法通过显示条件可以应用于不一定在同一图像域中的测量域来增加灵活性。我们知道有一项先前的工作将去噪分数匹配用于MRI重建（Ramzi等人，2020年）。（Ramzi等人，2020）的研究人员使用摊余残差去噪自动编码器（AR-DAE）分数匹配损失（Lim等人，2020）来训练分数函数，然后使用退火哈密顿MC（Neal等人，201 1）从测量中进行重构。然而，（Ramzi等人，2020年）报告称，他们的方法在很大程度上落后于监督学习方法，尤其是在考虑单个样本时。此外，（Ramzi等人，2020年）中的培训方法以单独的渠道综合体为目标-有价值的数据，这限制了它们的应用。另一方面，我们的方法优于在监督下训练的神经网络，并且只需要训练幅度图像。值得注意的是，所提出的方法适用于PI。

本文提交后，我们发现了两个与拟议工作密切相关的独立作品。Jalal等人（2021）提议使用基于分数的生成模型来训练类似于我们的分数函数，并通过假设高斯测量噪声，通过退火Langevin dynamics（ALD）（Song和Ermon，2019）采样，以获得关于数据可靠性项的梯度信息。正如我们的工作所示，Jalal等人（2021）说明了使用基于分数的生成模型在不同子采样模式和不同解剖结构下进行重建的稳健性。我们和Jalal等人（2021）之间最大的区别在于，我们的方法只需要DICOM图像来训练分数函数。这与Jalal等人（2021）形成鲜明对比，因为他们需要完全采样的k空间数据来训练分数函数。

此外，我们的工作基于分数匹配的连续版本（Song等人，2021b），而Jalal等人的工作（2021）基于离散版本（Song和Ermon，2020）。还值得一提的是，我们使用了先进的采样器（PC）和更高效的网络架构，这被证明可以通过一个大的模型来提高生成建模的性能（Song等人，2021b）。最后，Jalal等人（2021）介绍了整理数据保真度梯度项，这需要指定每个噪声标度的方差计划。我们的方法没有额外的超参数，因此更容易实现。

Song等人（2022）可能与我们的工作最相关，因为作者还建议使用VE-SDE of（Song等人，2021b），并且他们与PC采样器一起使用相同的网络架构，就像我们的工作一样。我们的工作与Song等人（2022）的关键区别在于，我们得到了能够重构复值数据以及多线圈数据的解算器。Song等人（2022年）只专注于解决实值图像的模拟重建，这限制了实用性。此外，数据保真度强制步骤与我们的工作略有不同。

6.3.能源模型

基于能量的模型（EBM）是非归一化概率模型，其优点是避免了计算归一化常数（即分配函数）的需要（Song和Kingma，2021）。我们的工作依赖于去噪分数匹配来估计分数，这也属于EBM的范畴。当然，还有其他方法来训练循证医学，除分数匹配外，最广为人知的方法之一是对比发散（CD）（Carreira Perpinan和Hinton，2005）。

与我们的工作同时，提出了一种利用CD的MR加速算法（Guan等人，2021）。这项工作将他们的方法建立在持续对比发散（PCD）训练的EBM上，这是使用样本缓冲区的CD变体（Du和Mor-datch，2019）。具体而言，参数化能量函数Eθ。一旦训练了能量函数，就可以通过MCMC生成无条件样本，或者在MCMC更新步骤之间应用数据一致性投影，从条件分布中进行采样。

这个过程实际上与我们的方法相似，经过训练的函数形成了 $_xlogp_θ(x)=−∇ θ(x)$ 。然而，我们注意到拟议方法与（Guan等人，2021）的两个关键区别。首先，为了用CD训练Eθ，必须在每次迭代训练时用MCMC产生负样本，这是非常重要和昂贵的。一些启发式需要以使算法工作。相比之下，我们的分数函数的训练更加直接和稳健，分解为损失函数的显式形式，如等式（17）所示。其次，我们的方法只需要幅值（DICOM）图像进行训练，而（Guan等人，2021）需要原始数据。

6.4.逆问题的生成模型

在最近扩散模型激增之前，已有几种方法使用生成模型，特别是一般对抗网络（GAN）（Goodfello等人，2014）作为求解反问题的先验（Marinescu等人，2021；Asim等人，2020）。与针对特定问题训练的监督模型相比，这些方法提供了改进的灵活性。相反，人们可以利用训练有素的发电机Gæ，它是在没有前沿物理知识的情况下训练的。本质上，为了使用GAN先验解决逆问题，通常会针对以下方面进行优化：

其中A和y如等式（7）所定义，z表示潜在（噪声）矢量。这对应于找到使数据保真度最小化的正确潜在向量z。

这对应于调整模型参数，使得生成器适应问题的正向物理。一旦优化通孔（20）或（21）完成，一次通过发生器 $G_{\psi}$ 的正向传输就足以进行重建。不幸的是，这些方法存在一些问题。

首先，问题（20）和（21）都很难解决，需要使用一些启发式方法，例如使用复杂的损失函数（Marinescu等人，2021；Asim等人，2020）。考虑到GAN本身也是众所周知的难以训练的，依赖GAN先验的方法相对难以复制。第二，最后的重建步骤涉及一次前向通过 $G_{\psi}$ 。对于高度病态问题，从这一次通过中生成高质量样本可能特别困难，这可能是难以实现高质量和数据保真度重建的原因。

提出的方法建议使用扩散模型代替GAN，解决了这两个问题。扩散模型具有相对明确的损失，因此更容易训练。此外，采样过程可以用最基本的反问题求解方法轻松完成。此外，使用扩散模型，可以实现细粒度控制，因为我们迭代地优化重构。

6.5.更广泛的影响

所提出的方法可以很容易地应用于计算成像中的其他问题，具有良好的训练得分函数和对推理过程的正确修改。单分数函数已经显示出广泛的适用性：SR（Choi等人，2021；Saharia等人，2021）、图像重建等。这可能会改变目前生物医学成像中的深度学习模式。例如，如果有足够的能力，可以为成像模态训练单个得分函数，并将其用作通用问题求解器。

6.6.限制

为完整起见，这里我们列出了当前工作的两个限制。首先，当我们尝试用1D欠采样模式重建OOD数据时，我们有时会在局部边缘观察到轻微的锯齿状伪影。如图11（1.OOD侦察）所示，伪影不明显。然而，当将所提议的框架扩展到OOD数据时，应该小心，因为健壮性会受到损害。我们注意到，如图9所示，在2D采样模式中没有观察到这种伪影。

第二，当进行极端条件重建时，如图11（2.极端侦察）所示，我们偶尔会获得不令人满意的结果（例如，标有红色虚线的样本）。此外，我们观察到，由于高度不适性，后验样本中的详细结构具有高度差异。因此，当将加速因子推至非常高的值时，应小心，例如，通过对多次重构进行采样并考虑第5.5节中讨论的不确定性。

7.结论

最后，我们提出了一种新的基于分数的加速MRI重建方法。我们通过使用幅度数据的连续时间去噪分数匹配来训练对数数据分布的梯度。使用学习的分数作为先验，可以通过在每个步骤中简单地应用数据一致性投影，从给定测量的条件分布中进行采样。无论是单线圈还是多线圈病例，我们的方法都能产生高精度的重建。与现有技术相比，我们展示了我们的方法在质量和实用性方面的优势。

我们相信，我们的方法为成像中的逆问题开辟了新一代方法。将我们的方法直接应用于其他场地，以测试其通用性是未来研究的一个有趣方向。除此之外，还有留下未回答的问题，例如，缩小我们的方法和前馈神经网络方法之间的重建速度差距。我们希望在不久的将来，将积极讨论许多有趣的问题和答案。

附录

不写了

你可能感兴趣的:(扩散模型,医学图像重建,机器学习,深度学习,人工智能)

star31.6k，Aider：让代码编写如虎添翼的终端神器
ider是一款运行在终端中的AI结对编程工具，它能与大型语言模型（LLM）无缝协作，直接在您的本地Git仓库中编辑代码。无论是启动新项目，还是优化现有代码库，Aider都能成为您最得力的助手。它支持Claude3.5Sonnet、DeepSeekV3、GPT-4o等顶级AI模型，几乎可以连接任何LLM，让编程体验如虎添翼。Stars数35,188Forks数3,230主要特点Git操作：Aider
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
openai-agents记忆持久化（neo4j） ZHOU_CAMP oi_agents agent中的记忆模块 neo4j python 开发语言
目录环境安装模型配置Memory配置测试环境安装mem0ai[graph]安装uvpipinstall"mem0ai[graph]"docker启动neo4j数据库dockerrun\-p7474:7474-p7687:7687\-eNEO4J_AUTH=neo4j/password\neo4j:5模型配置fromdotenvimportload_dotenvimportosfromopenaii
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
2025年渗透测试面试题总结-2025年HW(护网面试) 31（题目+回答）独行soc 2025年护网面试职场和发展安全 linux 护网渗透测试
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)311.自我介绍2.渗透测试流程（五阶段模型）3.技术栈与开发经历4.自动化挖洞实践5.信息搜集方法论6.深度漏洞挖掘案例8.SQL注入实战技巧9.AWVS扫描与防御10.CSRFvsSSRF核心差异11.SSRF正则绕过技术12.虚拟主机识别原
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
mysql 主从复制原理、实现方式以及主从同步延迟的处理方式
mysql主从复制原理、实现方式MySQL主从复制是实现高可用、读写分离和灾难恢复的核心机制，其本质是主库（Master）将数据变更异步同步到从库（Slave）。以下是深度解析：一、主从复制核心原理1.三线程协作模型BinlogDumpThreadI/OThreadSQLThread主库Master从库SlaveRelayLogSlaveDB线程所在位置职责BinlogDumpThread主库监听
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
基于高斯两步移动搜寻法（2SFCA）的城市绿地可达性分析 yorov GIS技巧算法
【2SFCA的基本思路，可以略过】对每个供给点j，搜索所有在j搜寻半径（d0）范围内的需求点（k），计算供需比Rj；对每个需求点i，搜索所有在i搜寻半径（d0）范围内的供【数据】成都市城区绿地数据、各街道小区数据、路网数据OSM【那再来理解一下高斯两步移动搜索法】对于最初的两步移动模型相当于二分，而高斯型相当于是缓慢下降—急速下降—趋于平缓的状态。很像上次莫兰指数里说的空间关系概念化。第一步，对于
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
Java NIO 模型笔记笑衬人心。 JAVA学习笔记 java nio 笔记
目录JavaNIO概述JavaBIOvsNIONIO三大核心组件Channel（通道）Buffer（缓冲区）Selector（选择器）Channel详解Buffer详解Selector详解NIO工作流程图示例代码讲解NIO模型的优缺点NIO与Netty简介总结JavaNIO概述JavaNIO（NewI/O）是从Java1.4开始引入的一套新的I/OAPI。主要用于构建高性能、高并发的网络通信程序。
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
超轻量级中文OCR项目使用教程甄墨疆
超轻量级中文OCR项目使用教程chineseocr_lite超轻量级中文ocr，支持竖排文字识别,支持ncnn、mnn、tnn推理(dbnet(1.8M)+crnn(2.5M)+anglenet(378KB))总模型仅4.7M项目地址:https://gitcode.com/gh_mirrors/ch/chineseocr_lite1.项目介绍本项目是一个超轻量级的中文OCR（OpticalCha
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
善用关系网络：开源AI大模型、AI智能名片与S2B2C商城小程序赋能下的成功新路径
摘要：本文聚焦于关系在个人成功中的关键作用，指出关系即财富，善用关系、拓展人脉是成功的重要途径。在此基础上，引入开源AI大模型、AI智能名片以及S2B2C商城小程序等新兴技术工具，探讨它们如何助力个体在复杂的关系网络中更高效地挖掘和利用资源，提升处理关系的能力，从而为事业成功开拓新道路，揭示这些技术元素在当代成功路径中的创新应用与重要意义。关键词：关系网络；开源AI大模型；AI智能名片；S2B2C
学Simulink——整流器场景：基于Simulink的单相全桥可控硅整流器仿真建模 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 simulink matlab
目录手把手教你学Simulink——整流器场景：基于Simulink的单相全桥可控硅整流器仿真建模一、背景介绍二、系统结构设计三、建模过程第一步：创建新Simulink项目第二步：添加主要模块1.交流电源2.单相全桥可控硅整流器3.LC滤波器4.负载模拟5.触发脉冲生成模块6.测量模块第三步：搭建主电路拓扑第四步：搭建触发脉冲生成逻辑1.设计触发脉冲逻辑2.集成至Simulink模型四、参数设置五
探索 Qwen3-0.6B：轻量级大模型的技术突破与应用潜力
在大模型技术飞速发展的今天，轻量化、高性能的模型成为业界关注的焦点。Qwen3-0.6B作为阿里推出的轻量级大模型，凭借其独特的技术架构和卓越性能，在众多模型中脱颖而出。本文将深入探讨Qwen3-0.6B的技术特性、优势以及应用场景，带你领略这款轻量级大模型的魅力。一、Qwen3-0.6B核心技术架构Qwen3-0.6B基于Transformer架构进行优化，采用了一系列先进的技术手段，在保证模型
vllm推理实践 try2find java 前端服务器
1.vllm推理demo实验fromvllmimportLLM,SamplingParams#定义生成参数sampling_params=SamplingParams(temperature=0.7,top_p=0.9,max_tokens=100,)#加载DeepSeek模型（以deepseek-llm-7b为例）#model_name="deepseek-ai/deepseek-llm-7b"
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
Transformer模型压缩：结构化剪枝与混合精度量化研究 pk_xz123456 仿真模型机器学习深度学习 transformer 剪枝深度学习
Transformer模型压缩：结构化剪枝与混合精度量化研究摘要本文针对Transformer模型在实际部署中面临的计算资源消耗大、内存占用高和推理延迟等问题，提出了一种结合结构化剪枝与混合精度量化的综合压缩方案。我们首先分析了Transformer模型的结构特点及其在计算效率方面的瓶颈，然后系统地研究了结构化剪枝和混合精度量化的理论基础与实现方法。通过实验验证，我们的方法在保持模型性能的同时显著
Logistic回归预测模型2：R语言实现模型的内部和外部验证
前面我们讲了logistic回归预测模型的建立，今天介绍的是模型的验证，可以在训练集和验证集中通过ROC曲线、校准曲线和决策曲线分别进行验证。1、原始数据原始数据分为训练集和验证集，其中训练集用于模型的构建和内部验证，验证集用于外部验证。两个数据集都包含5列，且列名相同。组别Group为因变量，1代表阳性结局，0代表阴性结局。自变量1和4为连续性变量，自变量2和3为二分类变量。2、安装所需要的R包
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
资深php工程师必会必知架构深山技术宅 PHP 经验素养 php 架构开发语言
作为资深PHP工程师，必须掌握以下架构设计及核心组件，这些架构能力决定了系统能否支撑高并发、高可用及复杂业务场景：一、分层架构（基础但关键）经典三层模型HTTP请求SQL表示层业务逻辑层数据访问层数据库表示层：API网关（LaravelRoutes/SymfonyRouting）业务层：领域服务（DDD设计模式应用）数据层：Repository模式+Eloquent/DoctrineORM二、高性
在 Node.js 中如何使用 MongoDB 创建多个关联模型
在Node.js中使用MongoDB创建多个关联模型，通常是通过Mongoose来实现。Mongoose是一个基于Node.js的MongoDBODM（对象数据建模）库，它可以简化MongoDB数据库的操作，并且支持定义模型之间的关系，例如一对多（`one-to-many`）或多对多（`many-to-many`）关系。以下是如何在Node.js中使用Mongoose创建多个关联模型的示例：###
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一