AITIME论道

非‘玩具’的隐式多尺度深度均衡模型

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

尽管绝大多数深度网络都是基于一个核心的概念---神经“层”的叠加，我们提出一种只有一层、但是却可以代表无限层叠加的隐性深度模型（implicit-depth model)：深度平衡模型（DEQ）。基于这一设计，我们进一步提出了多尺度的深度平衡模型（multiscale DEQ，或MDEQ），并讨论MDEQ是如何同步驱动多个特征流来达到并行的特征平衡点（synchronized feature equilibria）。

白绍杰：本科毕业于美国卡内基梅隆大学（CMU）计算机系和应用数学系（双学士），目前是CMU机器学习系四年级博士生，导师为J.Zico Kolter教授。研究方向主要集中在深度时间序列模型，以及融合数学优化模型和深度学习结构，并从而构建稳定、低内存、易于分析的隐性深度学习（implicit deep learning）方法。

一、相关背景

在计算机视觉和音频处理等领域，最先进的模式识别系统几乎普遍基于多层层次特征提取器。这些模型是分阶段构建的：输入通过一系列连续的块进行处理，每个块以不同的分辨率操作。这个体系结构明确地表达了层次结构，用上采样层和下采样层在不同规模的连续块之间转换。这种设计的一个重要动机是在这些领域中突出的多尺度结构和极高的信号维数。例如，一个典型的图像包含数百万个像素，这些像素必须由模型进行一致的处理。

诸如神经ODE（NODEs）和深均衡模型（DEQ）等隐式深层网络的最新进展例证了可微分建模的替代方法。这些结构用模型必须满足的解析条件替换显式的、深度叠放的层，并且能够在恒定的内存占用范围内模拟具有“无限”深度的模型。隐式建模的一个显著成就是其成功应用于自然语言处理中的大规模序列。

但隐式深度学习与一般模式识别任务相关吗？其中一个明显的挑战是隐性网络去掉了灵活的“层次”和“阶段”。因此，尚不清楚他们是否可以适当地对多尺度结构进行建模，而多尺度结构在某些领域中对高分辨能力是至关重要的。这是激发我们工作的挑战，放弃层次和阶段的深层序列的隐式模型（implicit models），能否在具有丰富多尺度结构特征的领域（如计算机视觉）获得具有竞争力的精度?

为了应对这一挑战，本文引入了一类新的隐式网络：多尺度深度均衡模型（MDEQ）。它受到 DEQs的启发，DEQs在序列建模中获得了很高的准确性。我们充分扩展了DEQ的构造，以引入多种信号分辨率的同时均衡建模。MDEQ通过在所有特征尺度上直接优化稳定表示，同时解决了多个分辨率流的平衡。与标准的显式深层网络不同，MDEQ不会连续处理不同的分辨率，而较高的分辨率会流入较低的分辨率，反之亦然。相反，不同的特征尺度在一个单一的“浅”模型中被并行处理，并驱动到平衡点。

这种设计带来两个主要优点。首先，像基本的DEQ一样，我们的模型不需要通过显式层堆栈进行反向传播，并且在训练过程中具有O(1)内存占用量。这一点特别重要，因为模式识别系统会占用大量内存。其次，MDEQ修正了DEQ的一个缺点，在平衡状态下暴露了多个特征尺度，从而为辅助损失和复合训练程序提供自然的接口，如预训练(例如，在ImageNet上)和微调(例如，在分割或检测任务上)。多尺度建模使单个MDEQ能够同时训练在不同尺度上定义的多个损失，其平衡特征可以作为各种任务的“头”。

我们通过对大规模图像分类和语义分割数据集进行广泛的实验来证明MDEQ的有效性。值得注意的是，这种浅层隐式模型的准确度水平可与最新的深层显式模型相提并论。在ImageNet分类中，MDEQ在参数计数相似情况下优于基准ResNet（例如ResNet-101），达到了77.5%的top-1精度。在Cityscapes语义分割上，用于ImageNet实验的MDEQs与最近的显式模型的性能相当，同时消耗的内存也少得多。我们最大的MDEQ在Cityscapes验证集上超过了80%mIoU，胜过强大的卷积网络，并且非常接近最优效果。到目前为止，这是迄今为止隐式深度学习的最大规模应用，对于直到最近才主要应用于“玩具”领域的一类模型而言，这是一个了不起的结果。

1.1 隐式深度学习

几乎所有现代深度学习方法都使用显式模型，该模型提供用于正向传播的显式计算图。反向传播在同一图形中按相反顺序进行。这种方法是深度学习流行的框架的核心，并且与“架构”的概念相关联。相反，隐式模型没有规定的计算图。他们假定模型必须满足一个特定的标准(例如，ODE流的端点，或方程的根)。重要的是，驱动模型满足这一标准的算法并没有规定。因此，隐式模型可以在其前向传播中利用黑匣子解算器，并享受独立于前向传递轨迹的后向解析传播。

隐状态的隐式建模已经被深度学习社区探索了几十年。Pineda和Almeida研究了训练递归动态的隐式微分技术，也被称为递归反向传播(RBP)。网络设计的隐式方法最近引起了新的兴趣。例如，Neural ODE (NODEs)使用隐式ODE求解器对递归残差块进行建模，相当于采用无穷小步骤的连续ResNet。深度均衡模型（DEQ）使用黑盒寻根方法求解序列模型的不动点，等效于找到无限层网络的极限状态。隐式建模的其他实例包括优化层，可微物理引擎，逻辑结构学习和连续生成模型。

我们的工作将深度均衡方法引入以丰富的多尺度结构特征的信号域中。我们开发了第一个单层隐式深度模型，该模型能够缩放到现实的视觉任务（例如，百万像素级图像），并在这些情况下获得竞争性结果。相比之下，由于数值的不稳定性，基于ODE的模型到目前为止仅应用于相对低维的信号。例如，Chen等将28×28 MNIST图像降采样为7×7，然后再将其提供给神经ODE。更广泛地讲，我们的工作可以看作是隐式模型的新视角，其中模型定义和优化多个数据流的同时标准，这些数据流可以有不同的维度。到目前为止，虽然DEQs和NODEs是在单个特征流上定义的，但是单个MDEQ可以针对不同的任务联合优化特征，比如图像分割和分类。

1.2 计算机视觉中的多尺度建模

计算机视觉是层次多尺度建模的典型应用领域。深度卷积网络已成为该领域的主导。计算机视觉问题可以从所需输出粒度的角度来看待：从低分辨率（如整个图像的标签）到高分辨率输出（如语义分割中为每个像素分配标签）。这些问题的最先进模型被明确构造为以不同分辨率运行的处理的连续阶段。例如，一个ResNet通常包括4-6个连续的阶段，每一个操作的分辨率是前一个的一半。DenseNet使用不同的连接模式在层之间传递信息，但共享总体结构：一系列阶段。其他设计会逐渐降低特征分辨率，然后逐步提高它。还可以按照明确编排的顺序重复进行下采样和上采样。

多尺度建模一直是计算机视觉的中心主题。拉普拉斯金字塔是多尺度建模的一个有影响的早期例子。Farabet等人将多尺度处理与卷积网络相结合进行场景解析。并且已经在许多随后的架构中明确地解决了。

我们的工作为隐式深度网络带来了多尺度建模。MDEQ本质上只有一个阶段，其中不同的分辨率并存。输入以最高分辨率注入，然后隐式传播到其他标度，这些标度由（黑匣子）求解器同时进行优化，以驱动它们满足联合平衡条件。就像DEQs一样，MDEQ能够代表“无限”的深度网络，而只需要恒定的内存成本。

二、多尺度深度均衡模型

我们首先简要概述基本的DEQ构造以及将其扩展到计算机视觉时出现的一些主要挑战。

2.1 深层平衡(DEQ):通用公式

DEQ方法的核心思想之一是权重绑定：同一组参数可以在深度网络的各个层之间共享。形式化描述在隐含状态z上用参数θ制定了一个L层权重变换，公式如下：(1)

输入x会输入到每一层中。当确保足够的稳定性条件时，无限堆叠这些层（即L→∞）显示出基本上执行定点迭代，因此趋于达到平衡z^*=f_θ(z^*;x)。直观地，当我们迭代变换f_θ 时，隐藏表示趋于收敛到稳定状态z*。这种结构具有许多吸引人的特性。首先，我们可以直接求解不动点，这比显式遍历各层要快得多。我们将此公式化为寻根问题：

例如，人们可以利用牛顿或准牛顿方法来实现二次或超线性收敛到根。其次，可以使用g_θ的雅可比行列式在z*处直接向后传播平衡状态，而无需追溯正向寻根过程。形式上，给定损耗ℓ= L(z*,y)（其中y是目标），可以将梯度用隐函数定理（implicit function theorem）表示为：

这意味着DEQ的前向遍历可以依赖于任何黑盒根求解器，而后向遍历则是基于平衡时仅通过一层（或块）的区分而独立建立的。内存消耗只有一个块而不是L→∞块。由于g_θ的雅可比行列式计算起来可能很昂贵，因此DEQs可以求解涉及向量-雅可比乘积的线性方程，这要便宜的多：

挑战：我们刚刚总结的，主要是针对序列的处理。当我们从序列过渡到高分辨率图像时，我们注意到这些领域之间的重要差异。

首先，不同于典型的自回归序列学习问题(如语言建模)，其中的输入和输出具有相同的长度和维度，一般模式识别系统(如视觉系统)需要通过结构中的上采样和下采样的组合进行多阶段建模。基本的DEQ构造没有这种结构。

其次，诸如图像分类（标签）或对象定位（区域）之类的计算机视觉任务的输出可能与输入（完整图像）具有非常不同的尺寸：这也是基本DEQ不支持的功能。

第三，用于任务（例如语义分割）的最新模型通常基于“主干”，这些主干已针对图像分类进行了预训练，任务在结构上有所不同并且其输出也有不同尺寸。目前还不清楚DEQ结构如何支持这种转移。

第四，尽管DEQs过去的序列建模工作中可以利用一些最近提出的先进参数共享（weight-tied）体系结构来进行序列建模，作为设计fθ变换的基础，但在最先进的计算机视觉建模中还不存在这样最先进模型对等物。

2.2 MDEQ模型

MDEQ架构图如下所示：

图 1 尺度深度平衡模型(MDEQ)的结构

图1中显示了模型的所有组件。MDEQ由一个被驱动到平衡态的变换f_θ组成。不同尺度的特征同时并存，并被同时驱动到平衡状态。

MDEQ的中心部分是驱动转换为平衡的变换f_θ。我们使用一个简单的设计，首先通过残差块获取每个分辨率下的特征，块很浅并且结构相同。在分辨率i下，残差块接收内部状态Z_i，并以相同的分辨率输出变换后的特征张量。

图2 MDEQ中使用的residual block

剩余块的内部结构如图2所示。出于稳定性的原因，我们在很大程度上采用He et al.等人的设计，但使用组归一化而非批处理归一化。分辨率为i的残差块可以正式表示为：

在这些块之后，f_θ的第二部分是一个多分辨率融合步骤，混合不同尺度的特征地图(见图1)。变换后的特征从当前尺度i到其他尺度进行上采样或下采样。在我们的构造中，下采样是通过j-i连续2步3×3 Conv2d进行的，而上采样是通过直接双线性插值进行的。标尺j的最终输出是通过对所有传入标尺i提供的变换后的特征图求和而形成的；即每个比例尺的输出特征张量是所有比例尺的变换特征的混合。这迫使所有比例尺上的特征保持一致，并使整个系统达到协调平衡，从而协调各个比例尺上的表示。

输入表示：原始输入首先经过变换（例如，对齐要素通道的线性层）以形成x，并将其提供给f_θ。这种输入注入的存在对于隐式模型至关重要，因为它（连同θ）将动力学系统的流量与输入相关联。但是，与某些显式视觉体系结构使用的多尺度输入表示法不同，我们仅将x注入到最高分辨率的特征流中。输入以单个（完整）分辨率提供给MDEQ。因此，较低的分辨率始于根本不了解输入的状态。当（黑匣子）求解器将所有尺度逐渐驱动至平衡不动点z*时，这些信息将在此过程中被“隐式”地传播到各个特征尺度下。

图3 MDEQ与先前的隐式模型和标准的显式模型

在计算机视觉中的视觉比较

多预训练和辅助损失：图3比较了MDEQ与单流隐式模型（例如DEQ）和计算机视觉中的显式深层网络。这些不同模型揭示了不同的“界面”，可用于定义不同任务的损失。先前的隐式模型（例如神经ODEs和DEQs）通常假定损失是在隐式隐藏状态的单个流上定义的，其具有统一的输入和输出形状。因此，目前尚不清楚如何在结构上不同的任务之间灵活地转移此类模型（例如，先进行图像分类人物的预训练，以及再在语义分割人物上进行微调）。此外，没有自然的方法来定义辅助损耗，因为作为一个没有“层”的结构，正向和反向传播的计算轨迹是解耦的。

相比之下，MDEQ以多种分辨率向其状态公开了方便的“接口”。一种分辨率（最高）可以与输入的分辨率相同，并且可以用于定义密集预测任务（例如语义分割）的损失。另一种分辨率（最低）可以是空间尺寸被折叠的矢量，并且可以用于定义图像级标记任务（例如图像分类）的损失。这建议使用清晰的协议来针对不同任务训练同一模型，或者联合，或者按顺序。

三、实验

3.1 与CIFAR-10上已有的隐式模型比较

我们在CIFAR-10分类上进行了50个epochs的实验，并比较了参数数量大致相同的模型。但是，与基于ODE的方法不同，我们不会在将输入传递到MDEQ解算器之前,对原始图像执行下采样。训练MDEQ模型时，所有分辨率都用于最终预测：更高分辨率的流会经过附加的下采样层，并添加到最低分辨率的输出中以进行预测。

表1 CIFAR-10结果

表1中显示了CIFAR-10图像分类的MDEQ模型的结果。与NODE和增强型NODE相比，具有相似参数计数的小型MDEQ可以将精度提高20个百分点以上：将错误减少的幅度超过了两倍。MDEQ还改进了单流DEQ。最终，更大的MDEQ可以匹配甚至超过具有相同容量的ResNet-18的精度：这是隐式模型首次证明了这种性能。

3.2 ImageNet分类

我们测试MDEQ扩展到更高分辨率图像的更大数据集的能力：ImageNet。与CIFAR-10分类一样，我们在MDEQ模块之后增加了一个浅分类层，以融合不同尺度的均衡输出，并对综合损失进行训练。我们对小型MDEQ模型和大型MDEQ进行了基准测试，以提供与许多参考模型(如ResNet-18、-34、-50和-101)进行适当比较。注意，MDEQ只有一层residual blocks，然后是多分辨率融合。因此，为了匹配标准显式模型的容量，我们需要增加MDEQ内的特征维数。这主要是通过在残差块内调整卷积滤波器的宽度来实现的(见图2)。

表2 ImageNet分类top-1和top-5的准确率

表2显示了两种不同尺寸的MDEQs在计算机视觉中相对于知名参考模型的精度。MDEQs与强大的显式模型比非常有竞争力。例如，一个带有18M参数的小型MDEQ性能优于ResNet-18 (13M参数)、ResNet-34 (21M参数)，甚至优于ResNet-50 (26M参数)。较大的MDEQ (64M参数)达到与ResNet-101 (52M参数)相同的性能水平。这远远超出了隐式建模之前应用的规模和精度水平。

3.3 Cityscapes高分辨率街景图片的语义分割

在ImageNet上训练后，我们将同一MDEQ继续在在Cityscapes数据集上进行语义分割任务的微调。注意在此过程中我们使用的是和图像分类任务里的同一个MDEQ模型，但是相比起ImageNet里使用其最低分辨率的特征流的设定，在语义分割中我们使用最高分辨率的平衡点来定义损失函数。具体结果如下：

表3 城市景观数据集效果

MDEQ达到很高的准确性。它们接近当前的最新水平，并且匹配或优于过去两年发布的众所周知且经过精心设计的显式模型。较小的MDEQ（780万个参数）的平均IoU为75.1。这在相同大小的MobileNetV2Plus上进行了改进，并且对于这种规模的模型而言，它接近SOTA。较大的MDEQ（53.5M参数）达到77.8 mIoU，在备受赞誉的最新语义分段模型（如DeepLabv3和PSPNet）相差不到1个百分点之内，而较大版本的MDEQ（70.9M参数）则超过了它们。令人惊讶的是，尽管基于以前未应用到该领域的原理，我们的结果说明了可以通过“浅层”隐式模型实现这种级别的准确性。

3.4 运行时长和内存消耗

我们提供了使用CIFAR-10数据的MDEQs运行时间和内存分析，输入批处理大小为32。由于先前的隐式模型相对较小，我们提供了MDEQ和MDEQ-small的结果，以便进行公平的比较。所有的计算速度都是基于单个RTX 2080 Ti GPU上，所有计算速度均相对于ResNet-101模型（每批约150ms）进行基准测试。结果如下图所示：

图4 CIFAR-10上的运行时间和内存消耗

与显式模型（例如ResNets和DenseNets）相比，MDEQ在训练时节省了60％以上的GPU内存，同时保持了竞争优势。在ImageNet上训练大型MDEQ会消耗大约6GB的内存，而这大部分是Broyden求根法存储中间状态的消耗。这种低内存占用是反向传播的直接结果。同时，MDEQs通常比显式网络慢。

与ResNet-101相比，我们发现MDEQ的速度降低了2.7倍，这种趋势类似于在序列域中观察到的趋势。导致这种放缓的一个主要因素是，MDEQs始终在所有分辨率下保持特性，而诸如ResNets的显式模型会逐渐降低激活样本，从而减少计算量。但是，与具有172K参数的 ANODEs相比，类似大小的MDEQ速度快了3倍，而错误减少了3倍。

四、总结

本文介绍了多尺度深度均衡模型（MDEQs）：一种新的用于高维和多尺度结构领域的隐式体系结构。与先前的隐式模型（例如DEQ和Neural ODEs）不同，MDEQ通过以不同分辨率对多个特征表示进行同步平衡来求解和反向传播。我们证明了单个MDEQ可以用于不同的任务，例如图像分类和语义分割。我们的实验首次证明“浅层”隐式模型适用于实际的计算机视觉任务，并获得与显式架构相匹配的竞争性能，这些显式架构的特征是通过深度堆叠的层进行顺序处理。

隐式模型在这项工作中的出色表现提出了机器学习中的核心问题。迄今为止在深度学习中占主导地位的复杂的阶段式分层架构是否必要？MDEQ举例说明了一种不同的建模方法。这种方法在实践中可能比以前出现的方法更具实用性。这将有助于隐式深度学习的发展，并将进一步扩大可微分建模的议程。

e m t

往期精彩

AI i

整理：李健铨

审稿：白绍杰

排版：岳白雪

AI TIME欢迎AI领域学者投稿，期待大家剖析学科历史发展和前沿技术。针对热门话题，我们将邀请专家一起论道。同时，我们也长期招募优质的撰稿人，顶级的平台需要顶级的你！

请将简历等信息发至[email protected]！

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展，并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索，加强思想碰撞，打造一个知识分享的聚集地。

更多资讯请扫码关注

（直播回放：https://b23.tv/2HhvCD）

（点击“阅读原文”下载本次报告ppt）

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

非‘玩具’的隐式多尺度深度均衡模型

你可能感兴趣的:(卷积神经网络,算法,计算机视觉,神经网络,机器学习)