Python开发者

直白介绍卷积神经网络（CNN）

（点击上方公众号，可快速关注）

编译： Python开发者 - MentosZ 英文：ujjwalkarn.me

http://blog.jobbole.com/113819/

什么是卷积神经网络，它为何重要？

卷积神经网络（也称作 ConvNets 或 CNN）是神经网络的一种，它在图像识别和分类等领域已被证明非常有效。卷积神经网络除了为机器人和自动驾驶汽车的视觉助力之外，还可以成功识别人脸，物体和交通标志。

图1

如图1所示，卷积神经网络能够识别图片的场景并且提供相关标题（“足球运动员正在踢足球”），图2则是利用卷积神经网络识别日常物品、人类和动物的例子。最近，卷积神经网络在一些自然语言处理任务（如语句分类）中也发挥了很大作用。

图2

因此，卷积神经网络是当今大多数机器学习实践者的重要工具。但是，理解卷积神经网络并开始尝试运用着实是一个痛苦的过程。本文的主要目的是了解卷积神经网络如何处理图像。

对于刚接触神经网络的人，我建议大家先阅读这篇关于多层感知机的简短教程，了解其工作原理之后再继续阅读本文。多层感知机即本文中的“完全连接层”。

LeNet 框架（20世纪90年代）

LeNet 是最早推动深度学习领域发展的卷积神经网络之一。这项由 Yann LeCun 完成的开创性工作自1988年以来多次成功迭代之后被命名为 LeNet5。当时 LeNet 框架主要用于字符识别任务，例如阅读邮政编码，数字等。

接下来，我们将直观地了解 LeNet 框架如何学习识别图像。近年来有人提出了几种基于 LeNet 改进的新框架，但是它们的基本思路与 LeNet 并无差别，如果您清楚地理解了 LeNet，那么对这些新的框架理解起来就相对容易很多。

图3: 一个简单的卷积神经网络

图3中的卷积神经网络在结构上与原始的 LeNet 类似，并将输入图像分为四类：狗，猫，船或鸟（原始的 LeNet 主要用于字符识别任务）。从上图可以看出，接收船只图像作为输入时，神经网络在四个类别中正确地给船只分配了最高概率值（0.94）。输出层中所有概率的总和应该是1（之后会做解释）。

图3 的卷积神经网络中有四个主要操作：

卷积
非线性变换（ReLU）
池化或子采样
分类（完全连接层）

这些操作是所有卷积神经网络的基本组成部分，因此了解它们的工作原理是理解卷积神经网络的重要步骤。下面我们将尝试直观地理解每个操作。

一张图片就是一个由像素值组成的矩阵

实质上，每张图片都可以表示为由像素值组成的矩阵。

图4: 每张图片就是一个像素矩阵

通道（channel）是一个传统术语，指图像的一个特定成分。标准数码相机拍摄的照片具有三个通道——红，绿和蓝——你可以将它们想象为三个堆叠在一起的二维矩阵（每种颜色一个），每个矩阵的像素值都在0到255之间。

而灰度图像只有一个通道。鉴于本文的科普目的，我们只考虑灰度图像，即一个代表图像的二维矩阵。矩阵中每个像素值的范围在0到255之间——0表示黑色，255表示白色。

卷积

卷积神经网络的名字来源于“卷积”运算。在卷积神经网络中，卷积的主要目的是从输入图像中提取特征。通过使用输入数据中的小方块来学习图像特征，卷积保留了像素间的空间关系。我们在这里不会介绍卷积的数学推导，但会尝试理解它是如何处理图像的。

正如前文所说，每个图像可以被看做像素值矩阵。考虑一个像素值仅为0和1的5 × 5大小的图像（注意，对于灰度图像，像素值范围从0到255，下面的绿色矩阵是像素值仅为0和1的特殊情况）：

另外，考虑另一个 3×3 矩阵，如下图所示：

上述5 x 5图像和3 x 3矩阵的卷积计算过程如图5中的动画所示：

图5：卷积操作。输出矩阵称作“卷积特征”或“特征映射”

我们来花点时间理解一下上述计算是如何完成的。将橙色矩阵在原始图像（绿色）上以每次1个像素的速率（也称为“步幅”）移动，对于每个位置，计算两个矩阵相对元素的乘积并相加，输出一个整数并作为最终输出矩阵（粉色）的一个元素。注意，3 × 3矩阵每个步幅仅能“看到”输入图像的一部分。

在卷积神经网路的术语中，这个3 × 3矩阵被称为“过滤器”或“核”或“特征探测器”，通过在图像上移动过滤器并计算点积得到的矩阵被称为“卷积特征”或“激活映射”或“特征映射”。重要的是要注意，过滤器的作用就是原始输入图像的特征检测器。

从上面的动画可以明显看出，对于同一张输入图像，不同的过滤器矩阵将会产生不同的特征映射。例如，考虑如下输入图像：

在下表中，我们可以看到上图在不同过滤器下卷积的效果。如图所示，只需在卷积运算前改变过滤器矩阵的数值就可以执行边缘检测，锐化和模糊等不同操作 [8] —— 这意味着不同的过滤器可以检测图像的不同特征，例如边缘，曲线等。更多此类示例可在这里 8.2.4节中找到。

另一个理解卷积操作的好方法可以参考下面图6中的动画：

图6: 卷积操作

一个过滤器（红色边框）在输入图像上移动（卷积操作）以生成特征映射。在同一张图像上，另一个过滤器（绿色边框）的卷积生成了不同的特征图，如图所示。需要注意到，卷积操作捕获原始图像中的局部依赖关系很重要。还要注意这两个不同的过滤器如何从同一张原始图像得到不同的特征图。请记住，以上图像和两个过滤器只是数值矩阵。

实际上，卷积神经网络在训练过程中会自己学习这些过滤器的值（尽管在训练过程之前我们仍需要指定诸如过滤器数目、大小，网络框架等参数）。我们拥有的过滤器数目越多，提取的图像特征就越多，我们的网络在识别新图像时效果就会越好。

特征映射（卷积特征）的大小由我们在执行卷积步骤之前需要决定的三个参数[4]控制：

深度：深度对应于我们用于卷积运算的过滤器数量。在图7所示的网络中，我们使用三个不同的过滤器对初始的船图像进行卷积，从而生成三个不同的特征图。可以将这三个特征地图视为堆叠的二维矩阵，因此，特征映射的“深度”为3。

图7

步幅：步幅是我们在输入矩阵上移动一次过滤器矩阵的像素数量。当步幅为1时，我们一次将过滤器移动1个像素。当步幅为2时，过滤器每次移动2个像素。步幅越大，生成的特征映射越小。
零填充：有时，将输入矩阵边界用零来填充会很方便，这样我们可以将过滤器应用于输入图像矩阵的边界元素。零填充一个很好的特性是它允许我们控制特征映射的大小。添加零填充也称为宽卷积，而不使用零填充是为窄卷积。这在[14]中有清楚的解释。

非线性部分介绍（ReLU）

如上文图3所示，每次卷积之后，都进行了另一项称为 ReLU 的操作。ReLU 全称为修正线性单元（Rectified Linear Units），是一种非线性操作。其输出如下图所示：

图8: ReLU 函数

ReLU 是一个针对元素的操作（应用于每个像素），并将特征映射中的所有负像素值替换为零。ReLU 的目的是在卷积神经网络中引入非线性因素，因为在实际生活中我们想要用神经网络学习的数据大多数都是非线性的（卷积是一个线性运算 —— 按元素进行矩阵乘法和加法，所以我们希望通过引入 ReLU 这样的非线性函数来解决非线性问题）。

从图9可以很清楚地理解 ReLU 操作。它展示了将 ReLU 作用于图6中某个特征映射得到的结果。这里的输出特征映射也被称为“修正”特征映射。

图9: ReLU 操作

其他非线性函数诸如 tanh 或 sigmoid 也可以用来代替 ReLU，但是在大多数情况下，ReLU 的表现更好。

池化

空间池化（也称为子采样或下采样）可降低每个特征映射的维度，并保留最重要的信息。空间池化有几种不同的方式：最大值，平均值，求和等。

在最大池化的情况下，我们定义一个空间邻域（例如，一个2 × 2窗口），并取修正特征映射在该窗口内最大的元素。当然我们也可以取该窗口内所有元素的平均值（平均池化）或所有元素的总和。在实际运用中，最大池化的表现更好。

图10展示了通过2 × 2窗口在修正特征映射（卷积+ ReLU 操作后得到）上应用最大池化操作的示例。

图10: 最大池化

我们将2 x 2窗口移动2个单元格（也称为“步幅”），并取每个区域中的最大值。如图10所示，这样就降低了特征映射的维度。

在图11所示的网络中，池化操作分别应用于每个特征映射（因此，我们从三个输入映射中得到了三个输出映射）。

图11: 在修正特征映射上应用池化

图12展示了我们对图9中经过 ReLU 操作之后得到的修正特征映射应用池化之后的效果。

图12: 池化

池化的作用是逐步减少输入的空间大小[4]。具体来说有以下四点：

使输入（特征维度）更小，更易于管理
减少网络中的参数和运算次数，因此可以控制过拟合 [4]
使网络对输入图像微小的变换、失真和平移更加稳健（输入图片小幅度的失真不会改池化的输出结果 —— 因为我们取了邻域的最大值/平均值）。
可以得到尺度几乎不变的图像（确切的术语是“等变”）。这是非常有用的，这样无论图片中的物体位于何处，我们都可以检测到，（详情参阅[18]和[19]）。

至此…

图13

目前为止，我们已经了解了卷积，ReLU 和池化的工作原理。这些是卷积神经网络的基本组成部分，理解这一点很重要。如图13所示，我们有两个由卷积，ReLU 和 Pooling 组成的中间层 —— 第二个卷积层使用六个过滤器对第一层的输出执行卷积，生成六个特征映射。然后将 ReLU 分别应用于这六个特征映射。接着，我们对六个修正特征映射分别执行最大池化操作。

这两个中间层的作用都是从图像中提取有用的特征，在网络中引入非线性因素，同时对特征降维并使其在尺度和平移上等变[18]。

第二个池化层的输出即完全连接层的输入，我们将在下一节讨论。

完全连接层

完全连接层是一个传统的多层感知器，它在输出层使用 softmax 激活函数（也可以使用其他分类器，比如 SVM，但在本文只用到了 softmax）。“完全连接”这个术语意味着前一层中的每个神经元都连接到下一层的每个神经元。如果对多层感知器不甚了解，我建议您阅读这篇文章。

卷积层和池化层的输出代表了输入图像的高级特征。完全连接层的目的是利用这些基于训练数据集得到的特征，将输入图像分为不同的类。例如，我们要执行的图像分类任务有四个可能的输出，如图14所示（请注意，图14没有展示出完全连接层中节点之间的连接）

图14: 完全连接层——每个节点都与相邻层的其他节点连接

除分类之外，添加完全连接层也是一个（通常来说）比较简单的学习这些特征非线性组合的方式。卷积层和池化层得到的大部分特征对分类的效果可能也不错，但这些特征的组合可能会更好[11]。

完全连接层的输出概率之和为1。这是因为我们在完全连接层的输出层使用了 softmax 激活函数。Softmax 函数取任意实数向量作为输入，并将其压缩到数值在0到1之间，总和为1的向量。

正式开始——使用反向传播进行训练

如上所述，卷积+池化层用来从输入图像提取特征，完全连接层用来做分类器。

注意，在图15中，由于输入图像是船，对于船类目标概率为1，其他三个类为0

输入图像 = 船
目标向量 = [0, 0, 1, 0]

图15：训练卷积神经网络

卷积网络的整体训练过程概括如下：

步骤1：用随机值初始化所有过滤器和参数/权重
步骤2：神经网络将训练图像作为输入，经过前向传播步骤（卷积，ReLU 和池化操作以在完全连接层中的前向传播），得到每个类的输出概率。
假设上面船只图像的输出概率是 [0.2,0.4,0.1,0.3]
由于权重是随机分配给第一个训练样本，因此输出概率也是随机的。
步骤3：计算输出层的总误差（对所有4个类进行求和）
总误差=∑ ½(目标概率 – 输出概率)²
步骤4：使用反向传播计算网络中所有权重的误差梯度，并使用梯度下降更新所有过滤器值/权重和参数值，以最小化输出误差。
根据权重对总误差的贡献对其进行调整。
当再次输入相同的图像时，输出概率可能就变成了 [0.1,0.1,0.7,0.1]，这更接近目标向量 [0,0,1,0]。
这意味着网络已经学会了如何通过调整其权重/过滤器并减少输出误差的方式对特定图像进行正确分类。
过滤器数量、大小，网络结构等参数在步骤1之前都已经固定，并且在训练过程中不会改变 —— 只会更新滤器矩阵和连接权值。
步骤5：对训练集中的所有图像重复步骤2-4。

通过以上步骤就可以训练出卷积神经网络 —— 这实际上意味着卷积神经网络中的所有权重和参数都已经过优化，可以对训练集中的图像进行正确分类。

当我们给卷积神经网络中输入一个新的（未见过的）图像时，网络会执行前向传播步骤并输出每个类的概率（对于新图像，计算输出概率所用的权重是之前优化过，并能够对训练集完全正确分类的）。如果我们的训练集足够大，神经网络会有很好的泛化能力（但愿如此）并将新图片分到正确的类里。

注1：为了给大家提供一个直观的训练过程，上述步骤已经简化了很多，并且忽略了数学推导过程。如果想要数学推导以及对卷积神经网络透彻的理解，请参阅 [4] 和 [12]。

注2：上面的例子中，我们使用了两组交替的卷积和池化层。但请注意，这些操作可以在一个卷积神经网络中重复执行多次。实际上，现在效果最好的一些卷积神经网络都包含几十个卷积和池化层！另外，每个卷积层之后的池化层不是必需的。从下面的图16中可以看出，在进行池化操作之前，我们可以连续进行多个卷积 + ReLU 操作。另外请注意图16卷积神经网络的每一层是如何展示的。

图16

卷积神经网络的可视化

一般来说，卷积步骤越多，神经网络能够学习识别的特征就更复杂。例如，在图像分类中，卷积神经网络在第一层可能会学习检测原始像素的边缘，然后在第二层利用这些边缘检测简单形状，然后在更高级的层用这些形状来检测高级特征，例如面部形状 [14]。图17演示了这个过程 —— 这些特征是使用卷积深度信念网络学习的，这张图片只是为了演示思路（这只是一个例子：实际上卷积过滤器识别出来的对象可能对人来说并没有什么意义）。

图17: 卷积深度信念网络学习特征

Adam Harley 创建了一个基于 MNIST 手写数字数据集 [13]训练卷积神经网络的可视化。我强烈推荐大家使用它来了解卷积神经网络的工作细节。

我们在下图中可以看到神经网络对于输入数字“8”的具体操作细节。请注意，图18中并未单独显示ReLU操作。

图18：基于手写数字训练卷积神经网络的可视化

输入图像包含 1024 个像素点（32 × 32 图像），第一个卷积层（卷积层1）由六个不同的5 × 5（步幅为1）过滤器与输入图像卷积而成。如图所示，使用六个不同的过滤器得到深度为六的特征映射。

卷积层1之后是池化层1，它在卷积层1中的六个特征映射上分别进行2 × 2最大池化（步幅为2）。将鼠标指针移动到池化层的任意像素上，可以观察到它来自于2 x 2网格在前一个卷积层中的作用（如图19所示）。注意到2 x 2网格中具有最大值（最亮的那个）的像素点会被映射到池化层。

图19：池化操作可视化

池化层1之后是十六个执行卷积操作的5 × 5（步幅为1）卷积过滤器。然后是执行2 × 2最大池化（步幅为2）的池化层2。这两层的作用与上述相同。

然后有三个完全连接（FC）层：

第一个FC层中有120个神经元
第二个FC层中有100个神经元
第三个FC层中的10个神经元对应于10个数字 —— 也称为输出层

注意，在图20中，输出层的10个节点每一个都连接到第二个完全连接层中的全部100个节点（因此称为完全连接）。

另外，注意为什么输出层中唯一明亮的节点是’8’ —— 这意味着神经网络对我们的手写数字进行了正确分类（节点亮度越高表示它的输出更高，即8在所有数字中具有最高的概率）。

图20：完全连接层可视化

该可视化系统的 3D 版本在此。

其他卷积神经网络框架

卷积神经网络始于20世纪90年代初。我们已经讨论了LeNet，它是最早的卷积神经网络之一。下面列出了其他一些有影响力的神经网络框架 [3] [4]。

LeNet (20世纪90年代)：本文已详述。
20世纪90年代到2012年：从20世纪90年代后期到2010年初，卷积神经网络正处于孵化期。随着越来越多的数据和计算能力的提升，卷积神经网络可以解决的任务变得越来越有趣。
AlexNet（2012） – 2012年，Alex Krizhevsky（和其他人）发布了 AlexNet，它是提升了深度和广度版本的 LeNet，并在2012年以巨大优势赢得了 ImageNet 大规模视觉识别挑战赛（ILSVRC）。这是基于之前方法的重大突破，目前 CNN 的广泛应用都要归功于 AlexNet。
ZF Net（2013） – 2013年 ILSVRC 获奖者来自 Matthew Zeiler 和 Rob Fergus 的卷积网络。它被称为 ZFNet（Zeiler 和 Fergus Net 的简称）。它在 AlexNet 的基础上通过调整网络框架超参数对其进行了改进。
GoogLeNet（2014） – 2014年 ILSVRC 获奖者是 Google 的 Szegedy 等人的卷积网络。其主要贡献是开发了一个初始模块，该模块大大减少了网络中的参数数量（4M，而 AlexNet 有60M）。
VGGNet（2014） – 2014年 ILSVRC 亚军是名为 VGGNet 的网络。其主要贡献在于证明了网络深度（层数）是影响性能的关键因素。
ResNets（2015） – 何凯明（和其他人）开发的残差网络是2015年 ILSVRC 的冠军。ResNets 是迄今为止最先进的卷积神经网络模型，并且是大家在实践中使用卷积神经网络的默认选择（截至2016年5月）。
DenseNet（2016年8月） – 最近由黄高等人发表，密集连接卷积网络的每一层都以前馈方式直接连接到其他层。 DenseNet 已经在五项竞争激烈的对象识别基准测试任务中证明自己比之前最先进的框架有了显着的改进。具体实现请参考这个网址。

结论

本文中，我尝试着用一些简单的术语解释卷积神经网络背后的主要概念，同时简化/略过了几个细节部分，但我希望这篇文章能够让你直观地理解其工作原理。

本文最初是受 Denny Britz 《理解卷积神经网络在自然语言处理上的运用》这篇文章的启发（推荐阅读），文中的许多解释是基于这篇文章的。为了更深入地理解其中一些概念，我鼓励您阅读斯坦福大学卷积神经网络课程的笔记以及一下参考资料中提到的其他很棒的资源。如果您对上述概念的理解遇到任何问题/建议，请随时在下面留言。

文中所使用的所有图像和动画均属于其各自的作者，陈列如下。

参考

karpathy/neuraltalk2: Efficient Image Captioning code in Torch, Examples
Shaoqing Ren, et al, “Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”, 2015, arXiv:1506.01497
Neural Network Architectures, Eugenio Culurciello’s blog
CS231n Convolutional Neural Networks for Visual Recognition, Stanford
Clarifai/Technology
Machine Learning is Fun! Part 3: Deep Learning and Convolutional Neural Networks
Feature extraction using convolution, Stanford
Wikipedia article on Kernel (image processing)
Deep Learning Methods for Vision, CVPR 2012 Tutorial
Neural Networks by Rob Fergus, Machine Learning Summer School 2015
What do the fully connected layers do in CNNs?
Convolutional Neural Networks, Andrew Gibiansky
W. Harley, “An Interactive Node-Link Visualization of Convolutional Neural Networks,” in ISVC, pages 867-877, 2015 (link). Demo
Understanding Convolutional Neural Networks for NLP
Backpropagation in Convolutional Neural Networks
A Beginner’s Guide To Understanding Convolutional Neural Networks

Vincent Dumoulin, et al, “A guide to convolution arithmetic for deep learning”, 2015, arXiv:1603.07285

What is the difference between deep learning and usual machine learning?

How is a convolutional neural network able to learn invariant features?

A Taxonomy of Deep Convolutional Neural Nets for Computer Vision

Honglak Lee, et al, “Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations” (link)

看完本文有收获？请转发分享给更多人

关注「Python开发者」，提升Python技能

你可能感兴趣的:(直白介绍卷积神经网络（CNN）)

【华为机试真题JavaScript】尼科彻斯定理 forest_long 华为机试真题-JS 动态规划 javascript python java 华为
目录题目描述输入描述输出描述参考示例参考代码机试介绍写在最后题目描述验证尼科彻斯定理，即：任何一个整数m的立方都可以写成m个连续奇数之和。例如：1^3=12^3=3+53^3=7+9+114^3=13+15+17+19输入一个正整数m（m≤100），将m的立方写成m个连续奇数之和的形式输出。数据范围：1≤m≤100进阶：时间复杂度：O(m)，空间复杂度：O(1)输入描述输入一个int整数输出描述输
【Java】Java Lambda List转List 奔向理想的星辰大海云原生技术研发开发语言 java
JavaLambdaList转List的实现方法引言在Java开发中，Lambda表达式是一种非常强大和常用的特性，它允许我们以一种更加简洁和灵活的方式编写代码。在处理集合类数据时，我们经常需要对列表进行转换操作，将其转换为另一种类型的列表。本文将介绍如何使用JavaLambda表达式将一个List转换为另一个List。实现步骤为了更好地理解整个过程，我们可以使用表格来展示每个步骤的具体操作。下面
cursor 的组件以及使用一只很懒很懒的虫人工智能
写在前面：如果你没有使用过cursor,建议先看这篇文章：先自己随便点点，使用一下，然后再看看这些概念的东西会有一个更高效的认知。不拘泥于概念，但是又不能不了解概念。当然这些介绍也只是皮毛，在运用中才有更深的体会认识cursor基本布局：可以通过Ctrl+I打开最右边的cursorAI助手的智能面板，ctrl+N创建一个新的对话窗口Cursor三种不同的模式Chat：这个功能和你在kimi或者豆包
【Ubuntu】使用远程桌面协议（RDP）在Windows上远程连接Ubuntu 林九生 Ubuntu windows ubuntu linux
使用远程桌面协议（RDP）在Windows上远程连接Ubuntu远程桌面协议（RDP）是一种允许用户通过图形界面远程控制计算机的协议。本文将详细介绍如何在Ubuntu上安装和配置xrdp，并通过Windows的远程桌面连接工具访问Ubuntu。1.在Ubuntu上安装xrdp首先，我们需要在Ubuntu上安装xrdp服务。xrdp是一个开源的RDP服务器，允许远程用户通过RDP协议连接到Ubunt
03_如何高效的学习? Fioman_Hammer 经典语录学习随笔经验分享
文章目录一.整体性学习法介绍二.整体性学习的五个步骤:①获取信息②理解信息③拓展④纠错一.整体性学习法介绍学习并不是整理一个个独立的盒子,学习就是编织一张大网.整体性学习在于创造信息的网络,一个知识与另外一个知识相互关联,这些关联使得你真正的做到对知识的完全理解.你创造的联系越多,你就会记得越牢,理解得越好;二.整体性学习的五个步骤:一般来说,整体性学习分为五个步骤:获取->理解->拓展->纠错-
Apache Tomcat JBOSS Jetty Nginx WebLogic WebSphere之间的区别区别_jetty和tomcat和weblogic 2401_89694162 apache tomcat jetty
文章目录总结：Apache/Tomcat/JBOSS/Nginx区别.一、Apache+Tomcat二、Jetty三、Nginx四、JBossWebLogic、WebSphere、JBOSS、Tomcat之间的区别1：产品介绍：2：价位不同：3：开源性不同：4：对技术的支持：5：扩展性的不同：6：应用范围的区别：7：商业服务和技术支持的区别：8：安全性问题9：与数据库的紧密结合性：服务：三、部署四
Android从零开始搭建MVVM架构（4）————Room（从入门到进阶）(1) xcbyaya 程序员 android 架构 java
意思就是我们要往数据库里建表、建字段。就是使用这个bean对象。首先介绍下注解@Entity：数据表的实体类。@PrimaryKey：每一个实体类都需要一个唯一的标识。@ColumnInfo：数据表中字段名称。@Ignore：标注不需要添加到数据表中的属性。@Embedded：实体类中引用其他实体类。@ForeignKey：外键约束。这里我们建一个Person类（为了能保存数据，使数据持久化且Ro
企业IT数字化运维运营平台（总体架构、总体蓝图）建设方案公众号：优享智库数字化转型数据治理主数据数据仓库运维架构
这份文件是关于企业IT数字化运维运营平台的建设方案，主要介绍了业务背景、解决方案、成功应用案例等核心内容。以下是文件的核心要点总结：业务背景概述：IT运维趋势：随着万物互联时代的到来，IT设备数量激增，运维成为保障业务高效运转的基础。IT运维重要性：IT监控运维是企业业务正常与高效运转的基础保障，直接影响业务的收益和成本。IT运维现状：当前运维模式多为被动救火式，存在基础设施分散、管理困难、缺少自
使用Flink进行流式图处理 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
使用Flink进行流式图处理1.背景介绍1.1大数据时代的到来随着互联网、物联网和移动互联网的快速发展,数据呈现出爆炸式增长。根据IDC的预测,到2025年,全球数据量将达到175ZB。传统的批处理系统已经无法满足对实时数据处理的需求。因此,流式计算应运而生,成为大数据处理的重要组成部分。1.2流式计算的概念流式计算是一种新兴的数据处理范式,它能够持续不断地处理来自各种数据源的数据流。与传统的批处
最新版pyvideotrans3.46整合包，将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译，AI自动视频翻译配音加字幕软件，解压即用 struggle2025 人工智能语音识别机器学习自然语言处理语言模型
一、pyvideotrans3.46介绍（文末提供下载）官方地址：GitHub-jianchang512/pyvideotrans:Translatethevideofromonelanguagetoanotherandadddubbing.将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译。本文信息以及图片来源于开源官方地址这是一个视频翻译配音工具，可将一种语言的视频翻译
Android Room 使用 francisHuang android学习 android Room 数据库
官网介绍：https://developer.android.google.cn/training/data-storage/roomRoom是在SQLite上提供了一个抽象层，以便在充分利用SQLite的强大功能的同时，能够流畅地访问数据库。Room包含3个重要部分：数据库：包含数据库持有者，并作为应用已保留的持久关系型数据的底层连接的主要接入点。Entity：表示数据库中的表。DAO：包含用于
Python.NET 安装与使用教程卫伊祺Ralph
Python.NET安装与使用教程项目地址:https://gitcode.com/gh_mirrors/py/pythonnet本教程将指导你了解并安装Python.NET——这是一个让Python程序员能够无缝集成.NET框架的开源库。1.项目目录结构及介绍在克隆或下载pythonnet的源代码仓库后，你会看到以下基本目录结构：pythonnet/├──LICENSE#许可文件├──MANIF
Apache TVM：开源深度学习编译器栈的领跑者计攀建Eliza
ApacheTVM：开源深度学习编译器栈的领跑者tvmOpendeeplearningcompilerstackforcpu,gpuandspecializedaccelerators项目地址:https://gitcode.com/gh_mirrors/tv/tvm项目介绍ApacheTVM是一个专为深度学习系统设计的编译器栈。它旨在弥合生产力导向的深度学习框架与性能和效率导向的硬件后端之间的差
使用STM32高级定时器通道和互补通道驱动有刷直流电机的单极性驱动程序 QoyOle stm32 单片机嵌入式硬件
在嵌入式系统中，有刷直流电机（BrushedDCMotor）是常见的驱动装置。为了有效地驱动有刷直流电机，我们可以利用STM32微控制器的高级定时器通道和互补通道。本文将详细介绍如何利用这些功能来实现有刷直流电机的单极性驱动，并提供相应的源代码。STM32微控制器提供了多个高级定时器，例如TIM1、TIM8等。这些高级定时器具有多个通道，每个通道可以用于产生PWM信号或输出高电平。在有刷直流电机的
使用STM32实现电机控制无敌暴龙战士- stm32 单片机嵌入式硬件
使用STM32实现电机控制可以通过PWM信号驱动直流电机或步进电机。在本文中，我们将分别介绍如何通过STM32实现直流电机控制和步进电机控制，并提供详细的代码案例。一、直流电机控制直流电机控制主要涉及到PWM信号的生成和控制。在STM32中，可以使用定时器来生成PWM信号，并通过改变占空比来控制电机的转速。以下是一份基于STM32的直流电机控制代码案例：初始化引脚和定时器首先需要初始化引脚和定时器
AI人工智能代理工作流AI Agent WorkFlow：面向服务计算中的代理工作流管理 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：面向服务计算中的代理工作流管理关键词：人工智能，代理工作流，服务计算，自动执行，智能调度，协同处理，流程管理1.背景介绍1.1问题的由来随着互联网和云计算的快速发展，服务计算作为一种分布式计算模式，已经成为企业信息化建设的重要方向。在服务计算中，工作流技术被广泛应用于业务流程的建模、执行和管理。然而，传统的基于BPM（业务流程管理）的工作流管理
【张雪峰高考志愿填报】合集 iamyzs 高考考研高考志愿填报指导张雪峰
【张雪峰高考志愿填报】合集链接：https://pan.quark.cn/s/89a2d88fa807高考结束，分数即将揭晓，志愿填报的关键时刻近在眼前！同学们，这可是人生的重要转折点，选对志愿，就像为未来铺就一条光明大道。但志愿填报犹如迷雾中的航行，专业代码、院校分数线、录取规则等复杂信息让人摸不着头脑。别怕，我为大家精心准备了一份高考志愿填报资料。这份资料涵盖了各大院校的详细介绍，包括王牌专业
[C语言日寄] ＜stdio.h＞头文件功能介绍 siy2333 c语言工具库 #头文件 c语言算法笔记学习
在C语言的世界里，是一个极其重要的头文件，它提供了标准输入输出功能，是C语言程序与用户交互的核心工具。今天，我们就来深入探讨的功能、使用注意事项以及它的拓展应用。功能介绍是C语言标准库中的一个核心头文件，它定义了一系列用于输入输出操作的函数、宏和数据类型。这些功能使得程序能够与外部设备（如键盘、显示器、文件等）进行交互。标准输入输出函数提供了多种用于标准输入输出的函数，这些函数是C语言程序与用户交
python学习专栏 zhousenshan python新赛道 python
推荐学习资料《15分钟轻松学Python》教程目录-CSDN博客每天40分玩转Django教程目录-CSDN博客Pycharm社区版搭建Django环境及Django简单项目、操控mysql数据库-CSDN博客这个开源有关于事务方面高级内容介绍：django-vue-lyadmin:django-vue-lyadmin前端采用vue3+elementplus,后端采用PythonDjangoDRF
关于c语言可变参数详解 yancie_yc 编程语言 c语言可变参数函数
link:http://blog.chinaunix.net/space....blog&id=2808215TABLE1.介绍2.使用2.1代码实例，简单体会。2.2三个主要的宏2.3可变参数的个数确定2.4重扫描2.5更多的代码实例3.注意事项/限制4.参考资源1.介绍c语言有一个强大的功能，就是它允许定义可接受可变参数列表的函数。如：#includeintprintf(constchar*f
python文件：py,ipynb, pyi, pyc, pyd, pyo都是什么文件？ m 哆哆.ღ python python 开发语言
python：py,ipynb,pyi,pyc,pyd,pyo都是什么文件？1python文件类型介绍1.1.py文件：源代码.py文件是Python最基本的源代码文件格式，用于存储纯文本形式的Python代码。它是开发者编写程序的主要场所，包含函数、类、变量定义以及执行逻辑。Python解释器直接读取并执行.py文件中的指令。例如，创建一个简单的hello.py文件，内容如下：print("He
github最强Chatbox AI 模型桌面，支持 ChatGPT、Claude等主流模型，适用于 Win、Linux等，总结文档图片并互动，智能编程，AI实时联网搜索与查询，图片生成，科研写作等 struggle2025 人工智能深度学习语音识别计算机视觉语言模型图像处理数据分析
一、软件介绍（文末提供下载）Chatbox是一个AI模型桌面客户端，支持ChatGPT、Claude、GoogleGemini、Ollama等主流模型，适用于Windows、Mac、Linux、Web、Android和iOS全平台。github地址：GitHub-Bin-Huang/chatbox:User-friendlyDesktopClientAppforAIModels/LLMs(GPT,
Python自动摘要与文本摘录 CrMylive. python easyui 开发语言
前言随着互联网时代的到来，信息爆炸的问题越来越严重，人们需要处理的信息量也越来越大。在这种情况下，文本摘要和摘录技术变得越来越重要。文本摘要和摘录技术可以自动从大量的文本中提取出重要的信息，为人们快速掌握信息提供了有效的途径。本文将介绍Python自动摘要与文本摘录的相关技术，包括文本摘要和摘录的定义、方法、应用场景等方面。本文将从以下几个方面进行讲解：文本摘要和摘录的定义与概述文本摘要的方法和技
《C++ 并发编程指南》：开启并发编程新篇章孔秋宗Mora
《C++并发编程指南》：开启并发编程新篇章Cplusplus-Concurrency-In-PracticeADetailedCplusplusConcurrencyTutorial《C++并发编程指南》项目地址:https://gitcode.com/gh_mirrors/cp/Cplusplus-Concurrency-In-Practice项目介绍《C++并发编程指南》是一本开源书籍，旨在为
使用Python实现文本自动摘要 UIEdit python 人工智能开发语言
使用Python实现文本自动摘要在互联网时代，信息量不断增加，但人类阅读速度是有限的，如何高效地阅读和获取信息成为一项重要的任务。文本自动摘要技术可以帮助我们快速获取一篇文章的核心内容，从而提高阅读效率。文本自动摘要分为抽取式摘要和生成式摘要两种方法。其中抽取式摘要是从原文中选择一定比例的句子拼凑成一个摘要，而生成式摘要是通过对原文进行解析、理解、推理等方式生成摘要。下面我们将介绍如何使用Pyth
关于时间序列预测的一份介绍张焚雪人工智能算法大数据
时间序列预测是一种基于过去数据点的分析方法，用于预测未来值。它广泛应用于经济学、金融、气象学、销售预测、库存管理等领域。在这篇文章中，我就将介绍有关时间序列预测有关的东西，具体将包含其有关的概念、预测过程以及相关模型简介。一、概念1.1预测模型所谓预测模型就是用基于历史数据预测未来值的各种数学和统计模型，它是时间序列预测的核心，选择合适的预测模型直接影响到预测结果的准确性。一般我们考虑根据频率与趋
网络工程师：华为设备BGP命令大全 wljslmz 网络技术华为 BGP 路径矢量协议
华为（Huawei）作为全球领先的信息与通信技术（ICT）解决方案供应商，其网络设备广泛应用于企业网络和运营商网络中。边界网关协议（BorderGatewayProtocol，BGP）是互联网的主要路由协议，用于在不同自治系统（AS）之间交换路由信息。掌握华为设备的BGP命令对于网络工程师至关重要，因为这不仅涉及日常的网络运维，还影响到网络的整体性能和安全性。本文将详细介绍华为设备中的BGP命令，
企业IT战略规划：数字化转型的组织结构与管理机制 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
企业IT战略规划：数字化转型的组织结构与管理机制作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着信息技术的飞速发展，数字化转型已成为企业提升竞争力、实现可持续发展的关键。企业面临着如何构建适应数字化时代的组织结构和管理机制，以有效推动数字化转型进程的挑战。1.2研究现状目前，国内外许多学者和专家对数字化转型的组织结构和
.NET MAUI 项目教程瞿格女
.NETMAUI项目教程docs-mauiThisrepositorycontainsdocumentationfor.NETMulti-platformAppUI(MAUI).项目地址:https://gitcode.com/gh_mirrors/do/docs-maui1.项目介绍什么是.NETMAUI？.NETMulti-platformAppUI(.NETMAUI)是一个跨平台的UI框架，
OpenAI 函数调用功能入门 AI火箭 chatgpt openai
Javascript版Langchain入门作者：AI小火箭的HB我是AI小火箭的HB，我探索和写作人工智能和语言交叉点的所有事物，范围从LLM，聊天机器人，语音机器人，开发框架，以数据为中心的潜在空间等。介绍LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件）连接起来，允许开发人员将多个命令链接在
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name