陈小虾

卷积神经网络CNN模块化剖析

文章目录

一、深度学习概述

1.1 发展历程
1.2 深度学习的兴起
1.3 深度学习的特点
1.4 深度学习的优势

二、卷积神经网络剖析

2.1 卷积层
2.2 池化层
2.3 非线性激活函数
2.4 全连接层
2.5 损失函数
2.6 反向传播
2.7 网络优化

三、项目实战

一、深度学习概述

1.1 发展历程

上世纪60年代，Hubel等人通过对猫视觉皮层细胞的研究，提出了感受野这个概念。
到80年代，日本科学家福岛邦彦（Kunihiko Fukushima）提出Neocognitron（神经认知机），直接启发了后来的卷积神经网络。
1998年，Yann LeCun提出的卷积神经LeNet，首次提出了多层级联的卷积结构，可对手写数字进行有效识别。
2012年， Alex依靠卷积神经网络AlexNet夺得ILSVRC 2012比赛的冠军，吹响了卷积神经网络研究的号角。AlexNet成功应用了ReLu、Dropout、最大池化、LRN（Local Response Normalization，局部响应归一化）、GPU加速等新技术，启发了后续更多的技术创新，加速了卷积神经网络和深度学习的研究。从此，深度学习研究进入蓬勃发展的新阶段。
2014年Google提出的GoogleNet，运用Inception Module这个可以反复堆叠高效的卷积网络结构，获得了当年的ImageNet ILSVRC比赛的冠军，同年的亚军VGGNet全程使用3×3的卷积，成功训练了深度达19层的网络。
2015年，微软提出了ResNet，包含残差学习模块，成功训练了152层的网络，一举拿下当年ILSVRC比赛的冠军。
2019年3月27日 ——ACM宣布，深度学习的三位创造者Yoshua Bengio, Yann LeCun, 以及Geoffrey Hinton获得了2018年的图灵奖。

Hinton最重要的贡献：1983年发明的玻尔兹曼机（Boltzmann Machines），1986年发明反向传播的论文“Learning Internal Representations by Error Propagation”，AlexNet，在计算机视觉领域掀起一场革命。

Yann LeCun：代表贡献之一是卷积神经网络，拓展了神经网络的应用范围。

Bengio的贡献：在1990年代发明的Probabilistic models of sequences。发表了划时代的论文“A Neural Probabilistic Language Model”，使用高维词向量来表征自然语言。

1.2 深度学习的兴起

传统方法的瓶颈：人工设计特征是浅层特征，无法有效刻画对象的变化，所采用的识别网络是浅层网络。

浅层学习：2006年前，多种浅层机器学习模型被提出，如感知机、BP神经网络、支持向量机等。这些模型的结构基本上可以看成带有一层隐层节点，或没有隐层节点的神经网络结构。

兴起的标志：2006后，深度学习之父Hinton在《科学》杂志提出神经网络的深度学习方法，自此开启了深度学习在学术界和工业界的浪潮。

深度学习的动机：更复杂的分布往往需要更深层的网络结构。更深层次的网络具有更强的非线性拟合能力

1.3 深度学习的特点

1）与人脑相似的信息处理：从低层到高层的深层次特征抽象。
2）深层结构实现更复杂的非线性拟合。其本质是解决思路为维度空间映射，深层结构能够实现更复杂的非线性拟合。
3）深度特征的自动提取：利用反向传播自动学习深度特征。

1.4 深度学习的优势

1）更优的大数据学习能力：与传统机器学习算法相比，深度网络的结构可以随数据的增加而充分挖掘数据内在的分布规律，获得更优的性能。
2）更高层的特征提取机制：经典的机器学习算法需要复杂的特征提取过程。而深度神经网络可自适应地学习特征提取器，降低人工参与。
3）更优异的泛化性能：与传统的ML算法相比，深度学习可通过迁移学习实现不同图像域的域自适应学习能力，从而更容易适应不同的领域和应用。

深度学习产业化的核心要素：数据+运算能力+神经网络

二、卷积神经网络剖析

一般的卷积神经网络由以下几个层组成：卷积层，池化层，非线性激活函数，全连接层。这四者构成了常见的卷积神经网络。当然，损失函数也至关重要，还有各种各样的网络的优化，使得网络准确率更高。

2.1 卷积层

卷积层：卷积层是一个卷积神经网络最重要的部分，也是卷积神经网络得名的缘由。卷积层中每一个节点的输入是上一层神经网络的一小块，卷积层试图将神经网络中的每一个小块进行更加深入地分析从而得到抽象程度更高的特征。

CNN正式通过卷积的方式实现输入特征的提取和变换映射，从而获得数据的特征表示。卷积层本质上执行的是相关计算。

步长：卷积核移动的距离（包括下和左）。步长为n，则每次移动n个数值。

卷积后数据大小变化了，不再是原来数据的尺寸，怎么办？
在原始数据周围补充0，以保持卷积后的数据大小与输入数据一致。即为padding操作。

可根据需要设定补零的层数, 是一个可以设置的超参数, 但要根据卷积核的大小, 步幅, 输入矩阵的大小进行调整, 以使得卷积核恰好滑动到边缘。

一般情况下, 输入的图片矩阵以及后面的卷积核, 特征图矩阵都是方阵, 这里设输入矩阵大小为 $w$ , 卷积核大小为 $k$ , 步幅为 $s$ , 补零层数为 $p$ , 则卷积后产生的特征图大小计算公式为：

通常卷积层会使用多个滤波器实现特征的提取，如果将不同滤波器的输出级联起来，卷积层的输出可以看成是三维矩阵。

生成数据的深度：由滤波器的数量决定。
生成数据每一层的宽和高：由滤波器的大小和步长决定

在输出的某个位置 $(w, h)$ 沿着depth方向汇聚着不同滤波器提取的特征.
随着网络层的深入，卷积层抽取的特征逐渐由底层细化的边缘信息向高层抽象的语义信息过渡。

通常图片有红绿蓝(RGB)三个颜色通道(Channel)，那一个滤波器也需要三层滤波器对每个颜色通道进行过滤，于是6x6x3的图片经过3x3x3的滤波器过滤之后最终会得到一个4x4x1的图片，此时输出层图片的深度就是1。

思考：为什么用卷积？
计算量更低，并能保证性能

局部连接实现权值共享、稀疏连接、等变表示。

稀疏连接：卷积核的连线数量相比于全连接的连线数量极为稀疏。

等变表示：处于卷积网络更深层中的单元，他们的接受域要比处于浅层单元的接收域更大。如果网络还包含类似步幅卷积或者池化之类的结构特征，这种效应会加强。

局部感受野：由于图像的空间联系是局部的，每个神经元不需要对全部的图像做感受，只需要感受局部特征即可，然后在更高层将这些感受得到的不同的局部神经元综合起来就可以得到全局的信息了，这样可以减少连接的数目。

权值共享：不同神经元之间的参数共享可以减少需要求解的参数，使用多种滤波器去卷积图像就会得到多种特征映射。权值共享其实就是对图像用同样的卷积核进行卷积操作，也就意味着第一个隐藏层的所有神经元所能检测到处于图像不同位置的完全相同的特征。其主要的能力就能检测到不同位置的同一类型特征，也就是卷积网络能很好的适应图像的小范围的平移性，即有较好的平移不变性（比如将输入图像的猫的位置移动之后，同样能够检测到猫的图像）

2.2 池化层

用滤波器进行窗口滑动过程中，实际上"重叠"计算了很多冗余的信息，而池化操作就是去除这些冗余信息，并加快运动。

思考：池化层有什么作用？
1）池化用于降低尺度，从而避免大尺度所带来的高计算负担。
2）通过降低特征的分辨率使得特征对平移和其他形式变形的敏感度降低，增强特征的鲁棒性。
3）此外，池化层还能够降低特征维度（相比使用所有提取得到的特征），改善网络输出（不容易过拟合）

池化操作包括最大池化操作Max Pooling 和平均池化操作Mean Pooling

2.3 非线性激活函数

通常需要对卷积层和全连接层的输出使用激活函数进行处理，提升CNN的性能。

• 常用的非线性激活函数：

1.整流线性单元(Relu)使用激活函数

整流线性单元易于优化，整流线性单元在其一半的定义域上输出为零。
这使得只要整流线性单元处于激活状态，它的导数都能保持较大。它的梯度不但大而且一致，一阶导数处处为1。

整流线性单元通常作用于仿射变换之上：

整流线性单元的一个缺陷是它们不能通过基于梯度的方法学习那些使它们激活为零的样本。

整流线性单元的3个扩展：基于当 $z_i<0$ 时使用一个非零的斜率 $α_i$ ：

1）绝对值整流：固定 $α_i=-1$ 来得到 $g (z) = ∣ z ∣$ 。
2）渗漏整流线性单元（Leaky ReLU）：将 $α_i$ 固定成一个类似0.01的小值，
3）参数化整流线性单元（parametric ReLU）或者 PReLU 将 $α_i$ 作为学习的参数。

2.maxout单元（maxout unit）进一步扩展了整流线性单元。maxout单元将z划分为每组具有k个值的组，

这里 $G^((i))$ 是组 $i$ 的输入索引集 ${(i-1)k+1,…,ik\}$ 。

maxout单元具有抵抗一种被称为灾难遗忘（catastrophic forgetting）的现象，这个现象是说神经网络忘记了如何执行它们过去训练的任务.

原因:每一组中可以容许一些冗余来保存之前训练的知识。

3.logistic sigmoid与双曲正切函数
之前，大多数神经网络使用 logistic sigmoid 激活函数：

或者是双曲正切激活函数

这些激活函数紧密相关，因为 $t a n h (z) = 2 σ (2 z) - 1$ 。

sigmoid单元作为输出单元用来预测二值型变量取值为1的概率。sigmoid单元在其大部分定义域内都饱和——当z取绝对值很大的正值时，它们饱和到一个高值，当z取绝对值很大的负值时，它们饱和到一个低值，并且仅仅当z接近0时它们才对输入强烈敏感。sigmoid单元的广泛饱和性会使得基于梯度的学习变得非常困难。

在 $t a n h (0) = 0$ 而 $σ (0) = 1 / 2$ 的意义上，前者更像是单位函数。

当必须要使用sigmoid激活函数时，双曲正切激活函数通常要比 logistic sigmoid函数表现更好。
sigmoid 激活函数在除了前馈网络以外的情景中更为常见,如循环网络、许多概率模型以及一些自编码器。

4：其他激活函数

径向基函数（radial basis function, RBF）：这个函数在z接近模板 $W_{:,i}$ 时更加活跃。因为它对大部分 $x$ 都饱和到0，因此很难优化。

softplus函数： $g(a)=ζ(a)=log⁡(1+e^a)$ 。这是整流线性单元的平滑版本，Glorot et al.比较了softplus和整流线性单元，发现后者的结果更好。

硬双曲正切函数（hard tanh）：它的形状和tanh以及整流线性单元类似，但是不同于后者，它是有界的，

上式最小为-1，最大为1。

针对非线性激活函数的设计仍然是一个活跃的研究领域，许多有用的隐藏单元类型仍有待发现。

2.4 全连接层

全连接层把卷积层的输出拉直成向量，然后使用传统的神经网络实现特征变换。

全连接层的作用：
• 把卷积层的输出转换为向量形式
• 可以通过内积运算实现
• 每个输出神经元与所有的输入神经元连接

通常情况下，全连接层常加在卷积层后，进行结果的预测。

2.5 损失函数

我们到目前为止看到的线性模型和神经网络的最大区别，在于神经网络的非线性导致大多数我们感兴趣的代价函数都变得非凸。这意味着神经网络的训练通常使用迭代的、基于梯度的优化，仅仅使得代价函数达到一个非常小的值;而不是像用于训练线性回归模型的线性方程求解器，或者用于训练逻辑回归或SVM的凸优化算法那样保证全局收敛。

用于非凸损失函数的随机梯度下降没有这种收敛性保证，并且对参数的初始值很敏感。

和其他的机器学习模型一样，为了使用基于梯度的学习方法我们必须选择一个代价函数，并且我们必须选择如何表示模型的输出。深度神经网络设计中的一个重要方面是代价函数的选择。

在大多数情况下，我们的参数模型定义了一个分布 $p (y ∣ x; θ)$ 并且我们简单地使用最大似然原理。这意味着我们使用训练数据和模型预测间的损失作为代价函数。

如果我们对于同一个随机变量x有两个单独的概率分布 $P (x)$ 和 $Q (x)$ ,我们可以使用KL散度( Kullback-Leibler (KL) divergence)来衡量这两个分布的差异:

举例：P和Q分别代表目标标签和网络输出标签，则KL散度刻画两个分布的相似性。

KL散度有很多有用的性质，最重要的是它是非负的。
KL散度为0当且仅当P和Q在离散型变量的情况下是相同的分布，或者在连续型变量的情况下是“几乎处处”相同的。
因为KL散度是非负的并且衡量的是两个分布之间的差异，它经常被用作分布之间的某种距离。
然而，它并不是真的距离因为它不是对称的:对于某些 $P$ 和 $Q$ , $D_KL (P‖Q) \neq D_{KL} ( Q‖P)$ 。

一个和KL散度密切联系的量是交叉熵(cross-entropy),即 $H(P,Q)=H(P)+D_{KL} (P‖Q)$ ，它和KL散度很像但是缺少左边一项:

针对Q最小化交叉熵等价于最小化KL散度，因为Q并不参与被省略的那一项。

理解：x（类）在P的分布很大（即为目标类），则期望Q(x)的分布也很大，即输出概率要大，与我们的训练吻合。

代价函数的具体形式随着模型而改变,取决于 $log ⁡p_{model}$ 的具体形式

如果 $p_{model} (y│x)=N(y;f(x;θ),I)$ ，那么我们就重新得到了均方误差代价：

即：给定特征h,线性输出单元层产生一个向量 $y=w^T h+b$ 。线性输出层经常被用来产生条件高斯分布的均值:

最大化其对数似然此时等价于最小均方误差。

如果用Bernoulli输出，所对应的分布采用sigmoid单元

sigmoid单元输出定义为:

我们可以认为sigmoid输出单元具有两个部分。首先，它使用一个线性层来计算 $z=w^T h+b$ 。接着，它使用sigmoid激活函数将 $z$ 转化成概率。

$P (y)$ 可由非归一化（和不为1）的概率分布 $\tilde{p}(y)$ 来得到。

这种在对数空间里预测概率的方法可以很自然地使用最大似然学习。因为用于最大似然的代价函数是 $- l o g P (y ∣ x)$ ,代价函数中的 $l o g$ 抵消了sigmoid 中的 $e x p$ 。它的损失函数为:

通过将损失函数写成softplus函数的形式，我们可以看到它仅仅在 $(1 - 2 y) z$ 取绝对值非常大的负值时才会饱和。因此饱和只会出现在模型已经得到正确答案时——当 $y = 1$ 且 $z$ 取非常大的正值时，或者 $y = 0$ 且 $z$ 取非常小的负值时。

如果Multinoulli输出分布：softmax单元
看作是sigmoid函数的扩展，softmax函数最常用作分类器的输出，来表示 n 个不同类上的概率分布。

softmax 函数的形式为:

交叉熵为：

其中：

多个样本下：

对输出 $x_k^{(n)}$ 经过softmax处理后，每一个 $\hat{p}_k^{(n)}$ 的取值范围被限定在 $[0, 1]$ 之内，而且要满足 $\sum_{k=1}^{K}\hat{p}_k^{(n)}=1$ 。这时，某个 $\hat{p}_k^{(n)}$ 的增大势必会导致其他 $\hat{p}_k^{(n)}$ 减小。因此，在优化的时候只需要针对标签为 $k$ 的样本的输出值 $\hat{p}_k^{(n)}$ 进行优化，使其增大。

Softmax Loss 在二分类情况下的特殊情形 :

2.6 反向传播

反向传播是训练神经网络的常用方法，通过链式求导法则和梯度下降法，从最后一层到第一次，逐渐实现神经网络参数的训练。
与 BP神经网络一样, CNN 也是通过梯度下降和反向传播算法进行训练的, 则全连接层的梯度公式与 BP网络完全一样, 这里就不重复了. 下面介绍卷积层和池化层的梯度公式。

现在的目标是求出 $δ_{ij}$ 和 $\frac{∂v_{ij}}{ ∂w_{ij}}$ 的表达式. 首先求 $δ_{ij}$ , 从一个简单情况开始.

设输入是 3×3的矩阵, 卷积核是 2×2 的矩阵.
(1) 当步长为 1 时, 则可得到 2×2的特征图矩阵. 如下图所示:

绿色矩阵是第 $l - 1$ 层神经元, 红色的是第 $l$ 层, 黄色的是第 $l$ 层的卷积核, 图中省略掉了第 $l - 1$ 层的卷积核.。每个矩阵的元素可以看成一个神经元, 于是和 BP网络一样, 可以对每个神经元定义局部梯度, 为了看着清楚, 把矩阵的元素换成 $δ$ . 神经网络中数值的传递也可以看成导数的传递. 假设已经求出了 $δ^l$ , 则 $δ^{l−1}$ 的计算公式为:

这是一个递归公式. $δ$ , $w$ , $v$ 是矩阵形式, 公式中 rot180() 函数表示将矩阵逆时针旋转 $180$ 度, 参数 full 表示进行的完全的卷积运算, 这种运算形象的解释如下:

首先将特征图矩阵补一圈零, 然后用权重矩阵对补零后的特征图矩阵进行 vaild 型卷积运算.。这里补零的层数等于卷积核矩阵的大小减去 1, full型卷积的内涵在于使卷积从边缘开始, 即先计算 $w^{l}_{11}} δ_{11}^l$ , 然后是 $w^{l}_{12}} {δ_{11}^l}+{ w^{l}_{11}} δ_{12}^l$ , 以此类推。

(2) 当滑动步幅大于 1 时

上图分别是步长为 1, 2 时的卷积过程, 可以发现步长为 1 是一个比较完全的卷积, 当步长增大时, 会跳过某些区域, 因此可以通过对特征图补零的方式将步幅为 2 时生成的特征图转换为步幅 1 的特征图, 然后直接利用前面推导的公式即可求出 $δ^{l−1}$ . 补零如下图所示:

(3) 当卷积核数目为 N 时, 与 BP 网络隐藏层神经元局部梯度计算类似, 每一个权重的改变, 都会影响到下一层每一个神经元输入的改变, 所以误差的反响传递需要把误差之和传到前一层, 则公式可简单地修改为

(4) 对于池化层的梯度传递, 情况就简单了一些, 下面以 Max Pooling 为例

图中滑动窗口大小为 2×2, 步幅为 2, 则得到一个 2×2 的特征图, Max Pooling 方法是选择最大的数值作为输出, 由于过程中没有任何运算, 不存在梯度的变化, 所以误差可以直接由第 $l$ 层传递到第 $l - 1$ 层, 如下图所示:

图中假设四个角上的元素值最大, 则对应位置的局部梯度可直接反向传递, 其它位置由于没有连接, 则梯度设为 0.

如果池化类型是 Mean Pooling, 即取滑动窗口内的均值作为输出, 则将 $l$ 层的梯度的 $\frac{1}{ 4}$ 反向传递到 $l - 1$ 层, 如下图所示:

到此为止已经推导出了不同情况下的 $δ$ 的递归公式, 下面推导 $\frac{∂v_{ij}}{ ∂w_{ij}}$ 的表达式. 下图所示, 为了表达清楚, 将符号做一些替换, 相对于第 $l$ 层, 第 $l - 1$ 层的输出变量符号可由 $y$ 变为 $x$ .

根据卷积的原理, 可以得到:

可以发现, 由于共享权重, 一个权重 $w i j$ 的改变, 会影响所有的 $y$ . 因而对某一个权重求梯度时, 需要运用全微分公式. 现在以 $\frac{∂E}{ ∂w_{ij}^l}$ 为例, 求得表达式:

同理可得：

根据得到的结果, 可以发现计算 $\frac{∂E}{ ∂w_{ij}^l}$ 的规律:

首先将前面的图中卷积核和特征图调换一下位置, 将特征图矩阵的元素替换为 $δ$ , 将卷积核矩阵的元素替换为 $E$ 对 $w$ 的偏导. 根据前面得到的偏导公式, 可以发现特征图对输入矩阵卷积可得到右边黄色的偏导矩阵. 即

公式中 $w$ , $δ$ , $x$ 是以矩阵形式表达的. 同时, 可得到

2.7 网络优化

1 反向传播算法(Back Propagation Algorithm)

反向传播是训练神经网络的常用方法，通过链式求导法则和梯度下降法，从最后一层到第一次，逐渐实现神经网络参数的训练。

基于梯度下降的参数更新算法：

使用最多的GD算法：Mini-batch SGD
结合了GD和SGD，对小批量数据使用梯度下降，是一种有效的参数更新方法

算法：

Mini-batch SGD 算法中，有两个需要预先设置的参数：权重衰减(weight decay)，和动量系数(momentum)

Weight Decay：与2-范数配合使用，避免网络过拟合。取值较小，通常设置为 0.0005。

2 梯度消失

对于sigmoid、tanh等激活函数，由于其导数值 ${\sigma }'（x）$ 在某些情况下接近于 0 ，导致传到网络底层的梯度数值很小，造成网络参数更新缓慢，难以收敛。

解决（减缓）办法：

1）使用ReLU激活函数：
• ReLU激活函数的导数值非0即1
• 避免传统sigmoid激活函数导数值过低的问题

2）Batch Normalization
• 对每一层的计算结果进行尺度归一化
• 收敛速度加速5~20倍
• 作为一种正则化技术可以提高网络的泛化能力


3）Dropout 连接方式提高网络性能
• 训练阶段通过随机地选择神经元进行网络训练
• 有效防止网络过拟合，提高泛化能力


好啦，搞懂了每个模块之后，就可以去看懂文章啦！现在很多改进、优化的方法，就是在这些模块上的改进。

三、项目实战

项目实战请转至：tensorflow学习笔记（七）：CNN手写体(MNIST)识别。

系列相关论文：
1.BP神经网络的详细推导
2.用于图像分类的经典的卷积神经网络CNN
3.神经⽹络可以计算任何函数的可视化证明

MCP协议采用客户端-服务器架构的深层逻辑与架构对比分析
一、架构选择的核心动因1.功能解耦与安全边界的强制性要求MCP采用客户端-服务器（C/S）架构的核心动因源于AI系统与真实世界交互的特殊性：权限分层控制：主机（Host）作为协调层，严格划分客户端（Client）与服务端（Server）的操作权限。例如医疗场景中，诊断模型（Client）仅能通过医院授权的主机访问脱敏病历服务器，无法直接接触原始数据。沙箱隔离需求：每个MCP服务器运行在独立容器中（
TDengine 集群部署及启动、扩容、缩容常见问题与解决方案 TDengine （老段） TDengine 运维 tdengine 大数据时序数据库数据库物联网涛思数据 iot
一、部署阶段常见问题及解决方案1.dockerentrypoint.sh相关bug问题描述：在特定docker-compose.yaml文件下无法自动建立集群，原因是Docker镜像entrypoint文件/usr/bin/entrypoint.sh执行代码无法抓取出FIRST_EP信息（TDengine3.3.6.3版本）。解决方案：需检查taosd-C执行结果是否正常获取FIRST_EP，并确
时序数据库 TDengine × SSRS：专为工业、能源场景打造的报表解决方案
每当听到“做报表”三个字，是不是内心都会先叹口气？尤其在工业、能源、制造等场景，面对那些结构固定、字段繁多、格式要求严苛的报表任务，用Excel手动拼，真的是既费时又容易出错。现在解决方案来了——时序数据库TDengine与SQLServerReportingServices（SSRS）已经完成无缝集成！高性能时序数据库+企业级报表平台，帮你用更少的操作、更高的效率，制作出更稳定、更规范的专业报表
京东携手HarmonyOS SDK首发家电AR高精摆放功能
在电商行业的演进中，商品的呈现方式不断升级：从文字、图片到视频，再到如今逐渐兴起的3D与AR技术。作为XR应用探索的先行者，京东正站在这场体验革新的最前沿，不断突破商品展示的边界，致力于通过创新技术让消费者的选购过程更加直观、真实和高效。“3D技术能够提供更逼真的视觉呈现、更沉浸的交互体验，让消费者"所见即所得”，帮助品牌更好实现与用户的深入连接，“3D信息流"将成为下一代内容形态的重要载体。”-
Docker 高级管理 -- 容器通信技术与数据持久化婷儿z docker 容器运维
目录第一节:容器通信技术一：Docker容器的网络模式1：Bridge模式2：Host模式3：Container模式4：None模式5：Overlay模式6：Macvlan模式7：自定义网络模式二：端口映射关键对比三：容器互联关键对比四：容器间通信实现案例1.网络创建选项2.容器通信实现步骤3.通信方式对比第二节：数据持久化技术一：Docker的数据管理1.数据卷核心概念2.数据卷核心作用3.数据
Seaborn高阶玩法全解析：从复杂图表到多图布局的可视化实战指南
数据可视化就像给数据“画肖像”——初级阶段是勾勒轮廓，高级阶段则是赋予灵魂。在Python可视化生态中，Seaborn凭借“一行代码出美图”的优雅，成为数据分析的“画笔利器”。但你是否遇到过这样的场景：想同时展示数据分布与统计量，却被基础图表限制；想批量绘制分面图，手动拼接效率低下；想让图表更具设计感，却对颜色搭配和注解技巧一知半解？本文将带你解锁Seaborn的高阶玩法，从复杂图表绘制到多图布局
从0到1：SQL注入与XSS攻防实战——数据库安全加固全攻略小张在编程 sql xss 数据库
引言2023年某电商平台用户数据泄露事件中，黑客仅用一行username='OR'1'='1的登录输入，就拖走了百万用户信息；另一家社交网站更离谱，用户在评论区输入alert('xss')，竟让千万级用户的浏览器成了“提线木偶”。这些看似简单的攻击，为何能撕开企业安全防线？今天我们就来拆解SQL注入与XSS的“作案手法”，并给出一套可落地的数据库安全加固方案——毕竟，防住这两类攻击，能解决80%的
使用 p6spy，拦截到持久层执行的sql及参数 Peter-OK 一些问题 p6spy sql
声明：文章内容是自己使用后整理，大部分工具代码出自大牛，但因无法确认出处，故仅在此处由衷的对无私分享源代码的作者表示感谢与致敬！本人在拦截到sql的基础上加了分析功能和异常告警功能1、导入p6spy的jar包，如果是maven项目引入pomp6spyp6spy3.9.12、修改datasource数据源的driverClassName驱动和url地址为com.p6spy.engine.spy.P6
2.Spring Cloud生态全景解析：核心组件、能力边界与定位碎风影 SpringCloud深度解析 spring cloud spring 后端
导语：SpringCloud并非单一框架，而是基于SpringBoot构建的分布式系统工具集。它通过标准化封装，将服务发现、配置管理、熔断限流等复杂基础设施转化为开箱即用的组件，让开发者聚焦业务逻辑。本文将系统解析其核心组成、与SpringBoot的共生关系，并客观审视其能力边界，助您构建清晰的微服务技术选型地图。一、核心基石：SpringBoot与SpringCloud的共生关系关键结论：Spr
uniapp [安卓苹果App端] - 实现获取请求手机位置权限+开启定位获取经纬度/省市区地址等，检测权限手机定位是否开启并引导用户同意授权，uniApp app端调用本机开启本机定位权限及IP属地前端开发大师鸭 +Uniapp 开发问题汇总 uni-app 手机定位权限手机位置权限 uniapp安卓苹果系统权限用户拒绝定位权限后怎么办开启位置并获取IP定位数据经纬度及省市区县详细地址数据
前言网上的教程乱七八糟且兼容性太差，本文提供优质示例。在uni-appApp端（安卓APP|苹果APP）开发中，详解在app平台端实现获取手机位置权限及开启定位功能（原生实现不依赖第三方插件和地图），有权限则开启位置定位获取用户经纬度+IP属地+省市区县详细地址数据等操作，反之无权限则提示开启位置权限与引导用户授权操作，uniAppapp端实现判断是否拥有定位权限及提示引导用户授权同意，完美兼容安
从实验到文化 - “混沌日”与持续混沌 weixin_42587823 混沌数据库混沌
从实验到文化-“混沌日”与持续混沌第一部分：锻炼团队的“免疫系统”-混沌日(GameDay)什么是“混沌日”？混沌日是一场有计划、有组织的演习活动。在活动中，团队成员们齐聚一堂（无论是线上还是线下），在一个受控的环境中（理想情况是生产环境，但从预生产环境开始是更安全的选择），主动触发一次模拟的真实故障场景。它就像一次针对技术团队和系统的消防演习。它的价值何在？混沌实验不仅仅测试机器，它同样也测试人
Zsh中PATH环境变量错误的报错与别名配置实战指南喜欢编程就关注我 java python 前端 Zsh中PATH环境变量错误的报错与别名配置实战指南代码
Zsh中PATH环境变量错误的报错与别名配置实战指南一、PATH环境变量错误诊断矩阵1.1常见错误类型错误现象典型报错信息根本原因解决方案命令未找到zsh:commandnotfound:xxxPATH未包含命令所在目录检查PATH配置路径重复无报错但路径列表冗余多次添加相同路径使用数组去重权限问题zsh:permissiondenied:/usr/local路径目录无执行权限调整目录权限特殊字符
scanpy保存图片的常用方法汇总 Bio Coder 空间转录组 &单细胞 scanpy 保存图片汇总
在使用Scanpy（一个用于单细胞RNA测序数据分析的Python库）时，保存图片（如可视化结果）是常见的操作。Scanpy的绘图功能主要基于Matplotlib和Seaborn，保存图片的方法也与这些库的保存机制一致。以下是Scanpy保存图片的详细方法及注意事项：1.基本保存图片的方法Scanpy的绘图函数（如sc.pl.umap、sc.pl.tsne、sc.pl.pca等）通常会返回Matp
服务注册和发现组件的详细对比与选型建议（详细版）古龙飞扬 spring cloud spring 后端
服务注册和发现组件Eureka、Consul、ZooKeeper、Etcd和Nacos的区别与选型建议在微服务架构中，服务注册与发现是一个核心组件，它解决了服务实例的动态管理和自动发现的问题。目前，市场上存在多种服务注册与发现组件，其中Eureka、Consul、ZooKeeper、Etcd和Nacos较为常见。作为资深的软件架构师，本文将详细分析这些组件的区别，并提供选型建议。一、EurekaE
k8s深度讲解----宏观架构与集群之脑 - API Server 和 etcd weixin_42587823 云原生 kubernetes 架构 etcd
宏观架构与集群之脑-APIServer和etcd宏观架构：数据中心的操作系统在开始之前，让我们先建立一个高层视角。你可以将Kubernetes想象成一个管理整个数据中心的分布式操作系统。在这个操作系统中：控制平面(ControlPlane)就是它的“内核”，负责管理和决策。工作节点(WorkerNodes)就是它的“CPU和内存”，是真正运行应用程序的地方。我们常用的kubectl就是与这个“内核
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
Spring框架中的Component与Bean注解
SpringBoot中的@Bean与@Component![](https://pic4.zhimg.com/v2-f957e9ec5412c87a66ccb021410eaae9_14...)Spring的@Component和@Bean注解的关键区别在于：@Bean注解可用于暴露您自己编写的JavaBeans，而@Component注解可用于暴露源代码由他人维护的JavaBeans。Sprin
C++ 工厂模式与抽象工厂：创建对象的灵活设计海派程序猿 c++java jvm
C++工厂模式与抽象工厂：让对象“流水线”更优雅想象一下，你是一家玩具工厂的老板，主要生产两种玩具：小汽车和积木。最初，你的生产流程很简单，需要什么就直接用new创建什么：//生产小汽车Car*myCar=newCar();//生产积木Block*myBlock=newBlock();简单粗暴，效率很高，就像直接从仓库里抓取零件组装一样。但问题也随之而来：耦合度高：生产代码直接依赖于具体的Car和
掌握变量命名与Python继承机制
掌握变量命名与Python继承机制背景简介在编程中，变量命名和继承是基础且重要的概念。良好的命名习惯可以提升代码的可读性，而继承则是一种代码复用的重要机制。本文将结合具体的书籍章节内容，深入解析变量命名规则和Python继承机制。变量命名规则变量命名是编程中最基础的部分，而正确的命名习惯能够帮助其他开发者（或未来的自己）更好地理解代码。根据书籍提供的内容，我们应当遵守以下规则：变量名只包含数字、下
uiautomatorviewer工具在Android 9.0上的应用及优势小馬锅
本文还有配套的精品资源，点击获取简介：uiautomatorviewer是AndroidSDK中的自动化测试和UI分析工具，特别适用于Android9.0版本。它支持扫描和分析应用UI控件，获取关键UI元素信息以编写自动化测试脚本。工具采用XPath定位技术，对于复杂布局中的UI元素精确定位尤为有效。同时，uiautomatorviewer与Appium自动化测试框架在功能上具有重叠，但各有优势。
从实践到自动化：现代运维管理的转型与挑战运维
从实践到自动化：现代运维管理的转型与挑战在信息化快速发展的今天，企业IT系统的稳定性、可用性和安全性已成为衡量公司竞争力的重要因素之一。运维（IT运维）管理作为确保企业IT系统健康、稳定运行的关键职能，一直是企业技术团队关注的重点。然而，随着业务的复杂化、用户需求的变化以及技术的不断创新，传统的运维方式已逐渐无法满足企业对于高效、高可用、高安全的需求。如何提升运维效率、减少人为错误、提高运维系统的
华为手机手机与计算机传输,如何将华为手机的视频传到华为的电脑上？手机与电脑数据互传操作步骤... 人人保华为手机手机与计算机传输
手机与电脑数据互传操作bai步骤如下：1、手机du通过原装USB数据线与电脑相连，待zhi电脑自行dao安装驱动，并确认驱动安装成功，如下图所示：注：如驱动未安装成功，可通过安装HiSuite软件进行辅助驱动安装或者通过选择端口模式中的帮助进行电脑驱动安装。(1)在手机端弹出的对话框选择“是，访问数据”(2)在手机下拉菜单中USB连接方式中选择设备文件管理(MTP)注：关于设备文件管理(MTP)和
DMA技术与音频数据的存储和播放曹小满2579 Android基础音视频 Android
基本概念采样率：每秒采集的采样点次数。如480000HZ，就是我们常见的48KHZ采样点(Sample)：每一个采样点代表一个时间点的声音幅度值。对于立体声，每个采样点包含了两个声道(左声道，右声道)的数据。帧：一帧就是一个时刻采集的数据，如果音频是立体声则会产生2个采样点，如果是更复杂的比如5.1，则会产生更多的采样点。例如PCM数据是48KHZ，16bit的，立体声，则一秒的PCM数据有48K
稀缺工具，效率拉满！
在办公场景中，图像和文档是最常接触的两类文件类型。日常工作中经常需要对多个文件进行批量处理，如图片转文档、PDF文件空白页删除、PDF转双层、图片校正等操作。这些重复性操作如果逐个处理不但效率极低下，还可能出现错误，而利用批量操作工具。可以快速完成大量文件的批量操作；分享一款高效的文档、图片批量操作工具：图档批处理助手v1.2.1；图档批处理助手是一款专注于高效处理文档与图像批任务的轻量级工具，软
Flex与Spring集成 hkmw Flex 配置 spring flex application dependencies components access
Flex与Spring集成UsingFlexwithSpringUPDATE(1/12/2007):IputtogetheraTomcat-basedTestDriveServerthatincludesthesamplesdescribedbelowrunningout-of-thebox.Readthispostformoreinfo.WhatisSpring?Springisoneofthe
Ubuntu 与 Windows 实现文件夹共享懒羊羊大王呀 Linux windows Linux Samba 文件夹共享
Ubuntu20.04与Windows实现文件夹共享Linux中Samba的下载与配置sudoupdateapt#更新工具包sudoaptinstallsamba#下载Sambasudocp/etc/samba/smb.conf/etc/samba/smb.conf.bak#尽量备份一下sudovim/etc/samba/smb.conf#修改配置文件#添加以下内容，其中[shared]#共享文件
量子计算的数学地基：解码希尔伯特空间的魔法牧之112 量子计算
在科技圈，“量子计算”早已不是陌生的名词。从谷歌的“量子霸权”实验到IBM的量子云服务，从药物研发的分子模拟到密码学的革命性突破，量子计算正以颠覆式的姿态重塑着人类对计算的认知。但在这些令人惊叹的应用背后，藏着一个关键的数学基石——希尔伯特空间（HilbertSpace）。它像一片隐形的“量子舞台”，支撑着量子比特的叠加、纠缠与计算，是理解量子计算本质绕不开的概念。一、从“普通空间”到“量子空间”
【视频观看系统】- 技术与架构选型
✅项目技术选型方案一、整体架构风格项目层级技术选型说明架构风格微服务架构（SpringCloud）独立部署、易扩展、易维护服务通信HTTP（RestTemplate或Feign）+RocketMQ同步调用+异步事件注册中心Nacos服务注册、发现、配置中心配置中心Nacos配置管理多服务统一配置API网关SpringCloudGateway路由转发、权限验证、限流服务监控SpringBootAdm
Readr 项目安装与配置指南芮奕滢Kirby
Readr项目安装与配置指南readr项目地址:https://gitcode.com/gh_mirrors/rea/readr1.项目基础介绍readr是一个R语言的开源项目，由HadleyWickham创建和维护。该项目的主要目的是提供一种快速且友好的方式来读取分隔文件（如CSV和TSV）中的矩形数据。readr能够解析多种数据类型，并在解析过程中提供详细的错误报告，以便用户能够快速识别和解决
为什么MEMS定向短节抗磁干扰优于磁通门定向短节？ ericco123 科技制造 MEMS 陀螺仪惯性技术
一、磁通门传感器的核心缺陷：磁敏感性的局限磁通门传感器作为磁性定向短节的核心，其工作原理完全依赖地磁场。这导致其在井下复杂环境中存在不可克服的技术缺陷，主要表现在以下两个方面：1.磁干扰下数据失真当磁通门传感器处于套管、油管、钻杆等由铁磁性材料构成的井段时，这些材料会严重畸变周围的地磁场分布。由于无法区分真实地磁场与畸变磁场，导致方位角测量结果失真甚至完全错误。在强磁矿区、邻井电磁作业等存在强人工
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http