lan人啊

脉冲神经网络（SNN）论文阅读（一）-----Going Deeper With Directly-Trained Larger Spiking Neural Networks

原文链接：https://blog.csdn.net/qq_43622216/article/details/123591425

Going Deeper With Directly-Trained Larger Spiking Neural Networks

说明
相关信息
主要贡献
启发
Abstract
Introduction
Related Work
- SNN学习算法：
- 深度神经网络（DNN）中的梯度消失或爆炸：
- 正则化：
Materials and Methods
- 迭代的LIF模型（Iterative LIF model）：
- 阈值依赖批量正则化（Threshold-dependent batch normalization）:
- 整体训练算法（Overall training algorithm）:
Theoretical Analysis
- 梯度规范理论（Gradient norm theory）：
- 膜电势衰减机制的影响（Influence of membrane decay mechanism）：
- 尺度因子（Scaling factors）：
Deep Spiking Residual Network
- Basic Block：
- 网络架构（Network architecture）：
Experiment
- 静态数据集上的实验：
- 神经形态数据集上的实验：
Conclusion
Supplementary Material（待补充）
- A Codes for Algorithms（算法代码）
- B Proofs of Theorems（定理证明）
- C Details of Experiments（实验细节）
- D Analysis of Computation Reduction（计算量降低分析）
部分参考文献

说明

准备将自己读的一些和SNN（脉冲神经网络）相关的一些论文记录下来，方便自己以后回看也希望能够帮到有需要的人。
删除了文中一些自认为不重要的内容（很少），其他部分尽量使用专业用语进行翻译，如果有什么出错或不恰当的地方希望各位批评指出。

文献	时间	N-MNIST	MNIST-DVS	ImageNet	CIAFR10	CIFAR10-DVS	DVS128-Gesture	SHD Dataset
文献1	2018年	98.78%
文献2	2019年	99.53%			90.53%	60.5%
文献3（本文）	2020年			67.05%	93.16%	67.8%	96.87%
文献4	2021年		99.13%			70.4%	97.56%
文献5	2021年					72%	98.61%	91.08%
文献6	2022年	99.63%				73.8%	98.96%

主要贡献

论文提出了基于spatio-temporal backpropagation （时空反向传播）的threshold-dependent batch normalization (tdBN) 方法，称为 “STBP-tdBN”，并使用tdBN构建了一个深度脉冲残差网络，扩展了直接训练的SNN的深度（从小于10层到50层），使用很小的timestep（时间步长）在CIFAR-10数据集上达到了93.15%的准确率，在DVS-CIFAR10数据集上达到了67.8%的准确率（SOTA）、ImageNet数据集上达到了67.05%的准确率。

启发

基于本文提出的tdBN算法以及ResNet-SNN，可以用其构建深层次的SNN网络并取得更好的性能。

Abstract

脉冲神经网络（SNN）在时空信息的bioplausible coding（生物可信编码）和event-driven（事件驱动）信号处理方面具有广阔的应用前景，非常适合应用于energy-efficient（低能耗的）神经形态硬件中。然而，其独特的工作模式使得其比传统网络更难训练。目前，主要有两种方式训练高性能的深层SNN。一是将预训练的ANN模型转换为对应的SNN版本，这种方式通常需要较长的coding window（编码窗口）进行收敛，也不能在训练时利用spatio-temporal features（时空特征）来解决时间任务（temporal tasks）。另一种方法是在时空域（spatio-temporal domain）中直接训练SNN，但由于激发函数（firing function）的二元脉冲活动（binary spike activity）和梯度消失或爆炸的问题，目前的方法还局限于浅层架构，难以利用大规模数据集(如ImageNet)。为此，我们提出了一种阈值依赖批量归一化(threshold-dependent batch normalization ，tdBN)方法，该方法基于新兴的时空反向传播（spatio-temporal backpropagation），称为“STBP-tdBN”，可以直接训练深层SNN，并在神经形态硬件上有效地实现其推理。利用提出的方法和精心设计的shortcut connection，我们将直接训练的SNN从一个浅层结构(<10层)大大地扩展到一个很深的结构(50层)。此外，我们基于“块动态等距（Block Dynamical Isometry）”理论从理论上分析了我们方法的有效性。最后，我们报告了更好的精度结果，包括在CIFAR-10上的93.15%，在DVS-CIFAR10上的67.8%，在ImageNet上的67.05%，而且时间步长（timestep）非常小。据我们所知，这是第一次在ImageNet上探索直接训练的高性能的深度SNN。我们相信这项工作将为充分发挥SNN的优势、吸引更多的研究者在这一领域做出贡献铺平道路。

Introduction

目前主要有两种方式来训练高性能的SNN。

第一种方式是将预训练的ANN转换为SNN，这通常需要数百个时间步长。因此，尽管这些SNN与具有类似结构的ANN具有相当的精度，但大量的时间步长会导致严重的信号延迟（signal latency）并增加计算量。
另一种方法是基于梯度下降方法直接训练SNN，该方法不依赖于预先训练的ANN并且能减少时间步长。
目前基于STBP算法训练的SNN仅限于浅层架构，无法在大规模数据集上达到令人满意的性能。因此，在上述算法下我们明确了两个需要解决的问题，以便直接训练更深层的SNN。

第一个问题是梯度消失或爆炸。由于其独特的时空信息处理机制和不可微的脉冲信号，当直接训练SNN时，梯度传播表现得非常不稳定，在大多数情况下趋于消失，这影响了深层SNN的效果。到目前为止，直接训练的SNN还没有一种有效的方法可以很好地处理这个问题。前人的工作都没能直接训练深层SNN并且他们的模型都小于10层，严重影响了他们方法的性能。
另一个问题是我们需要平衡每个神经元的阈值和输入，以在 SNN 中获得适当的放电率（firing rate）。当输入与阈值相比太小时，神经元发出的脉冲很少，神经元膜电位保持不变，因此神经元处理的信息无法充分表达。当输入太大时，神经元会一直放电（脉冲）并对输入的变化不敏感。对于直接训练的SNN，由于双脉冲（binary spikes）逐层传播，在训练过程中突触前输入（presynaptic inputs）的分布会发生偏移，使得输入的大小不合适。人们提出了许多方法来处理这个问题，如threshold regularization（阈值正则化）和NeuNorm。
Normalization（正则化）似乎是解决这两个问题的合适方法，能够稳定网络和梯度传播，并且能将突触前输入的分布正则化到相同的期望和方差，通过减少内部协变量移位（internal covariate shift）来平衡阈值和输入。然而，现有的正则化方法并不适合于SNN的训练。对于额外的时间维度和特殊的激活机制（activation mechanism），直接训练的SNN需要专门设计的正则化方法。
本文提出了一种直接训练深层SNN的新算法，主要工作如下：

我们提出阈值依赖批量归一化来解决梯度消失或爆炸问题，并调整放电率。在此基础上，利用残差网络结构，修改适合SNN的shortcut connection。
在此基础上，我们深入研究了直接训练的SNN(从10层扩展到50层)，并在大规模非脉冲数据集(CIFAR-10, ImageNet)和神经形态数据集(DVSGesture, DVS-CIFAR10)上进行测试。
在CIFAR-10和ImageNet上，我们全面验证了不同的SNN架构(ResNet-18, 34, 50)，并给出了使用更少的时间步长(不超过6个时间步长)与类似SNN的比较结果。据我们所知，这是第一次直接训练的带有全脉冲（full spikes）的SNN在ImageNet上显示了相当高的准确性。在神经形态数据集上，我们的模型在DVS-Gesture和DVS-CIFAR10上都取得了最好的性能（state-of-the-art），显示了SNN在处理时空信息方面的优势。

Related Work

SNN学习算法：

在过去的几年里，很多学习算法都在探索如何训练一个深层的SNN，如(1)一些将预训练的ANN转化为SNN;(2)基于梯度下降的算法。

第一种方法叫做"ANN-SNN conversion methods"，它将ReLU函数的实值输出转换为SNN中的二进制脉冲，被认为是最流行的训练高性能深层SNN的方法。这种方法在大规模数据集上达到了有竞争力的性能，相对于ANN也没有严重的退化。然而，这种方法忽略了脉冲神经元丰富的时间动态行为（temporal dynamic behaviors）并且通常需要数百或数千个时间步长才能接近预训练的ANN的精度。
基于梯度下降的算法对SNN进行误差反向传播训练。利用梯度下降优化学习算法，一些SNN模型在CIFAR-10和其他神经形态数据集上达到了较高的性能。直接训练的SNN在处理空间和时间信息方面显示出巨大的潜力，并能在非常少的时间步长内达到较高的的准确性。但是，由于梯度消失和内部协变量移位，还不能直接训练出非常深的SNN，这正是我们想要克服的。

深度神经网络（DNN）中的梯度消失或爆炸：

当动态等距时（即其输入输出雅可比矩阵的每个奇异值都保持在1附近），DNN可以避免梯度消失或梯度爆炸。Chen¹等人提出了“块动态等距”，作为所有复杂串并联DNN的通用统计工具，通过研究神经网络中每个块的一阶矩和二阶矩，并分析它们对梯度分布的影响，并对神经网络中权值初始化（ weight initialization）、批处理归一化（batch normalization ）和shortcut connection 的作用进行了理论解释，为我们算法的开发提供了理论依据。

正则化：

对于人工神经网络（ANN）来说，正则化(如batch normalization、group normalization、 layer normalization )已成为常用的方法。batch normalization(BN)通过减少内部协变量移位（internal covariate shift）来加速深度网络训练，从而提高学习速度并正则化模型。虽然它会导致很高的学习延迟（learning latency ）和增加计算量，但BN使得能够训练更深的网络并避免梯度消失或爆炸。对于SNN，研究人员提出了其他的正则化技术，如data-based normalization、Spike-Norm和NeuNorm。这些正则化方法的目的是平衡输入和阈值，避免严重的信息丢失，但它们仍然忽略了梯度消失问题，对直接训练的深层SNN无效。我们注意到BN在ANN中的效果和SNN中输入分布的重要性，因此我们修改BN以满足SNN模型的训练和推理。

Materials and Methods

迭代的LIF模型（Iterative LIF model）：

迭代LIF模型最早由Wu²等人在2019年提出，利用欧拉法（Euler method）求解Leaky integrate-and-fire (LIF)模型的一阶微分方程，并将其转换为迭代表达式
$u^t = \tau_{decay}u^{t-1}+I^t \tag{1},$
其中 $\tau_{decay}$ 是描述膜电位衰减速度的常数， $u^t$ 是膜电位， $I^t$ 是突触前输入， $V_{th}$ 表示给定的阈值。当 $u^t>V_{th}$ 时，神经元发放一个脉冲并将 $u^t$ 置为0。突触前输入是由前一层的其他神经元发放的的脉冲信号之和，因此 $I^t$ 可以表示为 $x^t=\sum_{j}w_jo^t(j)$ ,其中 $w_j$ 表示权重， $o^t(j)$ 表示在 $t$ 时刻来自其他神经元的二进制脉冲输出。考虑到空间结构，并设置 $u_{reset}=0$ ，则整个空间和时间域的迭代LIF模型可以表示为
$u^{t,n+1} =\tau_{decay}u^{t-1,n+1}(1-o^{t-1,n+1})+x^{t,n}, \tag{2}$
$o^{t,n+1} =\begin{cases}1&{\rm if}\,u^{t,n+1}>V_{th},\\ 0&{\rm otherwise} \end{cases} \tag{3}$
其中 $u^{t,n}$ 表示在第 $n$ 层神经元在 $t$ 时刻的膜电位， $o^{t,n}$ 是二进制脉冲， $\tau_{decay}$ 是膜电势衰减常数（potential decay constant）。
迭代LIF模型可以在空间和时间维度上实现前向和后向传播，这使得它对一般的机器学习编程框架很友好。

阈值依赖批量正则化（Threshold-dependent batch normalization）:

批归一化(batch normalization, BN)作为DNN的正则化组成部分，是目前常用的神经网络方法，它可以实现稳定的收敛和更深层的神经网络。但是，由于SNN额外的时间维度和特殊的激活机制，直接训练的SNN需要专门设计的归一化方法。这促使我们提出阈值依赖的批归一化（threshold-dependent batch normalization，tdBN）。
我们考虑一种脉冲卷积神经网络(SCNN)。设 $o^t$ 表示时间步长（timestep）为 $t$ 时一层内所有神经元的脉冲输出，以及卷积核 $W$ 和偏差（bias） $B$ ，我们有如下表达式
$x^t = W \circledast o^t + B \tag{4}$
其中 $x^t \in R^{N \times C \times H \times W}$ 表示以 $N$ 为批处理轴(batch axis)且时间步长为 $t$ 时的突触前输入， $C$ 是通道轴（channel axis）， $(H, W)$ 是空间轴。
在我们的tdBN里，高维的突触前输入将会沿着通道维度被归一化（如下图1所示）。令 $x^t_k$ 表示 $x^t$ 的第 $k$ 个通道的特征图(feature map)， $x_k=(x^1_k,x^2_k,...,x^T_k)$ 会按照如下方式进行归一化
$\hat{x}_k=\frac {\alpha V_{th}(x_k-E[x_k])}{\sqrt{Var[x_k]+\epsilon}}, \tag{5}$
$y_k = \lambda_k \hat{x}_k + \beta_k, \tag{6}$
其中 $V_{th}$ 表示阈值， $\alpha$ 是一个依赖于网络结构的超参数， $\epsilon$ 是一个很小的常数， $\lambda_k$ 和 $\beta_k$ 是两个可以训练的参数， $E[x_k]、Var[x_k]$ 是在一个MiniBatch上统计估计的 $x_k$ 的均值和方差。图1展示了 $E[x_k]、Var[x_k]$ 的计算过程，可定义为
$E[x_k] = mean(x_k), \tag{7}$
$Var[x_k] = mean((x_k - E[x_k])^2). \tag{8}$
因此，在训练期间， $y_k \in R^{T \times N \times H \times W}$ 正是下一层第k个通道的神经元在T时间步长内接收到的归一化突触前输入。

图1 在tdBN中计算E[x]和Var[x]，每一个立方体表示在t时间步长时的一个feature map tensor，其中N是batch axis，C是channel axis，(H,W)是空间轴。在C维向量E[x]和Var[x]中的每一个元素由对应通道的黄色张量估计。

在推理过程中，我们遵循标准Batch Normalization的模式（schema），分别估计出代表 $E[x_k]$ 和 $Var[x_k]$ 在整个数据集上的期望 $\mu_{inf}$ 和 $\sigma^2_{inf}$ ，这些期望和方差可以在训练过程中通过移动平均求解（moving average solution）得到。
除此之外，在对具有tdBN的SNN进行推理时，进行批量尺度融合（batchnorm-scale-fusion）是必要的。它移除了推理期间的Batch Normalization操作，从而保持网络是全脉冲（full-spiking）的，并使其能够在神经形态平台上实现。设 $W_{c,k}$ 和 $B_{c,k}$ 表示一层里的第 $c$ 个feature map与下一层的第 $k$ 个feature map之间的卷积核和偏差，模式（schema）可以由下式定义
$W^{'}_{c,k} = \lambda_k \frac {\alpha V_{th}W_{c,k}}{\sqrt{\sigma^2_{inf,k}+\epsilon} }, \tag{9}$
$B^{'}_{c,k} = \lambda_k \frac{\alpha V_{th}(B_{c,k}-\mu_{inf,k})}{\sqrt{\sigma^2_{inf,k}+\epsilon}}+ \beta_k, \tag{10}$
其中的 $W^{'}_{c,k}$ 和 $B^{'}_{c,k}$ 表示经过batchnorm-scale-fusion后的权重和偏差，因此在推理过程中，脉冲通过变换后的权重 $W^{'}_{c,k}$ 和偏差 $B^{'}_{c,k}$ 逐层传播，就不需要进行batch norm操作。因此，我们的tdBN只影响训练期间的计算量而不影响已经训练好的SNN的运行过程。
简而言之，我们的tdBN与标准BN有两个主要区别。首先，与ANN不同的是，SNN不仅逐层（layer by layer）地传播信息，而且从上一时刻刻传播到下一时刻。因此，tdBN应该在时间和空间两个维度上对特征输入进行归一化。其次，根据阈值 $V_{th}$ 归一化方差。在tdBN中，激活前的值（pre-activations ）被归一化为 $N(0,(\alpha V_{th})^2)$ 而不是 $N (0, 1)$ 。我们用1和0初始化可训练参数 $\lambda$ 和 $\beta$ ，在串联神经网络里（serial neural network）超参数 $\alpha$ 都设为1。对于有 $n$ 个分支的局部并行网络结构， $\alpha= \frac{1}{\sqrt{n}}$ 。这使得在早期的训练过程中 $V_{th}$ 的激活前的值均值为0，标准差为 $V_{th}$ 。tdBN的代码见文末的补充材料A。

整体训练算法（Overall training algorithm）:

在本节中，我们介绍STBP-tdBN的整体训练算法，用我们的tdBN从头开始训练深层SNN。
在误差反向传播中，我们将最后一层作为解码层（decoding layer），最终的输出Q表示为：
$\frac {1}{T} \sum_{t=1}^{T}Mo^{n,t}, \tag{11}$
其中 $o^{n,t}$ 是最后一层输出层发放的脉冲， $M$ 是解码层矩阵， $T$ 是时间步长（timestep）。
然后我们让输出通过一层softmax层。损失函数（loss function）使用交叉熵。考虑有输出 $Q=(q_1,q_2,...,q_n)$ 和标签向量（label vector） $Y=(y_1,y_2,...,y_n)$ ，损失函数 $L$ 定义为：
$p_i = \frac{e^{q_i}}{\sum_{j=1}^ne^{q_i}}, \tag{12}$
$-\sum_{i=1}^ny_ilog(P_i). \tag{13}$
利用迭代LIF模型，STBP-tdBN方法在空间和时间域上反向传播损失函数 $L$ 的梯度。利用链式法则，可以利用下式来计算 $\frac{\partial L}{\partial o_i^{t,n}}$ 和 $\frac{\partial L}{\partial u_i^{t,n}}$ ：
$\frac{\partial L}{\partial o_i^{t,n}} = \sum_{j=1}^{l(n+1)}\frac{\partial L}{\partial u_j^{t,n+1}}\frac{\partial u_j^{t,n+1}}{\partial o_i^{t,n}} + \frac{\partial L}{\partial u_i^{t+1,n}}\frac{\partial u_i^{t+1,n}}{\partial o_i^{t,n}}, \tag{14}$
$\frac{\partial L}{\partial u_i^{t,n}} = \frac{\partial L}{\partial o_i^{t,n}}\frac{\partial o_i^{t,n}}{\partial u_i^{t,n}} + \frac{\partial L}{\partial u_i^{t+1,n}}\frac{\partial u_i^{t+1,n}}{\partial u_i^{t,n}}, \tag{15}$
其中 $o^{t,n}$ 和 $u^{t,n}$ 表示第 $n$ 层神经元在 $t$ 时刻的脉冲和膜电位，由于脉冲活动不可微分， $\frac{\partial o^t}{\partial u^t}$ 实际上并不存在，为了解决这个问题，Wu³等人在2018年提出了导数曲线（derivative curve）来近似脉冲活动的导数，在本文中，我们使用矩形函数（rectangular function），它在梯度下降中是很有效的，可以由下式求得：
$\frac {\partial o^t}{\partial u^t} = \frac {1}{a}sign(|u^t-V_{th}| < \frac {a}{2}). \tag{16}$
整体训练算法的代码同样见文末的补充材料A。

Theoretical Analysis

在本节中，我们将分析tdBN对STBP-tdBN训练的SNN的影响。利用神经网络中梯度规范理论（gradient norm theory）的理论工具，我们发现我们的tdBN可以缓解训练过程中梯度消失或爆炸的问题。我们还将解释归一化过程中加入的尺度因子 $\alpha$ 和 $V_{th}$ 的作用。

梯度规范理论（Gradient norm theory）：

梯度范数理论是近年来发展较好的理论，它旨在克服各种神经网络结构中的梯度消失或爆炸问题。在本文中，我们采用Chen⁴等人在2020年提出的“Block Dynamical Isometry”来分析tdBN在直接训练的SNN中的效果，它把网络看作为一系列的块（block）：
$f_{i,\theta_i} \circ f_{i-1,\theta_{i-1}} \circ ... \circ f_{1,\theta_1}(x), \tag{17}$
其中函数 $f_{j,\theta_j}$ 表示第 $j$ 个块，并将其输入输出雅可比矩阵定义为 $\frac {\partial f_j}{\partial f_{j-1}} = J_j$ ，使用 $\phi(J)$ 表示 $t r (J)$ 的期望， $\varphi(J)$ 表示 $\phi(J^2) - \phi ^2(J)$ ，随后证明下面几个引理（lemma）：

引理1. 考虑一个神经网络，它可以如式（17）那样用一系列的块表示，第 $j$ 个块的雅可比矩阵表示为 $J_j$ 。如果 $\forall j,\phi(J_jJ_j^T)\approx 1$ 且 $\varphi(j_jJ_j^T)\approx 0$ ，网络就达到了“块动态等距（Block Dynamical Isometry）”，并能避免梯度消失或梯度爆炸。

引理2. 考虑一个神经网络块，包含有0均值的数据归一化（data normalization with 0-mean）、线性转换（linear transform ）和整流激活rectifier activations（General Linear Transform）。设输入输出向量的二阶矩分别为 $\alpha_{in}$ 和 $\alpha_{out}$ ，有 $\phi(JJ^T)=\frac{\alpha_{out}}{\alpha_{in}}$ 。

在梯度规范理论框架的基础上，将梯度规范与脉冲神经元的特性相结合，进一步分析tdBN算法对SNN的有效性。
LIF模型有两个独特的超参数： $\tau_{decay}$ 和 $V_{th}$ ，其中 $\tau_{decay}$ 影响梯度在时间域中的传播， $V_{th}$ 影响空间维度。在SNN的实验中， $\tau_{decay}$ 通常设置为比较小的值（如0.25）。为了分析梯度变换，我们将模型简化，设置 $\tau_{decay}$ 为0，得到如下命题：

定理1： 考虑一个时间步长为T的SNN，在T时刻的第 $j$ 个雅可比矩阵记为 $J^t_j$ 。当 $\tau_{decay}=0$ 时，将两个tdBN层之间每个块（block)的输入向量和输出向量的二阶矩固定为 $V_{th}^2$ ，有 $\phi(J_j^t(J_j^t)^T)\approx1$ 并且可以在SNN的训练过程中避免梯度消失或梯度爆炸。
证明： 定理1的证明基于引理1和引理2，详细的证明过程在补充材料B中。

膜电势衰减机制的影响（Influence of membrane decay mechanism）：

下面分析 $\tau_{decay}$ 对梯度传播的影响。从等式（2）到等式（15），可以得到：
$\frac{\partial L}{\partial u_i^{t,n}} = \frac{\partial L}{\partial o_i^{t,n}}\frac{\partial o_i^{t,n}}{\partial u_i^{t,n}} + \frac{\partial L}{\partial u_i^{t+1,n}}\tau_{decay}(1-o_i^{t,n}). \tag{18}$
如果一个神经元发放了脉冲， $1-o_i^{t,n})=0$ ，此时梯度与 $\tau_{decay}$ 无关。另一方面，由于 $\tau_{decay}$ 是一个很小的常数，神经元在 $t + 1$ 时刻的梯度对 $t$ 时刻的影响不大。
为了验证定理1和分析膜电势衰减机制的影响，我们在CIFAR-10数据集上用20层的plain spiking network评估tdBN。在图2中，我们展示了在训练过程中的前1/6个epoch中除了第一个编码层和最后一个输出层外的每一层梯度范数（gradient norm）的均值。结果表明，当 $\tau_{decay}$ = 0时，梯度范数曲线表现较稳定，证实了我们的理论。但要注意的是， $\tau_{decay}$ 不能设置为0，因为这样会阻碍信息沿时间维度传播从而造成严重的退化问题。因此我们在 $\tau_{decay}\neq0$ 的条件下评估我们的方法。当 $\tau_{decay}$ 设置为0.25和0.5时，梯度范数随着网络的加深增长非常缓慢，也就不会影响训练过程。研究结果有力地支持了我们的结论，即在深层SNN中可以避免梯度消失或爆炸的问题。

图2 基于tdBN的plain spiking network的gradient norm

尺度因子（Scaling factors）：

众所周知，SNN模型获得有竞争力的性能的关键是设置合适的阈值以保持发放率（firing rate）和减少信息丢失。为了实现这一点，我们在tdBN的归一化实现中引入两个尺度因子用来平衡预激活（pre-activation）和阈值。在早期的训练过程中，有 $\alpha$ 和 $V_{th}$ 两个尺度因子，通过将可训练参数 $\lambda$ 和 $\beta$ 初始化为1和0来将预激活归一化为 $N(0,V_{th}^2)$ 。
首先，我们提出定理2来解释预激活和神经元膜电势之间的关系，以助于理解为什么我们的方法是有效的。

定理2 采用迭代LIF模型，假设预激活 $x^t \sim N(0,\sigma_{in}^2)$ ，则膜电势 $u^t \sim N(0,\sigma_{out}^2)$ 且 $\sigma_{out}^2 \propto \sigma_{in}^2$ 。
证明定理2的证明同样在补充材料B中。

用可视化分析方法验证定理2，在实验中设置 $\tau_{decay}=0.25$ 并展示具有不同预激活方差 $\sigma_{in}^2$ 的膜电势分布情况，结果如图3所示。我们发现在预激活和膜电势的分布之间有高度的相似性，进一步支持了定理2。

图3 具有不同预激活方差的膜电势分布
接下来，利用LIF模型分析信息前向传播机制。
在前向过程中，当膜电势达到阈值时神经元会发放一个脉冲从而使信息前向逐层传播。根据定理2和等式（3），我们可以近似计算神经元发放脉冲的可能性

P(u^t>V_{th})

。不难看出，

P(u^t>V_{th})

与膜电势的方差

\sigma_{in}^2

和

\sigma_{out}^2

正相关。因此，使用尺度因子来调整预激活的分布，以维持深层SNN的脉冲发放率。图4显示了当我们将预激活的方差

x^t\sim N(0,\sigma_{in}^2)

设为不同值时神经元的发放率分布情况。

脉冲神经网络（SNN）论文阅读（一）-----Going Deeper With Directly-Trained Larger Spiking Neural Networks_第4张图片

图4 具有不同预激活方差的神经元发放率（firing rate）分布
由于延迟/衰退（decay）机制，即使神经元每次都接受到正的输入也可能不会触发一个脉冲（如图4a），这意味着下一层的神经元只接受到很小的非零突触前输入，使得脉冲信号在深层SNN中消失，阻止了信号的前向传播。另一种情况是一个神经元一直在发放脉冲（如图4c），这意味着一些神经元的输出对预激活的变化不敏感，会导致计算量的增加。
综上所述，为了平衡突触前输入和阈值以维持发放率，我们利用尺度因子来控制膜电势和预激活的方差，从而减轻其对阈值的依赖。因此，我们将预激活归一化为

N(0,V_{th}^2)

。

Deep Spiking Residual Network

当网络变得越来越深时，ResNet是解决退化问题的最流行的架构之一。通过使用shortcut connection，He⁵等人于2016年在不同层之间增加了恒等映射（identity mapping），使得能够训练深层的神经网络。受到残差学习的启发，本文提出了深度脉冲残差网络（deep spiking residual network），使用tdBN代替了BN层并且修改了shortcut connection以达到更好的性能。

Basic Block：

ANN中的ResNet是由一些basic block（基本块）构建的。图5(a)显示了ResNet-ANN中传统的基本块的形式。

图5 传统的ResNet-ANN和带有tdBN的ResNet-SNN中不同的basic block

传统的基本块是在相对比较shallow的残差网络中实现的，它包含有两层的 $\times 3$ 卷积、BN层和ReLU激活层。在此基础上，我们提出了我们的深度脉冲残差网络的基本块。如图5(b)所示，使用LIF模型替换掉ReLU激活并使用tdBN替换掉BN层。除此之外，还在最终的相加之前修改了shortcut connection并增加了一个tdBN层。然后将最终激活层或shortcut connection中的超参数 $\alpha$ 设为 $\frac {1}{\sqrt{2}}$ ，其它tdBN层的超参数 $\alpha$ 设为1，这能保证每个激活的输入分布在训练开始时满足 $N(0,V_{th}^2)$ 。

网络架构（Network architecture）：

使用基本块来构建深度脉冲残差网络。最初的编码层接受输入并直接使用一个stride=2的卷积核进行下采样（downsampling），然后脉冲活动通过基本块传播。和ResNet-ANN类似，当特征图（feature map）减半时我们也将channel数量增加一倍。在平均池化或者全连接层后，最后的解码层使用全连接层和softmax函数。

Experiment

本文将深度残差SNN在静态非脉冲数据集（static non-spiking datasets，如CIFAR-10和ImageNet）和神经形态数据集（neuromorphic dataset，如DVS-gesture和DVS-CIFAR10）上都进行了测试，并将结果与别的SNN模型进行比较，验证了该方法在精度和时间步长上的优势。补充材料C中对数据集的介绍、预处理、参数配置、训练细节和结果分析进行了总结。

静态数据集上的实验：

静态数据集上的实验包括CIFAR-10和ImageNet，它们都是标准的图像识别基准（benchmark）。我们用不同的时间步长、尺寸（size）和深度测试ResNet-SNN。由于脉冲的稀疏性，我们的模型与具有相同架构的ANN相比，在非常少的时间步长的情况下显著减少了计算量。与别的SNN模型相比，ResNet-SNN的速度更快、效果更好！实验结果如下表1所示，详细的分析在补充材料D中。

表1 ResNet-SNN与别的SNN模型在CIFAR-10和ImageNet数据集上的比较结果

神经形态数据集上的实验：

与非脉冲的静态数据集相比，神经形态数据集包含更多的时间信息，这更适合于SNN来体现其优势。这里采用了两个具有挑战性的神经形态数据集：DVS-Gesture和DVS-CIFAR10。在DVS-Gesture上面达到了直接训练的SNN（directly-trained SNN）的SOTA（state-of-the-art）结果，实验结果如下表1和表2。

Conclusion

在本文中，我们提出了一种归一化（normalization）方法，使得能够直接训练高性能的深层SNN。我们结合梯度规范理论（gradient norm theory），证明该方法在训练过程中能够有效地平衡输入刺激和神经元阈值，从而促进学习收敛。在此基础上，通过进一步引入shortcut connection，我们将直接训练的SNN从一个常见的浅层结构(不到十层)大大扩展到一个非常深的结构(五十层)。最后，在大规模静态图像数据集和神经形态数据集上对模型进行了评价。与其他SNN模型相比，我们在CIFAR-10和ImageNet上实现了较高的准确率并具有显著更小的推理延迟。据我们所知，这是第一个在ImageNet上报道的一个直接训练的和非常深的SNN的工作。在神经形态数据集上，我们的模型可以有效地处理时空信息，并取得最先进的（state-of-the-art）性能。
综上所述，本工作为深层SNN的直接训练提供了一种可行的方案。它保持了基于脉冲的通信机制的高效率，使得SNN能够解决更复杂的大规模分类任务，有利于在神经形态硬件上的实现并促进SNN的实际应用。

Supplementary Material（待补充）

A Codes for Algorithms（算法代码）

图A-1 tdBN算法代码

脉冲神经网络（SNN）论文阅读（一）-----Going Deeper With Directly-Trained Larger Spiking Neural Networks_第10张图片

图A-2 整体训练代码

B Proofs of Theorems（定理证明）

C Details of Experiments（实验细节）

D Analysis of Computation Reduction（计算量降低分析）

部分参考文献

Chen Z, Deng L, Wang B, et al. A comprehensive and modularized statistical framework for gradient norm equality in deep neural networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 44(1): 13-31. ↩︎
Wu Y, Deng L, Li G, et al. Direct training for spiking neural networks: Faster, larger, better[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2019, 33(01): 1311-1318. ↩︎
Wu Y, Deng L, Li G, et al. Spatio-temporal backpropagation for training high-performance spiking neural networks[J]. Frontiers in neuroscience, 2018, 12: 331. ↩︎
Chen Z, Deng L, Wang B, et al. A comprehensive and modularized statistical framework for gradient norm equality in deep neural networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 44(1): 13-31. ↩︎
He K, Zhang X, Ren S, et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 770-778. ↩︎

你可能感兴趣的:(脉冲神经网络（SNN）论文阅读,神经网络,深度学习,算法,人工智能,计算机视觉)

【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
数字签名与数字证书 TABE_ 计算机网络数字签名数字证书
这里写目录标题数字签名数字证书数字证书的原理数字证书的特点如何验证证书机构的公钥不是伪造的数字签名数字签名是非对称密钥加密技术与数字摘要技术的应用，数字签名就是用加密算法加密报文文本的摘要（摘要通过hash函数得到）而生成的内容。发送报文时，发送方用一个哈希函数从报文文本中生成报文摘要，然后用发送方的私钥对这个摘要进行加密生成数字签名，之后将数字签名和报文一起发送给接收方，即数字证书。接收方首先用
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
访问者模式烟沙九洲设计模式访问者模式 java
访问者（Visitor）模式属于行为型模式的一种。访问者模式主要用于分离算法和对象结构，从而在不修改原有对象的情况下扩展新的操作。它适用于数据结构相对稳定，而操作（行为）容易变化的场景。访问者模式允许在不修改现有类的情况下，为类层次结构中的对象定义新的操作。访问者模式通过将操作封装到一个独立的类（即访问者）中，使得对象结构与操作解耦。访问者模式使用了一种名为双分派（在运行时根据两个对象的类型动态选
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
软考中级软件设计师考点知识点笔记总结 day06 莫问alicia 软考中级软件设计师笔记数据结构算法
文章目录6、树和二叉树6.1、树的基本概念6.2、二叉树的基本概念6.3、二叉树的遍历6.4、查找二叉树（二叉排序树）BST6.5、构造霍夫曼树+6.6、线索二叉树6.7、平衡二叉树7、图7.1、存储结构-邻接矩阵7.2、存储结构-邻接表7.3、图的遍历7.4、拓扑排序7.5、最小生成树普利姆算法7.6、克鲁斯卡尔算法6、树和二叉树6.1、树的基本概念结点的度：一个结点的度是指该结点拥有的子树数量
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
HTML实现酷炫3D相册算法与编程之美编程之美 css html js css3 javascript
欢迎点击「算法与编程之美」↑关注我们！本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。欢迎加入团队圈子！与作者面对面！直接点击！目录1、创建文件目录2、调背景色3、制作3D相册4、将图片散开，围成一圈。5、绘制透明底盘6、最终效果1、创建文件目录在Hbuilder在新建一个目录，创建css和js文件。图12、调背景色在style块里面给整个页面渲染成黑色调。*{padd
Description of a Poisson Imagery Super Resolution Algorithm 论文阅读青铜锁00 论文阅读 Radar 论文阅读
DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数α2.3对比传统方法的优势3.实验验证与结果3.1实验设计3.2关键结果4.未来研究方向（实波束雷达领域）4.1挑战
蓝桥杯备赛计划 laitywgx 蓝桥杯职场和发展
1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
高频交易：当速度与智慧在金融市场中“飙车”（策略＋算法）西蒙斯.果 python numpy pandas
高频交易：当速度与智慧在金融市场中“飙车”高频交易（High-FrequencyTrading,HFT）就像金融市场的“闪电侠”，利用强大的计算机和复杂的算法，在毫秒甚至微秒内完成交易。它的目标是抓住市场中的微小机会，赚取“快钱”。以下是对高频交易策略和算法的详细介绍，带点幽默感，让你在了解金融科技的同时也能会心一笑。---一、高频交易策略：金融市场的“快闪族”1\.做市策略：买卖价差的“中间商”
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
算法及数据结构系列 - 滑动窗口诺亚凹凸曼算法及数据结构算法数据结构 java
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法算法及数据结构系列-动态规划算法及数据结构系列-双指针算法及数据结构系列-回溯算法算法及数据结构系列-树文章目录滑动窗口框架思路经典题型76.最小覆盖子串567.字符串的排列438.找到字符串中所有字母异位词3.无重复字符的最长子串滑动窗口框架思路/*滑动窗口算法框架*/voidslidingWindow(strings,str
QHDBO基于量子计算和多策略融合的蜣螂优化算法算法小狂人算法改进智能优化算法量子计算算法
2.DBO基本的蜣螂算法通过模拟蜣螂在自然界中的四种行为（滚动、产卵、觅食和偷窃）来执行种群位置更新。2.1滚动蜣螂在自然界中，蜣螂必须通过太阳导航，使其球滚动的路线尽可能直线。方程(1)用于原始论文中更新滚动蜣螂的位置：xi(t+1)=xi(t)+α⋅k⋅xi(t−1)+b⋅Δx(1)x_i(t+1)=x_i(t)+\alpha\cdotk\cdotx_i(t-1)+b\cdot\Deltax\
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
H800能效架构实战解析智能计算研究中心其他
内容概要H800能效架构以异构计算资源调度与动态功耗控制为核心，通过系统级协同设计实现算力密度与能耗优化的双重目标。其核心技术覆盖智能负载分配、电压频率动态调节及热管理三大模块，形成从芯片级到数据中心级的垂直优化链路。在架构设计中，异构资源调度算法通过实时分析任务特征与硬件状态，动态分配CPU、GPU及专用加速器资源，最大化硬件利用率；动态功耗模块则基于负载波动自适应调整供电策略，结合多级电压频率
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
算力网协同创新与多场景应用实践智能计算研究中心其他
内容概要算力网协同创新正通过技术融合与场景适配，驱动算力资源的高效整合与跨域调度。核心突破方向涵盖异构计算架构优化、边缘计算实时响应能力提升，以及智能算力在工业互联网、数字孪生等场景的动态供给。随着“东数西算”工程推进，算力网络需兼顾性能与可持续性，在芯片制程优化、模型压缩算法及能耗管理等领域形成技术闭环。技术方向应用场景关键指标异构计算架构工业检测任务延迟<10ms模型压缩算法医疗影像分析计算资
算力技术创新与多场景应用突破智能计算研究中心其他
内容概要算力技术创新正成为驱动数字经济发展的核心引擎，其演进路径呈现出多维度突破态势。从量子计算颠覆性架构到光子计算超高速特性，从异构计算资源动态整合到边缘计算实时响应机制，技术革新持续突破物理边界与能耗瓶颈。应用层面，工业互联网实时控制、元宇宙沉浸式交互、生物计算精准建模等场景对算力提出差异化需求，推动智能调度算法与能效管理体系的协同优化。与此同时，全国一体化算力网络建设加速芯片制程迭代、数据中
搜索插入位置(力扣题）风继续吹.. LeetCode算法题 leetcode 算法职场和发展前端
题目：给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。来源：力扣（LeetCode）请必须使用时间复杂度为O(logn)的算法示例以及输出结果来源：力扣（LeetCode）示例1:输入:nums=[1,3,5,6],target=5输出:2示例2:输入:nums=[1,3,5,6],target=2输出:1示例3:输入:num
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb