你电吴彦祖

《神经网络与深度学习》-注意力机制与外部记忆

注意力机制与外部记忆

- 1. 认知神经学中的注意力
- 2. 注意力机制
- - 2.1 注意力机制的变体
  - - 2.1.1 硬性注意力
    - 2.1.2 键值对注意力
    - 2.1.3 多头注意力
    - 2.1.4 结构化注意力
    - 2.1.5 指针网络
- 3. 自注意力模型
- 4. 人脑中的记忆
- 5. 记忆增强神经网络
- - 5.1 端到端记忆网络
  - 5.2 神经图灵机
- 6. 基于神经动力学的联想记忆
- - 6.1 Hopfield网络
  - 6.2 使用联想记忆增加网络容量

前馈网络和循环网络拟合能力很强，但由于优化算法和计算能力的限制，实践中难以达到通用近似的能力。处理复杂任务时，计算机的计算能力仍是限制神经网络发展的瓶颈。
为减少计算复杂度，借鉴生物神经网络的机制，引入了局部连接、权重共享、汇聚操作简化神经网络结构，缓解模型复杂度和表达能力之间的矛盾，但仍希望通过不过度增加模型复杂度来提高模型表达能力。
神经网络中可以存储的信息量称为网络容量。一组神经元的存储容量和神经元的数量和网络的复杂度成正比。
人脑同样存在网络容量问题，人脑记忆只有几秒，但人脑有注意力机制和记忆机制两个问重要机制来解决信息过载的问题。
借鉴人脑的机制，提高神经网络处理信息的能力，注意力：通过自上而下的信息选择机制来过滤大量无关信息；引入外部记忆：优化神经网络的记忆结构来提高神经网络存储信息的容量。

1. 认知神经学中的注意力

注意力是指，人可以关注一些信息的同时忽略另一些信息的选择能力。人脑接受大量感觉输入，但人脑可以有意或无意地从大量输入信息中选择小部分有用信息来重点处理，并忽略其他信息，这种能力注意力(Attention)，注意力可用在外部刺激（听觉、视觉、味觉），也可以作用在内部意识（思考、回忆）。注意力常分为两类：

自上而下的有意识的注意力，聚焦式注意力（Focus Attention）:有预订目的、依赖任务的，主动有意识地聚焦于某一对象的注意力
自下而上的无意识的注意力，基于显著性的注意力（Saliency-Based Attention）：由外界刺激驱动的注意，不需要主动干预，和任务无关。如果一个对象的刺激信息不同于其周围信息，一种无意识的的赢者通吃（Winner-Take-All）或者门控（Gating）机制就可以把注意力转向这个对象。记忆信息、阅读、思考等大部分人脑活动依赖于有意识、无意识的注意力。

鸡尾酒会效应：一个人在吵闹的鸡尾酒会上和朋友聊天，周围噪声多，仍可以听到朋友的谈话，而忽略其他人的声音（聚焦式注意力），如果未注意到背景中有重要的词（如他的名字），他会马上注意到（显著性注意力）。
聚焦式注意力会随着环境、情景或任务不同而选择不同的信息。找人时，专注于每个人的脸部，统计人数时，专注于每个人的轮廓。

2. 注意力机制

计算能力有限的情况下，注意力机制（Attention Mechanism）作为一种资源分配方案，将有限计算资源用来处理更重要的信息，是解决信息过载的主要手段。
目前的网络中，最大汇聚（池化）、门控机制可近似地看做自下而上的基于显著性的注意力机制。自上而下的聚焦式注意力，也是有效的信息选择方式，以阅读理解为例，对长文章的内容提问，问题之和段落中的一两个句子相关，其余无关，为减小神经网络的计算负担，只需把相关的片段挑选出来，让后续的神经网络处理，而不是输入所有的文章给网络。
用 $\pmb{X} = [\pmb{x_1}, \cdots, \pmb{x_N}] \in \R^{D \times N}$ 表示 N 组输入信息，其中 D 维向量 $\pmb{x}_n \in \R^D$ , $\in [1, N]$ 表示一组输入信息。注意力机制从 $\pmb{X}$ 中挑选一些和任务相关的信息输入到网络，计算步骤：

在所有输入信息上计算注意力分布
根据注意力分布计算输入信息的加权平均

注意力分布 为了从 N 个输入向量 $[\pmb{x}_1, \cdots,\pmb{x}_N]$ 中选出和某个特定任务相关的信息，引入一个和任务相关的表示，称为查询向量(Query Vector) ，并通过一个打分函数来计算每个输入向量和查询向量之间的相关性。

给定一个和任务相关的查询向量 $\pmb{q}$ ，我们用注意力机制 $\in [1,N]$ 来表示被选择信息的索引位置，即 z = n 表示选择了第 n 个输入向量，为了便于计算，采用软性信息选择机制。首先计算在给定 $\pmb{q}$ 和 $\pmb{X}$ 下，选择第 i 个输入向量的概率 $\alpha_n$ :

其中 $\alpha_n$ 称为注意力分布（Attention Distribution）， $s(\pmb{x}, \pmb{q})$ 为注意力打分函数，可以使用以下几种方式计算：

其中 $\pmb{W}, \pmb{U}, \pmb{v}$ 为可学习的参数，D为输入向量的维度。理论上，\pmb{W}, 加性模型和点积模型的复杂度差不多，但点积模型在实现上可以更好地利用矩阵乘积，计算效率更高。当输入向量的维度D比较高时，点积模型的值通常具有较大的方差，从而导致softmax函数的梯度比较小。故缩放点积模型可以很好地解决这个问题。双线性模型课看做是一种泛化的点积模型，假设 $\pmb{W} = \pmb{U}^T\pmb{V}$ ，双线性模型可写成 $s(\pmb{x} ,\pmb{q}) = \pmb{x}^T\pmb{U}^T\pmb{V}\pmb{q}= (\pmb{Ux})^T\pmb{Vq}$ ，即分别对 $\pmb{x}$ 和 $\pmb{q}$ 进行线性变换后计算点积。相比点积模型，双线性模型在计算相似度时引入了非对称性。

加权平均 注意力分布 $\alpha_n$ 可以用来解释在给定任务相关的查询 $\pmb{q}$ 时，第 n 个输入向量受关注的程度，采用一种软性的信息选择机制对输入信息进行汇总，即：

上式称为软性注意力机制（Soft Attention Mechanism）。注意力机制可以单独使用，但更多作为神经网络汇总的一个组件，示例：

2.1 注意力机制的变体

2.1.1 硬性注意力

软性注意力所选择的信息是所有输入向量在注意力分布下的期望，而硬性注意力（Hard Attention）只关注某一个输入向量。两种实现方式：

选取最高概率的一个输入向量，即

$att(\pmb{X},\pmb{q}) = \pmb{x}_{\hat{n}}$

其中 $\hat{n}$ 为概率最大的输入向量的下标，即 $\hat{n} = \arg_{n=1}^{N}max \alpha_n$ 。

通过在注意力分布式上随机采样的方式实现。

硬性注意力缺点：基于最大采样或随机采样的方式选择信息，会使得最终的损失函数与注意力分布之间的函数关系不可导，因此无法使用反向传播算法训练。为使用反向传播算法，常采用软性注意力代替硬性注意力。

2.1.2 键值对注意力

用键值对格式来表示输入信息，其中“键”用来计算注意力分布 $\alpha_n$ ，“值”用来计算聚合信息。
用 $(K,V)=[(\pmb{k}_1,\pmb{v}_1),\cdots,(\pmb{k}_N,\pmb{v}_N)]$ 表示N组输入信息，给定任务相关的查询向量 $\pmb{q}$ 时，注意力函数如下， $s(\pmb{k}_n, \pmb{q})$ 为打分函数：

键值对注意力机制实例，当 $K = V$ 时，键值对模式等价于普通的注意力机制：

2.1.3 多头注意力

多头注意力（Multi-Head Attention）是利用多个查询 $[\pmb{q}_1, \cdots, \pmb{q}_M]$ ，来并行地从输入信息中获取多组信息，每个注意力关注输入信息的不同部分。

其中 $\bigoplus$ 表示向量拼接。

2.1.4 结构化注意力

之前的介绍，假设所有的输入信息是同等重要的，是扁平（Flat）结构，注意力分布实际上是在所有输入信息上的多项式分布。
但如果输入信息是层次（hierarchical）结构，比如文本可以分为词、句子、段落、篇章等不同粒度层次，可用层次化的注意力来进行更好的信息选择。
此外，假设注意力分为上下文相关的二项分布，可用图模型构建更复杂的结构化注意力分布。

2.1.5 指针网络

注意力机制主要是用来做信息筛选，从输入信息中选取相关的信息。注意力机制可分为两步：1.计算注意力分布 $\alpha$ ，2.根据 $\alpha$ 来计算输入信息的加权平均。可以只利用注意力机制中的第一步，将注意力分布作为一个软性的指针来指出相关信息的位置。
指针网络是一种序列到序列模型，输入为长度为N的向量： $\pmb{X}=\pmb{x}_1,\cdots,\pmb{x}_N$ 。输出是长度为M的下标序列： $\pmb{c}_{1:M}=c_1, c_2, \cdots,c_M, c_M \in [1,N], \forall m$ 。比如输入是一组乱序的数字，输出是按大小排序的输入数字序列的下标。
条件概率 $p(c_{1:M}|\pmb{x}_{1:N})$ 可以写成：

其中条件概率 $p(c_m|\pmb{x}_{c_1},\cdots,\pmb{x}_{c_{(m-1)}},\pmb{x}_{1:N})$ 课通过注意力分布来计算。假设用一个RNN对 $\pmb{x}_{c_1},\cdots,\pmb{x}_{c_{(m-1)}},\pmb{x}_{1:N}$ 进行编码得到向量 $\pmb{h}_m$ ，则：

其中 $s_{m,n}$ 为在解码过程中第 m 步时， $\pmb{h}_m$ 对 $\pmb{h}_n$ 的未归一化的注意力分布，即：

其中 $\pmb{v}, \pmb{W}, \pmb{U}$ 为可学习的参数。
下图是指针网络的示例，其中 $\pmb{h}_1，\pmb{h}_2，\pmb{h}_3$ 为输入数字20，5,10经过RNN的隐状态， $\pmb{h}_0$ 对应一个字符 $<$ ，当输入 $>$ 时，网络一步一步输出三个输入数字从大到小排序的下标。

3. 自注意力模型

使用神经网络处理变长向量序列时，通常可以使用CNN或RNN进行编码来得到一个相同长度的输出向量序列：

基于CNN或RNN的序列编码可看做一种局部编码方式，只建模了输入信息的局部依赖关系，虽然RNN理论上可建立长距离依赖关系，但由于信息传递的容量以及梯度消失问题，只能建立短距离依赖关系。
建立输入序列之间的长距离依赖关系的两种方法：1.增加网络层数，通过一个深层网络获取远距离信息交互；2.使用全连接网络。全连接网络是非常直接的建模远距离依赖的模型，但无法处理变长的输入序列。不同输入长度，连接权重的大小也不同。可用注意力机制来动态生成不同连接的权重，即自注意力模型（Self-Attention Model）。
自注意力模型采用查询-键-值（Query-Key-Value，QKV）。计算过程如下，红色字母表示矩阵维度：

假设输入序列为 $\pmb{X}=[\pmb{x}_1,\cdots,\pmb{x}_N] \in \R^{D_x \times N}$ ,输出序列为 $\pmb{H}=[\pmb{h}_1,\cdots,\pmb{h}_N] \in \R^{D_v \times N}$ .自注意力模型计算过程如下：

对于每个输入 $\pmb{x}_i$ ，首先将其线性映射到三个不同的空间，得到查询向量 $\pmb{q}_i \in \R^{D_k}$ 、查询向量 $\pmb{k}_i \in \R^{D_k}$ 、
查询向量 $\pmb{v}_i \in \R^{D_v}$ 。
对于整个输入序列 $\pmb{X}$ ,线性映射过程可以简写为：

其中 $\pmb{W}_q \in \R^{D_k \times D_x}$ 、 $\pmb{W}_k \in \R^{D_k \times D_x}$ 、 $\pmb{W}_v \in \R^{D_v \times D_x}$ 分别为线性映射的参数矩阵， $\pmb{Q} = [\pmb{q}_1,\cdots,\pmb{q}_N]$ ， $\pmb{K} = [\pmb{k}_1,\cdots,\pmb{k}_N]$ ， $\pmb{V} = [\pmb{v}_1,\cdots,\pmb{v}_N]$ 分别是由查询向量、键向量、值向量构成的矩阵。
对于每一个查询向量 $\pmb{q}_n \in Q$ ,利用键值对注意力机制，可以得到输出向量 $\pmb{h}_n$ ：

其中 $\in [1,N]$ 为输出和输入向量序列的位置， $\alpha_{nj}$ 表示第 n 个输入关注到第 j 个输入的权重。

如果使用缩放点积为打分函数，输出向量序列可以简写为：

其中softmax为按列进行归一化的函数。
全连接模型和自注意力模型的对比如下，实线表示可学习的权重，虚线表示动态生成的权重，由于自注意力模型的权重是动态生成的，因此可处理变长的信息序列：

自注意力模型可作为神经网络中的一层使用，也可用来替换卷积层和循环层，也可以和他们一起交替使用（如X可以使卷积层或循环层的输出）。自注意力模型计算的权重 $\alpha_{ij}$ 只依赖于 $\pmb{q}_i$ 和 $\pmb{k}_j$ 的相关性，忽略了输入信息的位置信息。因此在单独使用时，自注意力模型可以拓展为多头自注意力模型（Multi-Head Self-Attention），在多个不同的投影空间中捕捉不同的交互信息。

4. 人脑中的记忆

生物神经网络中，记忆是外部信息在人脑中的存储机制。大脑记忆是通过生物神经网络实现的。直观上，记忆机制和神经网络的连接形态以及神经元的活动相关。整体效应存储在大脑中，记忆在大脑皮层是分布式存储的，而不是存储在某个局部区域。
人脑的记忆具有周期性和联想性。
记忆周期 人脑记忆特点，记忆分为长周期记忆、短周期记忆、长期记忆，也称为结构记忆或知识，体现为神经元之间的连接形态，其更新速度比较慢。短期记忆体现为神经元的活动，更新较快，维持时间为几秒至几分钟，是神经连接的暂时性强化，通过不断巩固、强化可形成长期记忆。短期记忆和长期记忆的动态更新过程为演化过程。
长期记忆类比于人工神经网络的权重参数，短期记忆类比于人工神经网络中的隐状态。
还有一个工作记忆，是人脑的缓存，维持时间常为几秒，与短期记忆不同：短期记忆一般指外界的输入信息在人脑中的表示和短期存储，不关心这些记忆如何被使用；而工作记忆是一个和任务相关的“容器”，可以临时存放和某项任务相关的短期记忆和其他相关的内在记忆. 工作记忆的容量比较小，一般可以容纳 4 组项目。

联想记忆 人脑一个主要特点是通过联想来进行检索的，联想记忆是指一种学习和记住不同对象关系的能力。
联想记忆指可通过内容匹配的方法进行寻址的信息存储方式，也称为基于内容寻址的存储，计算机是根据地址来进行存储的，叫随机访问存储。
和LSTM的记忆单元相比较，外部记忆可以存储更多的信息，并且不直接参与计算，通过读写接口来操作。因LSTM模型中的记忆单元包含信息存储和计算两功能，不能存储太多信息，故LSTM记忆单元像计算机寄存器，外部记忆像计算机内存单元。
借鉴人脑工作记忆，可在网络中引入一个外部记忆单元提高网络容量，外部记忆两种实现方式：1.结构化记忆，这种记忆和计算机中的信息存储方法类似，可分为多个记忆片段，并按一定的结构来存储；2. 基于神经动力学的联想记忆，具有更好的生物学解释性。
不严格记忆模型类比：

5. 记忆增强神经网络

为增强网络容量，引入辅助记忆单元，将和任务相关的信息保存在其中，需要时再读取。辅助记忆单元常称为外部记忆（External Memory），以区别RNN的内部记忆（隐状态），这种添加了外部记忆的神经网络也称作记忆增强神经网络（Memory Augmented Neural Network，MANN），或简称为记忆网络（Memory Network，MN）。
记忆网络主要有4个模块：

主网络C：也称为控制器(Controller)，负责信息处理，并与外界的交互（接受外界输入，输出结果到外界）。主网络同时通过读写模块和外部记忆进行交互。
外部记忆单元M：外部记忆单元用来存储信息，一般可分为很多记忆片段，这些片段按一定结构组织，常用向量来表示，外部记忆单元可用一组向量 $\pmb{M} = [\pmb{m}_1,\cdots,\pmb{m}_N]$ 表示。向量的组织方式可以是集合、树、栈、队列等。大部分信息存储在外部记忆中，不需全时参与主网络运算。
读取模块R：根据主网络生成的查询向量 $\pmb{q}_r$ ，从外部记忆单元中读取相应的信息 $\pmb{r}=R(\pmb{M},\pmb{q}_r)$ 。
读取模块W：根据主网络生成的查询向量 $\pmb{q}_w$ 和要写入的信息 $\pmb{a}$ 来更新外部记忆 $\pmb{M}=W(\pmb{M},\pmb{q}_w,\pmb{a})$ 。

这种结构化的外部记忆是带有地址的，要实现人脑的联想记忆能力，需要按内容寻址的方式进行定位，然后进行读取或写入操作，按内容寻址通常使用注意力机制来进行。通过注意力机制可实现“软性”寻址方式，即计算一个在所有记忆片段上的分布，而不是一个单一的绝对地址。比如读取模型R的实现方式可以为：

其中 $\pmb{q}_r$ 是主要网络生成的查询向量， $s ()$ 为打分函数，类比计算机存储器读取，计算注意力分布的过程类似计算机寻址过程，信息加权平均过程类似计算机内容读取过程。
引入外部记忆，可将神经网络的参数和记忆容量“分离”，即少量增加网络参数的条件下，可大幅增加网络容量，注意力机制可看做一个接口，将信息的存储与计算分离。外部记忆从记忆结构和读取方式等方面演变出很多模型。

5.1 端到端记忆网络

端到端记忆网络采用一种可微的网络结构，可多次从外部记忆读取信息，在端到端记忆网络中，外部记忆单元是只读的。
给定一组需要存储的信息 $m_{1:N} = \{m_1,\cdots,m_N\}$ ，首先将其转换成两组记忆片段 $[\pmb{a}_1,\cdots,\pmb{a}_N]$ 和 $[\pmb{c}_1,\cdots,\pmb{c}_N]$ 分别存放在两个外部记忆单元中，其中 A 用来寻址，C用来输出。
主网络根据输入 $\pmb{x}$ 生成 $\pmb{q}$ ，并使用键值对注意力机制来从外部记忆中读取相关信息 $\pmb{r}$ :

并产生输出

其中 $f ()$ 为预测函数，分类任务中， $f ()$ 可为Softmax函数。

多跳操作 为了实现更复杂的计算，可让主网络和外部记忆进行多伦交互，在第 k 轮交互中，主网络根据上次从外部记忆中读取的信息 $\pmb{r}^{(k-1)}$ ,产生新的查询向量：

其中 $\pmb{q}^{(0)}$ 为初始的查询向量， $\pmb{r}^{(0)} = 0$ 。
假设第 k 轮交互的外部信息为 $A^{(k)}$ 、 $C^{(k)}$ ，主网络从外部记忆读取信息为：

在第 K 轮交互后，用 $\pmb{y} = f(\pmb{q}^{(K)} + \pmb{r}^{(K)} )$ 进行预测。多轮的交互方式称为多跳（Multi-Hop）操作，该操作中参数共享，为简化起见，每轮交互的外部信息可共享使用，比如 $A^{(1)}=\cdots=A^{(K)}$ 、 $C^{(1)}=\cdots=C^{(K)}$ :

5.2 神经图灵机

图灵机 图灵机可模拟任何计算问题，结构如下：

无限长纸带：纸带少有一个个方格组成，每个方格可存储一个符号。
符号表：纸带上可能出现的所有符号的集合，包含一个特殊的空白符
读写头：指向纸带上某个方格的指针，每次可以向左或右移动一个位置，可对当前方格内容进行读写、擦除。
状态寄存器：用来保存图灵机当前所处的状态，其中包含两个特殊的状态：起始状态、终止状态
控制规则：根据当前机器所处的状态以及当前读写头所指的方格上的符号来确定读写头下一步的动作，令机器进入一个新的状态。

神经图灵机 主要由两个部件构成：控制器：一个前馈或循环圣经网络；外部记忆：定义为矩阵 $\in \R^{D \times N}$ ，N 是记忆片段的数量，D是每个记忆片段的大小，可读写。
每个时刻 t ，控制器接受当前时刻的输入 $\pmb{x}_t$ 、上一个时刻的输出 $\pmb{h}_{t-1}$ 、上一个时刻从外部记忆读取的信息 $\pmb{r}_{t-1}$ ，并产生输出 $\pmb{h}_{t}$ ，同时生成和读写外部记忆相关的三个向量：查询向量 $\pmb{q}_t$ 、删除向量 $\pmb{e}_t$ 、增加向量 $\pmb{a}_t$ 。然后对外部记忆 $\pmb{M}_t$ 进行读写操作，生成读向量 $\pmb{r}_t$ 和新的外部记忆 $\pmb{M}_{t+1}$ 。

读操作 在时刻t，外部记忆的内容记为 $\pmb{M}_t = [\pmb{m}_{t,1}, \cdots, \pmb{m}_{t,N}]$ ，读操作为从外部记忆 $\pmb{M}_t$ 中读取信息 $\pmb{r}_t \in \R^{D}$ 。
首先通过注意力机制来进行基于内容的寻址，即：

其中 $\pmb{q}_t$ 为控制器产生的查询向量，用来进行基于内容的寻址，函数 s()为加性或乘性的打分函数，注意力分布 $\alpha_{t,n}$ 是记忆力片段 $\pmb{m}_{t,n}$ 对应的权重，并满足 $\sum_{n=1}^{N}\alpha_{t,n}=1$ .
根据注意力分布 $\alpha_t$ ,可以计算读向量 $\pmb{r}_t$ 作为下一个时刻控制器的输入：

写操作 外部记忆的写操作可以分解为两个子操作：删除和增加。
控制器产生删除向量 $\pmb{e}_t$ 和增加向量 $\pmb{a}_t$ 分别为从外部记忆中删除的信息和增加的信息。删除操作是根据注意力分布来按比例地在每个记忆片段中删除 $\pmb{e}_t$ ，增加操作是根据注意力分布来按比例地给每个记忆片段加入 $\alpha{a}_t$ 。具体过程如下：

通过写操作得到下一个时刻的外部记忆 $\pmb{M}_{t+1}$ 。

6. 基于神经动力学的联想记忆

结构化的外部记忆更多是受现代计算机架构启发，分离计算和储存功能，缺乏生物学解释。基于神经动力学的联想记忆模型引入到神经网络增加网络容量，具有生物学可解释性。
联想记忆模型（Associative Memory Model）主要通过神经网络的动态演化来联想，两种应用场景：

输入模式和输出模式在同一空间，这种模型叫做自联想模型（Auto-Associative Model）。自联想模型可以通过前馈神经网络或RNN来实现，也常称为自编码器（Auto-Encoder，AE）。
输入模式和输出模式不在同一空间，这种模型叫做异联想模型（Hetero-Associative Model）。广义上讲，大部分机器学习问题都可看做异联想，因此异联想模型可作为分类器使用。

联想记忆模型可以成一种RNN，基于神经动力学来实现按内容寻址的信息存储和检索。

6.1 Hopfield网络

除作为机器学习模型外，神经网络还可以作为一种记忆的存储和检索模型。
Hopfield 网络（Hopfield Network）是一种RNN网络，由一组相互连接的神经元组成，Hopfield 网络也可认为是所有神经元都相互连接的不分层的网络，每个神经元既是输入单元，又是输出单元，没有隐藏神经元。一个神经元和自身没有反馈相连，不同神经元之间连接权重是对称的。

假设一个Hopfield 网络有M个神经元，第 i 个神经元的更新规则为：

其中 $w_{ij}$ 为神经元 i 和 j 之间的连接权重， $b_i$ 为偏置。
连接权重 $w_{ij}$ 有以下性质：

Hopfield 网络更新可分为异步和同步两种方式，异步更新是每次更新一个神经元，更新顺序可以是随机或事先固定的；同步更新是指一次更新所有的神经元，需要有一个时钟来进行同步，第 t 时刻的神经元状态 $\pmb{s}_t = [s_{t,1},\cdots,s_{t,M}]^T$ ，其更新规则为：

其中 $\pmb{s}_0 = \pmb{x}, \pmb{W}=[w_{ij}]_{M \times M}$ 为连接权重， $\pmb{b} = [b_i]_{M \times 1}$ 为偏置向量，f 为非线性阶跃函数。

能量函数 在Hopfield中，每个不同的网络状态定义为一个标量属性，称为能量

Hopfield网络是稳定的，即能量函数经过多次迭代后会达到收敛状态，权重对称是一个重要特征，因为他保证能量函数在神经元激活时单调递减，不对称的权重可能导致周期性震荡或混乱。
给定外部输入，网络经过演化，会达到某个稳定状态，这些稳定状态称为吸引点（Attractor），一个Hopfield中常有多有吸引点，每个吸引点为一个能量的局部最优点。下图红线为网络能量的演化方向，蓝点为吸引点：

联想记忆 Hopfield网络存在有限的吸引点，每个吸引点 u 都对应一个“管辖”区域 $R_u$ ，如果输入向量 $\pmb{x}$ 落入这个区域，挽留过最终会收敛到 u。因此，吸引点可以看做是网络中存储的模式，将输入 $\pmb{x}$ 作为起始状态，随时间收敛到吸引点 $\pmb{u}$ 上的过程为检索过程。即使输入向量 $\pmb{x}$ 只包含部分信息或包含噪声，，只要其位于对应存储模式的“吸引”区域内，那么随着时间演化，网络最终会收敛到其对应的存储模式. 因此，Hopfield 的检索是基于内容寻址的检索，具有联想记忆能力。

信息存储 信息存储是指将一组向量 $\pmb{x}_1,\cdots,\pmb{x}_N$ 存储在网络中的过程，存储过程主要调整神经元之间的连接权重，故可以看作是一种学习过程。Hopfield 网络的学习规则有很多种. 一种最简单的学习方式为：神经元和之间的连接权重通过下面公式得到：

如果 $x_i$ 和 $x_j$ 在输入向量中相同的概率越多，则 $w_{ij}$ 越大。这种学习规则类似人脑神经网络的学习：如果两个神经元经常同时被激活，则连接加强，否则连接消失。这种学习方式称为Hebbian 法则。

存储容量 对于联想记忆模型来说，存储容量为其能够可靠地存储和检索模式的最大数量。对于数量为 M 的互相连接的二值神经元，总状态数 $2^M$ ，其中可作为有效稳定点的状态数量就是其存储容量。模型容量一般与网络结构和学习方式有关。Hopfield网络最大容量为 0.14M，玻尔兹曼机的容量为0.6M，但是其学习效率低，需要长时间的演化才能到达均衡状态。通过改进学习算法，Hopfield网络的最大容量可以到达 O(M)。如果允许高阶（K）连接，比如三个神经元连接关系，其稳定存储的最大容量 $O(M^{K-1})$ 。引入复数运算，有效提高了网络容量，总体上讲，通过改进网络结构、学习方式、引入更复杂的运算（复数、量子操作），可有效改善联系记忆网络的容量。

6.2 使用联想记忆增加网络容量

联想记忆具有存储和检索功能，我们可以利用联想记忆来增加网络容量。和结构化的外部记忆相比，联想记忆具有更好的生物学解释性。如，将一个联想记忆模型作为部件加入LSTM网络，从而在不引入额外参数的情况下增加网络容量，或者将RNN网络中的部分连接权重作为短期记忆，并通过联想记忆模型进行更新，从而提高网络性能。上述网络中，联想记忆都是作为一个更大网络的组件，用来增加短期记忆的容量。联想记忆组件的参数可以使用Hebbian 方式来学习，也可以作为整个网络参数的一部分来学习。

ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【3.6 python中的numpy编写一个“手写数字识”的神经网络】 wang151038606 深度学习入门 python numpy 神经网络
3.6python中的numpy编写一个“手写数字识”的神经网络要使用Python中的NumPy库从头开始编写一个“手写数字识别”的神经网络，我们通常会处理MNIST数据集，这是一个广泛使用的包含手写数字的图像数据集。但是，完全用NumPy来实现神经网络（包括数据的加载、预处理、模型定义、前向传播、损失计算、反向传播和权重更新）是一个相当复杂的任务，因为NumPy本身不提供自动微分或高级优化算法（
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
卷积神经网络（CNN）详细介绍及其原理详解（二） FFmpeg123 Pytorch cnn 深度学习人工智能
接上一文继续;五、全连接层假设还是上面人的脑袋的示例，现在我们已经通过卷积和池化提取到了这个人的眼睛、鼻子和嘴的特征，如果我想利用这些特征来识别这个图片是否是人的脑袋该怎么办呢？此时我们只需要将提取到的所有特征图进行“展平”，将其维度变为1×x1×x1×x，这个过程就是全连接的过程。也就是说，此步我们将所有的特征都展开并进行运算，最后会得到一个概率值，这个概率值就是输入图片是否是人的概率，这个过程
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
TextCNN：文本卷积神经网络模型一只天蝎编程语言---Python cnn 深度学习机器学习
目录什么是TextCNN定义TextCNN类初始化一个model实例输出model什么是TextCNNTextCNN（TextConvolutionalNeuralNetwork）是一种用于处理文本数据的卷积神经网（CNN）。通过在文本数据上应用卷积操作来提取局部特征，这些特征可以捕捉到文本中的局部模式，如n-gram（连续的n个单词或字符）。定义TextCNN类importtorch.nnasn
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
机器学习到底是个啥旷_9b08
机器学习是装逼神器？曾几何时，当我还在本科打dota玩屁股的时候，身边总有一帮大神。听他们谈话我的心情是。。。大佬中有各路高手前端、后段、java三大架构。。。但最令本渣一听到就仰慕甚至肃然起敬的是当听到卷积神经网络的时候。顿时就有种掉线三十分钟别人都是六神装的感觉。另外，班会上别班小哥用说用机器学习把图片转换成梵高风格时自己班妹纸那一声声尖叫怕是很难忘掉了。。。好在家里爸妈给了次重新做人的机会，
入门篇，带你了解CPU, GPU, TPU, NPU, DPU 今夕是何年，视觉算法部署深度学习算法人工智能
目录CPU(中央处理器)GPU(图形处理器)TPU(张量处理单元)NPU(神经网络处理器)DPU(数据处理器)CPU(中央处理器)专业介绍：CPU是计算机系统的核心，负责执行操作系统和应用程序的指令。它由多个核心组成，每个核心可以独立执行任务。CPU的设计重点是处理复杂的逻辑运算和顺序任务，如分支预测、指令调度等。现代CPU通常包含多个层级的缓存（如L1、L2和L3缓存），以减少访问主存储器的延迟
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
【深度学习实战】使用深度学习模型可视化工具——Netron在线可视化深度学习神经网络量子-Alex 深度学习神经网络人工智能
一直以来，对于深度学习领域的开发者，可视化模型都是非常迫切的需求，今天主要介绍一款可视化工具——NetronNetron有三种使用方式：在线、本地安装、pip安装今天在这里只介绍在线使用这种方式。Netron有个官方的网站：Netron点击进去是这样的一个界面我们可以点击openmodel从本地选择一个预训练模型可以看到这里就显示出来了
PHP中使用grpc服务的教程详解 Oona_01 php android 开发语言
这篇文章主要为大家详细介绍了PHP中使用grpc服务的教程相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下grpc是通过定义服务端和客户端的代码来实现的通信的。但是要实现通信，还是要将其方法包装为一个http请求，除非你把grpc的服务端代码放在本地的端口上。grpc是面对微服务框架而风生水起的，上次我用python编写了一个图神经网络处理的微服务，使用grpc放在我的服务
每天五分钟玩转深度学习框架PyTorch：获取神经网络模型的参数幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 神经网络人工智能模型参数 python
本文重点当我们定义好神经网络之后，这个网络是由多个网络层构成的，每层都有参数，我们如何才能获取到这些参数呢？我们将再下面介绍几个方法来获取神经网络的模型参数，此文我们是为了学习第6步（优化器）。获取所有参数Parametersfromtorchimportnnnet=nn.Sequential(nn.Linear(4,2),nn.Linear(2,2))print(list(net.paramet
每天五分钟玩转深度学习框架PyTorch：将nn的神经网络层连接起来幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 神经网络人工智能机器学习 python
本文重点前面我们学习pytorch中已经封装好的神经网络层，有全连接层，激活层，卷积层等等，我们可以直接使用。如代码所示我们直接使用了两个nn.Linear（），这两个linear之间并没有组合在一起，所以forward的之后，分别调用了，在实际使用中我们常常将几个神经层组合在一起，这样不仅操作方便，而且代码清晰。这里介绍一下Sequential()和ModuleList()，它们可以将多个神经网
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本