静静的喝酒

深度学习笔记之Transformer(八)Transformer模型架构基本介绍

机器学习笔记之Transformer——Transformer模型架构基本介绍

引言
- 回顾：
- - 简单理解： $\text{Seq2seq}$ 模型架构与自编码器
  - 自注意力机制
- $\text{Transformer}$ 架构
- - 关于架构的简单认识
  - 多头注意力机制
  - 包含掩码的多头注意力机制
  - 基于位置信息的前馈神经网络
- 残差网络与层标准化操作
- 编码器的输出与信息传递
- 关于预测问题

引言

上一节介绍了自注意力机制的基本逻辑，并介绍了位置编码 $(\text{Position Encoding})$ 。本节将介绍 $\text{Transformer}$ 的模型架构。

回顾：

简单理解： $\text{Seq2seq}$ 模型架构与自编码器

在 $\text{Seq2seq}$ ——基本介绍中提到，基于机器翻译任务的 $\text{Seq2seq}$ 结构主要包含两个部分：编码器 $(\text{Encoder})$ 与解码器 $(\text{Decoder})$ 。并且这两个部分分别使用独立的循环神经网络来实现输入序列与输出序列的序列长度不同的情况。

作为个人对编码器、解码器概念上的误区，在稀疏自编码器与变分自编码器中同样认识过编码器、解码器的概念。并且它们从原理上存在相似之处：
该部分属于个人理解，有不同见解的小伙伴欢迎交流讨论。

无论是稀疏自编码器还是变分自编码器，它们都是欠完备自编码器 $(\text{Undercompleter AutoEncoder})$ 的一种改良——在不想单纯地将输入分布恒等映射到输出分布动机的基础上，希望隐变量 $h$ 能够学习到更多优质的特征信息；

同理，在 $\text{Seq2seq}$ 结构中，关于编码器的输出—— $\text{Context}$ 向量 $\mathcal C$ ，它本身就是一个固定大小的向量。虽然它的大小是单个时刻的序列信息，但实际上它包含了整个序列的序列信息。而在解码器中，有效的输入也仅有 $\mathcal C$ ，这是它们的相似之处。
无论是 $\mathcal C$ 还是隐变量 $h$ ,它们自身是‘不完整/缺失’的，但它们表示的序列信息是丰富的。

它们的不同之处也很明显：

基于欠完备自编码器的动机，在设计策略(损失函数) 的过程中，不仅对真实分布 $x$ 与重构分布 $f [g (x)]$ 进行约束，并且还对隐变量 $h$ 进行稀疏性角度的约束：
$\mathcal L[x,g(f(x))] + \Omega(h) \quad h = f(x)$
无论是稀疏自编码器还是变分自编码器，它们都使用了 $\text{KL}$ 散度对 隐变量进行了约束：
其中 $\hat {\rho_j}$ 表示隐藏层第 $j$ 个神经元输出 $h_j$ 的期望结果。而 $\rho$ 表示人为设置的关于 $h$ 的‘先验信息’。
$\begin{cases} \begin{aligned} \text{Sparse AutoEncoder : }\mathcal J_{Sparse}(\mathcal W,b) & = \mathcal L[x,g(f(x))] + \Omega(h) \\ & = \mathcal J(\mathcal W,b) + \beta \cdot \sum_{j=1}^{\mathcal K} \text{KL}(\rho ||\hat {\rho_j}) \\ \text{Variational AutoEncoder : }\mathcal J_{VAE} & = \mathbb E_{\mathcal Q(h \mid x;\phi)} \left[\log \mathcal P(x \mid h;\theta)\right] - \text{KL} [\mathcal Q(h \mid x;\phi) || \mathcal P(h)] \end{aligned} \end{cases}$
相反， $\text{Seq2seq}$ 的目标函数仅仅是一个对生成结果取均值的极大似然估计，它并没有单独对中间变量 $\mathcal C$ 直接构建策略进行约束：
$\mathop{\arg\max}\limits_{\theta} \log \mathcal P(\mathcal Y \mid \mathcal X) = \mathop{\arg\min}\limits_{\theta} -\frac{1}{N} \sum_{n=1}^N \log \mathcal P(y_n \mid x_n)$

自注意力机制

自注意力机制 $\text{(Self-Attention)}$ 的核心包含两点：

使用缩放点积 $\text{(Scaled Dot-Product)}$ 的方式计算注意力分数 $(\text{Attention Score})$ ：
$a(\mathcal Q,\mathcal K) = \left[\frac{\mathcal Q\mathcal K^T}{\sqrt{d}}\right]_{N \times \mathcal M} \quad \begin{cases} \mathcal Q \in \mathbb R^{N \times d} \\ \mathcal K \in \mathbb R^{\mathcal M \times d} \end{cases}$
其中 $N,\mathcal M$ 分别表示序列 $\mathcal Q,\mathcal K$ 的长度，并且它们中的每一个元素均使用 $d$ 维特征进行表示。
在第 $1$ 点的基础上，自注意力机制将 $\mathcal Q,\mathcal K$ 设置成完全相同的事物。在后续的注意力映射中，被映射的信息 $\mathcal V$ 同样与 $\mathcal Q,\mathcal K$ 完全相同：
$\begin{cases} \mathcal Q,\mathcal K,\mathcal V \Rightarrow \mathcal X \in \mathbb R^{\mathcal T \times d} \\ \quad \\ \mathcal Y \in \mathbb R^{\mathcal T \times d} =\text{Softmax} \left\{\begin{aligned}\left[\frac{\mathcal X \mathcal X^T}{\sqrt{d}}\right]_{\mathcal T \times \mathcal T}\end{aligned}\right\} \cdot [\mathcal X]_{\mathcal T \times d} \end{cases}$

通过上述的自注意力过程以及自注意力结果 $\mathcal Y$ 的格式，可以判断出：序列 $\mathcal X$ 内的每个元素分别与 $\mathcal X$ 的所有元素均计算了注意力分数，并将元素对应的分数结果累加并映射在了对应元素中。

我们不否认序列 $\mathcal X$ 中的每个元素都得到了它们对应的注意力信息；但同样存在另一个问题：序列 $\mathcal X$ 中某元素与所有元素(含自身)所产生的 $\mathcal T$ 个注意力分数之间是离散的；

我们在使用压缩点积计算注意力分数时，仅仅使用到了各元素对应的 $d$ 维表示；也就是说：如果对序列 $\mathcal X$ 中的元素打乱顺序，并不会影响注意力分数结果。但序列的顺序同样是序列的重要特征。例如：如果将一个文本句子打乱了词的顺序，该句子的语义信息会发生剧烈变化甚至丢失。但仅仅是自注意力机制感应不到这种变化。

在序列中添加位置编码 $\text{(Position Encoding)}$ 能够很好地解决该问题。通过相邻位置元素内同一维度的位置编码信息构成少量错位来使模型感知到元素的上下文关系：
详细介绍见上一节,其中 $\mathcal P_{i,2j},\mathcal P_{i,2j+1}$ 分别表示序列中第 $i$ 个元素内第 $2 j ， 2 j + 1$ 个维度特征的表示。
$\begin{cases} \begin{aligned} \mathcal P_{i,2j} & = \sin \left(\frac{i}{10000^{\frac{2j}{d}}}\right) \\ \mathcal P_{i,2j+1} & = \cos \left(\frac{i}{10000^{\frac{2j}{d}}}\right) \end{aligned} \end{cases}$

$\text{Transformer}$ 架构

关于架构的简单认识

关于 $\text{Transformer}$ 模型的第一印象，就是它依然是编码器——解码器架构。但是它与 $\text{Seq2seq}$ 的核心区别在于：

$\text{Seq2seq}$ 关于序列数据的处理在编码器、解码器中分别使用独立的循环神经网络来获取序列特征；而 $\text{Transformer}$ 仅通过自注意力加位置编码的方式从序列数据中提取序列特征。

以编码器结构为例。与神经网络类似，其内部包含若干个 $\text{Transformer}$ 块 $(\text{Transformer Block})$ ，每一个 $\text{Transformer}$ 块的输出作为下一个 $\text{Transformer}$ 块的输入。接下来将分别对编码器、解码器中的 $\text{Transformer}$ 块进行介绍，并观察它们的差异性。

多头注意力机制

关于多头注意力机制 $(\text{Multi-Head Attention})$ ，它的逻辑是：并行执行自注意力机制若干次，从而得到不同版本的注意力结果。
这种基于基于相同输入，通过不同方式进行学习，并将各学习结果进行处理的思想，使得我们联想到了两个方法： $\text{Bagging}$ 与卷积神经网络。

关于 $\text{Bagging}$ ，其核心思想是通过自助采样法 $(\text{Bootstrapping Sampling})$ 对数据集合 $\mathcal D$ 进行 $\mathcal M$ 次独立采样得到相应的新集合 $\mathcal D_i(i=1,2,\cdots,\mathcal M)$ ；针对每一个 $\mathcal D_i$ 使用独立的基学习器进行学习，并将所有基学习器学习的结果根据不同任务进行描述：

关于回归任务：对各基学习器的输出结果取均值操作。
关于分类任务：使用多数表决 $(\text{Majority Voting})$ 的方式决定分类结果。

不否认各集合 $\mathcal D_i$ 内的样本间存在差异，但它们描述的分布和 $\mathcal D$ 对应的真实分布相同；并且这种方式能够有效降低分布的预测方差。
仅从操作的角度观察，取均值/投票的方式将各基学习器学习到特征的差异性给‘抹平’了。

关于卷积神经网络，其核心思想是通过相互独立的卷积核对同一输入数据执行卷积操作。每一个卷积核都会得到关于输入数据的抽象信息。

每一个卷积核产生的抽象结果被称作一个‘通道’ $(\text{Channel})$ ；
和 $\text{Bagging}$ 方法类似，将若干个‘通道’的抽象信息使用‘池化’ $(\text{Pooling})$ 的方式对各通道的特征进行归纳/筛选。无论是‘最大池化'还是‘平均池化’，依然没有保留差异信息。

并不是说没有保留差异信息就是缺陷，这需要根据具体任务具体分析。在序列信息的处理过程中，这种差异性是有必要的。我们需要更好地处理这种差异性。

关于多头注意力机制的执行过程表示如下：

将添加位置编码的输入数据 $\mathcal X$ 通过独立的全连接层 $(\text{Fully Connected Layer,FC})$ 得到相应的特征信息 $\mathcal Q,\mathcal K,\mathcal V$ ：
$\begin{cases} \mathcal Q = [\mathcal W_{\mathcal Q}]^T \mathcal X + b_{\mathcal Q} \\ \mathcal K = [\mathcal W_{\mathcal K}]^T \mathcal X + b_{\mathcal K} \\ \mathcal V = [\mathcal W_{\mathcal V}]^T \mathcal X + b_{\mathcal V} \end{cases}$
这仅仅是一个自注意力机制内的特征表示，假设多头注意力机制中包含 $\mathcal M$ 个独立的自注意力机制，对应的特征信息表示如下：
每个特征信息对应的权重也均是相互独立的。
$\mathcal Q^{(i)},\mathcal K^{(i)},\mathcal V^{(i)} \quad (i=1,2,\cdots,\mathcal M)$
每一个头执行各自的自注意力机制：
这里 $\mathcal A^{(i)}$ 表示第 $i$ 自注意力机制的输出特征。
$\begin{cases} \begin{aligned} & a \left[\mathcal Q^{(i)},\mathcal K^{(i)}\right] = \frac{\mathcal Q^{(i)}[\mathcal K^{(i)}]^T}{\sqrt{d}} \\ & \mathcal A^{(i)} = \text{Softmax} \left\{ a \left[\mathcal Q^{(i)},\mathcal K^{(i)}\right]\right\}\mathcal V^{(i)} \end{aligned} \end{cases} \quad i=1,2,\cdots,\mathcal M$
将 $\mathcal M$ 个输出特征进行拼接 $(\text{Concatenate})$ ，并再次使用全连接层进行特征表示：
和 $\text{Bagging}$ 与卷积神经网络相比，这种 $\text{Concatenate}$ 加全连接层的方式保留了各个自注意力机制产生的差异性信息。
$\begin{cases} \mathcal A & = \text{Concat}\left[\mathcal A^{(1)},\mathcal A^{(2)},\cdots,\mathcal A^{(\mathcal M)}\right] \\ \mathcal O & = [\mathcal W_{\mathcal A}]^T \mathcal A + b_{\mathcal A} \end{cases}$

包含掩码的多头注意力机制

在解码器模块中，不仅包含多头注意力机制，并且还包含带掩码的多头注意力机制。带掩码操作的多头注意力机制的思想在于：

回顾 $\text{Seq2seq}$ 模型执行机器翻译任务的过程中，以包含注意力机制的模型为例，它的输入包含 $3$ 项信息：
$y^{(t)} = \mathcal G \left[y^{(t-1)},\mathcal C_t,h_{\mathcal D}^{(t-1)}\right]$
其中：

$y^{(t-1)}$ 表示解码器 $t - 1$ 时刻的输出信息；
$\mathcal C_t$ 表示解码器 $t$ 时刻与编码器所有时刻输出的注意力信息；
$h_{\mathcal D}^{(t-1)}$ 表示解码器 $t - 1$ 时刻产生的序列信息；

很明显，对当前时刻的预测信息与当前时刻的信息以及后续时刻信息之间没有关联关系。

虽然在 $\text{Transformer}$ 的解码器中不会像 $\text{Seq2seq}$ 一样一个时刻仅预测一个元素，而是所有时刻结果全部输出。但在预测过程中与 $\text{Seq2seq}$ 同理：解码器对序列中一个元素进行预测时，不应该考虑当前时刻以及后续时刻元素信息。
以未来时刻信息作为条件下，对未来信息进行预测。这是不合理的。

这种操作在 $\text{Transformer}$ 中使用掩码 $(\text{Mask})$ 的方式进行表示：如果对序列数据 $\mathcal X$ 中的第 $i$ 个元素 $x_i$ 进行预测时，就将其看作是预测该序列中的最后一个元素，而后续的 $x_{i+1},x_{i+2},\cdots$ 等等被 $\text{Mask}$ 掉。

基于位置信息的前馈神经网络

从多头注意力机制中输出的数据格式表示为： $[\text{BatchSize,SeqLength,Dimension}]$ 。其中 $\text{BatchSize}$ 表示批次内样本数量； $\text{SeqLength}$ 表示序列长度； $\text{Dimension}$ 表示输出序列信息中各元素的向量表示维数。
其中 $\text{Dimension}$ 是由多头注意力机制累积下来的维数结果。

需要注意的是：不同序列的 $\text{SeqLength}$ 存在差异。这个差异是输入序列自身的性质，与模型自身无关。理论上认为：模型可以处理任意长度的序列信息，因而不能将序列长度这个参数作为模型的参数。

基于位置信息的前馈神经网络 $(\text{Position-wise FeedForward Network})$ 自身就是一组全连接层。而它的主要作用是对注意力机制的输出特征进行非线性变换。由于上面的要求，这个非线性变换作用的对象并不是一个序列，而是序列中的每一个元素。

该网络由两个线性计算层和一个 $\text{ReLU}$ 激活函数构成：
$\begin{cases} \widetilde{\mathcal O}_1 = x \mathcal W_1 + b_1 \\ \mathcal O_1 = \text{ReLU}(\widetilde{\mathcal O}_1) = \max(0,\widetilde{\mathcal O}_1)\\ \mathcal O_2 = \mathcal O_1 \mathcal W_2 + b_2 \end{cases}$
其中 $\mathcal W_1 \in \mathbb R^{\text{Dimension} \times d_{FFN}};\mathcal W_2 \in \mathbb R^{d_{FFN} \times \text{Dimension}}$ ，其中 $d_{FFN}$ 表示前馈神经网络中隐藏层的维数大小。很明显：无论是 $\mathcal W_1,\mathcal W_2$ 还是 $b_1,b_2$ ，它们的维数信息与序列长度 $\text{SeqLength}$ 没有任何关系。只要关于元素的模型参数学习好了， $\text{SeqLength}$ 无论长短都可以进行训练。

终上，我们要将非线性变换的关注点在于序列中的每一个元素，并且消除 $\text{SeqLength}$ 这个维度对模型的影响，因此执行过程表示如下：
其具体做法可看作是将所有文本序列‘全部首尾连接在一起，构成一个‘超长序列’。这个思路与 $\text{Word2vec}$ 系列模型的假设存在相似之处。

将 $\text{Multi-Head Attention}$ 部分的输出格式由 $3$ 维格式： $[\text{BatchSize,SeqLength,Dimension}]$ 修改为 $2$ 维格式： $[\text{BatchSize * SeqLength,Dimension}]$ ；
这个操作本身就是为了‘模糊’掉 $\text{SeqLength}$ 这个维度在前馈神经网络中的作用。但在 $\text{PyTorch}$ 中，这个操作都不需要做。因为 $\text{PyTorch}$ 中的 $\text{nn.Linear()}$ 只会将最后一个维度作为特征维度。
将修改后特征作为前馈神经网络的输入，并得到对应的输出结果格式： $\left[\text{BatchSize * SeqLength,Dimension}\right]$ ；
基于上述 $\mathcal W_1,\mathcal W_2$ 格式的描述，输出格式结果不会发生变化。
最后将输出结果格式由 $[\text{BatchSize * SeqLength,Dimension}]$ 还原回原始格式 $[\text{BatchSize,SeqLength,Dimension}]$ 。

残差网络与层标准化操作

关于残差网络 $(\text{Residual Network})$ 这里不再赘述，详见传送门。

在执行神经网络的反向传播过程中，随着 $\text{Transformer Block}$ 块的增多(神经网络的深度增加)，导致注意力层或者全连接神经网络层中的权重信息不可避免地会出现特征空间偏移的情况。因而我们需要对特征进行归一化操作，从而增加模型的收敛速度。

但批标准化 $(\text{Batch Normalization,BN})$ 并不适合用在序列长度可能存在差异的自然语言处理任务中，因而使用层标准化的方式执行归一化操作。层标准化的核心思路在于：在同一 $\text{Batch}$ 内的各样本之间独立同分布：
关于层标准化传送门

关于层标准化的具体操作表示如下：
分别使用torch,手动(manual)分别实现 $\text{Layer Normalization}$ ,结果相同。

import numpy as np
from torch import nn as nn
import torch

def LayerNormTest(mode):
    arr1 = np.arange(1, 26).reshape(5,5,1)
    arr2 = np.arange(11, 36).reshape(5,5,1)
    arr3 = np.arange(31, 56).reshape(5,5,1)
    arr = torch.tensor(np.concatenate([arr1,arr2,arr3],axis=2)).float()
    arr = torch.permute(arr,(2,0,1)).unsqueeze(0)
    assert mode in ["torch","manual"]
    if mode == "torch":
        Norm = nn.LayerNorm([3,5,5])
        arrNorm = Norm(arr)
    else:
        U = arr.mean()
        S = (arr - U).pow(2).mean()
        arrNorm = (arr - U) / torch.sqrt(S + 1e-5)
    return arrNorm
    
if __name__ == '__main__':
    a1 = LayerNormTest(mode="torch")
    a2 = LayerNormTest(mode="manual")
    print(a1)
    print("---" * 30)
    print(a2)

可以观察到，它的均值结果U、方差结果S均是一个标量；也就是说： $\text{LayerNorm}$ 基于整个 $\text{Batch}$ 内所有元素执行的均值与方差操作。而这种做法的底层逻辑是：它将该 $\text{Batch}$ 内的各样本看作成一个独立的数据集来执行标准化。根据 $\text{Batch}$ 的定义， $\text{Batch}$ 自身就是训练集随机采样产生的一个子集，因而各个 $\text{Batch}$ 的分布是相似的，并且理论上都趋近于样本真实分布。

print(U)
tensor(26.3333)
print(S)
tensor(207.5555)

编码器的输出与信息传递

回归上图：

其中左侧虚线框中描述的 $\text{Transformer}$ 模块是一个编码器 $(\text{Encoder})$ 模块；图中仅仅画了一个，但实际上，和深度神经网络相同，可以通过叠加编码器模块，使其增加编码器的神经网络深度；从而最终得到一个类似于 $\text{Seq2seq}$ 模型中 $\text{Context}$ 向量 $\mathcal C$ 作用的编码器输出：
而右侧虚线框中描述的 $\text{Transformer}$ 模块是一个解码器 $(\text{Decoder})$ 模块；与编码器部分相似，它同样可以通过叠加解码器模块来增加解码器的神经网络深度。

但与 $\text{Seq2seq}$ 模型不同的是： $\text{Transformer}$ 块自身并不是一个类似于 $\text{RNN}$ 的循环结构，因此不同于 $\text{Seq2seq}$ 解码器仅将 $\text{Context}$ 向量 $\mathcal C$ 作为初始时刻的隐藏层输入， $\text{Transformer}$ 的解码器部分需要每一个解码器模块均需要编码器输出结果作为输入；并且是作为 $\text{Multi-Head Attention}$ 的 $\text{Query}$ 与 $\text{Key}$ 的输入；
并且要求编码器与解码器中 $\text{Transformer}$ 块的数量是相等的。
这里有一点不太理解，因为 $\text{Encoder}$ 内的 $\text{Transformer}$ 块在执行隐藏层状态的运算中，并没有与 $\text{Decoder}$ 中对应位置的 $\text{Transformer}$ 块之间存在关联关系，感觉只和 $\text{Encoder Output}$ 有关系，也有可能上面的图画错了，欢迎小伙伴们一起讨论。
并且编码器的输出作为每一个解码器 $\text{Transformer}$ 模块中多头注意力机制的 $\text{Key,Value}$ ；而 $\text{Query}$ 来自于目标序列(解码器自身的输入)。

关于预测问题

关于预测问题，我们早在动态模型的推断任务中就介绍过这个概念。已知前 $t$ 个观测值，预测第 $t + 1$ 个预测值的后验分布：
$\mathcal P(o_{t+1} \mid o_1,o_2,\cdots,o_t)$
而关于 $\text{Transformer}$ 的预测任务中，前 $t$ 个观测值也是通过预测得到的。在解码器模块的自注意力机制对于 $t + 1$ 时刻信息的预测过程中，首先会使用前 $t$ 个预测结果分别作为 $\text{Key,Values}$ ；而第 $t$ 个值作为 $\text{Query}$ 来参与多头注意力机制的计算过程。

相关参考：
Transformer 、Reformer知识点整理
nn.LayerNorm的实现及原理

自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
【速通RAG实战：数据库】6.RAG向量数据库原理无心水速通 RAG 实战！解锁 AI 2.0 高薪密码速通RAG实战 RAG快速开发实战 RAG RAG向量数据库相似度 FAISS Chroma
在RAG（检索增强生成）系统中，向量数据库扮演着至关重要的角色，它负责存储文本经过Embedding处理后的向量表示，并能高效地进行向量检索，以找出与查询向量最相似的文档。1.向量数据库原理1.向量表示在RAG系统里，文本首先会通过Embedding模型（如OpenAIEmbeddings、SentenceTransformers等）转化为固定维度的向量。这些向量能够捕捉文本的语义信息，使得语义相
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
资本市场的这些网红～李大霄春耕部落
当今，网红已经是各大媒体追逐的对象。直播网红，唱歌网红，象棋网红，游戏网红等等，因为所从事的行业不同而存在很多的类型，其中，在资本市场也存在网红，这些网红就是我们经常能看的到的那些所谓资本市场的专家。李大霄:这是个很有意思的人。说他是网红，大家应该不会有什么异议。这不只是因为他自己喜欢在博客、媒体上等刷存在感，也是由于他富有娱乐性的表达方式。几年前，我已知道他。从开始的空头司令，到现在的死多头。李
AI人工智能领域知识图谱在文本分类中的应用技巧 AI天才研究院 AI大模型企业级应用开发实战人工智能知识图谱分类 ai
AI人工智能领域知识图谱在文本分类中的应用技巧关键词：知识图谱、文本分类、图神经网络、实体关系抽取、深度学习、自然语言处理、特征融合摘要：本文深入探讨了知识图谱在文本分类任务中的应用技巧。我们将从知识图谱的基本概念出发，详细分析如何将结构化知识融入传统文本分类流程，介绍最新的图神经网络方法，并通过实际案例展示知识增强型文本分类系统的构建过程。文章特别关注知识表示学习与文本特征的融合策略，以及在不同
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
「Tokens是胡扯」？Mamba作者炮轰Transformer，揭秘AI模型致命缺陷 | AI早报未来世界2099 AI日报人工智能 transformer 深度学习业界资讯
1、OpenAI疯狂挖角反击！Meta华人科学家+马斯克三员大将集体跳槽2、清华&NTU突破性研究：仅需2张图，AI即可重构3D空间认知3、极智嘉港股上市首日破发！清华系机器人公司市值153亿引关注4、星海图融资超1亿美金！美团、今日资本领投，估值暴涨3倍5、华人团队用RL打造AIAgent，种子轮狂揽1200万美元融资6、Skywork-R1V3.0震撼开源：高考数学142分，多学科推理能力直逼
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
大语言模型应用指南：网页实时浏览 AGI大模型与大数据研究院 AI大模型应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：网页实时浏览作者：禅与计算机程序设计艺术1.背景介绍1.1大语言模型的崛起1.1.1自然语言处理的发展历程1.1.2Transformer模型的突破1.1.3预训练语言模型的优势1.2网页浏览的痛点1.2.1信息过载与检索困难1.2.2内容理解与知识提取1.2.3个性化与智能化需求1.3大语言模型与网页浏览的结合1.3.1智能问答与对话系统1.3.2知识图谱与语义搜索1.3.3
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu