Huterox

前沿系列--Transform架构[架构分析+代码实现]

文章目录

前言
总体架构
- 总体
- 任务使用
输入部分
- Embedding
- Position Encoding
- - why
  - 实现
注意部分
- 注意力机制/自注意力
- 掩码
- - 作用
  - 如何工作
  - 形状解释
- 完整实现
- 多头注意力实现
- Norm处理
FeedForward 以及连接
编码器
解码器
- 中间层
- 组装
输出层
模型组装
总结

前言

Transform这玩意的大名我想就不用我多说了。那么我们今天要做的就是对Transform架构进行了解，并且使用Pytorch进行一个编写实现。（其实这边博文的话很早之前就差不多写好了，但是话我本人喜欢做一个系列就一直没发布）由于描述的是一种架构，因此好消息是，对于新的理论部分没有啥要求。但是坏消息是，需要一定的前期知识储备。我们这边还是拿到NLP任务来进行展开，虽然Transform这个玩意作为一个架构不仅仅在NLP领域进行应用在CV领域等等也在用，但是一开始的来源还是这个NLP这边来的，一条时间线可以注意一下就是2017提出了Transform，2018 Bert出来了，2020 GPT3都出来了。最近ChatGPT都杀疯了。只能说时代变化太快，从大二入坑差不多一年了，还在水里爬。OK，废话不多少我们开始吧，那么在开始之前的话，我们期望你已经阅读了这篇博文：还在调API写所谓的AI“女友”，唠了唠了，教你基于python咱们“new”一个（深度学习）因为会有一些奇怪的比喻来自这里，当然如果对应Seq2Seq有一定了解或者做过类似的任务的话，那么welcome here！

总体架构

总体

首先Transform的总体架构的话其实非常清晰明了

整个Transform架构的话其实和我们的Seq2Seq是类似的，都是通过Encoder到Decoder最后输出一组概率假设我们还是文本的一个生成任务的话，例如AI机器人，语言翻译，再或者说是从一个信号序列到另一个信号序列的转变。不过里面对于传入的参数的处理是不太一样的。同时相对我们原先构建的基于GRU搭建的SEQ2SEQ网络来说，其实实现的话会更简单一点，在原先最大的挑战在于对各个输出，输入维度的一个判断和编写，难点在于对循环神经网络的理解，因为调试的坑都在这边，也就是Decoder部分。但是在今天的Transform当中，会友好很多，难点在注意力机制的编写部分以及对它的一个理解。

任务使用

OK，那么我们现在对Transform进行了一个简单的预览，那么现在我们来看看我们如何使用Transform架构，如何使用这个模型。我们那个闲聊的机器人的来说吧，我们原来是这样的：

我们使用了两个循环神经网络来充当编码器，解码器，同时由于我们在解码的过程中需要逆向过程来一个词一个词的去生成句子，因此我们还需要手写decoder的一个循环过程，然后就是对里面参数的疯狂调整，最后在转化为一组概率，假设输入的句子是1x10并且假设有100种词，也就是不同的词语+标点有100个，那么最后我们得到的玩意是1x10x100的一个概率矩阵。然后我们通过概率矩阵去生成一个句子。这个是我们原来的一个流程。

那么在使用Transform的话，有什么区别呢？答，总体上来说其实区别不大。我们其实只是把Seq2Seq给换成了transform，更加准确一点其实是，我们把原来GRU给换成了transform当中的编码器和解码器。
也就是这两个家伙：

再形象一点就是，我们把GRU或者LSTM这种循环神经网络给换成了这种带有注意力机制的编解码器。并且我们对于编码器和解码器当中相互交融的位置也不太一样。那么这个时候我们可以引出我们本文当中的第一个问题了，那就是说，为什么我们可以使用到这个东西，来代替RNN结构。

输入部分

Embedding

OK，现在我们带着第一个问题来看到我们的输入部分：

首先我们可以看到一开始对于输入需要先进行Embedding操作，这个操作的话，是我们常规的一个操作，那么紧接着还有一个PositionEncoding的一个操作。那么对于Embedding的操作我们可以理解，目的就是为了能够把一个文本，例如一个句子10个词语构成，那么就变成10xembedding_dim的一个向量。具体的代码也简单是这样的：

class Embeddings(nn.Module):

    def __init__(self,dim,vocab):
        super(Embeddings,self).__init__()
        self.em = nn.Embedding(vocab,dim)
        self.dim = dim

    def forward(self,x):
        return self.em(x)*math.sqrt(self.dim)

Position Encoding

why

那么PositionEncoding是什么东西呢？OK，这里我们先来回顾一下如果我们使用RNN的话我们有什么特点，或者说我们原来为什么要使用GRU或者LSTM这种RNN结构呢？是因为，词语的位置之间是有关系的对吧。词和词之间不是独立的，而存在一种关系，例如“我爱你”和“你爱我”这是不同意思，前者可能是你作为舔狗，后者可能是别舔你。因此我们采用了RNN这种结构，主要是因为词语之间的一种联系。那么问题来了一定只有一种解决方案不？显然不是，如果我们有一种方法我们可以直接把词语之间的一种位置关系也直接表示出来的话，那么理论上来说我们可以替代到刚刚的RNN的效果。

那么PositionEncodeing显然看名字就知道做的就是这种事情。

实现

OK，我们这边先来看到是怎么实现的：

"""
负责实现对句子中每一个位置信息进行一个编码
编码之后的维度是[seq_len,dim]
"""
class PostitionEncoding(nn.Module):

    def __init__(self,dim,dropout,max_len=5000):
        super(PostitionEncoding,self).__init__()
        """
        dropout让部分神经元失去作用（其实就是让某些
        神经元的梯度消失，让输入中的X矩阵部分为0
        """
        self.dropout = nn.Dropout(p=dropout)

        pe = torch.zeros(max_len,dim)

        #初始化绝对位置矩阵
        postition = torch.arange(0,max_len).unsqueeze(-1)

        #定义一个变幻矩阵
        div_matrix = torch.exp(torch.arange(0,dim,2)*-(math.log(10000)/dim))

        #进行奇数偶数位置的分别赋值
        pe[:,0::2] = torch.sin(postition*div_matrix)
        pe[:,1::2] = torch.cos(postition*div_matrix)

        pe = pe.unsqueeze(0)

        #pe,不参与模型的梯度运算,因此需要将pe注册为buffer
        self.register_buffer('pe',pe)

    def forward(self,x):
        """
        :param x: embedding 后的x
        :return:
        """
        x = x+Variable(self.pe[:,:x.size(1)],requires_grad=False)
        return self.dropout(x)

这部分的实现是这样的：

使用到一个位置信息矩阵pe,这个矩阵一开始我们设置的足够大，并且作为一个定量（不参与梯度计算）
定义一个变幻矩阵，目的是为了对pe的维度进行变幻
确定句子当中的词序，因为我们输入的东西是batch_size,seq_len,dim的一个句子，词本身在句子中就是有序的因此：postition = torch.arange(0,max_len).unsqueeze(-1) 就是词的一个序号（在句子中）
此时变幻矩阵和position矩阵进行运算，然后赋值给到pe,这个位置信息矩阵。
将位置信息和原来的embedding后的信息进行累加处理，让数据具备位置信息

这里的话可能第一个魔幻的地方来了，为什么这样处理之后就具备了位置信息。这里问题的话其实是整个神经网络算法的魔幻之处，我们这样处理的信息确实和位置有关系，但是具体是什么关系我们是不知道的，这个只能改到神经网络自己去“学习”表示，也就是常说的解释能力比较差的一种情况，只是说我们期望是这种效果，并且实验的表现上这种解释行得通。

那么在这里的话还需要注意的是这个，我们有两个地方是有这样的处理的：

注意部分

之后的话我们来看到这个注意了机制部分：

这个玩意看架构图也知道是整个transform当中比较重要的一个地方了，基本上一个架构全是注意力机制，然后疯狂传递。

注意力机制/自注意力

OK，现在我们来看到这个注意力机制。其实这个注意了机制的话，不要想得很复杂，它里面其实就三个东西：Query,Key,Value 然后通过特殊的计算之后得到一种权重，然后和我们输入的X进行一个计算，让X当中的某些值放大或者缩小，从而影响到我们神经网络里面的权重，因为我们现有的神经网络结构，都是对参数W进行一个计算求导的，影响W的是我们X的一个值。可以这样理解我们的注意力机制就是，X影响到了部分W，然后W再影响道下一个batch的X，然后在反过来影响到W，W不再是混乱的，W的缩放呈现处理一种分布所就是所谓的一种注意力的表现。反正大概是这种意思吧，我们不太需要关心这个。

那么我们先直接来看到这个公式还有架构吧：

首先它的计算公式是这样的：

有四个变量，Q，K，V还有Dk。这几个是啥我们待会再来说，那么在我们的网络结构里面是这样的：

这个时候我们在来解释一下这个Q，K，V是啥。

Q：query，假设我们在做一个文本的特征提取，假设给一个文本，叫你提取出里面的关键词，那么Query就是我们输入的文本
K： key，是我们输入的一些关键信息。
V： value，是网络生成的

那么这块的话我们可以发现就是说Query和Key应该是知道的，Value是我们最终期望得到的。假设我们在做一个语文作业。我们的期望是AI可以做出来，于是我们输入Query，也就是题目，之后我们有一个参考答案Key，或者说是参考提示。现在在学习的过程中，我们是不知道怎么做的，最好的方式是找几个例题去做一下，于是我们拿到Query和Key，自己在生成Value也就是解题，然后在去对一下大概的答案，看看自己有没有get到题目的关键点。那么类比一下，get题目的关键点，不是题目的关键信息嘛，不就是文本中的主要要点呗，也就是关键特征呗，那么这个不就是注意力机制的目的呗。

这个的话，我们先直接看到代码：

    @staticmethod
    def attention(query,key,value,mask=None,dropout=None):
        """
        :param query:
        :param key:
        :param value:
        :param mask: 掩码
        :param dropout: 传入dropout对象
        :return:
        """

        """
        当Q=K=V时，此时attention就是传说中的self-attention
        """

        #这里的dim其实就是embedding里面的dim
        dim = query.siez(-1)

        #参照计算公式进行计算
        sorces = torch.matmul(query,key.transpose(-2,-1)/math.sqrt(dim))

        if(mask is not None):
            """
            Q,K,V-->[batch_size,seq_len,embedding_dim]
            与mask里面的0进行对应，如果是0，那么替换为很小的数字
            在sorces的对应位置上
            [seq_len,seq_len]
            """
            sorces = sorces.masked_fill(mask==0,-1e9)

        p_attn = F.softmax(sorces,dim=-1)
        if(dropout is not None):
            p_attn = dropout(p_attn)

        #完成乘法，并反馈query的attention
        return torch.matmul(p_attn,value),p_attn

（mask是啥，先不管）OK，现在我们知道了注意力机制，并且我们知道就是说，我们的Key和Value理论上来说应该要相等，或者尽可能相等，换一句话说，我们期望是输入的Key和我们的Value能够相等。那么自注意力机制是啥呢，其实很简单就是Q=K=V，啥玩意呢，就是Key按道理假设是按照刚刚的例子的话，Key是提示，是答案，那么如果没有给答案不就自己做了呗，答案就是题目也就是说没给提示，要自己做。大概就这样理解吧。

掩码

作用

之后的话，我们可以发现在代码当中还有mask，这种东西，那么这个是啥呢。

掩代表遮掩，码就是我们张量中的数值，它的尺寸不定，里面一般只有1和0的元素，代表位置被遮掩或者不被遮掩，至于是0位置被遮掩还是1位置被遮掩可以自定义，因此它的作用就是让另外一个张量中的一些数值被遮掩，也可以说被替换,它的表现形式是一个张量。

在transformer中,
掩码张量的主要作用在应用attention时，有一些生成的attention张量中的值计算有可能已知了未来信息而得到的，未来信息被看到是因为训练时会把整个输出结果都一次性进行Embedding，但是理论上解码器的的输出却不是一次就能产生最终结果的，而是一次次通过上一次结果综合得出的，因此，未来的信息可能被提前利用. 所以，我们会进行遮掩。

这个看起来比较抽象，我们直接来看到它的生成的代码怎么来的：

    @staticmethod
    def subsequent_mask(size):
        attn_shape = (1,size,size)

        subsequent_mask = np.triu(np.ones(attn_shape),k=1).astype('uint8')
        return torch.from_numpy(1-subsequent_mask)

这个东西呢，就是用来生成掩码的东西，那么运行完之后的效果是啥呢，假设我们生成的是4x4的一个掩码，那么效果就是这样的：

其他的地方是0。那么这个玩意有作用，或者为啥长这个样子呢。
什么叫做未来的张量呢？未来的信息？
我们这里的话，我们来回到我们用GRU来生成句子的时候是怎么做的：

原来在生成句子的时候，我们是一步一步去生成的对吧，也就是说，当前的+上一个生成的词语来进行推导生成。也就是这样一步一步来生成的：

也就是说在生成当前的词语的时候，我们不可能拿到后面的词语的信息来进行生成。

但是现在是什么情况。现在我们没有这样的循环结构。我们是直接一个句子，一个句子所有的特征都给出来了，也就是我们是直接一个张量大小为[batch_size,seq_len,embedding_dim]的玩意过来去生成这样的词语的。但是不可否认的是在一次一次运算的过程中，我们是期望词语也是一个一个生成的，因为这样才合理啊，你不可能知道你还没有说的话吧，或者还没有想到的话吧，这个肯定是有次序的。那么掩码的作用此时就不言而喻了，为了这种次序性。换一句话说掩码用来模拟RNN结构的次序性质。至此，用RNN结构的对于词语的位置特征，词语的次序特征都进行了简要代替。

如何工作

OK，现在我们再来看到掩码大概是如何工作的，这个时候我们再回到attention的代码当中：

        if(mask is not None):
            """
            Q,K,V-->[batch_size,seq_len,embedding_dim]
            与mask里面的0进行对应，如果是0，那么替换为很小的数字
            在sorces的对应位置上
            [seq_len,seq_len]
            """
            sorces = sorces.masked_fill(mask==0,-1e9)

其实答案已经在注释了给出来了，QKV的维度正如咱们的这个注释所说，当进行运算之后的话，source的维度变成了[seq_len,seq_len]，此时按照下三角矩阵，我们把mask当中为0的用很小的值来替换，这样的话，对应位置的信息就很小了。之后在进行矩阵运算

return torch.matmul(p_attn,value),p_attn

还原维度并且得到处理之后的X，和attn的一个权重。

形状解释

那么这个时候的话，我们也可以来解释另一个问题就是为什么，是有一个偏移的。我们假设只有一个句子进入，也就是假设现在都是二维的张量进入网络，之后我们进行运算之后我们的source大概应该是这样的：

假设这个现在是我们的source矩阵，假设恰好source运算完毕之后，下三角也是1，上三角是别的数值，但是和mask运算之后应该是这样的。它的大小是seq_len x seq_len。或者是max_len x max_len。
它的话这样理解，纵坐标是代表我们知道的词，就是输入，横坐标要的是我们要生成或者转换的信息，因为神经网络就是对信息不断转换提取码，对那个feature对吧。此时生成第一个的时候，第一个肯定是要已知的。生成第二个的时候，3,4未来的就看不到了，大概就是下图的效果：

这块的话其实也是模拟那种RNN按照次序提取信息的过程，后面的信息是逐步看到的。

完整实现

OK，现在我们来看到一个实现。这里的话我把这个玩意封装到了一个工具类当中，因为后面会使用到：


class Utils(object):

    def __init__(self):
        pass

    @staticmethod
    def subsequent_mask(size):
        attn_shape = (1,size,size)

        subsequent_mask = np.triu(np.ones(attn_shape),k=1).astype('uint8')
        return torch.from_numpy(1-subsequent_mask)

    @staticmethod
    def attention(query,key,value,mask=None,dropout=None):
        """
        :param query:
        :param key:
        :param value:
        :param mask: 掩码
        :param dropout: 传入dropout对象
        :return:
        """

        """
        当Q=K=V时，此时attention就是传说中的self-attention
        """

        #这里的dim其实就是embedding里面的dim
        dim = query.siez(-1)

        #参照计算公式进行计算
        sorces = torch.matmul(query,key.transpose(-2,-1)/math.sqrt(dim))

        if(mask is not None):
            """
            Q,K,V-->[batch_size,seq_len,embedding_dim]
            与mask里面的0进行对应，如果是0，那么替换为很小的数字
            在sorces的对应位置上
            [seq_len,seq_len]
            """
            sorces = sorces.masked_fill(mask==0,-1e9)

        p_attn = F.softmax(sorces,dim=-1)
        if(dropout is not None):
            p_attn = dropout(p_attn)

        #完成乘法，并反馈query的attention
        return torch.matmul(p_attn,value),p_attn

    @staticmethod
    def clone(module,N):
        """
        :param module: 目标网络
        :param N: 克隆个数
        :return:
        """
        return nn.ModuleList(
            [copy.deepcopy(module) for _ in range(N)]
        )

多头注意力实现

之后的话就是我们多头注意力实现了，也就是这个破玩意：

其实啥是多头注意力呢，其实很好理解，就是在基本注意力的基础上，我们把一个数据拆分为不同维度，对不同维度的数据进行分别注意力机制，然后做合并即可。

也就是说我们输入的数据是，一开始我们通过embedding和position encodinh之后，我们的数据应该是[batch_size,seq_len,embedding_dim]，假设我们划分8个头，那么其实就是把这个数据划分为[batch_size,seq_len,head,embedding_dim//head]，然后最后两个维度进入注意力机制呗。

代码实现是这样的：

class MultiHeadedAttention(nn.Module):

    def __init__(self,head,dim,drop=0.3):
        """
        :param head: 多少个头（其实就是dim划分多少份）
        :param dim:
        :param drop:
        """
        super(MultiHeadedAttention,self).__init__()

        assert dim%head==0,"head的数量设置不合理"

        self.d_k = dim//head
        self.head = head
        self.dim = dim

        self.liners = Utils.clone(nn.Linear(self.dim,self.dim),4)

        self.attn = None
        self.drop = nn.Dropout(drop)

    def forward(self,query,key,value,mask=None):
        if(mask is not None):
            #扩充mask,因此此时加了一个头，张量多了一个维度
            mask = mask.unsqueeze(1)
        batch_size = query.size(0)
        #进行计算,这个-1，其实是句子的每一个词
        query,key,value = [
            model(x).view(batch_size,-1,self.head,self.d_k).transpose(1,2)
            for model,x in zip(self.liners,(query,key,value))
        ]
        x,self.attn = Utils.attention(query,key,value,dropout=self.drop)
        #此时做合并
        x = x.transpose(1,2).contiguous().view(
            batch_size,-1,self.dim
        )
        return self.liners[-1](x)

Norm处理

之后的话我们看到我们的结构还有这个：

那么这个的话我们要实现一：

class LayerNorm(nn.Module):

    def __init__(self,dim,eps=1e-6):
        """
        :param dim: embedding_dim
        :param eps: 放置除以0
        """
        super(LayerNorm,self).__init__()

        self.eps = eps
        self.a = nn.Parameter(torch.ones(dim))
        self.b = nn.Parameter(torch.zeros(dim))

    def forward(self,x):
        mean = x.mean(-1,keepdim=True)
        std = x.std(-1,keepdim=True)
        return self.a*(x-mean)/(std+self.eps)+self.b

那么到这里的话，我们的注意力部分其实就差不多了。

FeedForward 以及连接

之后我们再看到这个：

我们要把这个也实现了，然后我们就可以组装我们的编码器了。

这个其实好办：

这个是我们的FeedForward

class PositionwiseFeedForward(nn.Module):

    def __init__(self,dim,d_h,drop=0.3):
        super(PositionwiseFeedForward,self).__init__()

        self.l1 = nn.Linear(dim,d_h)
        self.l2 = nn.Linear(d_h,dim)
        self.dropout = nn.Dropout(drop)

    def forward(self,x):
        x = F.leaky_relu(self.l1(x))
        return self.l2(self.dropout(x))

之后是我们的连接部分，就是这些乱七八糟的线：

class SubLayerConnection(nn.Module):

    def __init__(self,dim,dropout=0.3):
        super(SubLayerConnection,self).__init__()
        self.norm = LayerNorm(dim)
        self.dropout = nn.Dropout(dropout)

    def forward(self,x,sublayer):

        return x+self.dropout(sublayer(self.norm(x)))

编码器

OK，现在我们基本的编码里面需要的组件就做好了，我们现在组装一下：

class Encoder(nn.Module):

    def __init__(self,layer,N):
        """
        :param layer: 多少层的编码器
        :param N: 多少个编码器
        """
        super(Encoder,self).__init__()
        self.layers = Utils.clone(layer,N)
        self.norm = LayerNorm(layer.dim)

    def forward(self,x,mask):
        for layer in self.layers:
            x = layer(x,mask)
        return self.norm(x)

解码器

之后的话是我们的解码器，这个东西和我们的编码器其实有点类似，只是中间的输入。

中间层

这里我们先定义一下中间层，因为这个东西需要接受我们编码器传递过来的值：

class DecoderLayer(nn.Module):

    def __init__(self,dim,self_attn,src_attn,feed_forward,dropout):

        """
        :param dim:
        :param self_attn: 自注意力机制 Q=K=V
        :param src_attn: 常规注意力机制  Q!=K=V
        :param feed_forward:
        :param dropout:
        """

        super(DecoderLayer,self).__init__()
        self.dim = dim
        self.self_attn = self_attn
        self.src_attn = src_attn
        self.feed_forward = feed_forward
        self.sublayer = Utils.clone(SubLayerConnection(dim,dropout),3)

    def forward(self,x,memory,source_mask,target_mask):
        """
        :param x: 上一层输入
        :param memory: 编码层的语义(编码器输出）
        :param source_mask: 数据源的掩码
        :param target_mask: 目标数据的掩码
        :return:
        """
        m = memory

        x = self.sublayer[0](x,lambda x:self.self_attn(x,x,x,target_mask))
        x = self.sublayer[1](x,lambda x:self.src_attn(x,m,m,source_mask))
        #最后一个连接结构
        return self.sublayer[2](x,self.feed_forward)

组装

之后的话，我们在组装一下：

class Decoder(nn.Module):

    def __init__(self,layer,N):
        super(Decoder,self).__init__()
        self.layers = Utils.clone(layer,N)
        self.norm = LayerNorm(layer.dim)

    def forward(self,x,memery,source_mask,target_mask):

        for layer in self.layers:
            x = layer(x,memery,source_mask,target_mask)
        return self.norm(x)

输出层

最后是我们的输出层，也就是这个：

这个的话，我们叫它生成器，因为我们最后确实是需要它生成我们的句子，最后输出的也是概率嘛。

class Generator(nn.Module):
    """
    没错最后也是做一个概率预测，选择最大的那一个，然后由词语组成句子输出
    """
    def __init__(self,dim,vocab_size):
        super(Generator,self).__init__()

        self.l = nn.Linear(dim,vocab_size)

    def forward(self,x):
        return F.log_softmax(self.l(x),dim=-1)

至于生成句子的处理手段，这个咱们在那个开头AI小姐姐的博文说了，我们还有一种方式优化。

模型组装

最后来到我们对于模型部分的组装。没错就是这个大图：

这个的话就简单了，因为我们已经组装好了各个组件。

class Model(object):


    @staticmethod
    def make_model(source_vocab,target_vocab,N=6,
                   dim=512,d_ff=2048,head=8,max_len=5000,
                   dropout=0.30):

        """
        :param source_vocab: 词汇数量
        :param target_vocab: 词汇数量
        :param N: 编码器/解码器多少个层
        :param dim: embedding_dim
        :param d_ff: 线性层多少个隐藏节点
        :param head: 多头注意力机制多少个头
        :param max_len: 句子的最大长度
        :param dropout:
        :return:
        """

        co = copy.deepcopy
        attn = MultiHeadedAttention(head,dim)
        pf = PositionwiseFeedForward(dim,d_ff,dropout)

        position = PostitionEncoding(dim,dropout,max_len)

        model = EncoderDecoder(
            Encoder(EncoderLayer(dim,co(attn),co(pf),dropout),N),
            Decoder(DecoderLayer(dim,co(attn),co(attn),co(pf),dropout),N),
            nn.Sequential(Embeddings(dim,source_vocab),co(position)),
            nn.Sequential(Embeddings(dim,target_vocab),co(position)),
            Generator(dim,target_vocab)
        )

        return model

到此我们整个模型就构建完成了，然后使用的话还是老规矩，当做Seq2Seq即可。当然同样的，作为一个饱受考验的模型，这个也是有实现好的第三方库的，没错不需要自己手写。

总结

okey~大概这个其实就是transform架构吧，总的来说，按照我的解读其实就是非常巧妙的对RNN能够带来的一些特征进行融合，并且效果还很好。当然整个架构给我的感觉其实就是“堆料，期望”。

堆料是啥意思呢：就是用了很多处理方案呗。
期望是啥意思，就是这些方案，解释性更多是用期望来表示。举个例子：

before：
我认为A和B之间还有一种关系我需要知道–>建立模型—>做实验，不断推导证明–>找出A和B之前确切的关系以及处理方案–>得到结论（可解释性的步骤+完整的数学模型+推导证明）

now:
我认为A和B之间存在一种关系我需要知道–>将A和B的数据进行处理连接整合（很粗略的模型）—>NN---->Expect could NN find some Relationships -->实验后效果好像达到了预期—>得到结论（这样做期望是这样实际上目前这样解释正确）

只是挑款没啥意思。

你可能感兴趣的:(自然语言处理,人工智能,突发奇想,架构,人工智能)

Grape-RAG disgare AI ai
Grape-RAG传统RAG的局限性图的优点用知识图谱来呈现数据关系GraphRAG传统RAG的局限性经典的RAG架构以向量数据库（VectorDB）为核心来检索语义相似性上下文，让大语言模型（LLM）不需要重新训练就能够获取最新的知识，其工作流如下图所示：这一架构目前广泛应用于各类AI业务场景中，例如问答机器人、智能客服、私域知识库检索等等。虽然RAG通过知识增强一定程度上缓解了LLM幻觉问题，
分布式资源管理和调度架构 johnny233 架构架构
概述不管是计算任务还是数据存储都会涉及资源分配，资源包括但不限于硬件资源如CPU、内存、硬盘、网口。在单机环境中，资源管理相对简单；分布式环境中，资源分布相对分散，如何协调资源应对计算任务和数据存储就是亟待解决的问题。资源管理和调度是将计算任务分配到资源的过程，为了处理并发的计算任务，系统会通过集群的方式组织资源。集群中的资源可以按照服务器或者虚拟机的方式划分。注：本文是《分布式架构原理与实践》的
【Elasticsearch 】聚合分析：聚合概述程风破～ Elasticsearch elasticsearch 大数据搜索引擎
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
Transformer架构原理详解：编码器（Encoder）和解码器（Decoder） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,编码器,解码器,自注意力机制,多头注意力,位置编码,序列到序列,自然语言处理1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展，其中Transformer架构扮演着至关重要的角色。自2017年谷歌发布了基于Transformer的机器翻译模型BERT以来，Transformer及其变体在各种NLP任务上取得了突破性的成果，例如文本分类、问答系统、文本摘要
MVC 架构学习笔记 disgare 架构 mvc 架构学习
MVC架构学习笔记Service与DAO层方法命名规约业务错误是用返回值来处理还是抛异常来处理Service与DAO层方法命名规约CRUD是指在做计算处理时的增加(Create)、读取查询(Retrieve)、更新(Update)和删除(Delete)几个单词的首字母简写。主要被用在描述软件系统中DataBase或者持久层的基本操作功能。对应这里的crud方法的命名，每个人有不同的实践。以下是阿里
微信 PC 版 4.0：新架构，新升级创意锦囊微信架构
探索微信PC版4.0：新架构带来的革命性升级微信在2023年底推出了PC客户端4.0测试版，引入了全新的QT+C++原生跨平台架构。这次架构重构标志着微信在桌面端从传统的WebView技术迈向更现代化、高性能的原生技术基础，带来了显著的功能升级和用户体验优化。从旧到新：架构大变革旧架构：WebView+JavaScript微信旧版PC客户端主要依赖WebView技术，通过HTML、CSS和Java
服务化架构 IM 系统之红包功能设计与实现棕生 IM系统服务化架构 IM系统服务化架构红包逻辑发红包抢红包拆红包
在IM系统中，“红包”是一种很常见的应用。在前面的文章（见《基于需求分析模型来结构化剖析IM系统》）中，我们曾分析过，“红包”属于扩展功能需求，“消息”属于基础功能需求，红包功能的实现需要基于消息功能的实现。在文章（见《分层架构IM系统之消息收发功能设计与实现》）中，我们深入分析过消息的收发流程；在IM的服务化架构中，消息收发逻辑与在分层架构中类似，见下图，我们快速回顾一下。图中箭头表示数据流向。
分层架构 IM 系统之消息收发功能设计与实现棕生 IM系统分层架构 IM系统分层架构消息收发生产消息阶段推送消息阶段确认消息阶段电话模型
“消息收发”是IM系统最最核心的业务逻辑模块，本篇文章是整个“分层架构IM系统”的核心！IM，即“即时通讯”，要求消息具备“及时性”和“可靠性”：及时性，要求消息的收发需要很低的延时，在线双方通过消息交流时，没有明显的滞后感。可靠性，要求消息不能丢失；对于消息发送方来说，只要消息发送成功了，消息就会一直存在服务端，不会丢失（除非因产品策略，删除久远的历史消息）；对于服务端来说，只要接收方在线，一定
分层架构 IM 系统之架构演进棕生 IM系统分层架构 IM系统分层架构业务分离 MQ解耦
在电商业务日活几百万的情况下，IM系统采用分层架构方式，如下图。分层架构的IM系统，整体上包含了【终端层】、【入口层】、【业务逻辑层】、【路由层】、【数据访问层】和【存储层】，我们在上篇文章（分层架构IM系统之架构解读）中进行了介绍。今天讨论局部的架构调整和演进！随着用户日活量的增多，业务规模也在逐步增大（即后端接口数量越来越大），而且业务逻辑也越来越复杂；为了引流，平台几乎每周都会做运营活动，此
思考（八十五）：IM 服务设计思路 fananchong2 Go游戏服务器开发的一些思考 IM 服务架构设计聊天服后端
IM服务器IM服务器，在游戏开发中，俗称聊天服一般有内嵌在游戏服架构内，与外置于游戏服架构外外置于游戏服架构外的聊天服，通常就是完整的IM服务器设计目标消息可靠，不丢失无状态，易扩展高性能服务类型介绍设计以下服务：服务类型说明Gateway网关，保持玩家连接APIAPI服，HTTPWeb服务，处理除聊天流程外的逻辑，如注册账号、鉴权、好友管理、群组管理等等Single单聊消息处理服务Group群组
mybatis架构原理章绍龙 java基础
1、mybatis配置SqlMapConfig.xml，此文件作为mybatis的全局配置文件，配置了mybatis的运行环境等信息。mapper.xml文件即sql映射文件，文件中配置了操作数据库的sql语句。此文件需要在SqlMapConfig.xml中加载。SqlMapConfig.xml是mybatis的核心文件。mybatis将dao层与sql语句分离开来，虽然写的时候分离开来了，但是执
Docker的原理：如何理解容器技术的力量思维导图-java架构用心去追梦大数据 java storm
要理解Docker的原理以及容器技术的力量，可以通过一个思维导图来帮助整理和展示信息。以下是一个基于文本的思维导图结构，用于说明Docker和容器技术的关键概念，特别关注于Java架构师可能会感兴趣的部分：Docker与容器技术│├───基本概念│├───容器(Container)││└───是一个轻量级、可移植、自包含的软件包│├───镜像(Image)││└───包含应用程序及其所有依赖项的只
【人工智能 | 大数据】基于人工智能的大数据分析方法用心去追梦人工智能大数据数据分析
基于人工智能（AI）的大数据分析方法是指利用机器学习、深度学习和其他AI技术来分析和处理大规模数据集。这些方法能够自动识别模式、提取有用信息，并做出预测或决策，从而帮助企业和组织更好地理解市场趋势、客户行为以及其他关键因素。以下是几种主要的基于AI的大数据分析方法：机器学习模型：通过训练算法让计算机从历史数据中学习并做出预测或分类。常见的机器学习技术包括监督学习（如回归分析、支持向量机）、非监督学
SpringCloud Alibaba：RocketMQ - 分布式消息中间件的最佳实践 mckim_ 笔记学习 spring cloud rocketmq
引言随着分布式系统和微服务架构的发展，消息队列作为异步通信的关键组件，其重要性日益凸显。RocketMQ作为一款高性能、高可靠的消息中间件，在处理海量消息方面表现卓越。本文将结合实际应用场景，全面介绍RocketMQ的基础知识、配置要点、高级特性以及性能监控的最佳实践。一、RocketMQ基础知识1.概述RocketMQ是由阿里巴巴开源的一款分布式消息中间件，以其高效、可靠、易用的特点著称。它支持
Mybatis框架蓝眸少年CY #SSM框架 mybatis
目录一、三层架构二、使用JDBC的缺陷三、快速入门1、概述2、解决的主要问题3、入门案例添加Maven坐标加入Maven插件编写Student实体类编写Dao接口StudentDao编写Dao接口Mapper映射文件StudentDao.xml创建MyBatis主配置文件创建测试类MyBatisTest配置日志功能insert操作（1）StudentDao接口中增加方法（2）StudentDao.
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
ChatGPT搜索漏洞：AI代码生成器安全隐患及应对策略前端
近年来，随着人工智能技术的飞速发展，各种AI代码生成器层出不穷，为程序员带来了极大的便利。然而，技术进步的同时也伴随着安全风险的提升。最近，OpenAI的ChatGPT搜索工具曝出重大安全漏洞，引发了业界广泛关注。本文将深入探讨该漏洞的细节、影响以及应对措施，并展望未来AI工具安全发展趋势。ChatGPT作为一款强大的AI工具，其搜索功能本意是帮助用户快速获取信息。然而，英国卫报近期报道揭露了Ch
20240619－James-快速鸟瞰并发编程, 呕心沥血整理的架构技术(第3篇) 2401_89821541 架构 java 网络
接口描述Runnablerun()方法没有返回值。Callablecall方法有返回值。FutureFuture是对于具体的Runnable任务或Callable任务的执行结果进行取消、查询是否完成、获取结果。必要时可以通过get方法获取执行结果，该方法会阻塞直到任务返回结果。ExecutorService使用Future作为返回类型。ExecutorServiceexecutorService=
2024年最全（一）大数据---Hadoop整体介绍（架构层）----（组件，并发知识体系大全 2401_84586689 程序员大数据 hadoop 架构
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！Hadoop方案一、大数据介绍============
什么是射频？射频基本架构？ Zebros 架构射频工程笔记
什么是射频？射频系统架构？一、认识射频1、射频信号射频（RadioFrequency），即高频交流变化电磁波的简称，可理解为无线电的代名词，描绘那些依赖无线技术进行通信的系统，特指频率范围在3kHz~300GHz的具有远距离传输能力的高频电磁波。电磁波无处不在，根据频率不同划分成不同领域，从低频到高频依次有：无线电、微波、红外线、可见光、紫外线、x射线、伽马射线等。射频归属于无线电中，再高的的频率
RocketMQ的集群架构是怎样的? java1234_小锋 java java-rocketmq rocketmq 架构
大家好，我是锋哥。今天分享关于【RocketMQ的集群架构是怎样的?】面试题。希望对大家有帮助；RocketMQ的集群架构是怎样的?1000道互联网大厂Java工程师精选面试题-Java资源分享网RocketMQ是阿里巴巴开源的分布式消息中间件，广泛用于处理高吞吐量、高可用的消息队列服务。它的集群架构设计非常注重高可用性、可扩展性和高效性。以下是RocketMQ的集群架构主要组件和工作原理：1.集
20240619－James-快速鸟瞰并发编程, 呕心沥血整理的架构技术(第3篇)(1) 2401_89760309 架构 java 网络
其实功能接口如下接口描述Runnablerun()方法没有返回值。Callablecall方法有返回值。FutureFuture是对于具体的Runnable任务或Callable任务的执行结果进行取消、查询是否完成、获取结果。必要时可以通过get方法获取执行结果，该方法会阻塞直到任务返回结果。ExecutorService使用Future作为返回类型。ExecutorServiceexecutor
Simulink开发项1000例实战专栏--实例69：使用Simulink搭建一个5G NR下行链路物理层功能的仿真模型 xiaoheshang_123 手把手教你学 MATLAB 专栏 MATLAB 开发项目实例 1000 例专栏 simulink
目录基于Simulink的5GNR下行链路物理层功能仿真项目实例1.项目背景2.系统架构2.15GNR下行链路物理层功能3.Simulink仿真模型搭建3.1创建新的Simulink模型3.2搭建波形生成模块3.3搭建信道估计模块3.4搭建同步模块3.5搭建解调与解码模块3.6仿真参数设置4.仿真结果与分析4.1波形生成4.2信道估计4.3同步4.4误码率（BER）分析5.总结具体代码实现：1.数
windows 10 32bit 配置Python编程环境 wangbingfeng0 tools maintenance
确认系统架构点击桌面左下角的搜索按钮，输入cmd运行命令行界面（CommandPrompt）；在命令行界面输入wmicCPUgetDataWidth↩︎，返回的是CPU的架构，64或32位；在命令行界面输入wmicOSgetOSArchitecture↩︎，返回的是Windows操作系统架构，64或32位。确认PowerShell版本PowerShell是Windows下的增强命令行环境，也是我们
rac 架构和原理羽之大公公 oracle 数据库开发 dba mysql
单点数据库VSRAC单节点数据库，如果实例宕机了，如果一个业务链接在实例上面，那么这个业务就中断了。这个时候系统就不具有可用性了，那么这个时候单节点的可用性是很差的。对于RAC来说，和单实例一样，还是一份数据文件，都是相同的存储上面放着oracle的文件，但是是由三个实例共用同一份数据文件。这样的好处是在三个实例之间做了冗余，在上面三个实例当中任意两个坏了业务都可以链接到剩下的一个实例，都可以
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能 tensorflow python
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程在人工智能领域中，算子（Operator）作为深度学习模型的基础执行单元，决定了整个模型的计算性能和结果准确性。随着硬件平台的多样化，如何将第三方深度学习框架中的算子适配到特定的硬件平台变得至关重要。本文将深入探讨如何在TensorFlow框架下开发适配昇腾AI处理器的算子插件，通过解析算子属性映射、数据排布
深入解析CANN算子开发：TBE与AI CPU算子类型及其开发方法全指南快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能
深入解析CANN算子开发：TBE与AICPU算子类型及其开发方法全指南在现代AI计算领域中，高效的算子开发对于优化深度学习模型的推理与训练至关重要。CANN（ComputeArchitectureforNeuralNetworks）作为华为AscendAI处理器的开发平台，提供了两种类型的算子开发支持：TBE算子和AICPU算子。每种算子类型针对不同的计算任务和硬件架构，开发者需要根据具体场景选择
Transformer 架构对比：Dense、MoE 与 Hybrid-MoE 的优劣分析 m0_74823683 面试学习路线阿里巴巴 transformer 架构深度学习
1.LLM基础架构类型DenseTransformerMoE(MixtureofExperts)TransformerHybrid-MoETransformer2.Transformer按照编码方式分类单向自回归模型(如早期GPT系列)双向模型(如BERT)编码器-解码器模型(如BART,T5)DenseTransformerDenseTransformer的优势是什么DenseTransform
深度挖掘：Oracle RAC数据库架构分析与实战攻略拟声的主扬专题数据库 oracle rac 性能优化网络备份
深度挖掘：OracleRAC数据库架构分析与实战攻略本书内容从集群概念入手，深入RAC原理和结构进行分析，结合存储和网络传输知识，全面讲解小机集群数据库RAC的安装示例，探讨RAC的管理和维护，详述备份恢复，并从故障诊断方法展开，细说性能优化的几个方面，再到Oracle最高可用架构的延伸。对其内容详细阅读
使用Sui索引框架支持自定义数据导入 Sui_Network 数据库 web3 大数据区块链网络云计算
Sui索引框架通过强大的数据导入框架提供对Sui链上数据的定制化访问。它允许任何相关软件，无论是在链上还是链下运行，收集原始链上数据和派生数据。利用Sui索引框架创建定制的数据流，开发者可以轻松构建响应链上事件的软件和产品。链上数据流的强大之处区块链数据结构旨在确保交易的完整性，这通常意味着它们没有针对整个历史的随机数据访问进行优化。然而，使用Sui索引框架构建的定制化数据流克服了这一限制，使开发
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key