【CS231n assignment 2022】Assignment 3 - Part 3，Transformer

前言

博客主页：睡晚不猿序程

⌚首发时间：2022.8.19

⏰最近更新时间：2022.8.19

本文由 睡晚不猿序程 原创，首发于 CSDN

作者是蒻蒟本蒟，如果文章里有任何错误或者表述不清，请 tt 我，万分感谢！orz

相关文章目录 ：

【CS231n assignment 2022】Assignment 2 - Part 1，全连接网络的初始化以及正反向传播
【CS231n assignment 2022】Assignment 2 - Part 2，优化器，批归一化以及层归一化
【CS231n assignment 2022】Assignment 3 - Part 1，RNN
【CS231n assignment 2022】Assignment 3 - Part 2，LSTM

文章目录

前言
1. 内容简介
2. Transformer
- 2.1 Transformer 结构
- 2.2 多头注意力机制
- 2.3 小总结
3. Transformer for Image Captioning
- 3.1 Transformer: Multi-Headed Attention
- 3.2 Positional Encoding
- 3.3 Transformer for Image Captioning
3. 总结、预告

1. 内容简介

上一次作业我们完成了 RNN 以及其变种 LSTM，在这次作业中我们将会完成 Transformer，这也是最近几年在 CV 领域用的非常广泛的模型。

2. Transformer

要完成作业，首先需要理解模型，笔者为了理解 Transformer，在作业做到这里之前就已经有看了很多的视频和博客讲述 Transformer 和它的各种变种了，笔者在这里会很感性的讲述一下 Transformer ，因为作者感觉，在作业解答博客中插入大段大段的理论解读不是很现实

2.1 Transformer 结构

首先我们先来看一下 Transformer 的结构图

我愿意称这张图为：Transformer——从入门到直接放弃

我用嘴巴来讲一下这个结构：

首先，Transformer 最开始是应用在 NLP 中的，他的论文《Attention is all you need》中，使用 Transformer 来进行不同语言的翻译，在翻译任务中，一般会采取编码器-解码器的结构，和我们上次的两个作业类似

编码器（左）：把输入的词语变成词向量，然后将其编码
解码器（右）：输入编码信息，然后进行解码，然后输出

Transformer，也就是变形金刚，变形金刚 ~ 随时变形状 ~ ~

我们可以把他想象成，我们输入一个句子，这个句子输入编码器，编码器会把他打散成为零件，接着零件被丢给解码器，解码器会通过说明书，把零件重新组装成句子

我们可以把他脑补成擎天柱变成大卡车的过程~

2.2 多头注意力机制

我这里的描述都会非常的感性，非常浅薄，如果要深入学习，一定要去查阅相关文章！！！

首先我们来讲一下注意力机制，一般来说都会有三个向量来表示，也就是 Q，K，V（Querry，Key，Value），我们可以把数据库的思想放到这里，我们要查询的东西为Q，它的关键字（主键）Key，其值为 Value

Transformer 中，编码器解码器的多头注意力有些许的区别，我先进行讲解然后补充，首先是编码器的

输入数据进行词嵌入转化成向量，然后进行位置嵌入，到这里输入数据就准备完毕了，准备输入的编码器

接下来注意力机制（单头）：

进行线性变换，有三个线性变换，把输入分别变成了Q,K,V矩阵
Q，K矩阵计算相关性，得到一个和 V 大小相同的矩阵
得到的矩阵和 V 进行相乘，得到经过注意力机制的输出

注意力可以让模型明白，翻译的时候，要更关注哪一部分的信息，比如翻译：“ Xiaoming，he like dog”，翻译 he 的时候，模型可能会更关注”Xiaoming“，因为此时 he 代指小明。让模型可以完成这种操作，就是依靠注意力机制

多头注意力：

多头注意力是单头注意力的拓展，单头注意力只有三个线性变换参数，也就是 $W_Q,W_K,W_V$ ，用来生成三个矩阵

而多头注意力也是有三个线性变换，但是每个线性变换用一组参数来生成多个矩阵，比如论文中提出的多头注意力机制，每个变换由8个参数组成，生成8个矩阵，最后矩阵进行拼接，得到最后的注意力输出

讲人话：用只用一个参数来进行映射，也就是说我只用一个工人来干活，有可能不靠谱，如果我用八个工人来干活，那么一个不靠谱那也就无所谓啦

带 mask 的多头注意力：

这个是解码器中需要的，因为我们在训练的时候，我们是把整个训练数据一次性输入进去的

这时候，训练解码器时，一整个句子输入进去，会导致解码器看到原先不应该看到的数据

因为翻译的时候，解码器应该是串行运行的，应该通过上一次的输出和当前的输入判断下一个输入
但是训练时候是并行的，我们一次性输入的句子如果送入注意力机制，那么就会出现错误，因为编码器提前看到了答案，这就麻烦了
所以我们要把接下来的输入遮盖掉，也就是利用一个上三角矩阵来掩盖

2.3 小总结

我在这里对 Transformer 做了一个感性又简短的总结，如果有哪里讲解有问题请大家一定要 tt 我

菜鸡作者也不知道自己的理解会不会有偏差

但是，总而言之，这是一个必须掌握的模型

3. Transformer for Image Captioning

我们正式开始我们的作业吧！手撸 Tr

好吧这次不用手撸了，这次我们大部分都会用到 Pytorch 来实现 Tr 的主要部分

我们在之前的实验可以看出，RNN 非常的强力，但是训练比较慢（因为它的训练是串行的）并且在训练长序列的数据的时候很难。Tr 一下子解决了这两个痛点：

并行训练
可以学习一个长序列的问题

好了，让我们开始吧

3.1 Transformer: Multi-Headed Attention

一上来我们就要完成多头注意力机制，首先先阅读一下作业给的详解吧~

这里的多头注意力机制继承了nn.Module类，我们现在来看一下它的初始化参数

    def __init__(self, embed_dim, num_heads, dropout=0.1):
        """
        Construct a new MultiHeadAttention layer.

        Inputs:
         - embed_dim: Dimension of the token embedding
         - num_heads: Number of attention heads
         - dropout: Dropout probability
        """
        super().__init__()
        assert embed_dim % num_heads == 0

        # We will initialize these layers for you, since swapping the ordering
        # would affect the random number generation (and therefore your exact
        # outputs relative to the autograder). Note that the layers use a bias
        # term, but this isn't strictly necessary (and varies by
        # implementation).
        self.key = nn.Linear(embed_dim, embed_dim)
        self.query = nn.Linear(embed_dim, embed_dim)
        self.value = nn.Linear(embed_dim, embed_dim)
        self.proj = nn.Linear(embed_dim, embed_dim)

        self.attn_drop = nn.Dropout(dropout)

        self.n_head = num_heads
        self.emd_dim = embed_dim
        self.head_dim = self.emd_dim // self.n_head

三个线性变换 query，key，value以及最后输出的线性变换 proj
一个 Dropout 层 attn_drop
使用的头数n_head
词向量的维度emd_dim
每个头的维度head_dim

知道了这些，我们开始完善前向传播，先来看一下相关信息

    def forward(self, query, key, value, attn_mask=None):
        """
        Calculate the masked attention output for the provided data, computing
        all attention heads in parallel.

        In the shape definitions below, N is the batch size, S is the source
        sequence length, T is the target sequence length, and E is the embedding
        dimension.
        N：批次大小
        S:原句子长度
        T：目的句子长度
        E：嵌入维度(类似隐藏状态)

        Inputs:
        - query: Input data to be used as the query, of shape (N, S, E)
        - key: Input data to be used as the key, of shape (N, T, E)
        - value: Input data to be used as the value, of shape (N, T, E)
        - attn_mask: Array of shape (S, T) where mask[i,j] == 0 indicates token
          i in the source should not influence token j in the target.

        Returns:
        - output: Tensor of shape (N, S, E) giving the weighted combination of
          data in value according to the attention weights calculated using key
          and query.
        """
        N, S, E = query.shape
        N, T, E = value.shape
        # Create a placeholder, to be overwritten by your code below.
        output = torch.empty((N, S, E))
        ############################################################################
        # TODO: Implement multiheaded attention using the equations given in       #
        # Transformer_Captioning.ipynb.                                            #
        # A few hints:                                                             #
        #  1) You'll want to split your shape from (N, T, E) into (N, T, H, E/H),  #
        #     where H is the number of heads.                                      #
        #  2) The function torch.matmul allows you to do a batched matrix multiply.#
        #     For example, you can do (N, H, T, E/H) by (N, H, E/H, T) to yield a  #
        #     shape (N, H, T, T). For more examples, see                           #
        #     https://pytorch.org/docs/stable/generated/torch.matmul.html          #
        #  3) For applying attn_mask, think how the scores should be modified to   #
        #     prevent a value from influencing output. Specifically, the PyTorch   #
        #     function masked_fill may come in handy.                              #
        ############################################################################

输入为 q,k,v 三个张量，以及遮盖张量（我们可以知道qkv三个张量是相同的）
它给出了提示
- 把张量从(N,T,E)划分为(N,T,H,E/H)会更加的方便
- 使用torch.matmul函数可以进行批量矩阵乘法，比如(N,H,T,E/H)乘以(N,H,E/H,T)可以产生一个(N,H,T,T)的张量，接下来我们就要用到这个啦
- 使用 pytorch 的masked_fill函数来进行遮盖

有了以上的提示，我们略加思考就可以写出多头注意力了

    def forward(self, query, key, value, attn_mask=None):
        """
        Calculate the masked attention output for the provided data, computing
        all attention heads in parallel.

        In the shape definitions below, N is the batch size, S is the source
        sequence length, T is the target sequence length, and E is the embedding
        dimension.
        N：批次大小
        S:原句子长度
        T：目的句子长度
        E：嵌入维度(类似隐藏状态)

        Inputs:
        - query: Input data to be used as the query, of shape (N, S, E)
        - key: Input data to be used as the key, of shape (N, T, E)
        - value: Input data to be used as the value, of shape (N, T, E)
        - attn_mask: Array of shape (S, T) where mask[i,j] == 0 indicates token
          i in the source should not influence token j in the target.

        Returns:
        - output: Tensor of shape (N, S, E) giving the weighted combination of
          data in value according to the attention weights calculated using key
          and query.
        """
        N, S, E = query.shape
        N, T, E = value.shape
        # Create a placeholder, to be overwritten by your code below.
        output = torch.empty((N, S, E))
        ############################################################################
        # TODO: Implement multiheaded attention using the equations given in       #
        # Transformer_Captioning.ipynb.                                            #
        # A few hints:                                                             #
        #  1) You'll want to split your shape from (N, T, E) into (N, T, H, E/H),  #
        #     where H is the number of heads.                                      #
        #  2) The function torch.matmul allows you to do a batched matrix multiply.#
        #     For example, you can do (N, H, T, E/H) by (N, H, E/H, T) to yield a  #
        #     shape (N, H, T, T). For more examples, see                           #
        #     https://pytorch.org/docs/stable/generated/torch.matmul.html          #
        #  3) For applying attn_mask, think how the scores should be modified to   #
        #     prevent a value from influencing output. Specifically, the PyTorch   #
        #     function masked_fill may come in handy.                              #
        ############################################################################
        # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

        Q = self.query(query)
        K = self.key(key)
        V = self.value(value)
        Q = Q.reshape((N, S, self.n_head, self.head_dim)).permute(0, 2, 1, 3)
        K = K.reshape((N, T, self.n_head, self.head_dim)).permute(0, 2, 1, 3)
        V = V.reshape((N, T, self.n_head, self.head_dim)).permute(0, 2, 1, 3)  # (N,H,T,E/H)

        energy = torch.matmul(Q, K.permute(0, 1, 3, 2)) / math.sqrt(self.head_dim)  # (N,H,T,T)

        if attn_mask is not None:
            energy.masked_fill_(attn_mask == 0, -math.inf)
        attention = torch.softmax(energy, dim=3)

        attention = self.attn_drop(attention)
        output = torch.matmul(attention, V)  # (N,H,T,E/H)
        output = output.permute(0, 2, 1, 3).contiguous()  # (N,T,H,E/H)
        output = output.reshape((N, S, self.emd_dim))
        output = self.proj(output)

        # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        ############################################################################
        #                             END OF YOUR CODE                             #
        ############################################################################
        return output

代码详解

多头注意力的八个头被放在一个大矩阵里面，所以只需要计算一次，但是需要我们手动把八个头给划分出来
划分出来八个头，使用torch.matmul进行批量矩阵乘法，计算出相关性
使用masked_fill_函数（这里的"_"表示修改自身）来进行填充，attn_mask==0的位置就是需要填充的位置，填充进负无穷大，后面使用 softmax 就会得到零
八个头进行拼接的时候，需要先用permute进行维度交换，然后才进行拼接，不然会出错
拼接完成后，经过最后的线性变换后输出

编写代码完成，来看一下最后得出的结果

误差在范围内，正确

3.2 Positional Encoding

在这里我们要完成 Tr 的位置嵌入相关代码

作者对每个词向量都进行了位置嵌入，使用的公式如下：
$\begin{cases} \text{sin}\left(i \cdot 10000^{-\frac{j}{d}}\right) & \text{j是偶数} \\ \text{cos}\left(i \cdot 10000^{-\frac{(j-1)}{d}}\right) & \text{otherwise} \\ \end{cases}$
这样子会得到一个位置向量，接下来把他和输入的X进行相加，得到经过位置嵌入的输出

我们可以使用列表推导来完成位置嵌入矩阵的初始化

class PositionalEncoding(nn.Module):
    """
    Encodes information about the positions of the tokens in the sequence. In
    this case, the layer has no learnable parameters, since it is a simple
    function of sines and cosines.
    """

    def __init__(self, embed_dim, dropout=0.1, max_len=5000):
        """
        Construct the PositionalEncoding layer.

        Inputs:
         - embed_dim: the size of the embed dimension
         - dropout: the dropout value
         - max_len: the maximum possible length of the incoming sequence
        """
        super().__init__()
        self.dropout = nn.Dropout(p=dropout)
        assert embed_dim % 2 == 0
        # Create an array with a "batch dimension" of 1 (which will broadcast
        # across all examples in the batch).
        pe = torch.zeros(1, max_len, embed_dim)
        ############################################################################
        # TODO: Construct the positional encoding array as described in            #
        # Transformer_Captioning.ipynb.  The goal is for each row to alternate     #
        # sine and cosine, and have exponents of 0, 0, 2, 2, 4, 4, etc. up to      #
        # embed_dim. Of course this exact specification is somewhat arbitrary, but #
        # this is what the autograder is expecting. For reference, our solution is #
        # less than 5 lines of code.                                               #
        ############################################################################
        # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

        index = [i for i in range(max_len)]
        even_ind = [i for i in range(embed_dim)if i % 2 == 0]
        odd_ind = [i for i in range(embed_dim)if i % 2 != 0]
        pe[:, :, even_ind] = torch.tensor(
            [[math.sin(i*pow(10000, -j/embed_dim))for j in even_ind]for i in index])
        pe[:, :, odd_ind] = torch.tensor(
            [[math.cos(i*pow(10000, -(j-1)/embed_dim))for j in odd_ind]for i in index])

        # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        ############################################################################
        #                             END OF YOUR CODE                             #
        ############################################################################

        # Make sure the positional encodings will be saved with the model
        # parameters (mostly for completeness).
        self.register_buffer('pe', pe)

接着修改前向传播代码，将位置嵌入的值加上去就可以啦

    def forward(self, x):
        """
        Element-wise add positional embeddings to the input sequence.

        Inputs:
         - x: the sequence fed to the positional encoder model, of shape
              (N, S, D), where N is the batch size, S is the sequence length and
              D is embed dim
        Returns:
         - output: the input sequence + positional encodings, of shape (N, S, D)
        """
        N, S, D = x.shape
        # Create a placeholder, to be overwritten by your code below.
        output = torch.empty((N, S, D))
        ############################################################################
        # TODO: Index into your array of positional encodings, and add the         #
        # appropriate ones to the input sequence. Don't forget to apply dropout    #
        # afterward. This should only take a few lines of code.                    #
        ############################################################################
        # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

        pe_x = x+self.pe[:, 0:S, 0:D]
        output = self.dropout(pe_x)

        # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        ############################################################################
        #                             END OF YOUR CODE                             #
        ############################################################################
        return output

代码验证

误差范围内，完美

3.3 Transformer for Image Captioning

在这里我们就要完成完全的 Tr了，我们打开文件cs231n/classifiers/transformer.py ，查看CaptioningTransformer 类

我们需要完善前向传播算法

    def forward(self, features, captions):
        """
        Given image features and caption tokens, return a distribution over the
        possible tokens for each timestep. Note that since the entire sequence
        of captions is provided all at once, we mask out future timesteps.

        Inputs:
         - features: image features, of shape (N, D)
         - captions: ground truth captions, of shape (N, T)

        Returns:
         - scores: score for each token at each timestep, of shape (N, T, V)
        """
        N, T = captions.shape
        # Create a placeholder, to be overwritten by your code below.
        scores = torch.empty((N, T, self.vocab_size))
        ############################################################################
        # TODO: Implement the forward function for CaptionTransformer.             #
        # A few hints:                                                             #
        #  1) You first have to embed your caption and add positional              #
        #     encoding. You then have to project the image features into the same  #
        #     dimensions.                                                          #
        #  2) You have to prepare a mask (tgt_mask) for masking out the future     #
        #     timesteps in captions. torch.tril() function might help in preparing #
        #     this mask.                                                           #
        #  3) Finally, apply the decoder features on the text & image embeddings   #
        #     along with the tgt_mask. Project the output to scores per token      #
        ############################################################################
        # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

        caption_embed = self.positional_encoding(self.embedding(captions))
        img_vec = self.visual_projection(features)

        mask = torch.ones((T, T), dtype=bool)
        mask = torch.tril(mask)

        img_vec = torch.unsqueeze(img_vec, 1)

        output = self.transformer(caption_embed, img_vec, mask)
        scores = self.output(output)

        # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        ############################################################################
        #                             END OF YOUR CODE                             #
        ############################################################################

        return scores

代码解析

首先观察提示，我们先将句子转化成词向量，然后把图片特征转化成图片限量
mask可以通过torch.tril函数转化成下三角矩阵
要给图片向量增加一个维度

到这里我们就完成了 Tr 的主要部分了，接下来进行模型的验证，用小数据来让他过拟合

我们可以看出最后得到的损失小于0.03

接下来我们再测试一下它的性能，发现训练数据拟合的不错，但是验证数据就不太行了

3. 总结、预告

在这次作业中，我们成功实现了 Tr 的关键部分，作业二的部分博主打算等作业三部分更新完成再补全iai

接下来将会实现 GANs 的部分啦

【计算机组成原理】2.3.1_1 浮点数的表示 Skywalker玄默冲虚考研面试学习方法
2.3.1_1浮点数的表示00:00各位同学大家好。通过之前几个小节的学习，我们已经知道了定点数怎么在计算机里表示，包括定点整数和定点小数。从这个小节开始，我们要学习浮点数在计算机里的表示和运算。这个小节中我们先介绍浮点数如何表示，我们会介绍浮点数它有什么作用，还有一个基本的原理。另外考试中常考的一个问题是浮点数的规格化，之后我们还会简单的介绍浮点数的表示范围相关的问题，这方面的内容其实已经从考研
Docker--容器编排小李学不完 Docker容器技术 docker 容器笔记
前言：本博客仅作记录学习使用，部分图片出自网络，如有侵犯您的权益，请联系删除本节目录如下一、DockerCompose入门1.1、为什么要使用DockerCompose部署容器1.2、DockerCompose的项目概念1.3、DockerCompose的工作机制1.4、DockerCompose的特点1.5、DockerCompose的应用场景1.6、使用DockerCompose的基本步骤二、
一本读懂数据库发展史的书人邮异步社区数据库
数据库及其存储技术，一直以来都是基础软件的主力。数据库系统的操作接口标准，也是应用型软件的重要接口，关系重大。作为最“有感”的系统软件，数据库的历史悠久、品类繁多、创新活跃。对数据库历史发展的介绍，有利于新一代技术人员的学习和传承；对未来演进的探究，有利于数据库开发者的思考和实践。如果想对当今数据库体系有一个深入的了解，最好学习一下数据库的发展史。这对于在我们脑海里建立数据库体系的知识大厦大有助益
Linux云计算学习笔记08 （CentOS 进程管理）墨影萧萧 linux 学习笔记 centos 运维云计算服务器
一.进程的定义程序：文件，一般是二进制，静态/usr/sbin/httpd，/usr/sbin/sshd程序是二进制文件（面试题之一）进程：是程序运行的过程，动态，有生命周期的，可以产生和消亡的(进程是已启动的可执行程序的运行实例,实例即运行可执行程序)。线程：线程是进程之内独立执行的一个单元。对于操作系统而言，其调度单元是线程；一个进程至少包括一个线程，通常将该线程称为主线程；一个进程从主线程的
一天果然越来越好
1.晨梦做梦了。梦到解题，学习数学。有个老教授，讲数学知识点，通俗易懂。你不懂的，他可以换种方式，变得极其简单让你一听就懂！真是大师级人物。老教授说，学习什么时候都不嫌晚！你只要踏踏实实持续不断学习2年，就能真正掌握一门学科！学习，浸盆式。不是见干见湿的学习方式。2.简笔画，治愈系。看了绘画的文章，触发灵感。自己可以为温暖的植物小铺，设计一个吉祥物。记录，表达心情。看不同层面的人的生活。宣传品牌温
果果有故事201天果爸性教育
假期天天是两点一线的生活，和你一起的时间就早上2小时，我要正确这两小时高质量。忘记时间，忘记其他事情，好好的享受当下，向你学习。图片发自App学会了胜利的姿势，早上开心的做这个动作，嘴里喊“耶”。每学会一种技能你都非常高兴。爸爸也替你高兴。
虚拟机安装hadoop，hbase（单机伪集群模式）流~星~雨大数据相关 hadoop hbase 大数据
虚拟机安装Hadoop，Hbase工作中遇到了大数据方面的一些技术栈，没有退路可言，只能去学习掌握它，就像当初做爬虫一样（虽然很简单），在数据爆发的现在，传统的数据库mysql，oracle显然在处理大数据量级的数据时显得力不从心，所以有些特定的业务需要引进能够处理大数据量的数据库，hadoop提供了分布式文件系统（HDFS）来存储数据，又提供了分布式计算框架（mapreduce）来对这些数据进行
剪了好长时间的视频终于发布了要改变命运的人
就是前天讲的拍的那个长视频，剪了大概一个多星期了，老是剪不好，心里一发急，心情还不好，前天才剪到了9分多钟，，昨天又剪了一天，才到8分多钟，又配下音，又配上字幕，一直搞到夜里2点多才发布。听人家说剪视频两三个小时就剪成了，我每个视频差不多一天都剪不好。有时拍不好，都拍170多分钟，有时两天都剪不好。记得在西瓜视频学习拍VLOg的时候，也是拍的很长，一个视频也是剪几天，后来学会拍ⅤLog，视频就拍的
十月，遇见崭新的自己 sharon___
十月，是个超级忙碌，超级充实的一个月。本月成长复盘01读书，写作收获：本月在格格读书成长营完成2本书的计划，读了吴军老师的《见识》和成甲老师的《好好学习》。写了7篇文章，完成1篇书评，已发豆瓣。不足：读完书还没有写践行清单的习惯，有也只写了几次就放弃了，原因是清单上的项目不够量化，导致有心无力的状况出现，重新调整，按SMART原则来制定。02早起，健身收获：本月早起30天，有一天国庆外出，加上旅途
2022-05-07 星期六多云恶毒女配的角色 lemon家的小苹果
没有人爱，没有其他人优秀，没有丰厚的物质条件。仿佛这种状态就是就是我们在剧中常见到的恶毒女配的生活条件，向我们完整诠释了“可恨之人必有可怜之处”的悲惨境遇。发生在身边的一些事，发生在心里的想法，都让我不自觉的将自己与女配的角色联系起来。还记得昨天的任务，老师让我们将自己这段时间的论文成果共享在学习群里。我在欣赏了自己的成果后，上交它，带着满心的欢喜走在去食堂的路上，想着，这回估计没有人能够做的比我
《写作高手都在用的黄金法则》 da1b69d3f531
《写作高手都在用的黄金法则》刻意练习：同样是天天写文章，有人写成了高手，有的人还在原地踏步。写作精进：黄金法则，多读/多写/多动多读：多读书才能全面构建你的知识体系。（读书平台有很多，一定要多读，电子书，纸质书籍）阅读理解能力：读懂作者的意思是阅读，完成形象的重构是理解。阅读理解力影响着其他学科的学习。三个维度：速度/广度/深度。速度，提高学习效率，取决于人脑接受信息的带宽及人眼识别文字图像的速度
2020-04-04 啊宁_9332
姓名：邓宁宁公司：蔚蓝时代实业有限公司【日精进打卡第608天】【知-学习】大纲《0遍》大学《0遍》【经典名句分享】1.快乐总与宽厚的人相伴，财富总与诚信的人相伴，聪明总与高尚的人相伴，魅力总与幽默的人相伴，健康总与快乐的人相伴！【行-实践】1.日常工作【省-觉悟】1.珍惜生命中遇到所有的人2.身体是革命的本钱！【感谢】1.感谢父母赐予生命！感谢老公一路相伴！【发愿】要把儿子接到跟前来！今日1善,累
分享：如何帮助小学生提分新姐是老师
家长最关心的当然是孩子的成绩，然而如果没有听力和口语的突破。孩子即便在小学能考90多分上了初中，尤其是初二，以后往往会出现成绩的滑铁卢。可家长们往往盯着“成绩”又从来不给孩子创造听、说、读英语的环境。大量的小学生家长整天抓着孩子做两件事情：背单词、学语法。殊不知，这样的方法是最低效的学习方法。单词和语法当然重要，问题是如何学单词和语法呢？就像我们学中文一样，学英语也需要经过听、说、读、写的过程：小
【多变量输入超前多步预测】基于Transformer的光伏功率预测研究（Matlab代码实现）科研_G.E.M. transformer matlab 深度学习
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、Transformer模型概述二、多变量输入三、超前多步预测四、实现步骤五、优势与挑战优势：挑战：六、结论与展望2运行结果3参考文献4Matlab代码、数据⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是
阿里云Apsara Clouder专项技能认证：实现调用API IT菌
阿里云ApsaraClouder专项技能认证之实现调用API接口，此项认证的功能要求开发者熟悉使用阿里云市场的API接口调用，关于API开发可见阿里云帮助文档-应用服务-API网关，里面有详细的基于云市场开发与调用API的文档和视频，想要做一点东东的童鞋还是以这里为准吧，毕竟实战才是真理。话又说回来，《ApsaraClouder专项技能认证：实现调用API接口》这门认证可作为开发者刚从事API学习
《给教师的68条写作建议》读书记录与收获若冰若晴
在张老师的阅读日更挑战群中看到了大厦书系推出的2022大厦寒假共读活动。活动内容是共读吴松超老师的《给教师的68条写作建议》，要求至少连续十天打卡，才算完成共读活动。这本书我早有耳闻，也在网上看过这本书的目录，很吸引我。想写东西总是无从下手的我很想通过这本书学习点干货，想等手里这几本书读完了再买来学习，于是迟迟没有下手。前天去上晚自习的时候，在校园里碰到张老师，张老师问我想不想参加大厦书系的共读活
2023-09-15幸福日记99 静心love
1.感恩自己早起，今天因为凌晨来好事，早上5点半醒来上个厕所身体还有些乏，一不小心就眯了一个小时。6点20才起来，不过起床后精神还是挺不错的2.感恩自己烧水接水间隙放松自己的肩膀，运动一下肩膀放松了很多3.感恩自己阅读半个小时，学习博多的好习惯，慢慢践行这些习惯助力自己早日实现财富自由4.感恩自己默默背诵羊皮卷第一卷，读着读着内心能量慢慢升起5.感恩自己早上赞美大宝，欣赏大宝的美丽自信笑容6.感恩
我的白月光不见了坚强的小疯子
初见时哦算了我与她没有初见我们是同学我注意到她的那天她很活泼也很可爱阳光透过窗户照到她的头发上面容上更为她披上金色的光辉煞是动人人未动心已动就算这世界让我重新来过怕是我也无法好好保护你吧二零一二年面为你和你闺蜜的一句话气的我直哭我直接回家了每一个坏男孩子或许都喜欢学习好的女生我也不例外只是我从来没想过会分开和失去尽管都不曾拥有我和她应该没有共同记忆的吧除了后来我的出糗五年级读完后因为一些原因我到乡
建立写作素材库野象小Z
今天是写作100天的第11天。每天的写作课程潇洒姐都会给我们引导，然后布置任务，可以按自己的计划写作，没有写作计划可以直接完成布置的任务。我看具体情况而定完成，要是布置的任务有启发或者共同感，我就按布置的计划写，要是没有，就按自己的计划。今天的学习，我才知道，原来写作也需要建立素材库，把那些转瞬即逝的灵感都“捕捉”到素材库里，用时就去调用。多么有效又方便呀！以前我总觉得记忆会记住那些想要记住的瞬间
微信小程序学习记录（2）视图层之wxml（数据绑定大括号，wx:for,wx:if） Spider_man_ 微信小程序
1，数据绑定WXML中的动态数据均来自对应Page的data。用双大括号将变量包起来，可以作用于(参考：https://www.w3cschool.cn/weixinapp/weixinapp-data.html)内容{{message}}Page({data:{message:'HelloMINA!'}})组件属性（需要在双引号之内）Page({data:{id:0}})控制属性（需要早双引号之
生命传记——孩子的五福人生规划觉察沚洋
姓名：余沚洋团名：5团第几天日记：第15天（11月9日）我今日觉察孩子的颜色优势与劣势的是（绿黄蓝橙）：蓝色我是如何赞美（或者包容）孩子的：包容他自己在家学习，没有去学校，给他时间调整好焦虑状态。我今日觉察孩子的四力模型优势和劣势（意志力、情感力、思考力、使命力）是什么：情感力、思考力、意志力我怎么发现的：1.关于孩子高考的承诺书，报名信息确认单，这两个表还是及时确认和认真填写。他虽然还在受到焦虑
感恩日记day5 海纳zj
一优点1.能够及时自我觉察要好好照顾自己2.始终有一颗积极上进的心3.队友出差自己带两个孩子很累但依然努力给自己保留时间续杯4.不再过度难为自己能够尽量接纳自己允许自己焦虑浮躁犯错5.爱上整洁每天都会坚持整理房间6.允许自己停下脚步休息7.善于学习和观察别人的长处二.积极的事情1.和孩子们去找了鸽子蛋摘了杏子2.陪小贤亲子阅读3.起床后玩了游戏孩子们超级开心4.和老公进行了一次关于我们现状的沟通5
ASP.NET(C#)对接验证码短信接口DEMO示例樱桃桃
学习编程得第N天，发现一个超简单验证码短信接口对接DEMO示例步骤1.注册互亿无线账号2.查找APIID和APIKEY3.代码的书写注册互亿无线账号网站：http://user.ihuyi.com/?JA9Ewr查找APIID和APIKEY'注意事项：'（1）调试期间，请使用用系统默认的短信内容：您的验证码是：【变量】。请不要把验证码泄露给其他人。usingSystem;usingSystem.D
2018-07-14 莫心莫肺
姓名：魏正君《六项精进》第270期感谢2组公司：绵阳大北农农牧科技有限公司【日精进打卡第361天】【知～学习】背诵《大学》1遍，累计510遍。背诵《六项精进大纲》1遍，累计510遍。【经典名句分享】爱出者爱返，福往者福来。己所不欲，勿施于人。己所欲者，慎施于人。人品是一个杠杆，它能够成倍的放大你的价值，也能成倍减少你的价值。【行～实践】1、修身：早起。2、齐家：无。3、建功：今日拜访普安冉幺幺15
04月03日|Day96|每日复盘哆啦A宏
04月03日|Day96|每日复盘【04月03日我做了什么】01、05点30分准时起床；02、称体重，相比04月02日-0.6斤；03、《好好学习》P213-P300阅读；04、羊皮卷二Day4语音朗读；05、论语第27集Day27语音朗读；06、10分钟极光英语Day38/Day180；07、佛学功课：药师佛号1080声+金刚经1部/18/108部；08、每日一本樊登读书《哲学起步》1.5倍速2
自然语言处理系列四十五》Elasticsearch搜索引擎》Elasticsearch入门及技术原理陈敬雷-充电了么-CEO兼CTO 搜索引擎自然语言处理 elasticsearch ai chatgpt gpt 人工智能
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列四十五Elasticsearch搜索引擎》Elasticsearch入门及技术原理Elasticsearch安装部署和使用总结自然语言处理系列四十五Elasticsearch搜索引擎》Elasticsearch入门及技术原理
自然语言处理系列四十二》新词发现与短语提取》新词发现》代码实战陈敬雷-充电了么-CEO兼CTO 自然语言处理人工智能 nlp ai chatgpt gpt java
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列四十二新词发现》代码实战短语提取算法原理总结自然语言处理系列四十二新词发现》代码实战新词发现是NLP的基础任务之一，通过对已有语料进行挖掘，从中识别出新词。上一篇文章已经对新词发现做了详细介绍，下面展示代码，HanLP工具提
3.7资深管理人日课：君子与小人之辩姜杨Ada
学习不是学完就结束，而要不断的温习，在不同的阶段温习曾经学过的同一个东西，都会有不一样的见解。君子和小人，我的理解就是正直的人和心怀不轨的人，实际现在小人有时候更多的形容是普通人。作为管理者一定要懂得识人，有时候并不是夸夸其谈的人就是好的，也不是默默无闻的人就是不聪明的，要透过表面去看本质。
2022-6-19晨间日记浏河边的浪荡汉子
今天是什么日子起床：5:30就寝：22:40天气：晴热心情：还凑合纪念日：普通的周日，中考最后一天任务清单昨日完成的任务，最重要的三件事：1、备课＆上课2、阅读3、写作改进：敢于开口，大声说话习惯养成：早睡早起，吃早饭周目标·完成进度每天一篇晨间日记，一篇公开发布文章两篇文章草稿阅读至少一个章节（或至少100页）学习·信息·阅读阅读《北京的人力车夫》上的大神文章健康·饮食·锻炼晚餐少吃，一碗白粥，
中公考研集训营学习，打卡 1／4 新生李权
每个单词，都是用金山词霸小程序，查出来的。没必要高估，查单词的作用，因为查完就忘，所以得查100遍。嗯。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb