chnyi6_ya

87.序列到序列学习（seq2seq）以及代码实现

1. 机器翻译

2. Seq2Seq

双向RNN可以做encoder，但不能做decoder。

3. 编码器-解码器细节

4. 训练

5. 衡量生成序列的好坏的BLEU

上面的公式既加入了段序列的惩罚项，又加入了更难出现的长序列的高权重。

6. 总结：

Seq2seq从一个句子生成另一个句子
编码器和解码器都是RNN
将编码器最后时间隐状态来初始解码器隐状态来完成信息传递
常用BLEU来衡量生成序列的好坏

7. 代码实现

下面，我们动手构建 seq2seq的设计，并将基于“英－法”数据集来训练这个机器翻译模型。

import collections
import math
import torch
from torch import nn
from d2l import torch as d2l

7.1 编码器

现在，来实现循环神经网络编码器。注意，我们使用了嵌入层（embedding layer） 来获得输入序列中每个词元的特征向量。嵌入层的权重是一个矩阵，其行数等于输入词表的大小（vocab_size），其列数等于特征向量的维度（embed_size）。对于任意输入词元的索引，嵌入层获取权重矩阵的第行（从 0 开始）以返回其特征向量。另外，本文选择了一个多层门控循环单元来实现编码器。

class Seq2SeqEncoder(d2l.Encoder):
    """用于序列到序列学习的循环神经网络编码器"""
    def __init__(self, vocab_size, embed_size, num_hiddens, num_layers,
                 dropout=0, **kwargs):
        super(Seq2SeqEncoder, self).__init__(**kwargs)
        # 嵌入层
        # embed是word2vec的思想，把字典里one-hot编码的字或者词，变成预训练（可能需要微调）的词向量
        # embed就是将word映射到向量空间
        self.embedding = nn.Embedding(vocab_size, embed_size)
        # 第一个参数是inputs大小，在之前一些代码中传入的是vocab_size或者len（vocab），是词表的大小
        # 但是在这里因为使用了nn.Embedding将词表的大小改变成了embed_size，再作为输入
        self.rnn = nn.GRU(embed_size, num_hiddens, num_layers,
                          dropout=dropout)

    def forward(self, X, *args):
        # 输出'X'的形状：(batch_size,num_steps,embed_size)
        X = self.embedding(X)
        # 在循环神经网络模型中，第一个轴对应于时间步
        # 把batch_size换到中间，把num_steps换到第一个轴
        # 转换为（时间步数量，批量大小，词表大小）
        X = X.permute(1, 0, 2)
        # 如果未提及状态，则默认为0

        # 输出output是每一个时间步的最后一层RNN的输出，根据图去理解，最后一层RNN往上的输出
        # state： 在最后一个时刻所有的层的输出，根据图去理解，是每一层最右边的输出
        output, state = self.rnn(X)
        # output的形状:(num_steps,batch_size,num_hiddens)
        # state的形状:(num_layers,batch_size,num_hiddens)
        return output, state

下面，我们实例化上述编码器的实现：我们使用一个两层门控循环单元编码器，其隐藏单元数为 16 。给定一小批量的输入序列X（批量大小为 4 ，时间步为 7 ）。在完成所有时间步后，最后一层的隐状态的输出是一个张量（output由编码器的循环层返回），其形状为（时间步数，批量大小，隐藏单元数）。

Pytorch：model.train()和model.eval()用法和区别，以及model.eval()和torch.no_grad()的区别

encoder = Seq2SeqEncoder(vocab_size=10, embed_size=8, num_hiddens=16,
                         num_layers=2)
encoder.eval() # 在eval模式下，dropout不会生效
X = torch.zeros((4, 7), dtype=torch.long)
output, state = encoder(X)
output.shape

运行结果：

由于这里使用的是门控循环单元，所以在最后一个时间步的多层隐状态的形状是（隐藏层的数量，批量大小，隐藏单元的数量）。如果使用长短期记忆网络，state中还将包含记忆单元信息。

state.shape

运行结果：

7.2 解码器

当实现解码器时，我们直接使用编码器最后一个时间步的隐状态来初始化解码器的隐状态。这就要求使用循环神经网络实现的编码器和解码器具有相同数量的层和隐藏单元。为了进一步包含经过编码的输入序列的信息，上下文变量在所有的时间步与解码器的输入进行拼接(concatenate)。为了预测输出词元的概率分布，在循环神经网络解码器的最后一层使用全连接层来变换隐状态。

class Seq2SeqDecoder(d2l.Decoder):
    """用于序列到序列学习的循环神经网络解码器"""
    def __init__(self, vocab_size, embed_size, num_hiddens, num_layers,
                 dropout=0, **kwargs):
        super(Seq2SeqDecoder, self).__init__(**kwargs)
        # decoder在模型上和encoder是一样的
        # decoder有自己的embedding层，不能和encoder共享，因为词汇都不一样
        self.embedding = nn.Embedding(vocab_size, embed_size)
        # 这里的输入是embed_size + num_hiddens
        # 并且假设了encoder隐藏层大小和decoder的隐藏层大小一样
        self.rnn = nn.GRU(embed_size + num_hiddens, num_hiddens, num_layers,
                          dropout=dropout)
        # decoder有输出层
        self.dense = nn.Linear(num_hiddens, vocab_size)

    def init_state(self, enc_outputs, *args):
      # enc_outputs是output、state
      # enc_outputs[1] 就是encoder输出的state
        return enc_outputs[1]

    def forward(self, X, state):
        # 输出'X'的形状：(batch_size,num_steps,embed_size)
        X = self.embedding(X).permute(1, 0, 2)

        # context是上下文信息
        # state是最后一个时刻的所有RNN层的隐藏状态，也就是图中最后一竖的H
        # state[-1]就是最后一个时刻的最后一层RNN的输出，也就是图中右上角的H
        # 那个右上角的H包括了所有浓缩的信息，把它拿到之后，重复几次，
        # 重复成decoder输入的长度，每个时刻都重复一次
        # 广播context，使其具有与X相同的num_steps
        # 从另一个角度理解为：repeat操作增加通道数，这里把二位矩阵扩充到三维，增加了seq维
        context = state[-1].repeat(X.shape[0], 1, 1)
        # decoder中RNN的输入是当前embedding的输出加上encoder传过来的上下文信息，
        # 虽然state已经传过来了，但是觉得不够，还要把最后那个时刻context和embedding拼在一起作为输入
        # 这也是为什么decoder的RNN的输入是embed_size + num_hiddens
        X_and_context = torch.cat((X, context), 2)
        output, state = self.rnn(X_and_context, state)
        output = self.dense(output).permute(1, 0, 2)
        # output的形状:(batch_size,num_steps,vocab_size)
        # state的形状:(num_layers,batch_size,num_hiddens)
        return output, state

下面，我们用与前面提到的编码器中相同的超参数来实例化解码器。如我们所见，解码器的输出形状变为（批量大小，时间步数，词表大小），其中张量的最后一个维度存储预测的词元分布。

decoder = Seq2SeqDecoder(vocab_size=10, embed_size=8, num_hiddens=16,
                         num_layers=2)
decoder.eval()
state = decoder.init_state(encoder(X))
output, state = decoder(X, state)
# 输出形状为（批量大小，时间步数，词表大小）
# 对每一个样本的每一个时刻都做一个输出
# state的形状为（层数，批量大小，隐藏层大小）
output.shape, state.shape

运行结果：

7.3 损失函数

在每个时间步，解码器预测了输出词元的概率分布。类似于语言模型，可以使用softmax来获得分布，并通过计算交叉熵损失函数来进行优化。回想一下machine_translation中，特定的填充词元被添加到序列的末尾，因此不同长度的序列可以以相同形状的小批量加载。但是，我们应该将填充词元的预测排除在损失函数的计算之外。

为此，我们可以使用下面的sequence_mask函数，通过零值化屏蔽不相关的项，以便后面任何不相关预测的计算都是与零的乘积，结果都等于零。例如，如果两个序列的有效长度（不包括填充词元）分别为 1 和 2 ，则第一个序列的第一项和第二个序列的前两项之后的剩余项将被清除为零。

def sequence_mask(X, valid_len, value=0):
    """在序列中屏蔽不相关的项"""
    maxlen = X.size(1)
    mask = torch.arange((maxlen), dtype=torch.float32,
                        device=X.device)[None, :] < valid_len[:, None]
    X[~mask] = value
    return X

X = torch.tensor([[1, 2, 3], [4, 5, 6]])
sequence_mask(X, torch.tensor([1, 2]))

我们还可以使用此函数屏蔽最后几个轴上的所有项。如果愿意，也可以使用指定的非零值来替换这些项。

X = torch.ones(2, 3, 4)
sequence_mask(X, torch.tensor([1, 2]), value=-1)

现在，我们可以通过扩展softmax交叉熵损失函数来遮蔽不相关的预测。最初，所有预测词元的掩码都设置为1。一旦给定了有效长度，与填充词元对应的掩码将被设置为0。最后，将所有词元的损失乘以掩码，以过滤掉损失中填充词元产生的不相关预测。

class MaskedSoftmaxCELoss(nn.CrossEntropyLoss):
    """带遮蔽的softmax交叉熵损失函数"""
    # pred的形状：(batch_size,num_steps,vocab_size)
    # label的形状：(batch_size,num_steps)
    # valid_len的形状：(batch_size,)
    def forward(self, pred, label, valid_len):
        # 生成和label形状一样全1的矩阵
        weights = torch.ones_like(label)
        # 把有效的长度保留下来，其他变为0
        weights = sequence_mask(weights, valid_len)
        # reduction定义为none，就不会对loss求和或者求平均
        self.reduction='none'
        # 这里loss调用的是父类函数，其实super中的内容可以删掉
        # 在pytorch中的MaskedSoftmaxCELoss规定要把vocab_size放在第2个维度
        unweighted_loss = super(MaskedSoftmaxCELoss, self).forward(
            pred.permute(0, 2, 1), label)
        # unweighted_loss * weights 会使得有效的地方留下来，其他为0
        # dim=1，就是对每个句子取平均
        weighted_loss = (unweighted_loss * weights).mean(dim=1)
        return weighted_loss

我们可以创建三个相同的序列来进行代码健全性检查，然后分别指定这些序列的有效长度为 4 、 2 和 0 。结果就是，第一个序列的损失应为第二个序列的两倍，而第三个序列的损失应为零。

loss = MaskedSoftmaxCELoss()
# 3是批量大小，4是时间步数，10是每个单词向量的维度
# torch.tensor([4, 2, 0]：第一个样本所有都是valid，第二个样本只有前两个是valie
# 最后一个样本全都不是valid
loss(torch.ones(3, 4, 10), torch.ones((3, 4), dtype=torch.long),
     torch.tensor([4, 2, 0]))

运行结果：

7.4 训练

在下面的循环训练过程中，特定的序列开始词元（“< bos>”）和原始的输出序列（不包括序列结束词元“< eos>”）拼接在一起作为解码器的输入。这被称为强制教学（teacher forcing），因为原始的输出序列（词元的标签）被送入解码器。或者，将来自上一个时间步的预测得到的词元作为解码器的当前输入。

def train_seq2seq(net, data_iter, lr, num_epochs, tgt_vocab, device):
    """训练序列到序列模型"""
    def xavier_init_weights(m):
        if type(m) == nn.Linear:
            nn.init.xavier_uniform_(m.weight)
        if type(m) == nn.GRU:
            for param in m._flat_weights_names:
                if "weight" in param:
                    nn.init.xavier_uniform_(m._parameters[param])

    # net就是encoder-decoder
    net.apply(xavier_init_weights)
    net.to(device)
    optimizer = torch.optim.Adam(net.parameters(), lr=lr)
    loss = MaskedSoftmaxCELoss()
    net.train()
    animator = d2l.Animator(xlabel='epoch', ylabel='loss',
                     xlim=[10, num_epochs])
    for epoch in range(num_epochs):
        timer = d2l.Timer()
        metric = d2l.Accumulator(2)  # 训练损失总和，词元数量
        for batch in data_iter:
          # batch中有源句子，源句子的valid_len，目标句子，目标句子的valid_len
            optimizer.zero_grad()
            X, X_valid_len, Y, Y_valid_len = [x.to(device) for x in batch]
            # bos：begin of sentence：源句子要翻译需要这个标志
            bos = torch.tensor([tgt_vocab['']] * Y.shape[0],
                          device=device).reshape(-1, 1)
            # dec_input 就是吧bos和Y（target）里面的除最后一项组合在一起
            dec_input = torch.cat([bos, Y[:, :-1]], 1)  # 强制教学
            # net的输入是编码器输入、解码器输入、编码器有效长度
            Y_hat, _ = net(X, dec_input, X_valid_len)
            # 计算loss的时候，因为y的填充不要算loss，所以传入Y_valid_len告诉非填充部分
            l = loss(Y_hat, Y, Y_valid_len)
            l.sum().backward()	# 损失函数的标量进行“反向传播”
            d2l.grad_clipping(net, 1)
            num_tokens = Y_valid_len.sum()
            optimizer.step()
            with torch.no_grad():
                metric.add(l.sum(), num_tokens)
        if (epoch + 1) % 10 == 0:
            animator.add(epoch + 1, (metric[0] / metric[1],))
    print(f'loss {metric[0] / metric[1]:.3f}, {metric[1] / timer.stop():.1f} '
        f'tokens/sec on {str(device)}')

现在，在机器翻译数据集上，我们可以 创建和训练一个循环神经网络“编码器－解码器”模型用于序列到序列的学习。

embed_size, num_hiddens, num_layers, dropout = 32, 32, 2, 0.1
batch_size, num_steps = 64, 10 # 句子长度为10
lr, num_epochs, device = 0.005, 300, d2l.try_gpu()

train_iter, src_vocab, tgt_vocab = d2l.load_data_nmt(batch_size, num_steps)
encoder = Seq2SeqEncoder(len(src_vocab), embed_size, num_hiddens, num_layers,
                        dropout)
decoder = Seq2SeqDecoder(len(tgt_vocab), embed_size, num_hiddens, num_layers,
                        dropout)
# 用encoder和decoder做出net
net = d2l.EncoderDecoder(encoder, decoder)
train_seq2seq(net, train_iter, lr, num_epochs, tgt_vocab, device)

运行结果：

训练的速度很快，是因为encoder和decoder都是一个RNN，长度为10，总共就2个RNN；也能看做是一个长度为20的RNN。

7.5 预测

为了采用一个接着一个词元的方式预测输出序列， 每个解码器当前时间步的输入都将来自于前一时间步的预测词元。与训练类似，序列开始词元（“< bos>”）在初始时间步被输入到解码器中。该预测过程如图所示，当输出序列的预测遇到序列结束词元（“< eos>”）时，预测就结束了。

使用循环神经网络编码器-解码器逐词元地预测输出序列。

# 之前训练的时候，在做解码器的输入和输出时，输入用的是+真实的target句子
# 而预测的时候我们是不知道真实句子的，所以会有区别
def predict_seq2seq(net, src_sentence, src_vocab, tgt_vocab, num_steps,
                    device, save_attention_weights=False):
    """序列到序列模型的预测"""
    # 在预测时将net设置为评估模式
    net.eval()
    # 把 源句子+ 转换为idx
    src_tokens = src_vocab[src_sentence.lower().split(' ')] + [
        src_vocab['']]
    # 有效长度
    enc_valid_len = torch.tensor([len(src_tokens)], device=device)
    # 对源句子进行填充和截取
    src_tokens = d2l.truncate_pad(src_tokens, num_steps, src_vocab[''])
    # 添加批量轴
    enc_X = torch.unsqueeze(
        torch.tensor(src_tokens, dtype=torch.long, device=device), dim=0)
    enc_outputs = net.encoder(enc_X, enc_valid_len)
    # 至此，以上代码都是encoder部分
    dec_state = net.decoder.init_state(enc_outputs, enc_valid_len)
    # 添加批量轴
    # 这里和之前有区别，之前给的是+目标句子，而在这里，就是给
    dec_X = torch.unsqueeze(torch.tensor(
        [tgt_vocab['']], dtype=torch.long, device=device), dim=0)
    output_seq, attention_weight_seq = [], []
    for _ in range(num_steps): # 预测n步
        # 每一步都往decoder中放入dec_X和dec_state
        # 第一次循环的dec_X就是
        # 输出Y和更新的state
        Y, dec_state = net.decoder(dec_X, dec_state)
        # 我们使用具有预测最高可能性的词元，作为解码器在下一时间步的输入
        # dim=2表示的是vocab维，此时的dec_X是作为下一步的输入
        dec_X = Y.argmax(dim=2)
        # 因为dec_X的维度比较高，通过squeeze
        pred = dec_X.squeeze(dim=0).type(torch.int32).item()
        # 保存注意力权重（稍后讨论）
        if save_attention_weights:
            attention_weight_seq.append(net.decoder.attention_weights)
        # 一旦序列结束词元被预测，输出序列的生成就完成了
        if pred == tgt_vocab['']:
            break
        # 没有预测结束，就把预测结果放入output_seq
        output_seq.append(pred)
    # 把预测的output_seq通过to_tokens把token（词元）查出来，并且用空格拼接，就能变成一句话了
    return ' '.join(tgt_vocab.to_tokens(output_seq)), attention_weight_seq

7.6 预测序列的评估

BLEU的代码实现如下：

def bleu(pred_seq, label_seq, k):
    """计算BLEU"""
    pred_tokens, label_tokens = pred_seq.split(' '), label_seq.split(' ')
    len_pred, len_label = len(pred_tokens), len(label_tokens)
    # 公式的第一部分
    score = math.exp(min(0, 1 - len_label / len_pred))
    for n in range(1, k + 1): # n-gram，从1一直算到k元语法
        num_matches, label_subs = 0, collections.defaultdict(int)
        for i in range(len_label - n + 1):
            label_subs[' '.join(label_tokens[i: i + n])] += 1
        for i in range(len_pred - n + 1):
            if label_subs[' '.join(pred_tokens[i: i + n])] > 0:
                num_matches += 1
                label_subs[' '.join(pred_tokens[i: i + n])] -= 1
        score *= math.pow(num_matches / (len_pred - n + 1), math.pow(0.5, n))
    return score

最后，利用训练好的循环神经网络“编码器－解码器”模型，将几个英语句子翻译成法语，并计算BLEU的最终结果。

engs = ['go .', "i lost .", 'he\'s calm .', 'i\'m home .']
fras = ['va !', 'j\'ai perdu .', 'il est calme .', 'je suis chez moi .']
for eng, fra in zip(engs, fras):
    translation, attention_weight_seq = predict_seq2seq(
        net, eng, src_vocab, tgt_vocab, num_steps, device)
    print(f'{eng} => {translation}, bleu {bleu(translation, fra, k=2):.3f}')

运行结果：

这节课整个过程可以理解为（个人理解，有问题欢迎指正）【摘自b站评论】：

1.获得训练集样本，将样本转化为embeding矩阵，每一个embeding向量对应一个词，embeding向量的种类有vocab_size个,这些embeding向量重复累积构成了整个文本(二维张量)。代码中的输入X是(batch_size,num_steps,embed_size)意义即：每个词用一个embeding向量表示，这个向量的维度为embed_size，每个时间步有num_steps个词，取batch_size个批量。

2.确定超参数时间步s，时间步长度即为单次输入(英语)和输出(法语)的最大数量。

3.确定批量b，这里是为了优化，以便训练时更快更好地迭代收敛。

4.每次选取b组长度为s的样本，这些样本在encoder中前向传递最终得到一个H，把H和对应的法语张量合并共同作为decoder的输入，后续像rnn一样前向传递，即：将当前词和此时的状态共同作为输入来预测下一个词。

5.预测完成后将output和实际文本对应的张量进行交叉熵计算，计算时只取有效长度避免出现多余的损失值。

6.训练完成后即可输入英语，把输出结果累积得到英语对应的法语翻译，并用bleu衡量翻译的好坏。

8. Q&A

Q1:encoder输出和decoder的输入，拼接和按位相加起来有什么区别吗？

A1: 不能按位加，因为decoder的输入是 embedding size，而encoder的输出是hidden size，上面的代码是取的一样的值，但实际上不能这么做，因为长度不一样。

Q2: 实际句子的长度超过了设定的句子长度，是直接截掉不用还是放到下一个句子？

A2: 截掉不用

复习博客：JVM hdzw20 java八股文复习 jvm java intellij-idea spring 后端
复习博客：JVM今日复习内容今天学习Java虚拟机（JVM），它是Java程序运行的基石。理解JVM的工作原理对于优化Java应用性能和排查问题至关重要。主要复习了以下内容：JVM内存模型JVM内存模型（也称为运行时数据区域）主要分为以下几个部分：程序计数器(ProgramCounterRegister)：一块较小的内存空间，是当前线程所执行的字节码的行号指示器。每个线程都有一个独立的程序计数器，
Matlab学习笔记：矩阵基础
MATLAB学习笔记：矩阵基础作为MATLAB的核心，矩阵是处理数据的基础工具。矩阵本质上是一个二维数组，由行和列组成，用于存储和操作数值数据。在本节中，我将详细讲解矩阵的所有知识点，包括创建、索引、运算、函数等，确保内容通俗易懂。我会在关键地方添加MATLAB代码示例，帮助你直观理解。最后，我会总结本课重点，并引出下一节“逻辑基础”的内容。一、什么是矩阵？在MATLAB中，矩阵是一个二维数组，元
ROS个人笔记
写在前面：由于个人原因距离上次学习ROS已经过去了2周时间，本以为时间不算长，但还是忘记了好多。因此写下这篇笔记，主要是记录学习过程中的概念性问题，程序代码可能会写，但是不是主要。1.ROS是什么：是一个生态系统，首先他是一个操作系统。统筹各种资源如通信，开发等。2.在以往开发时一旦工程庞大起来往往会对数据流通的耦合十分苦恼，因此ROS提供的通信方式为松耦合式的：节点Node。另外大工程时的另外一
乐惠国际怎么去学习操作技巧？该怎么分辨是否安全？御老师
微交易市场形式千变万化，稍有不慎就会导致亏损，为了把握盈利机会，最大限度降低风险，对基本面进行分析是必做功课。微交易中的基本面，指的是各种重大新闻、财政热点，这些动态资讯与市场行情走势息息相关，需要重点关注。那么，分析消息面时要注意哪些事项?搜索【庞老师微信：wtz677】一起学习盈利技巧一、注意资讯的时效性时效性是新闻的生命，直接关系到新闻信息的价值。在互联网时代，投资人可以突破地域限制，快速获
假如我有一个亿，我要怎么花？雯雯➕26号➕Ｄ2预热雯彩飞扬007
假如我有一个亿我将从三个时点来安排。你：200万元。给我爱的人一个安定的家和适合的保险。让他们从艰辛的体力劳动中抽离出来，安享晚年我：用500万做稳定的存款，1000万做理财，1000万用作天使投资。1000万用来做个人投资发展资金，学习西班牙语，出国留学，留出时间定期旅行✈️。用100万元买下2套门面房保证稳定的持续收入。他：1000万元在我所在的城市办一座概念图书馆，包含阅读和社交的功能，以公
2023-05-27 花开生两面
投射我儿读书明理，修身做人，每天阳光快乐，情绪平和稳定，越来越会调节自己的情绪和压力。投射我儿对家人、他人、社会都常怀一颗感恩之心，是一个暖心的男子汉。投射我儿对自己未来人生规划清晰，建立学习中短期目标，并为此不断努力。投射我儿生活、学习自律，扎实打好各学科基础，大二下学期的期末总绩点能进入本专业年级前15名，拿到保研资格。投射我儿大学期间交到一两位充满正能量的知心好友。投射我儿和3位新舍友能互帮
DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
家长也是小学生之《家庭教育口传书》124 井蛙读书
在我们高度关注如何进行家庭教育的时候，似乎忽略了一个问题——作为家庭教育关键环节的家长一环够不够强。家长的格局决定孩子的未来，可如何提升家长的格局又不是一时三刻的事。每一个家长都是从第一次开始的，成为家长的那一刻，家长与孩子是一样的，对未来的一切都是现学现用的。要想在家长这个身份上做的够好够强，就要不停地学习，以小学生的心态终身学习，陪孩子一起成长。今天继续分享《家庭教育口传书》——一本我被序言吸
2019-06-06 906bbbe1730f
尊敬的李老师，智慧的教授，亲爱的跃友们，大家晚上好！我是来自临沂永林木业的姜秀萍，今天是我日精进分享的第180天，给大家分享我今天的进步，每天进步一点点，距离成功便不远。比学习好好学好数学，计算，口算，培养孩子的同时，也锻炼了自己，会给自己的工作带来帮助。比改变我变了，世界就变了，虚心学习，从内而外，提高自身素养，和专业技能。比付出承担才会成长，付出才会杰出，只要努力付出，定会在将来的某一天收获成
单片机C语言程序设计实训100例--Proteus仿真实战
本文还有配套的精品资源，点击获取简介：《单片机C语言程序设计实训100例--Proteus仿真实战》是一本面向初学者和进阶者的实践指南，通过100个实例帮助读者掌握8051单片机的C语言编程技能。涵盖了I/O端口控制、定时器/计数器、中断系统、串行通信等关键知识点，并结合Proteus仿真，使得学习过程更为直观和高效。本课程设计项目经过测试，旨在帮助学生掌握单片机C语言编程的实际应用，为进入更复杂
中原焦点团队焦点初级32期孙晓娟2022年️3月10日坚持分享第️30天 85b9745cfed8
一个连父母都不放在眼里的孩子，长大后也必然是一位斤斤计较、眼界狭窄、礼仪欠缺的人。父母就是孩子最初成长的学习对象，严格要求自我，把控好自己的一言一行。孩子才能从父母这里，学会包容与爱，学会理解与尊重。我们尊重孩子，也赢得孩子的尊敬.如此才能让良好的教育理念滋养孩子的心田，幻化成孩子前行的动力，陪他走过漫长的人生岁月。
Java学习-----Bean 典孝赢麻崩乐急 java 学习 rpc
在Spring框架中，Bean是核心概念之一，它贯穿了整个Spring应用的生命周期，是实现依赖注入（DI）和控制反转（IoC）的基础。理解Bean的原理、作用及使用特点，对于掌握Spring框架至关重要。SpringBean的本质是由SpringIoC容器管理的对象，它的创建、初始化、依赖注入及销毁等过程均由容器控制，而非通过传统的new关键字手动创建。其核心原理可概括为以下两点：1.控制反转（
Java学习----NIO模型典孝赢麻崩乐急 java 学习 nio
在Java的I/O模型中，NIO（Non-BlockingI/O，非阻塞I/O）是对BIO的重要改进。它为高并发场景提供了更高效的处理方式，在众多Java应用中发挥着关键作用。NIO模型的核心在于非阻塞和多路复用，其采用“一个线程处理多个连接”的模式，主要依靠通道（Channel）、缓冲区（Buffer）和选择器（Selector）这三个核心组件协同工作，每个核心组件的功能原理和功能如下：（1）通
Java学习————————ThreadLocal 典孝赢麻崩乐急 java 学习开发语言
ThreadLocal是Java中一个非常重要的线程级别的变量隔离机制，它提供了线程局部变量，使得每个线程都可以拥有自己独立的变量副本，从而避免了多线程环境下的共享变量竞争问题。ThreadLocal的实现原理主要依赖于：（1）ThreadLocalMap：每个Thread对象内部都有一个ThreadLocalMap实例（2）弱引用键：ThreadLocalMap使用ThreadLocal对象作为
【第17章】亿级电商订单系统架构设计-概要设计 cherry5230 亿级流量架构设计与落地系统架构架构分布式中间件
1-1本章导学课程概述核心内容：从粗到精细化系统架构设计项目案例：年交易额200亿的B2B电商平台订单系统学习路径1.高层架构设计细化阶段分为两个核心部分：概要设计（本章重点）详细设计2.本章学习目标(1)概要设计方法论理解设计阶段的核心任务掌握具体实施方法建立设计思想指导体系(2)项目实践应用项目工程架构搭建环境配置规范组件关系梳理客户端->网关层->业务层->数据层(3)基础框架构建工程结构初
熬夜之后吃什么养生食物来补身体？2022-12-29 ffd7b3b7d90f
熬夜之后吃什么养生食物来补身体?因为工作，学习等方面的原因，现如今的年轻人越来越多地开始经常熬夜。都提倡早睡早起，很明显地说明熬夜晚睡对身体有害。有时候年轻人因为年轻身体好，不觉得熬几天夜有什么。但其实熬夜的危害特别大，如果你熬了夜，第二天一定要补回来的。一、需要的营养素1、补水。水是生命之源，熬夜的你，生物钟被打乱，代谢加快，体内的水循环出现异常。所以必须要补充足够的水分来滋养你的身体。2、维生
20181207 旅一30王思宁
1.在文章中我学到的重要概念:讲故事不要平铺直叙2.这篇中我学到的怦然心动词汇:facialrecognition刷脸smogfog雾霾3.本篇文章中我最喜欢的句子:Forgetthememories,continuetobelife,miss,justpassby.4.本周学习中我遇到的困难:东西太多，不知道从哪开始复习5.语伴给我的建议:好好复习吧，别挂科6.我的一些其他感受和收获:游戏的坑真
2022暑假总结 yanpinghappy
这个假期，娃都是按照每天的学习计划做事（10天日照旅游期间除外），大概是因为之前两三个寒暑假都是如此规律，所以娃也适应了这种按部就班的节奏。学习时间表，几乎都是我俩商量的结果，中间遇到时间紧张或者无法执行的情况，我们会再做调整。美中不足的是，复盘这一项我俩做得极少，这一点下次寒假时一定要加强起来。暑假第一个月，报了两个课程奥数和《水浒传》，时间排得满满的，把头一年报的游泳课挤出去了，到了第二个月才
2020-5-7晨间日记邓芬芳
今天是什么日子起床：五点三十五就寝：十一点之前天气：阴天有雨心情：焦虑纪念日：高品质的生活需要适度的焦虑任务清单昨日完成的任务，最重要的三件事：打扫卫生、听课、准备复学第一课团体训练活动改进：团体训练活动准备的不理想习惯养成：科学、合理安排时间，提高效率，知行合一周目标·完成进度积极主动高效快速完成领导安排的任务学习·信息·阅读继续阅读《自卑与超越》《权宜之计》等书籍继续学习微笑主义——整合心理学
2023-07-22 付宇杰
在我看来，王老师对整个课堂节奏把控的很好，从开始王老师从现实生活入手，将数学与实际相结合，通过现实生活中的数学问题引导学生进入课堂，接着就是王老师准备的六个例题，诱导引入，变式深入，带领学生逐步深入，了解学习排列问题的本质，王老师用准确、清晰、易懂、生动的语言，呈现知识，践行“以学生为主体“的课堂模式，选择适合该龄段的教学方法，从而激发学生的学习兴趣，促进学生的思维活动,能注意因材施教、因人施教,
《第十五次网课收获》宛如初夏
伊川王利珍坚持原创分享第386天今天晚上是网络中级第15次课程。再有一次就要结束了，还真的有点恋恋不舍呢！刘老师已经开始提前给我们预告了，以期降低我们的分离焦虑！四个月的学习历程。我们彼此由陌生到熟悉。现在经常在一块约练的几个学员已经是老朋友的感觉。虽然从未谋面，但心灵相通，互相扶持，互相帮助。电波相连的情谊也是一种别样的美好！首先通过顾老师展示的案例，大家各抒己见，加上刘老师的讲解。又收获了很多
【HCIA】DHCP配置实验
DHCP（DynamicHostConfigurationProtocol）配置实验通常用于网络课程或网络管理工作中，目的是让学习者或网络管理员理解并掌握如何配置和管理DHCP服务器，以便自动分配IP地址给网络中的设备。一、导言DHCP（DynamicHostConfigurationProtocol）是一种网络协议，用于自动分配IP地址给网络中的设备。DHCP通过以下三种主要机制来分配IP地址：
学习与财富同行：大学生校园内的多元赚钱之路高省飞智导师
随着经济的发展和社会的进步，越来越多的人开始关注学校里的赚钱项目。这些项目不仅能为学校带来收益，同时也能为创业者提供很多商机。那么，学校里究竟有哪些赚钱项目呢？下面就为大家详细介绍一下。一、校园快递代领服务随着网购的普及，校园快递业务也日益繁忙。学生们常常因为上课、兼职等原因无法及时领取包裹，这时候校园快递代领服务应运而生。这个项目需要有一定的组织和协调能力，以及对校园环境的熟悉程度。通过与快递公
自我感动式的努力，真的有用吗？星辰同学
你曾经有过这种感受吗？我今天有努力学习哎，我看书看了两个个小时，我觉得自己很刻苦；我今天有努力跑步哎，跑了两公里，觉得自己很自律；我今天有努力工作哎；晚上10点才回去…其实，你看书两小时，手机不停看了一个多小时，你努力跑步，也只是坚持了两天而已，努力工作，也是因为工作拖拉，没办法加班…最后，你没有取得成就，却怀疑人生，我明明努力了呀？可是一无所获。这种属于努力吗？应该算是自我感动式的努力吧！其实，
日精进第三十五天金缔尊周大生珠宝玉玉
尊敬的李老师，智慧的马教授，亲爱的家人们:大家好，我是（刘翠平)刘总的人，今天是2018年9月17号我的日精进第三十五天，我们互相勉励，携手前行，每天进步一点点，距离成功便不远。比学习:学习同事的素转非技巧，如何打动顾客的心，让顾客成为我们的老顾客。比改变:只要进店看的都是要买的，相信家人相信自己是最棒的，大家互相帮助，互相加油！比付出:总监中午来给我们开会，给我们从专卖店调货来辛苦了。比感恩:感
JAVA学习-行为抽象和Lambda.Lambda表达式守护者170 java学习 java 学习开发语言
行为抽象和Lambda表达式是Java8引入的新特性，用于简化代码和提高代码的可读性。一、概述、特点、使用方法以及与其他比较和高级应用的说明：1.行为抽象：它是指将一段代码抽象为一种功能或行为，以便在需要时可以传递给其他方法或对象。行为抽象通常通过接口来定义，其中接口包含一个或多个抽象方法来表示不同的功能。2.Lambda表达式：Lambda表达式是一种简洁的语法，用于实现行为抽象。它可以替代匿名
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
刘萍萍老师《基于新课标的情境活动与学习任务群设计策略》学习青箬笠0
刘萍萍新乡市基础教育教学研究室“让学生直接思考真实问题有助于激发和唤醒学生的理解。”（「美]格兰特·威金斯·「美」杰伊·麦克泰格《追求理解的教学设计》P44）所以要设计情境活动。一、情境活动与学习任务群概念从何而来“考试命题应以情境为载体，依据学生在真实情境下解决问题的过程和结果评定其素养水平。日常生活情境指向真实具体的社会生活，关注学生在生活场景中的语言实践，凸显语言交际活动的对象、目的和表述方
互相学习似水年华平
今晚受群内班主任的邀请，和大家分享我的学习心得。在晚上的分享会上，我听到了分享姐妹在讲述她们的故事，我不禁感叹，姐妹们的生活都是非常自律、人生有着清晰的目标。主播100课程班姐妹分享她每天早上如何练声，以及练声小技巧。蜕变100课程班姐妹分享她如何通过学习，制定人生的小目标、大目标以及终级目标。形象管理课程姐妹分享如何通过合理搭配穿衣打扮来提升自己的自信心。我和大家分享的是通过学习情商课，让我知道
一.初识C语言（1） Yu_Lijing C语言学习 c语言学习算法开发语言程序人生学习方法
目录1.前言2.什么是C语言3.第一个C语言代码4.数据类型5.常见内存单位6.变量①命名规则②全局变量和局部变量7.从键盘接收数据8.结尾1.前言本篇文章是学习《初识C语言》的总结，旨在复习，巩固，并产生新的理解。文中将会尽可能详尽阐述本章所学知识，会涉及知识的讲解，代码的演示，问题的探索。当然，这些都是浅尝辄止的，毕竟只是“初识”。2.什么是C语言在《初识C语言》中，我们首先先学习了什么是C语
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

87.序列到序列学习（seq2seq）以及代码实现

1. 机器翻译

2. Seq2Seq

3. 编码器-解码器细节

4. 训练

5. 衡量生成序列的好坏的BLEU

6. 总结：

7. 代码实现

7.1 编码器

7.2 解码器

7.3 损失函数

7.4 训练

7.5 预测

7.6 预测序列的评估

8. Q&A

你可能感兴趣的:(深度学习,学习,深度学习)