木大木打木大

理解Attention注意力的本质（附代码讲解与案例）

大部分关于attention的文章都是对‘attention is all your need‘这篇文章的讲解，对初学者并不友好，省略了很多先决知识，这篇文章翻译自’Attention Mechanism’，并结合了自己的理解，力求从浅入深地讲解attention机制的本质。
注：阅读本文之前需要对RNN结构有了解
可参考https://cuijiahua.com/blog/2018/12/dl-11.html

什么是注意力？

当我们想起‘注意力’（attention）这个词时，我们知道这意味着它会引导你专注于某个事物并引起更大的注意。像黑体加粗就是一种注意力。注意力机制在深度学习中则意味着在处理数据时我们会对某些因素（factors）给予更多的注意。

在更广的层面上看，attention是网络结构的一个组成，并由它负责管理和量化相互依赖（inter-dependence）：
1.在输入和输出元素之间（General Attention）
2.在输入元素之内（Self-Attention）

我们来看看一个attention在机器翻译中的例子。如果我们有句子 “How was your day”，想把它翻译成法语- “Comment se passe ta journée”。attention会做的就是把输入句子中重要且相关的词映射（map）到输出句子中的词，并且给这些词更高的权重，提升输出预测的准确性。

在翻译的每一步，权重都被赋予到输入词上

上述关于attention的解释比较宽泛与模糊，因为目前有许多种attention。在这里我们只介绍最常用的几种attention，它们常常用于sequence-to-sequence模型。虽然attention机制在计算机视觉有一定的应用，但目前它仍主要用于NLP任务，比如解决机器翻译中长序列的问题。

我们经常看到attention有如下的解释，但这种解释不够细致、深入，忽略了许多的先决知识，对初学者并不友好。

下面，我们将从本质来讲解推导attention机制

Attention in Sequence-to-Sequence Models

普通的seq2seq模型通常不能处理长的输入序列，因为在encoder中，只有最后一层的隐藏层才能作为decoder的上下文（context）向量，如图中黑色箭头所示。
而attention直接解决了这个问题因为它保存并利用了encoder的所有隐藏层：它建立了一个特殊的映射，使得每一个encoder的隐藏层都能与decoder的输出有关联。这意味着当decoder生成一个输出时，它可以从这个输入序列中选出特殊的元素，而不是只从最后一层的隐藏层生成输出。

Attention的种类

attention主要有两种：Bahdanau Attention和Luong Attention

Attention的种类

第一种attention，通常叫做加性注意力(Additive Attention)，来源于Dzmitry Bahdanau的论文。这篇文章旨在通过attention给予decoder以相关的输入句子。在该论文中，完整的步骤如下：

1.生成encoder的隐藏层
2.计算Alignment Scores （有些人翻译为相似度）
（注：encoder的最后一层隐藏层可用作decoder的第一层隐藏层）
3.对Alignment Scores进行softmax
4.计算上下文向量
5.对输出解码（decoding）

步骤2-5在每段时间（time step）不断重复直到有某种标志或输出超过了指定的最大长度。

下面是具体阐述与代码讲解
1. Producing the Encoder Hidden States
首先，我们会用RNN或它的变体（LSTM,GRU）去解码（encode）输入序列。
如图，每一个encoder RNN会对输入生成一个隐藏层状态。而后，我们会把隐藏层状态传给下一层RNN.

class EncoderLSTM(nn.Module):
  def __init__(self, input_size, hidden_size, n_layers=1, drop_prob=0):
    super(EncoderLSTM, self).__init__()
    self.hidden_size = hidden_size
    self.n_layers = n_layers
    
    self.embedding = nn.Embedding(input_size, hidden_size)
    self.lstm = nn.LSTM(hidden_size, hidden_size, n_layers, dropout=drop_prob, batch_first=True)

  def forward(self, inputs, hidden):
    #这里我们假设是语言任务，把输入embed成词向量
    embedded = self.embedding(inputs)
    #使词向量通过encoderLSTM，并返回输出
    output, hidden = self.lstm(embedded, hidden)
    return output, hidden

  def init_hidden(self, batch_size=1):
    return (torch.zeros(self.n_layers, batch_size, self.hidden_size, device=device),
            torch.zeros(self.n_layers, batch_size, self.hidden_size, device=device))

2. 计算 Alignment Scores
下面是前向传播：

class BahdanauDecoder(nn.Module):
  def __init__(self, hidden_size, output_size, n_layers=1, drop_prob=0.1):
    super(BahdanauDecoder, self).__init__()
    self.hidden_size = hidden_size
    self.output_size = output_size
    self.n_layers = n_layers
    self.drop_prob = drop_prob

    self.embedding = nn.Embedding(self.output_size, self.hidden_size)
    
    self.fc_hidden = nn.Linear(self.hidden_size, self.hidden_size, bias=False)
    self.fc_encoder = nn.Linear(self.hidden_size, self.hidden_size, bias=False)
    self.weight = nn.Parameter(torch.FloatTensor(1, hidden_size))
    self.attn_combine = nn.Linear(self.hidden_size * 2, self.hidden_size)
    self.dropout = nn.Dropout(self.drop_prob)
    self.lstm = nn.LSTM(self.hidden_size*2, self.hidden_size, batch_first=True)
    self.classifier = nn.Linear(self.hidden_size, self.output_size)

  def forward(self, inputs, hidden, encoder_outputs):
    encoder_outputs = encoder_outputs.squeeze()
    # Embed input words
    embedded = self.embedding(inputs).view(1, -1)
    embedded = self.dropout(embedded)
    
    # Calculating Alignment Scores
    x = torch.tanh(self.fc_hidden(hidden[0])+self.fc_encoder(encoder_outputs))
    alignment_scores = x.bmm(self.weight.unsqueeze(2))  
    
    # Softmaxing alignment scores to get Attention weights
    attn_weights = F.softmax(alignment_scores.view(1,-1), dim=1)
    
    # Multiplying the Attention weights with encoder outputs to get the context vector
    context_vector = torch.bmm(attn_weights.unsqueeze(0),
                             encoder_outputs.unsqueeze(0))
    
    # Concatenating context vector with embedded input word
    output = torch.cat((embedded, context_vector[0]), 1).unsqueeze(0)
    # Passing the concatenated vector as input to the LSTM cell
    output, hidden = self.lstm(output, hidden)
    # Passing the LSTM output through a Linear layer acting as a classifier
    output = F.log_softmax(self.classifier(output[0]), dim=1)
    return output, hidden, attn_weights

再获得了所有的encoder输出后，我们可以开始用decoder产生输出了。
alignment score是attention机制的核心，因为在生成decoder输出时，它量化了在分配每个encoder输出的attention的量。
alignment score计算公式如下：

decoder隐藏层状态和encoder输出将会通过（pass through）各自的线性层，并得到它们的训练权重。
在上图中，隐藏层大小是3，encoder输出是2。因此，它们将会被相加，并经过tanh激活。在此例中，decoder隐藏层将会被加到每个encoder输出中。

然后，再做矩阵乘法，得到最终的alignment score向量，每个encoder输出都有自己的得分。

注：因为decoder第一层没有之前的隐藏层和输出，则encoder的最后一层隐藏层和一个开始的标志 () 可以被用来分别替代这两项。

3 Softmaxing the Alignment Scores
在获得Alignment Score后，我们对其应用softmax，得到attention权重。

4. 计算上下文向量（Context Vector）
在得到attention权重后，我们通过把attention权重与encoder输出逐个相乘得到上下文向量。

5. 对输出解码(decoding)
在产生上下文向量后，我们将其与之前的decoder输出合并(concatenate)。而后我们将其投入decoder RNN单元(这里是LSTM)得到一个新的decoder隐藏层。将新的decoder隐藏层经过线性层（分类）处理后，我们得到了最终的输出，它给出下一个预测词的概率分数。

重复步骤2-4直到decoder产生了一个结束标志(End Of Sentence token)或者输出长度超过特定的最长长度。

Luong Attention

第二种attention是Thang Luong在论文里提到的，它通常叫做Multiplicative Attention，并且它是基于Bahdanau Attention建立的。
两者主要的差别在于：
1.alignment score计算方式不同
2.attention机制在decoder中应用的位置不同

在Luong的论文中介绍了3种计算alignment score的方法，而Bahdanau只介绍了一种。并且，通常的Attention Decoder框架结构不同于Luong Attention，因为上下文向量只是在RNN生成输出的时候被使用。接下来我们将详细的介绍Luong Attention：
（一定要结合图看）
1.生成Encoder隐藏层——encoder生成输入序列中每个元素的隐藏层
2.Decoder RNN——之前的decoder隐藏层和输出经过RNN处理，产生新的隐藏层。
3.计算Alignment Scores——使用新的decoder隐藏层和encoder隐藏层计算alignment scores
4.Softmaxing the Alignment Scores
5.计算上下文向量——encoder隐藏层和它们各自的alignment scores相乘得到上下文向量。
6.生成最终输出——上下文向量和decoder隐藏层合并（concatenate），并通过全连接层生成新的输出。
the context vector is concatenated with the decoder hidden state generated in step 2 as passed through a fully connected layer to produce a new output

生成Encoder隐藏层
该步骤与Bahdanau一致
Decoder RNN
不同于Bahdanau Attention, Luong Attention里的decoder使用RNN作为第一步而非最后一步。RNN会用之前的隐藏层和之前最终输出（步骤6）生成一个新的隐藏层。

class LuongDecoder(nn.Module):
  def __init__(self, hidden_size, output_size, attention, n_layers=1, drop_prob=0.1):
    super(LuongDecoder, self).__init__()
    self.hidden_size = hidden_size
    self.output_size = output_size
    self.n_layers = n_layers
    self.drop_prob = drop_prob
    
    # The Attention Mechanism is defined in a separate class
    self.attention = attention
    
    self.embedding = nn.Embedding(self.output_size, self.hidden_size)
    self.dropout = nn.Dropout(self.drop_prob)
    self.lstm = nn.LSTM(self.hidden_size, self.hidden_size)
    self.classifier = nn.Linear(self.hidden_size*2, self.output_size)
    
  def forward(self, inputs, hidden, encoder_outputs):
    # Embed input words
    embedded = self.embedding(inputs).view(1,1,-1)
    embedded = self.dropout(embedded)
    
    # Passing previous output word (embedded) and hidden state into LSTM cell
    lstm_out, hidden = self.lstm(embedded, hidden)
    
    # Calculating Alignment Scores - see Attention class for the forward pass function
    alignment_scores = self.attention(lstm_out,encoder_outputs)
    # Softmaxing alignment scores to obtain Attention weights
    attn_weights = F.softmax(alignment_scores.view(1,-1), dim=1)
    
    # Multiplying Attention weights with encoder outputs to get context vector
    context_vector = torch.bmm(attn_weights.unsqueeze(0),encoder_outputs)
    
    # Concatenating output from LSTM with context vector
    output = torch.cat((lstm_out, context_vector),-1)
    # Pass concatenated vector through Linear layer acting as a Classifier
    output = F.log_softmax(self.classifier(output[0]), dim=1)
    return output, hidden, attn_weights
  
class Attention(nn.Module):
  def __init__(self, hidden_size, method="dot"):
    super(Attention, self).__init__()
    self.method = method
    self.hidden_size = hidden_size
    
    # Defining the layers/weights required depending on alignment scoring method
    if method == "general":
      self.fc = nn.Linear(hidden_size, hidden_size, bias=False)
      
    elif method == "concat":
      self.fc = nn.Linear(hidden_size, hidden_size, bias=False)
      self.weight = nn.Parameter(torch.FloatTensor(1, hidden_size))
  
  def forward(self, decoder_hidden, encoder_outputs):
    if self.method == "dot":
      # For the dot scoring method, no weights or linear layers are involved
      return encoder_outputs.bmm(decoder_hidden.view(1,-1,1)).squeeze(-1)
    
    elif self.method == "general":
      # For general scoring, decoder hidden state is passed through linear layers to introduce a weight matrix
      out = self.fc(decoder_hidden)
      return encoder_outputs.bmm(out.view(1,-1,1)).squeeze(-1)
    
    elif self.method == "concat":
      # For concat scoring, decoder hidden state and encoder outputs are concatenated first
      out = torch.tanh(self.fc(decoder_hidden+encoder_outputs))
      return out.bmm(self.weight.unsqueeze(-1)).squeeze(-1)

3. 计算 Alignment Scores
在Luong Attention中,有3种不同的方式计算alignment score:

Dot
encoder与decoder的隐藏层相乘General
增加了一个权重矩阵

Concat

与Bahdanau Attention的是，在经过线性层（分类器）之前，decoder和encoder的隐藏层被加在一起。这意味着decoder和encoder的隐藏层不会有自己的权重矩阵，而是共享一个。
在经过线性层处理后，我们对输出进行tanh激活，而后与权重矩阵相乘得到alignment score。

4. Softmaxing the Alignment Scores
5. 计算上下文向量
6. 生成最终输出
这三步与之前一致

案例：机器翻译

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import numpy as np
import pandas
import spacy
from spacy.lang.en import English
from spacy.lang.de import German
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
from tqdm import tqdm_notebook
import random
from collections import Counter

if torch.cuda.is_available:
    device = torch.device("cuda")
else:
    device = torch.device("cpu")


# Reading the English-German sentences pairs from the file
with open("deu.txt","r+") as file:
  deu = [x[:-1] for x in file.readlines()]
en = []
de = []
for line in deu:
  en.append(line.split("\t")[0])
  de.append(line.split("\t")[1])

# Setting the number of training sentences we'll use
training_examples = 10000
# We'll be using the spaCy's English and German tokenizers
spacy_en = English()
spacy_de = German()

en_words = Counter()
de_words = Counter()
en_inputs = []
de_inputs = []

# Tokenizing the English and German sentences and creating our word banks for both languages
for i in tqdm_notebook(range(training_examples)):
    en_tokens = spacy_en(en[i])
    de_tokens = spacy_de(de[i])
    if len(en_tokens)==0 or len(de_tokens)==0:
        continue
    for token in en_tokens:
        en_words.update([token.text.lower()])
    en_inputs.append([token.text.lower() for token in en_tokens] + ['_EOS'])
    for token in de_tokens:
        de_words.update([token.text.lower()])
    de_inputs.append([token.text.lower() for token in de_tokens] + ['_EOS'])

# Assigning an index to each word token, including the Start Of String(SOS), End Of String(EOS) and Unknown(UNK) tokens
en_words = ['_SOS','_EOS','_UNK'] + sorted(en_words,key=en_words.get,reverse=True)
en_w2i = {o:i for i,o in enumerate(en_words)}
en_i2w = {i:o for i,o in enumerate(en_words)}
de_words = ['_SOS','_EOS','_UNK'] + sorted(de_words,key=de_words.get,reverse=True)
de_w2i = {o:i for i,o in enumerate(de_words)}
de_i2w = {i:o for i,o in enumerate(de_words)}

# Converting our English and German sentences to their token indexes
for i in range(len(en_inputs)):
    en_sentence = en_inputs[i]
    de_sentence = de_inputs[i]
    en_inputs[i] = [en_w2i[word] for word in en_sentence]
    de_inputs[i] = [de_w2i[word] for word in de_sentence]

hidden_size = 256
encoder = EncoderLSTM(len(en_words), hidden_size).to(device)
attn = Attention(hidden_size,"concat")
decoder = LuongDecoder(hidden_size,len(de_words),attn).to(device)

lr = 0.001
encoder_optimizer = optim.Adam(encoder.parameters(), lr=lr)
decoder_optimizer = optim.Adam(decoder.parameters(), lr=lr)

EPOCHS = 10
teacher_forcing_prob = 0.5
encoder.train()
decoder.train()
tk0 = tqdm_notebook(range(1,EPOCHS+1),total=EPOCHS)
for epoch in tk0:
    avg_loss = 0.
    tk1 = tqdm_notebook(enumerate(en_inputs),total=len(en_inputs),leave=False)
    for i, sentence in tk1:
        loss = 0.
        h = encoder.init_hidden()
        encoder_optimizer.zero_grad()
        decoder_optimizer.zero_grad()
        inp = torch.tensor(sentence).unsqueeze(0).to(device)
        encoder_outputs, h = encoder(inp,h)
        
        #First decoder input will be the SOS token
        decoder_input = torch.tensor([en_w2i['_SOS']],device=device)
        #First decoder hidden state will be last encoder hidden state
        decoder_hidden = h
        output = []
        teacher_forcing = True if random.random() < teacher_forcing_prob else False
        
        for ii in range(len(de_inputs[i])):
          decoder_output, decoder_hidden, attn_weights = decoder(decoder_input, decoder_hidden, encoder_outputs)
          # Get the index value of the word with the highest score from the decoder output
          top_value, top_index = decoder_output.topk(1)
          if teacher_forcing:
            decoder_input = torch.tensor([de_inputs[i][ii]],device=device)
          else:
            decoder_input = torch.tensor([top_index.item()],device=device)
          output.append(top_index.item())
          # Calculate the loss of the prediction against the actual word
          loss += F.nll_loss(decoder_output.view(1,-1), torch.tensor([de_inputs[i][ii]],device=device))
        loss.backward()
        encoder_optimizer.step()
        decoder_optimizer.step()
        avg_loss += loss.item()/len(en_inputs)
    tk0.set_postfix(loss=avg_loss)
  # Save model after every epoch (Optional)
torch.save({"encoder":encoder.state_dict(),"decoder":decoder.state_dict(),"e_optimizer":encoder_optimizer.state_dict(),"d_optimizer":decoder_optimizer},"./model.pt")

encoder.eval()
decoder.eval()
# Choose a random sentences
i = random.randint(0,len(en_inputs)-1)
h = encoder.init_hidden()
inp = torch.tensor(en_inputs[i]).unsqueeze(0).to(device)
encoder_outputs, h = encoder(inp,h)

decoder_input = torch.tensor([en_w2i['_SOS']],device=device)
decoder_hidden = h
output = []
attentions = []
while True:
  decoder_output, decoder_hidden, attn_weights = decoder(decoder_input, decoder_hidden, encoder_outputs)
  _, top_index = decoder_output.topk(1)
  decoder_input = torch.tensor([top_index.item()],device=device)
  # If the decoder output is the End Of Sentence token, stop decoding process
  if top_index.item() == de_w2i["_EOS"]:
    break
  output.append(top_index.item())
  attentions.append(attn_weights.squeeze().cpu().detach().numpy())
print("English: "+ " ".join([en_i2w[x] for x in en_inputs[i]]))
print("Predicted: " + " ".join([de_i2w[x] for x in output]))
print("Actual: " + " ".join([de_i2w[x] for x in de_inputs[i]]))

# Plotting the heatmap for the Attention weights
fig = plt.figure(figsize=(12,9))
ax = fig.add_subplot(111)
cax = ax.matshow(np.array(attentions))
fig.colorbar(cax)
ax.set_xticklabels(['']+[en_i2w[x] for x in en_inputs[i]])
ax.set_yticklabels(['']+[de_i2w[x] for x in output])
ax.xaxis.set_major_locator(ticker.MultipleLocator(1))
ax.yaxis.set_major_locator(ticker.MultipleLocator(1))
plt.show()

求质因数个数程序猿小假算法
什么是质因数？质因数：在数论里是指能整除给定正整数的质数。也就是说，如果一个质数是某个数的因数，那么这个质数就是这个数的质因数。例如，对于数字12，它的因数有1、2、3、4、6、12。其中2和3是质数，所以12的质因数是2和3。如何求一个数有多少个质因数呢？举一个例子，方便大家理解~例：求2024有几个质因数？1.从最小的质数开始尝试分解最小的质数是2，我们先看2024能否被2整除。2024/2=
揭秘Fluss核心功能 - 底层存储和查询 java
大家好，我是大圣。Fluss提供了可靠的底层存储设计与灵活的查询更新机制。然而，这一切听起来似乎很复杂，里面有太多看似晦涩的技术名词——比如日志表（LogTablet）、键值表（KvTablet）、Tablet、TabletServer等等。那么，Fluss的存储到底是怎么运作的？本文将从一个具体的数据例子出发，带你逐步了解Fluss的底层存储逻辑，以及查询和更新数据时，系统背后的变化过程。从一个
常见的图形库概览-03-D3.js 入门例子后端java
常见的图形库系列常见的图形库概览-00-overview常见的图形库概览-01-Chart.js入门例子常见的图形库概览-03-D3.js入门例子HighCharts交互式图表-01-入门介绍Plotly函数图像绘制ApexCharts图表入门例子Victory图表基于React，适合React项目，支持移动端Recharts入门例子AntVG2入门例子图表库C3.js入门例子图表库GoogleC
Linux 怎么在储存设备上创建文件系统？ linux
简介Linux中的mkfs命令用于在存储设备（例如分区、逻辑卷或整个磁盘）上创建文件系统。它代表makefilesystem（创建文件系统），是磁盘格式化的基本命令。语法mkfs[options]：目标设备，例如：/dev/sda1,/dev/sdb,/dev/loop0[options]：定制文件系统的选项支持的文件系统ext2/3/4：第二、第三和第四个扩展文件系统（mkfs.ext2、mkf
【赵渝强老师】Kubernetes中Pod的探针
在K8s集群中，当Pod处于运行状态时，kubelet通过使用探针（Probe）对容器的健康状态执行检查和诊断。Kubernetes支持的三种类型的探针。视频讲解如下：https://www.bilibili.com/video/BV1V1tFenEXL/?aid=113130512390...下面分别进行介绍。livenessProbe（存活探针）该类型的探针将检查Pod中的容器是否正在运行。如
Dart语言的软件工程 Code侠客行包罗万象 golang 开发语言后端
Dart语言的软件工程引言随着技术的快速发展，各种编程语言层出不穷。Dart语言作为Google开发的一种现代编程语言，近年来获得了越来越多的关注。其在移动应用开发、网页开发以及后端服务等领域的广泛应用，使得Dart在软件工程中扮演了越来越重要的角色。在本文中，我们将深入探讨Dart语言的特性、生态系统以及在实际软件工程中的应用。Dart语言简介Dart是一种面向对象、类定义的编程语言，具有明确的
Objective-C语言的语法糖 Quantum&Coder 包罗万象 golang 开发语言后端
Objective-C语言的语法糖引言语法糖是编程语言设计中的一个重要概念。它指的是一种可以使得代码更易读和易写的语法形式。对于程序员来说，语法糖就像是糖衣，让一些看似复杂的逻辑变得简单明了。在编程语言中，好的语法糖能够提高开发效率，降低代码的复杂度。在这篇文章中，我们将深入探讨Objective-C语言中的语法糖，如何利用这些语法糖来优化我们的代码结构和可读性。一、Objective-C简介1.
Lua语言的数据结构 Quantum&Coder 包罗万象 golang 开发语言后端
Lua语言的数据结构及其应用引言Lua是一种轻量级的编程语言，因其简单易学和高效灵活而广受欢迎。尤其在游戏开发、嵌入式系统以及其他需要高性能的场合中，Lua常常作为脚本语言被使用。在Lua中，数据结构的设计充分考虑了其简洁性与高效性，使得开发者能够更方便地进行各种数据处理。本文将深入探讨Lua语言中的主要数据结构及其应用，帮助读者更好地理解和使用Lua。Lua的数据结构概述Lua主要提供了两种内置
MATLAB语言的数据库交互 Quantum&Coder 包罗万象 golang 开发语言后端
MATLAB语言的数据库交互引言在当今数据驱动的时代，掌握数据库的使用和管理是非常重要的。MATLAB作为一种强大的数值计算和数据分析工具，广泛应用于科学研究、工程设计和数据分析等领域。为了更有效地处理和分析数据，MATLAB提供了与各类数据库交互的功能。本文将探讨MATLAB语言如何与数据库进行交互，包括连接数据库、执行SQL查询、读取和写入数据等基本操作，并结合实例进行详细说明，以帮助读者理解
云手机：虚拟技术的革命性应用与实体手机的优劣对比云云321 智能手机服务器矩阵线性代数安全
在近年来，随着互联网的火速发展，云手机作为一种新兴的技术产品，在游戏行业特别是手游市场中掀起了一股热潮。云手机，顾名思义，是架设在ARM虚拟服务器上的手机，其独特的虚拟技术为用户带来了前所未有的使用体验。那么，云手机与实体手机相比，究竟有哪些优劣呢？让我们来一探究竟。云手机的优势应用不占本地内存实体手机中，应用的安装和运行都会占用手机的内存空间。随着用户下载的应用越来越多，内存空间往往会变得捉襟见
蓝桥杯模拟赛第二届题目敲代码的啦哇嘻蓝桥杯职场和发展
1.如果一个数p是个质数，同时又是整数a的约数，则p称为a的一个质因数。请问，2024的最大的质因数是多少？2.对于两个整数a,b，既是a的整数倍又是b的整数倍的数称为a和b的公倍数。公倍数中最小的正整数称为a和b的最小公倍数。请问，2024和1024的最小公倍数是多少？3.两个数按位异或是指将这两个数转换成二进制后，最低位与最低位异或作为结果的最低位，次低位与次低位异或作为结果的次低位，以此类推
亚矩阵云手机:搭建TikTok视频矩阵的高效解决方案云云321 矩阵智能手机线性代数
随着TikTok在全球范围内的快速崛起，越来越多的企业和个人创作者开始重视这一平台的推广营销潜力。TikTok视频作为一种有效的营销策略，通过多个账号的矩阵协同运营，能够显著提升品牌影响力和内容传播效果。而亚矩阵云手机，作为一种创新的云手机技术解决方案，为TikTok视频矩阵的搭建提供了强大的支持。TikTok视频矩阵概述TikTok视频矩阵是指通过创建和管理多个TikTok账号，形成一个相互协同
云手机能用来干什么？云手机在跨境电商领域的用途云云321 智能手机线性代数安全服务器矩阵
近年来，随着云手机的兴起，云技术越来越多的应用在我们工作和生活当中。云手机是一种在云端运行的手机，所有的运算和存储都在服务器上完成，用户端只是起到输入和输出的作用。作为一种全新的技术，它具体有哪些应用场景呢？作为跨境电商领域的从业者，我们能用亚矩阵云手机做什么呢？亚矩阵云手机是海外市场营销的好工具对跨境电商来说最大的困境是没有流量，怎么样增加产品的曝光，让全球60亿人看到我们的产品是每个外贸企业都
doris 安装部署猫猫姐 Doris doris
doris安装部署架构Doris的主要架构分为FE（frontend）、BE（backend）两个角色、两个进程，不依赖于外部的组件，极易部署、运维，FE和BE都有很好的拓展性。FE：存储和维护集群的元数据，负责接收和解析用户的查询请求，规划查询计化，调度查询结果，FE主要分为三个角色：Leader、Follower、ObserverLeader和Follower主要是用来实现Doris集群的高可
1月15学习小丑皇，王中王学习
[SWPUCTF2018]SimplePHPphar反序列化的三个前提条件可以上传phar文件有可以利用的魔术方法文件操作函数的参数可控网站中有两个功能：查看文件和上传文件，利用查看文件将源码都先弄下来进行PHP代码审计。可以看到存在任意文件读取漏洞，读取所有文件的源代码file.phpThereisnofiletoshow!";}$show=newShow();if(file_exists($f
最近，大模型岗位爆了。。。 IT猫仔人工智能学习 ai
重磅消息，国资委打响了国内AI第一枪！宣布央企将把发展AI放在全局统筹地位上，并加快建设一批智能算力中心。这意味着传统行业又迎来了一次大洗牌，这个过程需要大量AI人才！！现在国内头部人工智能公司已经开始用AI数字人助力各行各业，央企+交互数字人将成今年一整年的趋势。除此之外，知名大厂也都在布局AI市场。懂AI的程序员年薪已经翻到80w-96w!风口之下，与其焦虑被行业淘汰，不如先人一步掌握AI大模
职工管理系统c++ LE715 c++开发语言
职工管理系统一.头文件部分职工抽象类worker.h老板类boss.h普通员工类employee.h经理类manager.h职工管理类workerManager.h二.源文件部分老板类boss.cpp普通员工类employee.cpp经理类manager.cpp职工管理类workerManager.cpp职工管理系统.cpp三.系统运行界面职工管理系统职工管理系统可以用来管理公司内所有员工的信息本
自动化测试工具Ranorex Studio（九十三）-RANOREX的静默安装机器视觉小小测试员自动化测试工具运维
RANOREX的静默安装你可以使用标准的MSI命令行参数（参见下面的例子）来定制Ranorex的安装。例如，将RanorexRuntime通过静默安装的方式安装在不同的（虚拟）机器上。l安装包l安装命令行l安装许可证安装包Ranorex使用Microsoft/WindowsInstaller(MSI)来进行安装，因此，相应的标准都能被使用。命令行可以在自解压zip文件(Ranorex.-x.x.x
Vue全流程--数据代理的理解以及在Vue中的应用不清参 Vue全流程 vue.js 前端 javascript
数据代理定义数据代理就是通过一个数据对象代理对另一个对象中的属性进行读/写需要用到的基础知识js的Object.defineProperty函数补充：（请大致读完后再看下文）Documentletnumber=18;letdata={//Modelname:"小王",sex:"男",url:'https://space.bilibili.com/1347961416?spm_id_from=333
11-2.Android 项目结构 - themes.xml 文件基础解读我命由我12345 Android -简化编程 android xml gitee java-ee java android runtime android jetpack
themes.xml文件基础解读themes.xml用于定义一个Android应用程序的主题@color/purple_500@color/purple_700@color/white@color/teal_200@color/teal_700@color/black?attr/colorPrimaryVariant1、主题继承...定义了一个名为Theme.MyTheme的自定义主题，它继承自T
iOS开发最佳实践与架构指南 csp1223
本文还有配套的精品资源，点击获取简介：为确保iOS应用开发的代码质量、可维护性以及提升团队协作效率，遵循一组明确的开发准则和最佳实践是必不可少的。Trendyol提供的"ios-guidelines"是一个全面的指南，详细介绍了包括MVC、MVVM、VIPER在内的架构模式，CocoaPods依赖管理，SwiftLint代码风格检查，AutoLayout和Storyboard工具使用，以及单元测试
Kimi终于开源了，联手清华开源大模型推理架构Mooncake 吴脑的键客人工智能架构人工智能
在人工智能迅速发展的时代，大型模型的智能化水平不断提升，但随之而来的推理系统效率挑战也越来越明显。如何应对高推理负载、降低推理成本、缩短响应时间，已成为业界共同面对的重要问题。Kimi公司联合清华大学的MADSys实验室，推出了基于KVCache的Mooncake推理系统设计方案，该方案于2024年6月正式发布。Mooncake推理系统通过创新的PD分离架构和以存换算为中心的理念，显著提升了推理的
mysql_real_connect的概念和使用案例青草地溪水旁 c语言学习 mysql学习笔记 mysql adb 数据库
mysql_real_connect是MySQLCAPI中的一个函数，用于建立一个到MySQL数据库服务器的连接。这个函数尝试建立一个到MySQL服务器的连接，并返回一个MYSQL*类型的指针，这个指针可以用于后续的数据库操作。函数原型MYSQL*mysql_real_connect(MYSQL*mysql,constchar*host,constchar*user,constchar*passw
深入探讨Kafka：架构、实现原理与开发实践 Ceramist kafka 架构分布式
深入探讨Kafka：架构、实现原理与开发实践ApacheKafka是一个高性能的分布式流处理平台，广泛应用于实时数据处理、日志收集、消息发布/订阅等领域。本文将详细解析Kafka的架构、实现原理，并提供一些开发中的注意事项，帮助读者更好地理解和使用Kafka。一、Kafka简介Kafka由LinkedIn开发，并于2011年开源，2012年成为Apache顶级项目。Kafka的设计目标是为处理实时
网络爬虫——分布式爬虫架构好看资源分享网络爬虫 Python 爬虫分布式架构
分布式爬虫在现代大数据采集中是不可或缺的一部分。随着互联网信息量的爆炸性增长，单机爬虫在性能、效率和稳定性上都面临巨大的挑战。分布式爬虫通过任务分发、多节点协作以及结果整合，成为解决大规模数据抓取任务的核心手段。本节将从Scrapy框架的基本使用、Scrapy-Redis的分布式实现、分布式爬虫的优化策略等多个方面展开，结合实际案例，帮助开发者掌握分布式爬虫的设计与实现。1.Scrapy框架的核心
G1原理—G1的GC日志分析解读液态不合群 jvm java 算法
1.TLAB的GC日志解读(1)一套基本的参数设置首先参数上要有一套基本的设置：-XX:InitialHeapSize=128M-XX:MaxHeapSize=128M-XX:+UseG1GC-XX:+PrintGCDetails-XX:+PrintGCTimeStamps-XX:+PrintTLAB-XX:+UnlockExperimentalVMOptions-XX:G1LogLevel=fi
openfeign如何修改接口上的地址？？？明天更新日后嚣张的资本 java
使用场景：假设在这里配置了路径，但是我又想通过数据库动态配置地址，该如何操作呢？？？请看代码示例：（使用openfeign的拦截器进行处理）---->请看大屏幕：接口：packagemairuirobot.iwarehousecontrol.framework.functions.iwc.feign;importcom.alibaba.fastjson.JSONObject;importmairu
【mybatis】基本操作：详解Spring通过注解和XML的方式来操作mybatis m0_74824552 mybatis spring xml
mybatis的常用配置配置数据库连接#驱动类名称spring.datasource.driver-class-name=com.mysql.cj.jdbc.Driver#数据库连接的urlspring.datasource.url=jdbc:mysql://127.0.0.1:3306/mybatis_testcharacterEncoding=utf8&useSSL=false#连接数据库的名
电子电气架构 --- 整车整车网络管理浅析车载诊断技术思考车载总线类型架构计算机外设人工智能网络自动驾驶整车整车网络管理浅析
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的
Objective-C语言的数据类型 Quantum&Coder 包罗万象 golang 开发语言后端
Objective-C数据类型详解Objective-C是一种面向对象的编程语言，主要用于macOS和iOS应用程序的开发。作为C语言的超集，Objective-C继承了C语言的基本数据类型，同时也引入了一些独特的特性。本文将对Objective-C的各种数据类型进行详细的介绍，以帮助读者更好地理解和使用这种语言。一、基本数据类型1.整型（IntegerTypes）整型用于表示整数。在Object
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

理解Attention注意力的本质（附代码讲解与案例）

什么是注意力？

Attention in Sequence-to-Sequence Models

Attention的种类

Attention的种类

Luong Attention

案例：机器翻译

你可能感兴趣的:(理解Attention注意力的本质（附代码讲解与案例）)