无水先生

用变压器实现德-英语言翻译【01/8】:嵌入层

一、说明

本文是“用变压器实现德-英语言翻译”系列的第一篇文章。它引入了小规模的嵌入来建立感知系统。接下来是嵌入层的变压器使用。下面简要概述了每种方法，然后是德语到英语的翻译。

二、技术背景

嵌入层的目标是使模型能够详细了解单词、标记或其他输入之间的关系。此嵌入层可以被视为将数据从高维空间转换为低维空间，也可以视为将数据从低维空间映射到高维空间。

2.1 从单热向量到嵌入向量

在自然语言处理中，令牌派生自可能包含章节、段落或句子的数据语料库。这些以各种方式分解成更小的部分，但最常见的标记化方法是按单词。语料库中所有独特的单词都被称为词汇表。

词汇表中的每个单词都被分配一个整数，因为它更容易被计算机处理。有多种方法可以分配这些整数，但同样，最简单的方法是按字母顺序分配它们。

下图演示了将较大的语料库分解为其组件并为每个组件分配整数的过程。请注意，为简单起见，标点符号被去掉，文本设置为小写。

通过为每个单词分配索引而创建的数字顺序意味着一种关系。由于这不是意图，因此索引通常用于为每个单词创建一个独热编码向量。单热向量与词汇表的长度相同。在这种情况下，每个向量有 24 个元素。它被称为“一热”向量，因为只有一个元素被“打开”或设置为 1;所有其他令牌都处于“关闭”状态或设置为 0。1 的索引对应于分配给单词的整数值。通常，模型学习预测向量中给定索引的最高概率。

当一个模型只有十几个标记或类可供预测时，独热编码向量通常是一种方便的表示形式。但是，大型语料库可以有数十万个代币。不是使用充满零的稀疏向量，这些向量没有传达太多意义，而是使用嵌入层将向量映射到较小的维度。可以训练这些嵌入式向量来传达有关每个单词及其与其他单词的关系的更多信息。

本质上，每个单词都由一个d_model维向量表示，其中d_model可以是任何数字。它只是指示嵌入维度的数量。如果d_model是 2 或 3，则可以可视化每个单词之间的关系，但通常根据任务使用 256、512 和 1024 的值。

下面可以看到一个优化嵌入的示例，其中类似类型的书籍彼此靠近嵌入：

2.2 嵌入向量

嵌入矩阵的大小为 （vocab_size， d_model）。这允许将大小为 （seq_length， vocab_size） 的单热向量矩阵乘以它以获得新的嵌入式表示。序列长度由 seq_length 表示，即序列中的标记数。请记住，到目前为止，可视化中的“序列”是整个词汇表。在实践中，将使用词汇的子集，例如“基本段落”。该序列将被标记化、索引并转换为独热编码向量矩阵。然后，这些独热编码向量将能够与嵌入矩阵相乘。

嵌入序列的大小为（seq_length， vocab_size） x （vocab_size， d_model） = （seq_length， d_model）。这意味着句子中的每个单词现在都由d_model维向量表示，而不是vocab_size元素的独热编码向量。下面可以看到此矩阵乘法的示例。索引序列的形状为（3，24），嵌入矩阵的形状为 （24， 3）。一旦它们相乘，输出就是一个（3，3） 矩阵。每个单词都由其 3 元素嵌入向量表示。

当独热编码矩阵与嵌入层相乘时，将返回嵌入层的相应向量，而不进行任何更改。下面是独热编码向量和嵌入矩阵的整个词汇表之间的矩阵乘法。输出是嵌入矩阵。

这表明有一种更简单的方法可以在不使用矩阵乘法的情况下获取这些相同的值，因为矩阵乘法可能会占用大量资源。分配给每个单词的整数可用于直接索引嵌入矩阵，而不是从 one-hot 编码向量转到 d_model 维嵌入（从较大维度到较小维度）。这就像从一维转到d_model维，提供有关令牌的更多信息。

下图显示了如何在不乘法的情况下获得完全相同的结果：

2.3 从头开始嵌入

可以在 Python 中创建上述图的简单实现。嵌入序列需要一个分词器、单词及其索引的词汇表，以及词汇表中每个单词的三维嵌入。分词器将序列拆分为其标记，在本示例中为小写单词。下面的简单函数从序列中删除标点符号，将其拆分为标记，并将它们小写。

# importing required libraries
import math
import copy
import numpy as np

# torch packages
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch import Tensor

# visualization packages
from mpl_toolkits import mplot3d
import matplotlib.pyplot as plt

example = "Hello! This is an example of a paragraph that has been split into its basic components. I wonder what will come next! Any guesses?"

def tokenize(sequence):
  # remove punctuation
  for punc in ["!", ".", "?"]:
    sequence = sequence.replace(punc, "")
  
  # split the sequence on spaces and lowercase each token
  return [token.lower() for token in sequence.split(" ")]

tokenize(example)

['hello', 'this', 'is', 'an', 'example', 'of', 'a', 'paragraph', 'that', 
'has', 'been', 'split', 'into', 'its', 'basic', 'components', 'i', 
'wonder', 'what', 'will', 'come', 'next', 'any', 'guesses']

创建分词器后，可以为示例创建词汇表。词汇表包含构成数据的唯一单词列表。虽然示例中没有重复项，但仍应将其删除。一个简单的例子是下面的句子：“我很酷，因为我很矮。词汇将是“我，是，酷，因为，短”。然后，这些词将按字母顺序排列：“我，因为，酷，我，短”。最后，它们将被分配一个整数：“am： 0，因为： 1， cool： 2， i： 3， short： 4”。此过程在下面的函数中实现。

def build_vocab(data):
  # tokenize the data and remove duplicates
  vocab = list(set(tokenize(data)))

  # sort the vocabulary
  vocab.sort()

  # assign an integer to each word
  stoi = {word:i for i, word in enumerate(vocab)}

  return stoi

# build the vocab
stoi = build_vocab(example)

stoi

{'a': 0,
 'an': 1,
 'any': 2,
 'basic': 3,
 'been': 4,
 'come': 5,
 'components': 6,
 'example': 7,
 'guesses': 8,
 'has': 9,
 'hello': 10,
 'i': 11,
 'into': 12,
 'is': 13,
 'its': 14,
 'next': 15,
 'of': 16,
 'paragraph': 17,
 'split': 18,
 'that': 19,
 'this': 20,
 'what': 21,
 'will': 22,
 'wonder': 23}

此词汇现在可用于将任何标记序列转换为其整数表示形式。

sequence = [stoi[word] for word in tokenize("I wonder what will come next!")]
sequence

[11, 23, 21, 22, 5, 15]

下一步是创建嵌入层，它只不过是一个大小为 （vocab_size， d_model） 的随机值矩阵。这些值可以使用torch.rand生成。

# vocab size
vocab_size = len(stoi)

# embedding dimensions
d_model = 3

# generate the embedding layer
embeddings = torch.rand(vocab_size, d_model) # matrix of size (24, 3)
embeddings

tensor([[0.7629, 0.1146, 0.1228],
        [0.3628, 0.5717, 0.0095],
        [0.0256, 0.1148, 0.1023],
        [0.4993, 0.9580, 0.1113],
        [0.9696, 0.7463, 0.3762],
        [0.5697, 0.5022, 0.9080],
        [0.2689, 0.6162, 0.6816],
        [0.3899, 0.2993, 0.4746],
        [0.1197, 0.1217, 0.6917],
        [0.8282, 0.8638, 0.4286],
        [0.2029, 0.4938, 0.5037],
        [0.7110, 0.5633, 0.6537],
        [0.5508, 0.4678, 0.0812],
        [0.6104, 0.4849, 0.2318],
        [0.7710, 0.8821, 0.3744],
        [0.6914, 0.9462, 0.6869],
        [0.5444, 0.0155, 0.7039],
        [0.9441, 0.8959, 0.8529],
        [0.6763, 0.5171, 0.9406],
        [0.1294, 0.6113, 0.5955],
        [0.3806, 0.7946, 0.3526],
        [0.2259, 0.4360, 0.6901],
        [0.6300, 0.2691, 0.9785],
        [0.2094, 0.9159, 0.7973]])

创建嵌入后，可以使用索引序列为每个标记选择适当的嵌入。原始序列的形状为 （6，），值为 [11， 23， 21， 22， 5， 15]。

# embed the sequence
embedded_sequence = embeddings[sequence]

embedded_sequence

tensor([[0.7110, 0.5633, 0.6537],
        [0.2094, 0.9159, 0.7973],
        [0.2259, 0.4360, 0.6901],
        [0.6300, 0.2691, 0.9785],
        [0.5697, 0.5022, 0.9080],
        [0.6914, 0.9462, 0.6869]])

现在，六个标记中的每一个都被一个 3 元素向量替换;新形状为 （6， 3）。

由于这些令牌中的每一个都有三个组件，因此它们可以在三个维度上映射。虽然此图显示了一个未经训练的嵌入矩阵，但经过训练的嵌入矩阵会像前面提到的书籍示例一样将相似的单词彼此靠近。

# visualize the embeddings in 3 dimensions
x, y, z = embedded_sequences[:, 0], embedded_sequences[:, 1], embedded_sequences[:, 2] 
ax = plt.axes(projection='3d')
ax.scatter3D(x, y, z)

2.4 使用 PyTorch 模块进行嵌入

由于 PyTorch 将用于实现转换器，因此 nn.可以分析嵌入模块。PyTorch将其定义为：

一个简单的查找表，用于存储固定字典和大小的嵌入。

此模块通常用于存储词嵌入并使用索引检索它们。模块的输入是索引列表，输出是相应的词嵌入。

这准确地描述了在前面的示例中使用索引而不是独热向量时所执行的操作。

至少，nn。嵌入需要vocab_size和嵌入维度，随着d_model的发展，将继续对其进行标注。提醒一下，这是模型维度的缩写。

下面的代码创建了一个形状为 （24， 3） 的嵌入矩阵。

# vocab size
vocab_size = len(stoi) # 24

# embedding dimensions
d_model = 3

# create the embeddings
lut = nn.Embedding(vocab_size, d_model) # look-up table (lut)

# view the embeddings
lut.state_dict()['weight']

tensor([[-0.3959,  0.8495,  1.4687],
        [ 0.2437, -0.3289, -0.5475],
        [ 0.9787,  0.7395,  2.0918],
        [-0.4663,  0.4056,  1.2655],
        [-1.0054,  1.4883, -0.1254],
        [-0.1028, -1.1913,  0.0523],
        [-0.2654, -1.0150,  0.4967],
        [-0.4653, -1.9941, -1.7128],
        [ 0.3894, -0.9368,  1.5543],
        [-1.1358, -0.2493,  0.6290],
        [-1.4935,  1.1509, -1.8723],
        [-0.0421,  1.2857, -0.4009],
        [-0.2699, -0.8918, -1.0352],
        [-1.3443,  0.4688,  0.1536],
        [ 0.3638,  0.1003, -0.2809],
        [ 1.4208, -0.0393,  0.7823],
        [-0.4473, -0.4605,  1.2681],
        [ 1.1315, -1.4704,  0.2809],
        [ 0.4270, -0.2067, -0.7951],
        [-1.0129,  0.0706, -0.3417],
        [ 1.4999, -0.2527,  0.4287],
        [-1.9280, -0.6485,  0.4660],
        [ 0.0670, -0.5822,  0.0996],
        [-0.7058,  0.2849,  1.1725]], grad_fn=)

如果将与之前相同的索引序列 [11， 23， 21， 22， 5， 15] 传递给它，则输出将是一个 （6， 3）矩阵，其中每个标记由其三维嵌入向量表示。索引必须采用张量的形式，数据类型为整数或长整型。

indices = torch.Tensor(sequence).long()

embeddings = lut(indices)

embeddings

输出将是：

tensor([[ 0.7584,  0.2332, -1.2062],
        [-0.2906, -1.2168, -0.2106],
        [ 0.1837, -0.9425, -1.9011],
        [-0.7708, -1.1671,  0.2051],
        [ 1.5548,  1.0912,  0.2006],
        [-0.8765,  0.8829, -1.3169]], grad_fn=)

三、变压器中的嵌入层

在原始论文中，嵌入层用于编码器和解码器。对nn的唯一补充。嵌入模块是一个标量。嵌入权重乘以 √（d_model）。这有助于在下一步中将嵌入添加到位置编码时保留基本含义。这实质上使位置编码相对较小，并减少了其对嵌入的影响。这个堆栈溢出线程更多地讨论了它。

为了实现这一点，可以创建一个类;它将被称为嵌入，并利用PyTorch的nn。嵌入模块。此实现基于带注释的转换器。

class Embeddings(nn.Module):
  def __init__(self, vocab_size: int, d_model: int):
    """
    Args:
      vocab_size:     size of vocabulary
      d_model:        dimension of embeddings
    """
    # inherit from nn.Module
    super().__init__()   
     
    # embedding look-up table (lut)                          
    self.lut = nn.Embedding(vocab_size, d_model)   

    # dimension of embeddings 
    self.d_model = d_model                          

  def forward(self, x: Tensor):
    """
    Args:
      x:              input Tensor (batch_size, seq_length)
      
    Returns:
                      embedding vector
    """
    # embeddings by constant sqrt(d_model)
    return self.lut(x) * math.sqrt(self.d_model)

四、前向传递

此嵌入类的工作方式与 nn 相同。嵌入。下面的代码演示了它与前面示例中使用的单个序列的用法。

lut = Embeddings(vocab_size, d_model)

lut(indices)

tensor([[-1.1189,  0.7290,  1.0581],
        [ 1.7204,  0.2048,  0.2926],
        [-0.5726, -2.6856,  2.4975],
        [-0.7735, -0.7224, -2.9520],
        [ 0.2181,  1.1492, -1.2247],
        [ 0.1742, -0.8531, -1.7319]], grad_fn=)

到目前为止，每个嵌入中只使用了一个序列。但是，模型通常使用一批序列进行训练。这实质上是一个序列列表，这些序列被转换为它们的索引，然后嵌入。这可以在下图中看到。

# list of sequences (3, )
sequences = ["I wonder what will come next!",
             "This is a basic example paragraph.",
             "Hello, what is a basic split?"]

虽然前面的示例很简陋，但它适用于序列批次。上图中显示的示例是具有三个序列的批处理;标记化后，每个序列由六个标记表示。标记化序列的形状为（3， 6），与 （batch_size， seq_length） 相关。基本上，三个，六个字的句子。

# tokenize the sequences
tokenized_sequences = [tokenize(seq) for seq in sequences]
tokenized_sequences

[['i', 'wonder', 'what', 'will', 'come', 'next'],
 ['this', 'is', 'a', 'basic', 'example', 'paragraph'],
 ['hello', 'what', 'is', 'a', 'basic', 'split']]

然后可以使用词汇表将这些标记化序列转换为其索引表示形式。

# index the sequences 
indexed_sequences = [[stoi[word] for word in seq] for seq in tokenized_sequences]

indexed_sequences

[[11, 23, 21, 22, 5, 15], 
 [20, 13,  0,  3, 7, 17], 
 [10, 21, 13,  0, 3, 18]]

最后，这些索引序列可以转换为可以通过嵌入层传递的张量。

# convert the sequences to a tensor
tensor_sequences = torch.tensor(indexed_sequences).long()

lut(tensor_sequences)

tensor([[[ 0.1348, -1.3131,  2.8429],
         [ 0.2866,  3.3650, -2.8529],
         [ 0.0985,  1.6396,  0.0191],
         [-3.8233, -1.5447,  0.5320],
         [-2.2879,  1.0203,  1.5838],
         [ 0.4574, -0.4881,  1.2095]],

        [[-1.7450,  0.2474,  2.4382],
         [ 0.2633,  0.3366, -0.4047],
         [ 0.2921, -1.6113,  1.1765],
         [-0.0132,  0.5255, -0.7268],
         [-0.5208, -0.9305, -1.1688],
         [ 0.4233, -0.7000,  0.2346]],

        [[ 1.6670, -1.7899, -1.1741],
         [ 0.0985,  1.6396,  0.0191],
         [ 0.2633,  0.3366, -0.4047],
         [ 0.2921, -1.6113,  1.1765],
         [-0.0132,  0.5255, -0.7268],
         [-0.4935,  3.2629, -0.6152]]], grad_fn=)

输出将是一个 （3， 6， 3）矩阵，它与 （batch_size、seq_length、d_model） 相关。本质上，每个索引令牌都被其相应的三维嵌入向量所取代。

在进入下一节之前，了解此数据的形状（batch_size、seq_length d_model）非常重要：

batch_size与一次提供的序列数相关，通常为 16、32 或 64。
seq_length与标记化后每个序列中的单词或标记数相关。
d_model与嵌入每个令牌后的模型大小相关。

有关位置编码的文章是本系列的下一篇。

请不要忘记点赞和关注更多！:)

五、引用

图片来源：Will Koehrsen
PyTorch 的嵌入模块
堆栈溢出讨论
带注释的变压器
变压器从零开始

列出从出生到现在最伟大的创造和显化成就宇宙的宠儿艳宝
1高三复读，考上大学，每天在床前写上“我轻松顺利考上大学”2转系到心理学，这是我一直想要的3坐月子考上公务员，每天观想梦想实现4观想轻松顺利做老师，梦想实现5观想轻松舒适的工作环境，目前已实现6观想与金钱相亲相爱，后天就拿到别墅的钥匙，7观想自己有一辆车，并会开车，梦想已实现8观想老公的工作做秘书，已实现很多年
日精进213天管西芹
敬爱的李老师，智慧的班主任，亲爱的跃友们大家好：2019年2月12号我是(管西芹），我的日精进行动第213天和大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1.比学习:读书每天读点心里学.学习无处都在。书中学习耐力，学习方法。2、比改变：所有的改变都是内心的态度，和主动的去做。说到不如做到。心变世界就变。观世界才有世界观。利他思维。沉默是也是一种改变。接纳，容纳所有
12、Rust 特性：多种形式与应用 Linux 精通Rust：从入门到实践 Rust 特性 Trait
Rust特性：多种形式与应用在Rust编程中，特性（trait）是一项强大的工具，它可以让我们定义一组行为，并让不同的类型来实现这些行为。特性有多种形式，下面我们来详细了解一下。1.特性的多种形式特性有多种不同的形式，每种形式都有其特定的用途和优势。1.1标记特性（Markertraits）标记特性定义在std::marker模块中，它们没有任何方法，只是简单地声明一个名称，用于标记一个类型属于某
Traefik 中实现流量治理3种方式和场景选择老兵发新帖云原生
Traefik中实现功能扩展或流量治理，三种主流实现方式的对比及典型应用场景：⚙️1.中间件链（MiddlewareChain）——最常用、开箱即用适用场景：基础流量治理（如请求头修改、身份认证、限流等）。优势：配置简单、无需编码、原生集成。典型实现：请求头操作：通过Header中间件增删/修改Header。身份认证：使用ForwardAuth将请求转发至外部认证服务（如Keycloak）。URL
Jenkins全方位CI/CD实战指南 KENYCHEN奉孝 Devops jenkins ci/cd 运维
Jenkins简介Jenkins是一个开源的持续集成和持续交付（CI/CD）工具，用于自动化软件开发过程中的构建、测试和部署任务。它通过插件扩展支持多种开发、测试和部署技术，帮助团队实现高效的软件交付流程。jenkins安装使用Docker安装Jenkins运行以下命令启动Jenkins容器：dockerrun-d-p8080:8080-p50000:50000-vjenkins_home:/va
探索未来游戏开发的新纪元 —— 使用Rust与Bevy引擎的《Rust Invaders》项目解析林泽炯
探索未来游戏开发的新纪元——使用Rust与Bevy引擎的《RustInvaders》项目解析rust-invadersSimpleRUSTgamewiththeBevyEngine项目地址:https://gitcode.com/gh_mirrors/ru/rust-invaders在游戏开发的浩瀚星海中，一款能够激发开发者创造力和提升效率的引擎至关重要。今天，我们要向您隆重推荐一个基于Rust编
精选好文//朗读小队日报（带音频） 2021.7.6之一结子青莲
时间：2021.7.6日晚8点朗读者：知心爱人朗读文章：《梦回大宋朝》文章作者：离九思作者少年时代由于受评书、戏曲和电视剧的影响，宋代在她的眼中，是一个颠倒黑白、忠奸混淆的暗黑时代。无论是含冤屈死的岳飛、罢官而终的狄青，殒身殉国的杨业、从容就义的文天祥，似乎都难以善终。而臭名昭著如蔡京、童贯、秦桧、梁师成、贾似道等却能升官发财权势滔天。以邪压正成为两宋的常态。随着时光荏苒，大学时代再看宋代，看到的
学习易效能前后的我小高_59f5
一、为何学习易效能我报名线下课一个很重要的原因是想陪孩子一起改变，由于我没给孩子做好榜样，她身上也由很多不好的习惯，比如熬夜、拖延、时间观念差，正好她今年刚毕业，我想这是一个改变自己的好机会，我希望她接触一些高能量的人，帮助她确立目标和人生方向。二、学习回来的收获：1.积极主动刘鑫老师说他有今天的改变得益于“积极主动”四个字，所以在课程结束选组长时，我就答应了小组伙伴的推荐，由于我们组是课堂作业P
开启富而喜悦的人生，从成长、自律开始！ yy财富姐姐
大家好，今天是2020年8月4日，是我学习成长1000天打卡的第201天。今天继续和大家学习《家里的黄金》人类最重要的资产是头脑总结篇之五第三部分开采你的黄金一、把你的定位和角色从消费者转移到供应商代表，你将会像沃尔玛一样分得利润并赚到金钱。而不是像传统消费者一样只是花钱。将自己定位为供应商代表，能让你将家用产品和服务的支出转变为收入，还能在此过程中拥有自己的人生。二，所有营销手段都有相同的目标建
乡村基层党组织成为带领群众打赢脱贫攻坚接续乡村振兴的坚强战斗堡垒何家欢
乡村基层党组织成为带领群众打赢脱贫攻坚接续乡村振兴的坚强战斗堡垒；为打通服务群众“最后一公里”，城市基层党组织建设成为联系服务群众、提升基层治理能力的重要抓手；筑牢国有企业的“根”和“魂”，国企党建为推进国企改革发展、做强做优做大国企提供了有力保证；坚持和完善高校党委领导下的校长负责制，强化院（系）党组织的政治功能，发挥师生党支部作用，引领推动高等教育事业发展，担负为党育人、为国育才时代重任；突出
对于没有怎么上过学的年轻人来说，难道就真的没有就业机会了吗？了然予心
都说知识改变命运，这话本身没有任何错误，也的确可以称之为一条真理，人们可以通过获取知识的方式走出大山，看到山另一边的风景；也可以通过知识获取地位和财富，以及宝贵的人生阅历与经验。然而不论知识的力量有多么强大，到目前为止也不是每一个人都能获取知识，并用知识的力量去武装自己。这其中有出生环境的影响，比如说偏远山区的孩子，即使是有希望小学的地区，可教育资源的缺乏与差异仍旧存在；也有家庭教育的影响，比如说
昇思MindSpore创新训练营·长三角站开始报名！昇思MindSpore 人工智能自然语言处理深度学习
一、介绍为充分发挥长三角研究型大学联盟教学实践基地共建共享功能，加强华东高校优秀青年学子的交流与互动，提供学生与产业界接触的机会，上海交通大学与华为技术有限公司共同发起，面向长三角研究型大学学生开设昇思MindSpore创新训练营。本次训练营以实践项目和业界需求为牵引，以学生实践为主线，让学生在实践的过程中学习和实践人工智能相关知识，掌握相关技术和工具，紧跟业界最新趋势，加深对人工智能行业的认识，
如何在HTML5页面中嵌入视频
在HTML5中嵌入视频主要使用标签，这是一种简单且标准的方式。以下是详细步骤和示例：基础实现视频嵌入示例您的浏览器不支持HTML5视频标签。核心属性说明controls添加播放控件（播放/暂停、进度条、音量等）width和height设置播放器尺寸（单位：像素）标签提供多个视频格式源以提高兼容性（浏览器会选择第一个支持的格式）：MP4(H.264)-兼容性最好WebM-开源格式，Chrome/Fi
LangChain4j：Java开发者的AI应用构建利器 | 1. 实战：构建AI对话应用秋秋棠人工智能 java 大数据
LangChain4j：Java开发者的AI应用构建利器目录LangChain4j简介LangChain4jvsSpringAI：JavaAI框架对比实战：构建AI对话应用环境搭建配置大模型核心服务实现深入ChatModel：灵活配置与应用框架选择建议LangChain4j简介LangChain4j是专为Java开发者设计的AI应用开发框架，它提供了开箱即用的API和模块化设计，让开发者能够快速构
虚拟团队管理林畅是个小太阳
在前面我们了解了领导力在我们常见的团队和组织形式中的运用，随着互联网技术的发展，人们的线上协作越来越便利，也给我们的组织带来了很多新的改变。我们看到身边越来越多地出现扁平化的组织结构，组织中的信息不再是层层传递，管理者和员工的距离被大大拉近。同时在越来越多的组织中也出现了虚拟团队的合作形式。1、什么是虚拟团队？其实虚拟团队是指由一些跨地区、跨组织的、通过通讯和信息技术的联结，试图完成共同任务的成员
OPPO未来科技大会，科技感满满！你最爱哪些黑科技呢？冬天不冷了
#OPPO未来科技大会#OPPO携手IHSMarkit发布《智能互融：借助5G、人工智能和云技术，释放机遇》白皮书，表明人工智能、云技术和边缘设备、互联和物联网的协同努力，将为企业和消费者带来价值。看了一下早上的，是说明年绿厂要发不少好玩的产品，比如智能手表AR眼镜之类的，有些可能跟Reno3一块发，对外是说构建生态万物互联，其实就是多卖几样多赚钱，然后用这钱砸了搞技术赚更大的钱，毕竟现场说了未来
2019.2.19 星期二多云亲子日记第473天其乐妈咪
北吃汤圆，南吃元宵，寓意团团圆圆，今天是正月十五元宵佳节，祝大家元宵节快乐，今天好多的话题就是“今天你吃汤圆了吗？”“什么馅的呢？”等等等等！今天早上我也吃上了婆婆亲手煮的汤圆，因为昨天晚上下雪的关系，没有回家，我走的时候他们都还在睡觉呢？怎能不羡慕呢？晚上公公炒菜，我和婆婆包水饺，因为猪瘟的关系，今天改吃素馅饺子，韭菜豆腐的，味道着实不错，我和小姑姑都后悔今天晚上又吃多了，呵呵！锻炼要提上日程了
感恩单220920 krysdracula
1.感谢闹钟让我早早起床开启一天的工作2.感谢今天体检工作，让我可以听到别人的心肺和触摸甲状腺，感觉临床技能又提高了3.感谢佳敏还有朴医生和刘婷，一起去吃午饭，大家一起吃饭就很开心4.感谢爸爸妈妈和我视频通话，听我唠唠嗑5.感谢图书馆让我可以自习，喜欢湖边的位置，很亮很舒服6.感谢简老师，听说实验遇到问题，一直帮我们问，找老师，找资料，很感谢7.感谢师姐，辛苦在和试剂公司沟通8.感谢快递员即使配送
【AI论文】CLiFT：面向计算高效与自适应神经渲染的压缩光场标记
摘要：本文提出了一种神经渲染方法，该方法将场景表示为“压缩光场标记（CLiFTs）”，以保留场景丰富的外观和几何信息。CLiFT通过压缩标记实现计算高效的渲染，同时能够通过调整标记数量来表征场景，或利用单个训练好的网络渲染新视角。具体而言，给定一组图像，多视图编码器会根据相机位姿对图像进行标记化处理。潜在空间K均值聚类算法利用这些标记选取一组精简的光线作为聚类中心。随后，多视图“压缩器”将所有标记
【锋子分享】神秘巨星张攀锋007er
10196768376664083107.jpg今天去把《神秘巨星》这一部电影欣赏完了。中途哭了两次，现在的自己越来越容易感动了。一次是女主为了妈妈放弃梦想的那一刻，一次是妈妈勇敢的反抗爸爸的场景。故事很简单，在印度一个男权社会，重男轻女的社会，女人的的生活和地位都是非常非常低微的，甚至是默默承受着家暴，但是总会有一些有梦想，敢去实现梦想的人，去圆自己的梦，也去圆他人的梦的励志故事。故事中三个女人
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
高仿lv包包怎么买便宜，分享给大家7个靠谱渠道美鞋之家
高仿LV包包是现在市场上非常热门的商品之一，虽然不是正版LV，但外观和质量都非常接近。很多人喜欢购买高仿LV包包，因为价格便宜，又能满足自己对时尚的追求。今天我就要分享给大家七个靠谱的渠道，教你如何买到便宜的高仿LV包包。微信:97870758(下单赠送精美礼品)第一个渠道是淘宝。淘宝是中国最大的网络购物平台，上面有很多卖家专门出售高仿LV包包。你可以通过搜索关键词“高仿LV包包”，找到很多卖家和
真相曝光：佛萨奇Force原力元宇宙背后的故事和经济模型口碑信息传播者
在数字化的浪潮中，佛萨奇2.0以其创新的智能合约系统，成为行业的焦点。不仅延续了经典的矩阵模式，还引入了NFT、BOOST矩阵、元宇宙等全新元素，展现出它对未来数字生态的深远布局。特别是结合NFT，佛萨奇2.0激发了无限的想象和可能。13分钟视频彻底弄明白佛萨奇Force原力元宇宙项目是什么佛萨奇2.0：智能合约的核心佛萨奇2.0的核心在于其智能合约系统。智能合约是存储在区块链上的自动执行程序，当
瓶底的乒乓球冷悲秋
周六，女儿和其他几个同学参加了由资深的高级物理老教师——张若明老师主理的初中补习课程。张老师拥有五十年的初中物理教学经验，首创“情景式实践型”物理教学，将各种物理实验带入课堂，让同学们通过亲自动手参与实验，直观的接触物理现象，从而更加直接的接收到课本上物理知识点。张老师的课可以用六个字形容：直观、深刻、生动！参与的同学获益自然匪浅！还记得上周的课后，张老师照例布置了一道实验作业，让同学们课后去做。
Spring - BeanFactory 和 ApplicationContext 有什么区别撸帝
学习完整课程请移步互联网Java全栈工程师BeanFactory可以理解为含有bean集合的工厂类。BeanFactory包含了种bean的定义，以便在接收到客户端请求时将对应的bean实例化。BeanFactory还能在实例化对象的时生成协作类之间的关系。此举将bean自身与bean客户端的配置中解放出来。BeanFactory还包含了bean生命周期的控制，调用客户端的初始化方法（initia
格列佛游记第13章马帅祺
格列佛利用自己的才智和知识做出了梳子藤蛇等工艺品，同时格列佛还为国王王后表演了钢琴，得到了国王和皇后的赏识。在格列佛同国王的计划中格列佛见国王之口说出了自己的见解
自媒体写作如何才能坚持下去？看我踩过的坑总结出这几条经验笑的心灵之旅
壹前阵子经过持续地输出文章，我拿到了某平台的原创功能。曾经我很希望能拿到它，可是拿到它以后，突然失去了创作的灵感和动力。不知道该写什么了。看着自己那少的可怜的阅读量，我决定加入一个写作群，了解一下互联网文章的写法。结果，整个人不好了。整个群组充满了焦虑与狂热，大家都羡慕着别人的爆款文带来的巨大流量和利益，恨不得自己马上写出个10w+，走上人生巅峰。不得不说，我被群里氛围带动了。只不过我是默默地退了
10万钻贝计划·50d，入70钻贝，学习在路上薇语
收益截图：话说我很疯狂，真的。工作上，偶尔遇上的学习机会也是，可是，虽然忙，我还是乐意参与的。这段时间，同事请产假孕假，导致严重超工作量，今天是尝试的第二天，整整两天马不停蹄的工作，确实很酸爽。可偏偏，我还报名了心理B证培训，一个年级28号人，仅有的两个名额，我抢了一个，太主动了。问题是，这培训会用到若干个周五和周六，这问题就来了。一是，班主任的工作，每个周五我需要提前做好预案，在周四把所有事情安
涤纶和聚酯纤维哪个面料好，夏天穿哪个面料的舒适？小小编007
涤纶和聚酯纤维都是合成纤维，具有许多相似的特性。它们都是由聚酯树脂制成的，具有耐磨损、耐褪色和耐皱的特点。然而，涤纶和聚酯纤维在某些方面有所不同。涤纶是一种广泛使用的合成纤维，具有许多优点。首先，涤纶具有较高的强度和耐久性，使其成为一种耐用的面料。其次，涤纶具有良好的弹性和回弹性，不易变形。此外，涤纶具有较好的抗皱性能，不易起皱，易于保持平整。最后，涤纶具有较好的吸湿性和透气性，使皮肤保持干爽舒适
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理