数据派THU

独家 | 图解BiDAF中的单词嵌入、字符嵌入和上下文嵌入（附链接）

作者：Meraldo Antonio

翻译：张玲

校对：吴金笛

本文约5200字，建议阅读15分钟。

本文重点讲解机器问答任务中常见机器学习模型BiDAF是如何利用单词、字符和上下文3种嵌入机制将单词转化为向量形式，同时包括单词的句法、语义和上下文信息的。

BiDAF(Bi-Directional Attention Flow，双向注意力流)是一种常用的问答任务机器学习模型，本文演示了BiDAF是如何使用三种嵌入机制将单词转化为向量形式的。

本文是图解双向注意力流（BiDAF）工作原理系列文章（共4篇）中的第二篇，BiDAF是一种常用的问答任务机器学习模型。

系列文章

https://arxiv.org/abs/1611.01603

概括的说，BiDAF是一个封闭域的抽取式问答模型。这意味着为了能够回答一个Query，BiDAF需要查阅包含回答查询所需信息的随附文本，这个随附的文本被称为Context。BiDAF的工作原理是从上下文中提取一个能够最好Answer查询的子串，这就是我们所说的“对查询的回答”。我有意将单词Query、Context和Answer大写，表示我在本文中使用他们时特指他们的专业技术能力。

本系列的第一篇文章介绍了BiDAF的框架。在本文中，我们将关注BiDAF体系结构中的第一部分-当模型接收到一个传入的Query及其附带文本时，第一件要做的事。为了便于学习，文末提供了这些步骤中包含的数学符号词汇表。让我们了解下相关步骤吧！

步骤1 符号化

在BiDAF中，首先对传入的Query和Context进行标记，即符号化，将这两个长字符串分解为他们的构成词。在BiDAF论文中，符号T和J分别表示Context和Query中单词的数量。下面是符号化的描述：

步骤2 单词嵌入

对步骤1得到的单词进行嵌入处理，并将其转化为数字向量。这些向量捕捉单词的语法功能（语法）和含义（语义），便于我们能够对它们进行各种数学计算。在BiDAF中，可以完成3个粒度级别上的嵌入：字符、单词和上下文。现在让我们关注第1个嵌入层-单词嵌入。

在最开始的BiDAF中单词嵌入算法使用的是GloVe，本文中，我只简要介绍它，因为已经有一些优秀的资源对它的工作过程进行了解释。如果你缺少时间深入理解详情，这里有一个非常简单的、关于GloVe的总结：

GloVe

https://nlp.stanford.edu/projects/glove/

优秀的资源

http://mlexplained.com/2018/04/29/paper-dissected-glove-global-vectors-for-word-representation-explained/

GloVe是一种无监督学习算法，利用单词在语料库中的共现频率来生成单词的向量表示，这些向量以数字的形式表示了单词不同方面的含义。

GloVe向量中的数字封装了单词的语义和语法信息，因此，我们可以使用这些向量执行一些很酷的操作！例如，如下图所示，我们可以使用减法来查询单词的同义词。

BiDAF使用Glove预先训练好的嵌入来获得Query和Context中单词的向量表示。“预训练”指的是在BiDAF模型训练过程中GloVe提前训练好的向量值不会更新，处于冻结状态。因此，你可以把BiDAF的单词嵌入步骤看作是一个简单的查找字典步骤，我们用向量（“字典”的“值”）替换单词（Glove“字典”的“键”）。

单词嵌入步骤输出2个矩阵，一个用于Context，一个用于Query。矩阵的长度等于Context和Query中的单词数量（用T和J表示，分别表示前后者的单词数量）。矩阵的高度采用d1预设值，等于GloVe的向量维度，可以是50、100、200或300.下图描述了Context的单词嵌入步骤：

步骤3 字符嵌入

我们使用GloVe得到大多数单词的向量表示，然而，这仍不足以达到我们的目的。

GloVe提前训练好的“字典”很大，包含了数百万个单词，但当训练BiDAF时仍会遇到在GloVe字典中不存在的单词，我们将这样的单词称为OVV词（Out-Of-Vocabulary,词表外）。GloVe会通过简单地分配一些随机向量值来处理它们，如果不进行补救，这种随机分配最终会混淆我们的BiDAF模型。

因此，我们需要一个能够处理OOV单词的嵌入机制，这就是字符嵌入的地方。字符嵌入使用一维卷积神经网络（One-Dimensional Convolutional Neural Network,1D-CNN）研究单词中的字符构成来寻找单词的数字表示。

你可以将1D-CNN看作是一个按字符滑动扫描单词的过程，这个扫描器可以有多个。这些扫描器可以同时关注多个字符，当扫描时，从所关注的字符中提取信息，最后，整合不同扫描器的信息形成单词的向量表示。

和单词嵌入输出一样，字符嵌入输出2个矩阵，分别用于Context和Query。矩阵的长度等于Context和Query中的单词数量T和J，而它们的高度则是1D-CNN中使用的卷积滤波器的数量（要知道什么是“卷积滤波器”，请阅读下节），用d2表示。这2个矩阵将和单词嵌入步骤输出的2个矩阵一起用。

1D-CNN其他细节信息

以上章节仅对1D-CNN的工作原理进行了简单的概念性介绍。在本节中，我将详细解释1D-CNN的工作原理。严格来说，这些细节对理解BiDAF的工作原理是不必要的，因此，如果您没有足够的时间，请随时向前跳着看。然而，如果是你那种无法理解你正在学习算法中的每一个运作部分就无法睡好的人，这一部分就是为你准备的。

使用1D-CNN的动机是，单个单词具有语义，单词构成也有语义。

例如，如果你知道“underestimate”这个单词的含义，你就会理解“misunderestimate”的意思，尽管后者并不是一个真正的单词。

为什么呢？根据你对英语的了解，前缀“mis”通常表示“错误”的意思，这会使你推断“misunderestimate”是指“mistakenly underestimate”，错误低谷某事的意思。

1D-CNN是一种模拟人理解单词构成语义能力的算法，更广泛地说，它是一个能够从长输入序列的较短片段中提取信息的算法，这个输入序列可以是音乐、DNA、语音记录、博客等。在BiDAF中，这个“长输入序列”是单词，而“短片段”是构成单词的字母组合和词素。

为了了解1D-CNN的工作原理，让我们看看下面的一系列插图，这些插图取自哈佛大学Yoon Kim等人的幻灯片。

幻灯片

https://nlp.seas.harvard.edu/slides/aaai16.pdf

1.假设我们想把1D-CNN应用到“absurdity”这个单词上，我们要做的第一件事是将单词中的每个字符表示为一个维度为d的向量。这些向量是随机初始化的，总的来说，这些向量构成一个矩阵C，d是这个矩阵的高度，而它的长度l只是单词中的字符数。在我们的例子中，d和l分别是4和9。

2.接下来，我们将创建一个卷积滤波器H。这个卷积滤波器（也称为“核”）是一个矩阵，我们将用它来扫描这个单词。它的高度d和矩阵C的高度相同，但它的宽度w是一个小于l的数字。H内的值是随机初始化的，将在模型训练期间进行调整。

3.我们将H覆盖在C的最左角，取H的元素积及其在C在投影（描述这个过程的专业术语是取H的Hadamard积及其在C上的投影）。这个过程输出一个和H维度相同的矩阵（d x l），将其中的所有数字相加得到一个标量。在我们的例子中，标量是0.1，这个数值作为一个新向量f的第1个元素值。

4.然后我们将H向右滑动一个字符并执行相同的操作（得到Hadamard积并求出结果矩阵中的数字之和）得到另一个标量0.7，作为f的第2个元素值。

5.我们一个字符一个字符地重复这些操作，直到达到单词的结尾。在每一步中，我们都会向f中添加一个元素值，并延长向量，直到它达到最大长度（l-w+1）。当我们一次性看到这个单词“absurdity”的3个字符时，向量f是它的一个数字表示。需要注意的是，卷积滤波器H中的值不会随着H在单词中的滑动而改变，更夸张地说，我们称H为“位置不变量”。 卷积滤波器的位置不变特性是我们能够捕捉某个字母组合的含义，无论这种组合出现在单词的哪个位置。

6.我们记下f中的最大值，最大值可以视为是f的“摘要”。在我们的例子中，这个数是0.7，这个数字被称为是f的“摘要标量”。取向量f的最大值过程叫做“最大池化”。

7.然后，我们用另一个卷积滤波器（又一个H），宽度可能不同。在下面的自立中，我们第二个H表示为H'，宽度为2。和第一个滤波器一样，我们沿着H'在单词上滑动，得到向量f，然后进行最大池化操作（即得到它的摘要标量）。

8.我们使用不同的卷积滤波器多次重复扫描过程，每个扫描过程产生一个摘要标量。 最后，收集这些不同扫描过程中的摘要标量，形成单词的字符嵌入。

就这样，我们现在得到一个基于字符的表示，作为单词表示的补充。这是1D-CNN这段离题段落的结尾，现在让我们回归到讨论BiDAF的话题上。

步骤4 高速神经网络

在这一点上，我们得到单词的两组向量表示，一组来自GloVe的单词嵌入，另一组来自1D-CNN的字符嵌入，下一步是垂直联结这些表示。

这种联结产生2个矩阵，分别用于Context和Query，高度是d，d1和d2之和。同时，他们的长度仍然和前一个矩阵相同（T表示Context矩阵的单词数量，J表示Query的单词数量）。

然后这些矩阵通过所谓的高速神经网络， 高速神经网络和前馈神经网络非常相似。你们可能已经非常熟悉前馈神经网络了。回顾一下，我们将向量y输进一个单层前馈神经网络中，在结果z输出之前会发生3件事：

1.将这一层的权重矩阵W与y相乘。
2.在W*y中添加偏差b。
3.对W*y应用非线性函数g，如Relu或Tanh

在高速神经网络中，只有一小部分的输入将受到上述步骤的影响，剩下的一小部分允许通过未转换的网络。 这些部分输入的大小由转换率t和携带率1-t来控制，通过sigmoid函数计算t值，在0-1之间。现在，我们的方程如下：

在退出高速神经网络时，将输入的转化部分和未转化部分加起来。

高速神经网络的作用是调整单词嵌入和字符嵌入步骤的相对贡献配比， 逻辑是，如果我们处理的是一个像“misunderestimate”这样的OOV词，会希望增加该词1D-CNN表示的相对重要性，因为我们知道它的GloVe表示可能是一些随机的胡言乱语。另一方面，当我们处理一个常见而且含义明确的单词时，如“table”时，我们可能希望GloVe和1D-CNN之间的贡献配比更为平等。

高速神经网络的输出同样是2个矩阵，分别用于Context（d-by-T矩阵）和Query（d-by-J矩阵），表示Context、Query中结合单词嵌入、字符嵌入调整的单词向量表示。

步骤5 上下文嵌入

事实证明，这些向量表示依旧无法达到我们的目的。问题是，这些单词表示并没有考虑到单词的上下文含义，也就是单词周围语境的含义。当我们仅依赖于单词和字符嵌入时，一对同音词，例如“tear”（眼睛中的水状排泄物）和“tear”（裂缝）将被赋予完全相同的向量表示，尽管实际上它们是不同的单词，这可能会混淆我们的模型并降低其准确性。

因此，我们需要一个嵌入机制，可以在上下文中理解一个单词，这就是上下文嵌入的地方。上下文嵌入层由长短期记忆序列（Long-Short-Term-Memory ，LSTM）组成，下面是LSTM的简介：

LSTM是一种能够记忆长期相关性的神经网络体系结构。当我们将一个输入序列（例如一个文本字符串）输入到一个常规的前向LSTM层时，每个时间步的输出序列都将对来自该时间步和过去时间步的信息进行编码。换句话说，每个单词的输出嵌入都将包含来自其前面单词的上下文信息。
BiDAF采用双向LSTM（Bi-LSTM），由前向和后向LSTM组成。前向和后向LSTM的组合输出嵌入会同时编码来自过去（向后）和未来（向前）的状态信息。换言之，现在这一层出来的每个单词表示都包含这个单词周围语境的上下文信息。

上下文嵌入步骤的输出是2个矩阵，依旧分别是Context和Query。BiDAF论文将这些矩阵称为H和U（术语警告-此处H不同于前面提到的卷积矩阵H，对不同概念使用相同的符号是不幸的巧合）。Context矩阵H是d-by-T矩阵，Query矩阵是d-by-J矩阵。

这就是BiDAF嵌入层的全部内容，多亏3个嵌入层的贡献，嵌入输出的H和U包含了Context、Query中所有单词的句法、语义和上下文信息。我们将在下一步中使用H和U，请注意，这一步我们会将这些信息综合起来使用，这是BiDAF中核心的技术创新，也是本系列下一篇文章的重点，请一定要看！

下一篇文章：

https://towardsdatascience.com/the-definitive-guide-to-bidaf-part-3-attention-92352bbdcb07

术语

Context：Query的附带文本，里面包含Query的答案。
Query：模型应该给出回答的问题。
Answer：Context的子字符串，包含可以回答Query的信息。这个子串是由模型提取出来的。
T：Context中的单词/标记数量。
J：Query中的单词/标记数量。
d1：单词嵌入步骤的维度（GloVe）。
d2：字符嵌入步骤的维度。
d：通过垂直联结单词和字符嵌入而获得的矩阵维度，d=d1+d2。
H：上下文嵌入步骤输出的Context矩阵，尺寸为2d-by-T。
U：上下文嵌入步骤输出的Query矩阵，尺寸为2d-by-J。

参考：

[1] Bi-Directional Attention Flow for Machine Comprehension (Minjoon Seo et. al, 2017)

https://arxiv.org/abs/1611.01603

[2] Character-Aware Neural Language Models (Yoon Kim et. al, 2015)

https://arxiv.org/abs/1508.06615

如果你对这篇文章有任何疑问/评论或者想联系我，请通过LinkedIn或gmail邮箱[email protected]联系。

原文标题：

Word Embedding, Character Embedding and Contextual Embedding in BiDAF — an Illustrated Guide

原文链接：

https://towardsdatascience.com/the-definitive-guide-to-bidaf-part-2-word-embedding-character-embedding-and-contextual-c151fc4f05bb

编辑：王菁

校对：林亦霖

译者简介

张玲，在岗数据分析师，计算机硕士毕业。从事数据工作，需要重塑自我的勇气，也需要终生学习的毅力。但我依旧热爱它的严谨，痴迷它的艺术。数据海洋一望无境，数据工作充满挑战。感谢数据派THU提供如此专业的平台，希望在这里能和最专业的你们共同进步！

翻译组招募信息

工作内容：将选取好的外文前沿文章准确地翻译成流畅的中文。如果你是数据科学/统计学/计算机专业的留学生，或在海外从事相关工作，或对自己外语水平有信心的朋友，数据派翻译组欢迎你们加入！

你能得到：提高对于数据科学前沿的认知，提高对外文新闻来源渠道的认知，海外的朋友可以和国内技术应用发展保持联系，数据派团队产学研的背景为志愿者带来好的发展机遇。

其他福利：和来自于名企的数据科学工作者，北大清华以及海外等名校学生共同合作、交流。

点击文末“阅读原文”加入数据派团队~

点击“阅读原文”拥抱组织

数字孪生：变电站监测和运维的智能化实践数字孪生家族数字孪生视频孪生数据可视化
随着夏季高温天气的到来，我国用电也迎来了高峰。用电负荷持续走高，对全国各地电网运维也迎来了挑战。电力系统作为现代社会的基础设施，其稳定性和可靠性至关重要，变电站则是实现电力系统电力互联互通的枢纽。在传统变电站中，由于依赖人工巡检和定期维护，存在效率低下和响应迟缓等问题。大量的人力投入，同时也使违章操作、疏忽大意等众多人为操作失误隐患大大提升。近年来，我国在智慧电网建设方面取得了显著成果，其中最为典
P1967 [NOIP 2013 提高组] 货车运稳兽龙算法 c++动态规划 spfa 最短路
题目背景NOIP2013提高组D1T3题目描述A国有nnn座城市，编号从111到nnn，城市之间有mmm条双向道路。每一条道路对车辆都有重量限制，简称限重。现在有qqq辆货车在运输货物，司机们想知道每辆车在不超过车辆限重的情况下，最多能运多重的货物。输入格式第一行有两个用一个空格隔开的整数$n,m$，表示A国有$n$座城市和mmm条道路。接下来mmm行每行三个整数x,y,zx,y,zx,y,z，每
Webpack 中的 Loader 和 Plugin 全面详解 JaysonJin webpack rust 前端
Webpack中的Loader和Plugin全面详解整理不易，记得收藏、点赞再加关注，后续还会更新更多实战文档！Webpack是现代前端构建体系的核心工具，其中Loader和Plugin是其功能扩展的两大支柱。它们虽然常一起出现，但本质和作用完全不同。本文将全面对比二者的定义、作用、使用场景、生命周期与示例，帮你彻底搞清Loader和Plugin的区别与使用方法。一、Loader是什么？定义：Lo
使用Spring Boot实现用户认证和授权 E绵绵 Everything spring boot 后端 java
文章目录引言第一章SpringBoot概述1.1什么是SpringBoot1.2SpringBoot的主要特性第二章用户认证和授权基础知识2.1用户认证2.2用户授权2.3SpringSecurity概述第三章项目初始化第四章实现用户认证和授权4.1定义用户实体类和角色实体类4.2创建Repository接口4.3实现Service类4.4配置SpringSecurity4.5创建Controll
软件工程领域框架复用：提升开发效率的秘诀项目管理实战手册项目管理最佳实践软件工程网络 hadoop ai
软件工程领域框架复用：提升开发效率的秘诀关键词：框架复用、软件开发效率、代码重用、设计模式、组件化、模块化、最佳实践摘要：本文深入探讨软件工程中框架复用的概念、原理和实践方法。我们将从基础概念出发，逐步分析框架复用的优势、实现方式和常见模式，并通过实际案例展示如何通过框架复用显著提升开发效率。文章还将讨论框架复用的适用场景、工具推荐以及未来发展趋势。背景介绍目的和范围本文旨在全面介绍软件工程中的框
鸿蒙应用变现策略：盈利模式全面分析操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
鸿蒙应用变现策略：盈利模式全面分析关键词：鸿蒙应用、变现策略、盈利模式、应用内购买、广告盈利、订阅服务摘要：本文旨在全面分析鸿蒙应用的变现策略和盈利模式。随着鸿蒙操作系统的广泛应用，众多开发者希望借助这一平台实现应用的盈利。文章将从背景介绍入手，阐述鸿蒙应用的发展现状和盈利的重要性。接着详细解析核心概念，包括常见的盈利模式及其原理。通过数学模型和公式说明不同盈利模式的潜在收益计算方法。结合项目实战
HarmonyOS Next 自定义安全键盘案例_鸿蒙next 自定义键盘 2401_86454776 harmonyos 安全计算机外设
NUMERIC,//数字键盘UPPERCASE,//大写字母键盘LOWERCASE,//小写字母键盘SPECIAL,//特殊字符键盘}/**键盘按键类型枚举*/exportenumEKeyType{INPUT,//输入类型，输入具体的值DELETE,//删除一个输入字符NUMERIC,//切换数字键盘CAPSLOCK,//切换大小写键盘SPECIAL,//切换特殊字符键盘}在真实业务场景下，自定义
[NOIP2013 提高组] 货车运输
[NOIP2013提高组]货车运输题目背景NOIP2013提高组D1T3题目描述A国有nnn座城市，编号从111到nnn，城市之间有mmm条双向道路。每一条道路对车辆都有重量限制，简称限重。现在有qqq辆货车在运输货物，司机们想知道每辆车在不超过车辆限重的情况下，最多能运多重的货物。输入格式第一行有两个用一个空格隔开的整数$n,m$，表示A国有$n$座城市和mmm条道路。接下来mmm行每行三个整数
Spring Boot 实现不同用户不同访问权限周凡123 spring boot java
前提近期在使用SpringBoot，用户角色被分为管理者和普通用户；角色不同，权限也就存在不同。在SpringBoot里实现不同用户拥有不同访问权限，可借助SpringSecurity框架达成。实现1.添加必要依赖首先要在pom.xml里添加SpringSecurity和JPA的依赖。org.springframework.bootspring-boot-starter-securityorg.s
1、快速上手 [代码级手把手解析diffusers库] Yuezero_ AIGC 人工智能深度学习
快速上手Pipeline内部执行步骤后续更新计划diffusers是HuggingFace推出的一个diffusion库，它提供了简单方便的diffusion推理训练pipe，同时拥有一个模型和数据社区，代码可以像torchhub一样直接从指定的仓库去调用别人上传的数据集和pretraincheckpoint。除此之外，安装方便，代码结构清晰，注释齐全，二次开发会十分有效率。diffusers使用
学习如何让STM32在运行时改变PWM频率和占空比 ZERONG_H 嵌入式 stm32 嵌入式硬件单片机
前言最近有个需求是关于调节占空比去控制风扇实现三挡风力大小的。由于硬件供电和控制成本等原因，普通的芯片支撑不起几个风扇同时转起来，于是就沿用了一个神奇的电路方案，但是这个方案在输出占空比的时候达不到真正的占空比（这里解释不清），因为电机类需要特别注意频率的大小，频率太高或者太低或多或少都会让人耳接受不了，反正是需要在运行时同时改变PWM频率和占空比，本文着重于应用，不讲原理。一、定时器介绍使用的是
2、成为世界顶尖3D游戏程序员之路 kdbshi 3D游戏程序员编程技能图形设计
成为世界顶尖3D游戏程序员之路1.成为世界顶尖3D游戏程序员的重要性游戏开发是一个充满挑战和机遇的领域，尤其对于那些对3D游戏编程感兴趣的青少年来说，掌握相关技能不仅能实现个人梦想，还能在未来的职业生涯中占据优势。本文将探讨成为世界顶尖3D游戏程序员所需的技能和获取这些技能的方法，帮助你在这个充满竞争的行业中脱颖而出。2.所需技能2.1编程技能编程是游戏开发的核心技能。掌握编程语言和技术是成为优秀
提升首屏加载的秘密武器：一文讲透 CDN 加速核心逻辑网罗开发实战源码前端 json javascript
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
量化AI价值的30个关键指标 mao_feng 人工智能 AI
摘要：量化AI的战略价值人工智能（AI）成功集成到业务运营中超越了单纯的技术部署;它需要一种严格、可量化的方法来展示其价值。本报告系统地分类并解释了评估AI优势的基本指标，从核心模型性能到总体战略和道德考虑因素。必须制定多方面的衡量策略，将技术AI指标与运营效率、客户体验、财务绩效、战略优势和负责任的AI实践等有形业务成果直接联系起来。稳健的关键绩效指标（KPI）不仅仅是问责制的工具;它们是持续改
什么是接口测试？测试界清流接口测试
2025最新Jmeter接口测试从入门到精通（全套项目实战教程）接口测试概念接口测试是项目测试的一部分，它测试的主要对象是接口，是测试系统组件间接口的一种测试。接口测试主要用于检测外部系统与所测系统之间以及内部各系统之间的交互点。测试的重点是检查数据交互、传递、和控制管理过程以及系统间的相互依赖关系等。接口测试目的测试与系统相关联的外部接口，测试的重点是检查数据的交互，传递和控制管理过程，提供测试
PHP基础语法讲解程序员小羊！杂文 php
大家好，我是程序员小羊！前言：PHP（HypertextPreprocessor）是一种常用于网页开发的服务器端脚本语言，易于学习并且与HTML紧密结合。以下是PHP的基础语法详细讲解。1.PHP基础结构1.1PHP脚本结构PHP代码通常嵌入到HTML文件中，并且用特殊的标记或短标记包围：是结束标记。PHP代码可以放在HTML代码中间，服务器解析时只执行PHP代码，输出结果会生成标准HTML页面。
镜子练习模板Day1 hehuiyi 健康医疗
2023.2.22遇到露易丝．海的《镜子练习》。首先我看了一遍，然后就做一遍。书上说用镜子可以看见童年的创伤、恐惧，甚至癌症。我觉得作者能写出这种状态出来他是经历过，当我经历痛苦的时候，我不知道怎么办，我就试它一会就镜子练习吧当我拿起镜子看到镜中的自己时，我不喜欢我自己的样子，我很想哭……深呼吸说出以下的肯定句：[我很想要喜欢你，我很想真正学会爱你，我们试试看并且一起发掘其中的乐趣吧]再深呼吸一次
第三届“传智杯”全国大学生IT技能大赛（初赛B组） START_GAME 实战笔记
第三届“传智杯”全国大学生IT技能大赛（初赛B组）链接：https://www.luogu.com.cn/contest/38442#description也直接洛谷进入———————————————————————————————笔记：前三题不难。卡在第四题（提交了18次才过-_-）,测试点二就是过不了。变量创建的位置改一下就过了，非常不明白为什么。虽然最后5题都过了，估计还是凉凉300+。T1
7-2 看照片找基友 (20分) START_GAME #并查集算法
7-2看照片找基友(20分)—并查集小A是个单身狗，他有很多好基友，他们平时喜欢出去聚会和旅游，每次聚会都会照一张集体照上传到群共享，有一天，小A整理照片，想通过照片来看看他们这群基友的情况。我们假定，在同一张照片里同时出现的，两两之间都是好基友，基友的基友也是好基友。那么问题来了，你能帮小A确定任意的两个人是否好基友吗？输入格式:首先输入照片的张数N（N#include#include#incl
PostMan接口测试流程程序员小雷 postman lua 测试工具测试用例 selenium 功能测试单元测试
1、下载和安装Postman:前往Postman官网（https://www.postman.com），下载适用于你的操作系统的Postman客户端。执行下载后的安装程序，并按照安装向导的指引完成安装过程。2、创建一个新的集合：打开Postman，点击左上角的"New"按钮，选择"Collection"（集合）。输入集合的名称，例如"APITests"，并选择存储位置。点击"Save"（保存）。3
STM32入门教程：红外遥控应用 MyM满满 stm32 单片机嵌入式硬件
STM32入门教程：红外遥控应用一、介绍红外遥控是现代电子产品中广泛应用的一项技术，通过红外线的收发实现设备之间的通信和控制。在本教程中，我们将使用STM32微控制器实现一个简单的红外遥控应用。主要内容包括红外遥控器的编码与解码，以及STM32的红外接收与发送功能的使用。二、硬件准备为了完成这个项目，我们需要以下硬件：STM32开发板（例如STM32F103C8T6）红外遥控器红外接收模块（例如红
搬运机器人系列编程：Fanuc M-20iA_5.坐标系设置与管理 zhubeibei168 机器人（二）机器人
5.坐标系设置与管理在汽车制造行业中，FanucM-20iA搬运机器人的高效作业离不开精确的坐标系设置与管理。坐标系是机器人编程中的基础，它决定了机器人在空间中的位置和姿态。本节将详细讲解如何设置和管理机器人的坐标系，包括世界坐标系、基座坐标系、工具坐标系和用户坐标系。5.1世界坐标系（WorldCoordinateSystem）世界坐标系是机器人系统中一个固定的参考坐标系，通常位于机器人底座上。
搬运机器人系列编程：Fanuc M-20iA_19.搬运机器人的安全防护措施 zhubeibei168 机器人（二）机器人安全网络
19.搬运机器人的安全防护措施在汽车制造行业中，搬运机器人（如FanucM-20iA）的安全防护措施至关重要。这些措施不仅能够保护操作人员的生命安全，还能够确保生产过程的顺利进行，避免因意外事故导致的生产中断和经济损失。本节将详细介绍FanucM-0iA搬运机器人在编程和操作过程中应采取的安全防护措施，包括软件和硬件层面的防护措施。19.1软件安全防护措施软件安全防护措施主要通过编程语言和控制逻辑
智能交通信号灯 java 猿 java日更 java 算法开发语言
题目描述蓝桥智慧城市在一条主干道上沿路安装了NNN个智能交通信号灯，这些信号灯按位置从111到NNN编号。每个信号灯都有着一种控制模式，对于第iii个信号灯，其控制模式用AiA_iAi表示，AiA_iAi是一个大于等于111的整数。为了评估信号灯配置的“多样性”，交通管理专家提出了一种度量方式：对于任意两个不同位置xxx和yyy，它们的多样性分数被定义为大于等于111的整数中，第一个既不是AxA_
信创领域的十大网络安全威胁有哪些极创信息信创产品兼容性互认证国产化信创安全 eclipse java tomcat hibernate opencv 数据挖掘
在信创（信息技术应用创新）领域，由于其涉及自主可控软硬件、核心技术与基础设施，网络安全威胁尤为突出，其网络安全威胁不仅涉及传统IT系统的共性问题，还因技术生态的独特性面临特殊挑战。结合信创环境的特点，以下是信创领域面临的十大主流网络安全威胁。一.人员安全意识不足真实的网络攻击可能并不需要多么高深的技术，更多的是针对人员的安全意识不足发起的攻击。在信创项目建设和运营过程中，涉及大量研发、实施、运维和
信创产品合规认证的一般流程，标准化产品、项目型产品极创信息健康医疗深度学习 opencv sqlite eclipse github git
信创产品合规认证流程分为标准化产品（通用产品）和项目型产品（特定项目交付）。核心流程概述基础适配与互认选择适配环境：确定目标适配的国产CPU架构（鲲鹏、飞腾、龙芯、兆芯、海光、申威等）、操作系统（麒麟、统信UOS、中科方德等）、数据库、中间件等。产品适配：在选定的信创环境下进行安装、部署、功能测试、性能调优等。获取证书：1.信创产品兼容性互认证证书：这是第一步也是最关键的证书。通常由产品厂商与基础
算法备案 | 算法备案必要性、算法类型、备案流程极创信息人工智能 AIGC
一、进行算法备案的必要性在当今的数字化时代，算法已经广泛应用于各个行业，引起了监管部门的高度关注，因为算法产品可能会带来一些潜在的风险。为了规范互联网信息服务中的算法推荐活动，抵制诸如深度生成合成、算法歧视、“大数据杀熟”、诱导沉迷等不合理应用，各个国家都先后出台了一系列关于算法管理的法律法规。在我国，《数据安全法》、《个人信息保护法》、《互联网信息服务算法推荐管理规定》等法律法规明确对算法的使用
stm32为何在诸多的单片机中脱颖而出？
STM32为何在诸多单片机中脱颖而出？一个十年嵌入式老兵的深度解析看到这个问题，我忍不住想起了十年前刚入行时的那段经历。那时候我刚从机械专业转到嵌入式领域，面对市面上琳琅满目的单片机产品：51单片机、PIC、AVR、MSP430、ARM7、ARM9...每一种都有自己的拥趸，每一种都在宣称自己的优势。但是有一款芯片，却在我接触的短短几年时间里，以迅雷不及掩耳之势席卷了整个嵌入式市场，那就是STM3
DS18B20温度传感器的Verilog初始化程序实战指南北海有座岛
本文还有配套的精品资源，点击获取简介：DS18B20是一款适用于宽温度范围的高精度数字温度传感器，采用Verilog语言实现其初始化程序，以便能够正确地在系统中运行。本指南详细介绍了DS18B20的初始化过程，包括电源配置、分辨率选择、报警阈值设定等，并解释了如何使用Verilog来控制和通信DS18B20传感器，对于嵌入式系统设计和硬件描述语言的学习具有重要价值。1.DS18B20传感器概述1.
Django REST framework - 缓存 djangopython
一位女性有着非常敏锐的意识，但几乎没有记忆力……她的记忆力足以工作，而且她工作很努力。——莉迪亚·戴维斯RESTFramework中的缓存与Django提供的缓存工具配合得很好。在APIView和ViewSet中使用缓存Django提供了一个method_decorator，用于在基于类的视图中使用装饰器。这可以与其他缓存装饰器一起使用，如cache_page、vary_on_cookie和var
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

独家 | 图解BiDAF中的单词嵌入、字符嵌入和上下文嵌入（附链接）

你可能感兴趣的:(独家 | 图解BiDAF中的单词嵌入、字符嵌入和上下文嵌入（附链接）)