过动猿

自然语言处理复习

第 3 章深度学习基础

第 4 章语言模型+词向量

第 5 章 NLP中的注意力机制

第 6 章 NLP基础任务

第 7 章预训练语言模型

第 3 章深度学习基础

1. 人工神经网络

2. 激活函数

（1）激活函数的作用

为了增强网络的表达能力，需要引入连续的非线性激活函数

（2）激活函数的性质

连续并可导的非线性函数
激活函数及其导函数要尽可能地简单
激活函数的导函数的值域要在一个合适的区间

（3）常用的激活函数

sigmoid函数： $\frac{1}{1+exp(-x)}$ ，值域(0,1)

tanh函数： $\frac{exp(x)-exp(-x)}{exp(x)+exp(-x)}$ ，值域(-1,1)

ReLU函数：，值域[0,正无穷)

3. 前馈神经网络DNN

（1）参数：层间连线权重W1，W2，...，WL；各层偏置b1，b2，...，bL

（2）softmax层： $\frac{e^{y_i}}{\sum e^{y_i}}$

（3）梯度下降法：

步骤：

1. 定义目标函数（损失函数）：用真实值和预测值的误差来定义损失函数，将问题转化为求极值的问题 $minL(\Theta )$

2. 优化目标函数（损失函数）：将参数作为变量，通过求极值来确定

常用损失函数：

0-1损失、平方损失、绝对值损失、对数损失、交叉熵损失、Hinge损失、指数损失

交叉熵损失： $-\sum y_ilogf(x_i)$

问题：

1. 参数初值：尽量随机

2. 学习率：不能太大也不能太小

3. 梯度消失问题：

（1）选择合适的激活函数

（2）用复杂的门结构代替激活函数

（3）残差结构

4. 过拟合问题：

（1）选择合适的正则方法

（2）Dropout

分类：

1. 梯度下降法：每更新一次参数，就需要计算一次全体数据相应参数的偏导数，这个计算量是很大的，函数的收敛速度会在数据量很大的时候会很慢。与SGD不同，每一次参数的改变，都能保证损失函数是朝着全局最小方向移动的。

2. 随机梯度下降法：每更新一次参数，只计算了1个batch的梯度，大大加快了函数的收敛速度。SGD每一次更新参数只考虑了一个数据，可能不会每一次都是朝着全局最优的方向移动，最终可能无法收敛到最小，但是会解决陷入局部最优的问题。

3. mini-batch梯度下降法

复合函数求导：链式法则，反向传播算法

4. 卷积神经网络CNN

局部连接+参数共享（模型参数变少）

（1）参数：卷积核的权值、卷积核的偏置、全连接的权值

（2）卷积层的作用：卷积层用来提取特征。其中局部连接+参数共享，可大大减少参数的个数

（3）池化层的作用：池化层用来特征选择，降低特征数量，并从而减少参数数量。

Max Pooling

Mean Pooling

（4）卷积神经网络结构上的特性：

局部连接

权重共享

空间或时间上的次采样

这些特性使得卷积神经网络具有一定程度上的平移、缩放和扭曲不变性

（5）卷积神经网络形状变换公式：

参数个数： $(KernelSize * KernelSize * c_{in} + 1)* c_{out}$

5. 图卷积神经网络GNN

6. 循环神经网络RNN

（1）循环神经网络核心思想：将处理问题在时序上分解为一系列相同的“单元”，单元的神经网络可以在时序上展开，且能将上一时刻的结果传递给下一时刻，整个网络按时间轴展开。即可变长。

（2）信息传播：

（3）输入输出结构：

（4）参数学习

BPTT：用反向传播不同的是，循环神经网络存在参数共享问题，从时间步上展开的每层的权重W都应该相同，因此每次都需要同时调整参数。

（5）问题：

1. 梯度消失/爆炸问题：在训练循环神经网络时，更经常出现的是梯度消失问题，训练较难

2. 长期依赖问题：距当前节点越远的节点对当前节点处理影响越小，无法建模长时间的依赖

（6）LSTM：LSTM 通过设计“门”结构实现保留信息和选择信息功能（输入门、遗忘门、输出门）

（7）GRU：输入门和遗忘门合并为更新门（更新门决定隐状态保留放弃部分）（更新门、重置门）

（8）RNN的改进

第 4 章语言模型+词向量

1. 统计语言模型

（1）模型

语言模型： $p(S) = \prod_{i=1}^{n}p(w_i|w_1......w_{i-1})$ ，其中S为句子，p(S)为句子的概率

二元模型： $p(S) = p(w_1) * p(w_2|w_1) * p(w_3|w_2) * ... * p(w_n|w_{n-1})$

n元模型： $p(S) = p(w_1,...,w_m) = \prod_{i=1}^{m}p(w_i|w_{i-(n-1)},...,w_{i-1})$

（2）参数学习的方法

最大似然估计方法：

（3）数据平滑

数据匮乏导致的零概率问题。

数据平滑的基本思想：调整最大似然估计的概率值,使零概率增值，使非零概率下调，“劫富济贫”，消除零概率，改进模型的整体正确率。

数据平滑的方法：加1法、减值法/折扣法、删除减值法

（4）语言模型性能评价

1. 实用方法：根据模型的表现来评价

2. 理论方法：用模型的困惑度来衡量

2. 神经语言模型

（1）基于DNN的模型：NNLM模型

（2）基于RNN的模型：RNNLM模型

随着模型逐个读入语料中的词w1 ;w2 ….隐藏层不断地更新为h(1),h(2)….. ，通过这种迭代推进方式，每个隐藏层实际上包含了此前所有上文的信息，相比NNLM 只能采用上文n元短语作为近似，RNNLM包含了更丰富的上文信息，也有潜力达到更好的效果。

RNNLM优点：

RNNLM 模型可以保留每个词的全部历史信息，不需简化为n-gram

引入词向量作为输入后不需要数据平滑

3. 词向量（浅层）

（1）词表示

符号表示

离散表示

                one-hot表示

                词袋模型：用该词在文档中出现的频数表示该词

                TF-IDF：用该词在文档中的占比来表示该词

分布式表示：用一个词的附近的其他词来表示该词

                基于计算的分布式表示：如SVD分解；耗空间过大，稀疏等问题

基于预测的分布式表示

（2）词向量

NNLM模型词向量

方法：采用低维稠密向量降维，|D|为定义的词向量的维度，|V|为词表大小

NNLM模型的作用：在训练语言模型同时也训练了词向量

RNNLM模型词向量

方法：采用低维稠密向量降维，|D|为定义的词向量的维度，|V|为词表大小

RNNLM 模型的作用：在训练语言模型同时也训练了词向量

C&W模型词向量

核心思想：采用直接对n元短语打分的方式替代语言模型中求解条件概率的方法：对于语料中出现过的n元短语，对其打高分；对于语料中没有出现的随机短语，对其打低分。通过这种方式，C&W模型可以更直接地学习得到符合分布假说的词向量。

特点：C&W 模型的目标函数是求目标词w与其上下文c的联合打分，而其他模型均为根据上下文c，预测目标词w。

C&W 模型在运算速度上优于NNLM模型，但在许多语言学任务上，效果不如其它模型

CBOW模型词向量

Skip-gram模型词向量

（3）经典模型总结

（4）词向量的特点

语义相似的词，其词向量空间距离更相近

相似关系词对的词向量之差也相似：如 $V(hotter) - V(hot) \approx V(bigger) - V(big)$

4. 神经语言模型相比统计语言模型的优势

统计语言模型：

1. 由于参数数量问题需要对词 i 的历史简化 n-gram

2. 需要数据平衡

神经语言模型：RNNLM可以解决所有上述问题

第 5 章 NLP中的注意力机制

1. 注意力机制概述

注意力机制就是加权求和机制，是神经网络中的一个组件，可以单独使用，但更多地用作网络中的一部分。对于集合Key，求相对于Query各个元素的权重，然后按权重相加形成Query要的结果

2. 传统注意力机制

（1）模块结构

输入：Query（Q）、Key（K）

输出：Attention-Value（Att-V）

步骤：

1. 计算（注意力打分函数）：

2. 计算对于Q各个Ki的权重，

3. 计算输出，各Ki乘以自己的权重，然后求和

（2）模块训练

将模块放到整体模型中，不需要额外的训练数据权重可以由模块中的参数学到

（3）模块评价

放到各个任务中检验，通过任务指标的提升证明模块的效果

（4）模块应用

网络中有“求和”的地方都可以用，如图卷积，机器翻译等

（5）注意力模块的优点

让任务处理系统找到与当前任务相关的显著的输入信息，并按重要性进行处理，从而提高输出的质量。

不需要监督信号，可推理多种不同模态数据之间的难以解释、隐蔽性强、复杂映射关系，对于先验认知少的问题，极为有效。

解决长距离依赖问题，提升任务性能

（6）注意力模块的作用

等权处理 - > 加权处理 -> 提升任务效果

软注意力soft attention：在求注意力分配概率分布的时候，对于输入句子X中任意一个单词都给出个概率，是个概率分布。

硬注意力hard attention：直接从输入句子里面找到某个特定的单词，然后把目标句子单词和这个单词对齐，而其它输入句子中的单词硬性地认为对齐概率为0

全局注意力global attention：Decode端Attention计算时要考虑输入Encoder端序列中所有的词

局部注意力local attention：Local Attention Model本质上是Soft AM和 Hard AM的一个混合或折衷。一般首先预估一个对齐位置Pt，然后在Pt左右大小为D的窗口范围来取类似于Soft AM的概率分布。

3. 注意力编码机制

通过建立序列各元素之间的关联关系形成一种序列表示（按元素之间关系对序列进行编码）；或通过不同序列元素之间的关联关系形成不同序列间的融合表示。

（1）单一向量编码

将输入序列按规则编码成单一向量表示。如，句表示/篇章表示，某词的上下文表示等

（2）不同序列间编码

将2个序列编码成二者的融合的表示序列，如，匹配任务和阅读理解任务常用的融合层表示

（3）同一序列自编码

利用多头自注意力编码对一个句子编码可以起到类似句法分析器的作用。如Transformer的编码端

第 6 章 NLP基础任务

1. 文本分类

文本分类是NLP中的常见的重要任务之一，应用广泛，在很多领域发挥着重要作用，例如垃圾邮件过滤、舆情分析以及新闻分类等。

神经网络分类方法：

基于词袋的文本分类

        简单对文本序列中每个词嵌入进行平均/加总，作为整个序列的表示。这种方法的缺点是丢失了词序信息。对于长文本，神经词袋模型比较有效。但是对于短文本，神经词袋模型很难捕获语义组合信息

基于卷积神经网络文本分类（TextCNN/DPCNN/Char-CNN/VDCNN）

        通过多个卷积层和子采样层，抽取序列的 n-gram特征信息，最终将得到特征信息合并成一个固定长度的向量作为整个序列表示。

基于循环神经网络文本分类（TextRNN/TextRCNN）

        将文本序列看作时间序列，不断更新，最后得到整个序列的表示。这种表示中包含的是序列的顺序信息。RNN属于“biased model”，一个句子中越往后的词重要性越高，这有可能影响最后的分类结果，因为对句子分类影响最大的词可能处在句子任何位置。

基于attention机制文本分类

        通过注意力机制对序列进行编码，最后得序列的表示，这种表示包含的是词与词之间的关联关系

基于预训练模型的文本分类

        通过预训练模型形成句表示，然后将该句表示作为分类的输入

基于图卷积神经网络文本分类

        根据任务对原文本加入附加信息并构建原文本与附加信息的关系图（将附加的结构信息融入文本），然后利用图卷积的方法提取文本有效的特征表示

2. 文本匹配

（1）复述识别

又称释义识别，是判断两段文本是不是表达了同样的语义，这一类场景一般建模成分类问题。

（2）文本蕴含识别

给定一个前提文本（text），根据这个前提去推断假说文本（hypothesis）与文本的关系，关系有：蕴含关系（entailment），矛盾关系（contradiction），中立关系（entailment）。这一类场景一般建模成多分类问题。

（3）问答

根据Question在段落或文档中查找Answer，这类场景常常会被建模成分类问题；还有一类是根据Question从若干候选中找出正确答案，这类场景常常会被建模成排位（ ranking ）问题。

（4）对话

与QA 类似，但是比QA更复杂，由于引入了历史轮对话，需要考虑在历史轮的限制下回复是否合理。一般建模为分类或排位问题。

（5）信息检索

信息检索是一个更为复杂的任务，往往会有Query—Tittle，Query—Document的形式（Query可能是一个Document）检索需要计算相似度和排序一般建模为排位问题。

深度学习文本匹配方法：自动提取出词语之间的关系特征并结合短语匹配中的结构信息和文本匹配的层次化特性，更精细地描述文本匹配问题。

3. 序列标注

（1）序列标注问题概述

序列标注方法：“将输入的语言序列转化为标注序列”，通过标注序列标签含义来解决问题。

命名实体识别：将给定的输入序列中的的命名实体（如人名、地名等）识别出来

信息抽取（实体识别）：将给定的输入序列中的特定信息抽取出来

词性序列标注：将给定的输入序列中词的词性标出来

（2）马尔可夫模型

马尔可夫链：

马尔可夫模型：

$p(S_0,S_1,...,S_T) = \prod_{t=1}^{T}p(S_t|S_{t-1})p(S_0)$

马尔可夫模型三元组： $M = (S,\pi ,A )$ ，S为模型中状态的有限集合，A为与时间无关的状态转义概率矩阵， $\pi$ 为初始状态空间的概率分布

例如：

（3）隐马尔可夫模型HMM

该模型是一个双重随机过程，我们不知道具体的状态序列（即不知道S），只知道状态转移的概率（即只知道A），即模型的状态转换过程是不可观察的（隐蔽的），而可观察事件的随机过程是隐蔽状态转换过程的随机函数。

隐马尔可夫模型五元组： $\lambda = (S,O,\pi ,A,B)$ ，其中S为状态集合，O为每个状态可能的观察值，A为状态转移矩阵，B为给定状态下观察值的概率分布， $\pi$ 为初始状态

HMM的特点：

HMM的状态是不确定或不可见的，只有通过观测序列的随机过程才能表现出来

观察到的事件与状态并不是一一对应，而是通过一组概率分布相联系

HMM是一个双重随机过程，两个组成部分：

马尔可夫链：描述状态的转移，用转移概率描述。

一般随机函数：描述状态与观察序列间的关系，用观察值概率描述。

HMM的三个假设：

马尔可夫性假设（状态构成一阶马尔可夫链）

不动性假设（状态与具体时间无关）

输出独立性假设（输出仅与当前状态有关）

HMM的结构：

HMM的评估问题：

序列概率 $P(O|\lambda )$ 的定义：

计算 $P(O|\lambda )$ ：

（1）前向算法：利用动态规划使用递归来降低计算复杂度

时间复杂度：

HMM的解码问题：

viterbi搜索算法：利用动态规划使用递归来降低计算复杂度

HMM在序列标注中的应用：

例1：

例2：

（4）神经网络序列标注模型

双向RNN+softmax模型存在的问题：输出之间彼此独立。

双向RNN+softmax改进：双向RNN+CRF

4. 序列生成

序列生成任务是NLP中的常见的重要任务之一，应用非常广泛，例如机器翻译‚自动文摘、机器阅读理解、对话生成、自动生成字幕等多项任务。

（1）Seq2Seq模型的输出产生方式

生成式模型Decoder

        根据编码端形成的输入表示和先前时刻产生成的输出tokens，生成当前输出 token （编码端和解码端有各自词表，二者可相同或不同。解码端需处理集外词OOV，一般用UNK 代替）

  分类：基本RNN架构生成框架、RNN+Attention架构生成框架、Transformer架构生成模型

选择式模型Decoder

        根据编码端形成的输入表示和先前时刻产生成的输出tokens，从输入端选择一个token作为输出 token （解码端和编码端词表相同）

选择-生成式模型Decoder

        根据编码端形成的输入表示和先前时刻产生成的输出tokens，生成或从输入端选择当前输出token （编码端和解码端有各自词表，二者可相同或不同。解码端需处理集外词OOV，一般用UNK 代替，该方法可有效的处理输出端的OOV 问题）

（2）生成式模型Decoder

基本RNN架构生成模型

RNN+Attention架构生成模型

Transformer架构生成模型

transformer模型特点：

全部采用Attention机制

克服了RNN无法并行计算的缺点，可以高度并行，训练速度快；

具有捕捉长距离依赖的能力，有较高的建模能力

transformer模型结构：

编码端：6层Attention堆叠，包含2个子层（Multi-head attention 和Feed Forward Network）

解码端：6层Attention堆叠，包含3个子层（Multi-head attention ，cross-attention和 Feed Forward Network）

交叉注意力部分：解码端的每一层与编码端的最后输出层做 cross-attention

transformer模型的encoder的输入：

词向量的embedding + positional encoding

transformer模型的encoder的输出：

词向量的深层表示，作为decoder里每一层中多头注意力层的K和V

transformer模型的decoder的输入：

词向量的embedding + positional encoding

transformer模型的decoder的输出：

输出结果

transformer模型的训练：

transformer模型的预测：

（3）选择式模型Decoder

生成式模型Decoder的缺点：输出词表是固定的，无法解决输出词表需按输入情况动态变化的问题

指针网络：

指针网络的应用：指针网络在 NLP 领域有广泛的用途，如文本摘要，阅读理解等从输入序列选输出序列的一系列复制类型的任务。指针网络也适合用于解决OOV（out of vocabulary）类问题

（4）选择-生成式模型Decoder

指针网络的缺点：输出直接从输入中选择，输出词表与输入词表相同，无法处理输出需要产生输入词表以外词的情况。

生成网络的缺点：高度的依赖词的的表征，当遇到OOV（Out-of-vocabulary）会出现表达不准确。而实际应用中，有些场合仅仅需对该生僻词逐字保留即可

（5）序列生成模型评价指标

BLEU值：

RGOUGE值：

（6）序列生成模型存在问题

曝光偏差问题（Exposure Bias）：一旦在预测前缀的过程中存在错误，会导致错误传播，使得后续生成的序列也会偏离真实分布。

解决方法：Scheduled Sampling：在训练过程中，混合使用真实数据和模型生成数据。

训练-评价目标不一致的问题：序列生成模型一般采用和任务相关的指标来进行评价，比如BLEU、GOUGE等，而训练时使用最大似然估计，这导致训练目标和评价方法不一致。

解决方法：可采用强化学习的策略进行模型训练

第 7 章预训练语言模型

预训练语言模型是采用迁移学习的方法（归纳迁移学习）通过自监督学习从大规模数据中获得与具体任务无关的预训练模型，然后用训练好的预训练模型提高下游任务的性能的一种数据增强法。

1. 预训练，精调范式（pre-train, fine-tune）

训练过程：

第一个阶段Pre-training：利用大型语料库完成预训练模型非监督学习

第二个阶段fine-tuning：针对特定任务在相应数据集中进行监督学习，通过 Fine-tuning 技术来适配具体任务。

（1）EMLO模型

（2）GPT

GPT 采用了 Transformer 的 Decoder 部分，并且每个子层只有一个 Masked Multi Self-Attention（768 维向量和 12 个 Attention Head）和一个 Feed Forward （无普通transformer解码器层的编码器-解码器注意力子层），模型共叠加使用了 12 层的 Decoder

训练过程：

第一个阶段 Pre-training ：主要利用大型语料库完成非监督学习；

第二个阶段 Fine-tuning：针对特定任务在相应数据集中进行监督学习，通过 Fine-tuning 技术来适配具体任务。

上图是对不同任务进行微调的输入转换。

将所有的结构化输入转换为 Token 序列，

然后使用预训练模型（Transformer）进行处理，

最后使用线性和 Softmax 层完成特定的监督学习任务。

微调调参方式：

（3）BERT

BERT是多任务学习：

语言模型任务

判断两个文本谁在前谁在后

使用堆叠的双向Transformer Encoder，在所有层中共同依赖于左右上下文基础版是12个Encoder (12层 )；高级版24个Encoder (24层 )

训练过程：

第一个阶段 Pre-training：主要利用大型语料库完成非监督学习

（1）基于MLM的训练方法

        随机遮住15%的单词作为训练样本。其中：80%用 masked token 来代替， 10%用随机的一个词来替换，10%保持这个词不变。



（2）基于NSP的训练方法

        正样本和负样本比例是1：1，50%的句子是正样本，即给定句子A和B，B是A的实际语境下一句；负样本：在语料库中随机选择的句子作为B。通过两个特定的 token[CLS]和[SEP]来串接两个句子，该任务在[CLS]位置输出预测



优化目标：Total loss = Masked Language Model loss + Next Sentence Prediction loss

第二个阶段 Fine-tuning：针对特定任务在相应数据集中进行监督学习，通过 Fine-tuning 技术来适配具体任务。

分类任务和匹配任务利用[CLS]位置的embedding

序列标注任务利用每个 token 的输出 embedding

序列生成任务（选择式生成）第二句 token 输出 embedding

（4）BART

BERT的缺点：具备双向语言理解能力的却不具备做生成任务的能力。

GPT的缺点：拥有自回归特性的却不能更好的从双向理解语言。

BART：采用标准Transformer结构

训练方法：

Pre - Training

五种加噪音的方法：

Token Masking：与BERT的[Mask]策略相同

Token Deletion：随机删除某些ToKen,相比较于Token Masking 模型必须决定哪个位置是遗漏的。

Text Infilling：同时选中连续的 Token 替换为一个[MASK], 或在原始数据种随机插入MASK Token （没有数据缺失情况下）模型不知道[Mask]对应多少 Token，也不知道Token 是否有效（让模型学习能力强大）

Sentence Permutation：将一个文档种的句子之间顺序打乱。

Document Rotation：从文档中随机选一个Token作为整个文档的起始Token，对文档轮换，此任务训练模型以识别文档的开始Token。

Fine-tuning

（5）T5

给整个 NLP 预训练模型领域提供了一个通用框架，把所有NLP任务都转化成一种形式(Text-to-Text)，通过这样的方式可以用同样的模型，同样的损失函数，同样的训练过程，同样的解码过程来完成所有 NLP 任务。

T5的输入输出格式：

训练过程：

Pre - Training

获得了完整的 T5 模型，还有它的训练方法。

Transformer Encoder-Decoder 模型；

BERT-style 式的破坏方法；

Replace Span 的破坏策略；

15 %的破坏比；

3 的破坏时小段长度。

Fine - tuning

2. 预训练，提示，预测范式（pre-train, Prompt, Predict）

不通过目标工程使预训练的语言模型（LM）适应下游任务，而是将下游任务建模的方式重新定义（Reformulate），通过利用合适prompt 实现不对预训练语言模型改动太多，尽量在原始 LM上解决任务的问题

Prompt主要问题：

输入端：怎么样选取合适的Prompt，适配不同任务，同时把模型潜能激发出来（怎么把Prompt结合输入的句子构成模型的输入）

两种形式：

1. 完形填空：「这个饼不错 ]，太 [Z]，

2. 前缀提示：「好好学习」，翻译成英文：[Z]

输出端：模型的输出（ Answer）可能与标签不同，拿到answer后如何往标准化的Y（标签空间）映射

常见answer形式：

1. Token：预训练 LM 词汇表中的一个 token，或者词汇子集；

2. Span：短的 multi-token span，这些通常与 cloze prompt 一起使用；

3. 句子或文档：这些通常与前缀 prompt 一起使用。

Prompting训练策略：怎样利用Prompt机制精调模型（第四范式的微调）

1. Promptless Fine-tuning：直接使用下游任务进行训练，不用prompt，更新预训练参数；优点-简单，不需要设计prompt；缺点-小数据集上容易过拟合或者不稳定

2. Tuning-free Prompting：基于prompt直接生成答案，无需调参。优点-简单高效；缺点-需要较重的prompt设计

3. Fixed-LM Prompt Tuning：固定预训练参数，调整prompt参数，使下游任务更好作用于prompt的产生；优点-适合小样本学习；缺点-不适合零样本学习，prompt模版通常不再是人工设计的

4. Fixed-Prompt LM Tunin：固定prompt参数，调整预训练参数

5. Prompt+LM Fine-tuning：调整prompt参数，调整预训练参数。适合大数据集，小数据集易过拟合

第三范式和第四范式的区别：

第三范式指的是先在大的无监督数据集上进行预训练，学习到一些通用的语法和语义特征，然后利用预训练好的模型在下游任务的特定数据集上进行fine-tuning，使模型更适应下游任务。GPT、Bert、XLNet等模型都属于第三范式，其特点是不需要大量的有监督下游任务数据，模型主要在大型无监督数据上训练，只需要少量下游任务数据来微调少量网络层即可。

第四范式指的是将下游任务的建模方式重新定义，通过合适的prompt来实现直接在预训练模型上解决下游任务，这种模式需要极少量（甚至不需要）下游任务数据，使得小样本、零样本学习成为可能。

第三范式的fine-tuning过程是调整预训练模型，使其更加匹配下游任务，那么第四范式就正好相反，prompt过程则是调整下游任务，使其更加匹配预训练模型。也就是第三范式是预训练模型迁就下游任务，而第四范式是下游任务迁就预训练模型。

你可能感兴趣的:(课程作业相关,自然语言处理,人工智能,深度学习)

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
水泥质量纠纷案代理词徐宝峰律师
贵州领航建设有限公司诉贵州纳雍隆庆乌江水泥有限公司产品质量纠纷案代理词尊敬的审判长、审判员：贵州千里律师事务所接受被告贵州纳雍隆庆乌江水泥有限公司的委托，指派我担任其诉讼代理人，参加本案的诉讼活动。下面，我结合本案事实和相关法律规定发表如下代理意见，供合议庭评议案件时参考：原告应当举证证明其遭受的损失与被告生产的水泥质量的因果关系。首先水泥是一种粉状水硬性无机胶凝材料。加水搅拌后成浆体，能在空气中
怎么起诉借钱不还的人？怎样起诉欠款不还的人？影子爱学习
怎么起诉借钱不还的人？怎样起诉欠款不还的人？如果遇到难以解决的法律问题，我们可以匹配专业律师。例如：婚姻家庭（离婚纠纷）、刑事辩护、合同纠纷、债权债务、房产（继承）纠纷、交通事故、劳动争议、人身损害、公司相关法律事务（法律顾问）等咨询推荐手机/微信:15633770876【全国案件皆可】借钱不还起诉对方需要哪些资料起诉欠钱不还的，一般需要的材料包括以下这些：借据、收据、欠条、付款凭证等证据，以及向
第四天旅游线路预览——从换乘中心到喀纳斯湖陟彼高冈yu 基于Google earth studio 的旅游规划和预览旅游
第四天：从贾登峪到喀纳斯风景区入口，晚上住宿贾登峪；换乘中心有4路车，喀纳斯①号车，去喀纳斯湖，路程时长约5分钟；将上面的的行程安排进行动态展示，具体步骤见”Googleearthstudio进行动态轨迹显示制作过程“、“Googleearthstudio入门教程”和“Googleearthstudio进阶教程“相关内容，得到行程如下所示：Day4-2-480p
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
4招写出高价值文章 zhiliner
文章写得泛泛是因为思考得不够深，思考得越深文章会越有价值。拿到一个主题一定要去深入挖掘事件背后的东西，比如人物困境以及趋势性的东西。写作过程中有几个深度思考的方法一、解剖，让旧素材焕发新意作为一个写作者，我们能够做的最大贡献，就是给出自己看世界的角度。解剖其实就是把这个话题相关的信息都列出来，详细的列出来，看清楚它的内部。我们看到一个老话题或者一段旧素材的时候，不要只看这个素材或者话题本身，一定要
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
2023-08-08 2023梦启支教团张牧泽
学汉字历史，行传统书法——中国矿业大学梦启支教团梦启三班开展书法文化课7月20日上午8时，中国矿业大学梦启支教团在贵州省金沙县西洛街道彩虹小学开展了“书法文化”课程。该课程意在向孩子们传授汉字演变的相关知识，围绕书法发展历史讲解不同时期的字形字体特点。此课程由梦启支教团成员王耀民讲授，梦启三班全体成员参加。中国文字的发展有数千年的历史，从早期雏形的象形文字到殷商时期的甲骨文、金文，再到西周、秦朝的
《吹牛大王历险记》读书随笔赵炳森
这本书的作者是埃·拉斯伯戈·毕尔格。（没查到相关内容，好像他只写过《吹牛大王历险记》。）最让人百思不得其解的是他居然能自己拉自己的辫子出泥潭？！我觉得自己拉自己的辫子只会把自己的辫子拉断，而不会飞出泥潭。（问:图片中底下的屁股为什么插了一根钢针？）屁股底下居然有根钢针？在泥潭应该是滑滑的吧，可是他怎么能夹紧马肚呢？马肚子应该是在马的下方。还有如果能从泥潭里把连人带马都给拽出来的话，他力气肯定很大，
我与《红楼梦》‖纪念曹雪芹出生307周年！归海逸舟是周成功子阳佳乐归海逸舟是周成功子阳佳乐
【今日作家推荐】中国古典小说之首《红楼梦》，其作者曹雪芹是文坛泰斗。约1715年5月28日，曹雪芹出生。所以，今天推荐的是中国人众所周知的作家——曹雪芹。曹雪芹在世界读者心目中也影响广大，可以与西方世界引以为豪的莎士比亚、歌德等媲美。1、我与《红楼梦》我一直想写一篇和《红楼梦》相关的文章，现在机会终于来了！《红楼梦》作为我国家喻户晓的文学名著，其影响是空前的。还在我很小的时候，姥姥经常讲《红楼梦》
2020-8-19晨间日记：看过的电影盐大虾
今天是周三起床：6点半就寝：11点天气：晴心情：正常纪念日：周三任务清单今日完成的任务，最重要的三件事：1.整理写过的文档2.电影《电灯泡》3.这就是街舞第三季第五期改进：早睡早起习惯养成：早睡早起，看书周目标·完成进度两篇文章学习·信息·阅读电影艺术发展史相关教材健康·饮食·锻炼吃了挺多零食，还喝了果粒橙，还是得少吃，多锻炼，不然会慢慢死掉的。人际·家人·朋友淡定交流，不放在心上。工作·思考专心
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
上班族可以做线上副业兼职有哪些？盘点7个适合上班族做的副业兼职！高省APP大九
对于许多上班族来说，工资往往不能满足他们的生活需求，因此许多人开始寻找副业来增加收入。以下是一些适合普通人的副业赚钱路子，希望能给您带来一些灵感。1、做好物推荐现在很多职场人其实有大量的个人时间，只不过这些个人时间比较碎片化，他们不能够很好的利用起来，其实可以利用这些碎片化的时间去做副业，比如做好物推荐。在网上有很多的平台，比如头条抖音等等都开通了一个商品的分销功能，只要你发布相关的视频或者文章，
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

自然语言处理复习

第 3 章 深度学习基础

第 4 章 语言模型+词向量

第 5 章 NLP中的注意力机制

第 6 章 NLP基础任务

第 7 章 预训练语言模型

你可能感兴趣的:(课程作业相关,自然语言处理,人工智能,深度学习)

第 3 章深度学习基础

第 4 章语言模型+词向量

第 7 章预训练语言模型