NLG一、seq2seq详解以及相应trick介绍

paper：https://arxiv.org/pdf/1406.1078.pdf

code：https://github.com/google/seq2seq

18年的时候使用这个模型做标题生成，今天来总结一下这个比较经典的模型结构。对于自动摘要或者标题生成的任务，一般有两种方法：抽取式和生成式。其中抽取式是从文章中对段落和句子打分进行抽取，而生成式是根据输入序列模型直接输出一个序列，相对比较智能一些，而本次分享的这篇论文就是生成式的一个经典框架。本论文是在2014年Google Brain团队和Yoshua Bengio 两个团队提出的，最初的主要目的是解决机器翻译问题，同时首次提出了GRU和Encoder-Decoder模型，也称为seq2seq。

一、seq2seq模型概要

Seq2Seq模型主要是用来解决将一个序列X转化为另一个序列Y的一类问题，比如机器翻译、自动摘要、对话系统中答案的生成等等都可以使用这个框架。这个过程有点类似比较传统的HMM、MEMM、CRF，通过一系列随机变量X，去预测另外一系列随机变量Y。但是不同的是，HMM模型中的随机序列与随机变量系列一一对应而Seq2Seq模型则并不是指一一对应的关系。

Seq2Seq生成模型的主要思路是在已知输入序列和前序生成序列的条件下,最大化下一目标词的概率，而最终希望得到的是整个输出序列的生成出现的概率最大：

说明：

1、其中T表示输出序列的时间序列大小，y1:t-1表示输出序列的前t-1个时间点对应的输出，X为输入序列。通常情况下，训练模型的时候y1:t-1使用的是ground truth tokens，然而在测试过程中，ground truth tokens是不可知的，需要使用前序预测到的y‘1:t-1来表示，这将会引发问题Exposure Bias。

2、在预测输出序列的每个token时，采用的都是最大化下一目标词(token)的概率，来得到token，对于整个句子或者说序列来说，这种解法是贪心策略，带来的是局部最佳。对于一个端到端的生成应用来说，目标是整个序列是最佳的，换句话说，希望最后的生成序列的tokens顺序排列的联合概率最大，找到一个全局最优。

二、seq2seq模型结构

seq2seq模型主要分为两个部分：Encoder和Decoder。Encoder主要完成对输入数据的编码，Decoder是对编码后的向量进行解码来输出整个输出序列。

上图Figure1是seq2seq的基本结构，Encoder把输入序列[x1,x2,…,xm]（由m个固定长度为d的向量构成）使用RNN、LSTM、GRU以及BILSTM等等常用的序列编码器进行编码后，形成一个语义向量C；Decoder基于这个C向量输出输出序列为[y1,y2,…,yn]（由n个固定长度为d的向量构成），输入序列和输出序列的长度可以不一样。

注意：输入和输出序列的向量维度是一样的，而且共用一个词表。

1）首先说明Encoder的计算过程，每个 X 代表一个句子中的每个词；每个圈代表每个隐藏状态，用 h 表示。用 t 代表时间，所以 h 如下计算（其中 f 是激活函数）。算完每个 h，就表示这个句子已经读完了。

2）最后一个隐藏状态就是整个输入序列的向量表示了，使用向量C来表示。

3）再次说明一下Decoder的计算过程，由于Decoder需要顺序解码，因此只能使用单向的RNN、LSTM或者GRU了，隐藏状态计算与Encoder的区别是：所有的隐藏单元的输入都是Encoder的语义向量C，而且还增加了输出y作为输入，公式如下：

最终每个词的输出使用如下公式计算：

这里的激活函数g要对应输出到词表里的词，一般采用softmax作为激活函数。

4）最终模型的目标是要求解所有训练中输入数据与输出数据pair对的平均最大，损失函数如下：

θ是模型的参数，n是训练数据的样本数量。

扩展：深入理解Encoder-Decoder框架，其实Encoder和Decoder都可以采用多层来实现。*****

三、seq2seq+attention模型结构

从传统的seq2seq框架可以看出，Encoder是把所有的输入序列编码为一个固定的语义向量C，由于RNNs长依赖的问题，这个向量并不能包含所有的输入序列信息；而Decoder又受限于这个向量C的表示。论文《Neural Machine Translation by Jointly Learning to Align and Translate》提出了attention机制来解决这个问题。模型结构如下图所示：

Encoder阶段使用BiRNN来进行编码，将Encoder中的每一个时刻的隐藏状态都保存至一个列表中[h1,h2,…,hm],在Decoder解码每一个时刻i的输出时，都需要计算Encoder的每个时刻的隐藏状态hi与Decoder的输出时刻的前一个时刻的关系si-1的关系，进而得到Encoder的每个时刻的隐藏状态对Decoder该时刻的影响程度。如此，Decoder的每个时刻的输出都将获得不同的Encoder的序列隐藏状态对它的影响，从而得到不同的语义向量Ci。

seq2seq+attention框架与原始的seq2seq最重要的区别在于Decoder引入Encoder端语义向量C的方式不一样，下面是seq2seq+attention的方式：

Decoder阶段的每个时刻的隐藏状态si，都会根据由Encoder阶段的隐藏状态序列对Decoder阶段上一个时刻(i-1)的隐藏状态的影响也就是我们的语义向量Ci和上一时刻的的状态si-1，上一个时刻的输出yi-1三者通过一个非线性函数得出。Decoder阶段每次解码一个词的时候都会对应不同的Encoder阶段的语义向量Ci，Ci是根据Encoder编码阶段的各个隐藏状态(向量)的权重和，下面介绍一下该语义向量的计算方式：

此公式中每个时刻的权重αij表示Encoder编码阶段的第j个隐藏状态对Decoder解码阶段的第i个隐藏状态的权重影响。hj就是Encoder阶段每个时刻的隐藏状态。

其中，eij为Encoder编码阶段的第j个隐藏状态和Decoder解码阶段的第i-1个隐藏状态的联合前馈网络关系。a是一个前馈神经网络，比如形式如下：

总结一下：整个计算Ci的过程为：分别计算Encoder编码阶段的每个隐藏状态和Decoder解码阶段的第i-1个隐藏状态前馈关系，再进行Softmax归一化处理计算出该Encoder编码阶段的隐藏状态的权重aij，最后将所有的Encoder编码阶段的隐藏状态的进行权重求和。

四、seq2seq模型的不足以及解决的trick

4.1、OOV与低频词

问题描述：OOV表示的是词汇表外的未登录词，低频词则是词汇表中的出现次数较低的词。在Decoder阶段时预测的词来自于词汇表，这就造成了未登录词难以生成，低频词也比较小的概率被预测生成。

trick1（Pointer-Generator）：

论文《Abstractive Text Summarization using Seq2Seq RNNs and Beyond》中使用Pointer-Generator机制来解决OOV和低频词问题。由于文本摘要的任务的特点，很多OOV 或者不常见的的词其实可以从输入序列中找到，因此一个很自然的想法就是去预测一个开关（switch）的概率P(si=1)=f(hi,yi-1,ci)，如果开关打开了，就是正常地预测词表；如果开关关上了，就需要去原文中指向一个位置作为输出。

trick2（copy机制）：

当生成一段文本的时候，这个生成单词可以有两种来源：一种是通过普通seq2seq生成；另一种是从原文本拷贝过来（这就是copy机制），比较有代表性的是下面两篇paper：《Get To The Point: Summarization with Pointer-Generator Networks》和《Incorporating Copying Mechanism in Sequence-to-Sequence Learning》。

《Get To The Point: Summarization with Pointer-Generator Networks》：

将每步输出的单词概率看作一个混合模型（生成的单词概率分布与拷贝原文的单词概率分布的混合），利用注意力得分作为拷贝单词的概率，公式如下：

《Incorporating Copying Mechanism in Sequence-to-Sequence Learning》：

M是输入隐藏层状态的集合，ctct是attention score，stst是输出的隐藏状态，g代表生成，c代表复制。

生成还是复制基于概率最大来选择，加了一个简单的限制规则，如果yt在输入中没出现，那么肯定不会是copy，p(yt,c|∗)=0；如果yt在只输入中出现，而词表中没有，那么肯定是copy，p(yt,g|∗)=0。

为了复制较长短语，作者改变了yt−1的表达式，加了一项selected read。yt−1的表达式由两项拼接而成，第一项是词的embedding，第二项叫做selective read，其目的是为了拷贝较长的短语。理解的话很直观，如果前一个词在输入中出现了，那么有一个权重的累加，否则为零。

trick3（pointer softmax）：

《Pointing the Unknown Words》，本篇提出了pointer softmax的机制，为了解决copy or generate 和 where to copy两个问题。也称为pointer-generator network。

1）copy or generate

用一个参数ztzt来决定是point，copy还是generate，用一个多层感知机来预测。输入由当前时刻attention得出的语义向量ctct和前一时刻decoder的隐藏层状态st−1st−1以及输出yt−1yt−1拼接构成。其实这个多层感知机的输入和NMT中decoder预测下一状态的输入是一模一样的，只是一个是学习对应的位置，一个是学习预测每个词的概率。

2）where to point

在attention softmax的基础上，额外用了一个location softmax来解决where to point的问题。目标是max p(lt|zt=0,(y,z)

4.2、Encoder阶段的Beam Search

问题描述：我们知道在Seq2Seq模型的最终目的是希望生成的序列发生的概率最大，也就是生成序列的联合概率最大。在实际预测输出序列的每个token的时候，采用的都是最大化下一目标词(token)的概率，因为Decoder的当前时刻的输出是根据前一时刻的输出，上一个时刻的隐藏状态和语义向量Ci.通过依次求每个时刻的条件概率最大来近似获得生成序列的发生最大的概率，这种做法属于贪心思维的做法，获得是局部最优的生成序列。

trick：论文《Sequence-to-Sequence Learning as Beam-Search Optimization》论文中提出Beam-Search来优化上述的局部最优化问题。Beam-Search属全局解码算法，Encoder解码的目的是要得到生成序列的概率最大，可以把它看作是图上的一个最优路径问题：每一个时刻对应的节点大小为整个词汇表，路径长度为输出序列的长度。可以由动态规划的思想求得生成序列发生的最大概率。假设词汇表的大小为v,输出序列的长度为n.设t时刻各个节点(各个词w)对应的最优路径为dt=[d1,d2,…,dv].则下一个时刻(t+1)的各个节点对应的最优路径为dt加上t时刻的各个节点(各个词w)到(t+1)的各个节点(各个词w)的最短距离,算法的复杂度为o(nv^2).因为词汇表的大小v比较大，容易造成算法的复杂度比较大。为了降低算法的复杂度，采用Beam Search算法，每步t只保留K个最优解(之前是保留每个时刻的整个词汇表各个节点的最优解)，算法复杂度为o(nKv)。

扩展：然而实际中Beam-Search由于它总是选择一条分支路径，导致最后的解码结果都差不多，缺乏多样性，改进措施如下：

思路一：通过增加惩罚项，比如对同一组的第二、第三选项进行降权，从而避免每次搜索结果都来自于同一路径。对于权重的选择，可以通过强化学习得到；也可以通过设置参数、调整参数来得到。

思路二：计算每条路径的概率分，如果后面生成的话跟第一组相似，就对该组进行降权，避免组与组之间相似度过高。

4.3、Exposure Bias

问题描述：Seq2Seq模型训练的过程中，解码阶段下一时刻的输出是需要依赖上一时刻的输出和上一时刻的隐藏状态和语义变量Ci.此时上一时刻的输出使用的是ground truth token；而在验证Seq2Seq模型的时候，由于不知道上一时刻的真实token，上一时刻的输出使用的是上上个时刻的预测的输出token，这将引发Exposure Bias(曝光偏差问题)。

trick：使用Beam Search的Encoder的方式也能一定程度上降低Exposure Bias问题，因为其考虑了全局解码概率，而不仅仅依赖与前一个词的输出，所以模型前一个预测错误而带来的误差传递的可能性就降低了。论文《Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks》中提出了DAD的方法，论文中提到Exposure Bias的主要问题是训练过程中模型不曾接触过自己预测的结果，在测试过程中一旦预测出现错误，那么模型将进入一个训练过程中从未见过的状态，从而导致误差传播。论文中提出了一个训练过程逐渐地迫使模型处理自己的错误，因为在测试过程中这是必须经历的。DAD提出了一种退火算法来解决这个问题，在训练过程中引入一个概率值参数εi ,每次以εi的概率选取真实的token作为输入， 1-εi的概率选取自己的prediction作为输入。逐渐降低εi，最终模型全都利用自己的prediction作为下一步的输入，和测试过程一致。

4.4、Sampled Softmax

问题描述：Seq2Seq模型的代价函数的loss便是sampled_softmax_loss。为什么不是softmax_loss呢？我们都知道对于Seq2Seq模型来说，输入和输出序列的class便是词汇表的大小，而对于训练集来说，输入和输出的词汇表的大小是比较大的。为了减少计算每个词的softmax的时候的资源压力，通常会减少词汇表的大小，但是便会带来另外一个问题，由于词汇表的词量的减少，语句的Embeding的id表示时容易大频率的出现未登录词‘UNK’。于是，希望寻找到一个能使seq2seq模型使用较大词汇表，但又不怎么影响计算效率的解决办法。

trick：论文《On Using Very Large Target Vocabulary for Neural Machine Translation》论文中提出了计算词汇表的softmax的时候，并不采用全部的词汇表中的词，而是进行一定手段的sampled的采样，从而近似的表示词汇表的loss输出。sampled采样需要定义好候选分布Q。即按照什么分布去采样。

4.5、seq2seq为什么需要bucket

问题描述：在处理序列问题时，每个batch中的句子的长度其实是不一的，通常做法是取batch中语句最长的length作为序列的固定的长度，不足的补PAD。如果batch里面存在一个非常长的句子，那么其他的句子的都需要按照这个作为输入序列的长度，训练模型时这将造成不必要的计算浪费。

trick：相当于对序列的长度做一个分段，切分成多个固定长度的输入序列，比如说小于100为一个bucket,大于100小于150为另一个bucket…。每一个bucket都是一个固定的computation graph。这样一来，对于模型输入序列的固定长度将不再单一，从一定程度上减少了计算资源的浪费。

4.6、连续生成重复内容的问题

问题描述：在Seq2Seq的解码阶段，生成序列是很可能会生成连续的重复词。

trick：论文《Get To The Point: Summarization with Pointer-Generator Networks》使用Pointer-Generator Networks)中使用Coverage mechanism来缓解重复词的问题，模型中维护一个Coverage向量，这个向量是过去所有预测步计算的attention分布的累加和，表示着该模型已经关注过原文的哪些词,并且让这个coverage向量影响当前步的attention计算。其中ci表示之前时刻的预测的attention分布和。

此外，该论文中添加了一个coverage loss用于惩罚对重复的attention。ai表示当前时刻的attention，ci表示之前时刻的预测计算的attention分布的累加和。

扩展：苏剑林之前对生成重复内容问题做了一个比较深入的剖析，请参考：https://kexue.fm/archives/8128

4.7、seq2seq中“根本停不下来”的问题

问题描述：在Seq2Seq的解码过程中，我们是逐个token地递归生成的，直到出现标记为止，这就是所谓的“自回归”生成模型。然而，研究过Seq2Seq的读者应该都能发现，这种自回归的解码偶尔会出现“根本停不下来”的现象，主要是某个片段反复出现，比如“今天天气不错不错不错...”、“你觉得我说得对不对不对不对...”等等，但就是死活不出现标记。

trick：论文《Consistency of a Recurrent Language Model With Respect to Incomplete Decoding》比较系统地讨论了这个现象，并提出了一些对策。

主要的解决思路就是如何在解码的时候生成标记，作者分别对确定性解码（主要包括贪心搜索和束搜索Beam search）和随机解码（主要包括原生随机解码、top-k随机解码和Nucleus随机解码来自文章《The Curious Case of Neural Text Degeneration》）进行了不同的策略：

1）对于原生的随机解码采用加入有界隐向量的方式；

2）对于top-k随机解码和Nucleus随机解码采用主动添加标记的方法；

3）对于确定性搜索采用自截断设计：想办法让有正的下界，而且这个下界随着t的增大而增大，最终逐渐趋于1。

参考文献：

[1]https://arxiv.org/pdf/1406.1078.pdf

[2]https://arxiv.org/pdf/1409.0473.pdf

[3]https://arxiv.org/abs/1602.06023.pdf

[4]https://arxiv.org/pdf/1603.06393.pdf

[5]https://arxiv.org/pdf/1603.08148.pdf

[6]https://arxiv.org/abs/1506.03099.pdf

[7] https://arxiv.org/abs/1606.02960.pdf

[8]https://arxiv.org/abs/1412.2007.pdf

[9]https://arxiv.org/pdf/1704.04368.pdf

[10]https://arxiv.org/abs/2002.02492.pdf

[11]https://blog.csdn.net/u014732537/article/details/81206267

[12]https://kexue.fm/archives/7500

[13]https://blog.csdn.net/thormas1996/article/details/81081772

[14]https://kexue.fm/archives/8128

[15]https://zhuanlan.zhihu.com/p/69159062

论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
第3篇：LangChain的架构总览与设计理念 Gemini技术窝 langchain 架构大数据人工智能 AIGC nlp
LangChain库是一个专为自然语言处理（NLP）设计的强大工具包，致力于简化复杂语言模型链的构建和执行。在本文中，我们将深入解析LangChain库的架构，详细列出其核心组件、设计理念及其在不同场景中的应用，并讨论其优缺点。文章目录1.LangChain库简介2.核心组件2.1数据输入模块作用2.2数据预处理模块作用2.3数据增强模块作用2.4数据加载与批处理模块作用2.5模型训练模块作用2.
java实现es分页查询_elasticsearch high level rest api分页查询数据 weixin_42565971 java实现es分页查询
Transport方式查询数据，在今后的elasticsearch中将不在维护，官方推荐用用highlevelrestapi或者lowerlevelapi去操作elasticsearch中的数据。在elasticsearch的增删改查操作中，其实最复杂的也就是分页查询了，根据elasticsearch官方资料，做个简单的笔记.1.准备jar包,我用的elasticsearch7.3版本,各版本需要
【心者不欺学习笔记】如何防范投资骗局回归简单宁静
1.不得不感慨一下，A股真是一个培养韭菜的好地方，韭菜割了一茬又一茬。在这样的市场做投资，有这样的对手真的是非常幸福，市场越无效，价值投资能获取的利润越大……2.再比如骗局：很多人发现买了错误的保险，也是这个心理，已经交了这么多钱，退保就要赔好多呢！可是不退，后面几十年还得继续交，更恶心。3.如何防范投资骗局第一、弄清楚每一个投资背后的原理，你赚的是谁的钱？大家要去想一想，我投资的项目，到底靠什么
心灵日记2021-10-27 俩小羊
能量日记：1、今天视觉笔记提速了半小时，完成后也没有整个人累垮的感觉，突然发现了解自己的能力，做自己能力范围内的事情是舒适的。当然适当地挑战也是很有必要的，前提就是必须要了解自己。2、完成Act的训练练习。3、选择挑战效能训练营，好好提提速度宽恕日记：1、Act行动营总是要挖痛苦，但也不得不说有些事情不想不等于不存在，当我们能够坦然去说，才是真正的接纳，我真的把接纳当成一种控制的手段而已，放下过去
PyTorch中用于神经网络的开源特征可视化工具包顾北向南
转载于:https://mp.weixin.qq.com/s/CTS3MUkcNTZXbAR2gvkcQw1.设置场景给概览功能的可视化作为一个研究领域，并推出了FlashTorch- 一个开放源码的功能可视化工具包建在PyTorch神经网络。该软件包可通过安装pip。查看GitHub仓库的源代码。也可以在GoogleColab上托管的这款笔记本中使用它，而无需安装任何东西！https://git
C++ 编程异常处理（try - throw - catch）详解 Aliven888 C/C++c++异常处理 try throw catch
文档声明：以下资料均属于本人在学习过程中产出的学习笔记，如果错误或者遗漏之处，请多多指正。并且该文档在后期会随着学习的深入不断补充完善。感谢各位的参考查看。笔记资料仅供学习交流使用，转载请标明出处，谢谢配合。如果存在相关知识点的遗漏，可以在评论区留言，看到后将在第一时间更新。作者：Aliven888文章目录1、背景2、异常处理的概述3、异常处理的方法3.1、异常的抛出（throw）3.2、异常的检
读李中莹先生论“阿Q精神" 猫咪06
这阵子重读《重塑心灵》，对“阿Q精神"一段很有感慨，在我们从小的信念里，阿Q的精神胜利法是被贬低的，是对无能力改变自己的境遇时，似手只能采用自我安慰的人的讽刺。李中莹先生在他的书中结合对话者的认可，定义阿Q精神“只求精神胜利，罔顾真实情况"，他就针对这两句话，解析阿Q精神，并进行了肯定‘，。首先“精神胜利"指的是自己内心有成功的感觉，这很符合NLP!如果所有人都认为你成功，而你自己没有成功的喜悦，
#第三周#《印象笔记留给你的空间》椰仔
《印象笔记留给你的空间》印象笔记不是一个记录类APP吗？难道这本书是教你怎么使用印象笔记的吗？带着这样的疑惑，我开启了本书的阅读。“记录的目的是为了遗忘。”开篇就有点颠覆的我的认知，为什么我们记录的目的就是为了遗忘呢？书中说到大脑擅长思考而不是记忆，但是我们总觉得我们的大脑应该担当“记忆”这个责任。但其实大脑是智慧的象征，相对自己而言，大脑的作用更在于思考和创造。在当今这个时代，与其去记忆信息，不
【心理】《津巴多普通心理学》第十二章读书笔记 dear心理咨询师黄倩雯
第十二章:心理障碍什么是心理障碍？医学模型将心理障碍视为疾病，心理学将心理障碍视为生物、心理、社会、行为因素交互作用的结果。
RAG 聊天机器人：用 Langchain 和 Streamlit开启与 PDF 的智能对话 Soyoger 大模型应用落地架构实战机器人 langchain pdf 大数据 chatgpt
与大量PDF文档的交互如今变得前所未有地便捷与智能。想象一下，您可以轻松与您的笔记、书籍和各种文档进行无缝对话，不再需要繁琐的手动查找和处理。这篇文章将带您逐步构建一个基于Multi-RAG和Streamlit的Web应用程序，该应用程序通过AI驱动的聊天机器人来读取、解析和处理PDF数据，提供前所未有的用户体验。让我们一起深入探讨开发这一创新应用的完整过程，了解如何通过先进技术实现高效的文档管理
存储课程学习笔记7_fuse库的简单使用（fuse,opencv的demo） yun6853992 dpdk学习 fuse
fuse一般称为用户态度文件系统，可以实现在用户层实现对文件系统的控制。通过fuse内核模块的支持，基于libfuse提供的接口，就可以实现一个文件系统。fuse内核模块实现了与VFS的对接，运行后可以看到/dev/fuse，拦截相关请求，反馈给fuse进程，进行操作。使用fuse进行开发，不用关注内核模块，直接使用libfuse库在用户态实现文件系统即可。0：总结1：fuse的开发，实际上和前面
Linux操作命令学习笔记 Erii要早睡 linux 学习
Linux操作命令学习笔记常用操作命令（以下均严格区分大小写）查看文件以及文件夹：ls命令ls-a（显示隐含文件，如以.开头的文件)ls-l(长格式输出，和ll命令效果近似)ls-R（递归显示）查看当前路径：pwd命令新建目录：mkdir命令mkdir-p（创建多级目录）切换工作目录：cd命令创建文件：touch命令（重复创建可以更新修改时间）文件复制：cp命令cp-R（递归复制）文件移动：mv命
Linux学习笔记16 - 系统命令 KAMI STUDIO Linux学习笔记 linux 学习笔记
1.Linux常见系统管理命令命令含义格式su切换用户su[选项][用户名]ps显示系统由该用户运行的进程列表ps[选项]top动态显示系统中运行的程序（一般为每隔5s）topkill输出特定的信号给指定PID（进程号）的进程，并根据该信号完成指定的行为，其中可能的信号有进程挂起、进程等待、进程终止等kill[选项]进程号uname显示系统的信息uname[选项]setup系统图形化界面配置set
公众号点赞怎么赚钱？揭秘背后的盈利之道氧惠佣金真的高
在数字化时代的浪潮中，微信公众号作为一种重要的自媒体平台，已经吸引了数以亿计的用户。其中，点赞功能不仅成为衡量内容质量的重要指标，更是许多公众号实现盈利的秘密武器。那么，公众号点赞究竟是如何赚钱的呢？本文将深入探讨这一问题，为您揭示公众号点赞背后的盈利之道。复旦大学专家建议：现在千万别买房，因为房价将会断崖式下跌公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲
#每天一本书+一页笔记# 1204《情绪的重建》 May终身阅读者
#一生一万本计划#10000/1204【阅读日期】20210703【书名】情绪的重建【作者】曾旻【关键词】如何应对情绪困扰【分类】心理学【简评】作者是心理咨询师，心理学硕士，知乎心理学优秀回答者，擅长科普心理学知识。本书介绍了人们出现情绪困扰的6种常见原因，应对情绪困扰的9种认知策略。全书逻辑清晰，浅显易懂，用丰富的故事、例子，帮助读者理解心理学知识，生动好读，贴近实际。推荐阅读。【出版社】天地【
linux man date命令,Linux学习笔记之date命令勃斯丶李mkq~~ linux man date命令
一、自定义输出[root@cent1~]#date+%Y-%m-%d2010-07-17[root@cent1~]#[root@cent1~]#date+’%Y-%m-%d%H:%M:%S’2010-07-1722:55:32[root@cent1~]#[root@cent1~]#date+’%H:%M:%S’22:55:44[root@cent1~]#[root@cent1sbin]#date+
STM32学习笔记（二、初识stm32单片机）藏，捉单片机 stm32 学习
一、stm32的含义是什么？首先stm32是意法半导体公司（ST）使用ARM公司的Cortex-M为核心生产的32位的单片机。其中，ST---意法半导体公司，即SOC厂商。M---为Microelectronics的缩写，即微型处理器。32---表示控制器为32位的。103---表示F系列的子系列。二、stm32的分类CPU位数内核系列描述32Cortex--M0STM32F0入门级STM32L0
web学习笔记11-node.js基础晴天.js web-学习笔记前端学习 node.js
一、ES6ECMAscript->ES是JS的标准规范ES6是JS的第六套标准规范1，块级作用域let声明的变量，会进入暂时性的死区，提升后暂时不允许访问，只有赋值以后才允许访问let声明的变量不允许重复声明块级作用域：大括号之间的语句块，例如if、else。块级作用域下，let和const声明的局部变量或者常量，不允许被块级作用域以外访问let和const即使声明在全局作用域下，也不是全局变量或
SAP HANA makaitai BW sap 数据库工具报表 layer 服务器
原文地址：http://LiuAlex.com/archives/1776也是刚刚开始学习HANA的一些知识，一边看书一遍做笔记，说到底无非是用自己的语言来理解标准帮组文档所讲解的意思，肯定有理解失误的地方，毕竟没有参加过标准培训，即使有培训，从老师那边来的知识也不可能是完整的传授过来，中间多少的知识遗漏是正常的，所以多看看HELP的文档，应该可以原汁原味的理解作者的意思。这张图片是从SAPHAN
经验笔记：Node.js 中的 process.nextTick 漆黑的莫莫笔记 node.js
Node.js中的process.nextTick经验笔记引言在Node.js环境中，process.nextTick是一个非常重要的API，用于在当前执行栈的所有同步操作完成后立即执行一个回调函数。这使得开发者能够在异步I/O操作和其他异步事件之前，执行一些需要立即响应的任务。本文将探讨process.nextTick的工作原理、使用场景以及注意事项。process.nextTick的工作机制N
励志计划DAY85/100 春艳读书
你如何过一天，就将如何过一生。打卡周期：5月11日——8月18日（100天）2020年8月4日星期二【每日金句】人生只有走出来的精彩，没有等出来的辉煌。今日小成就：一、【学习之输入篇】1、学习微课1节。2、读书《父母就是孩子最好的玩具》第二章二、【学习之输出篇】1、思维导图1幅2、社群分享《父母就是孩子最好的玩具》第二章3、整理读书笔记1篇。三、【社群成长篇】1.晨习小组进入第65天。今天完成4个
公众号运营成功的秘诀是什么？氧惠帮朋友一起省
公众号运营已成为企业、个人品牌宣传与市场推广的重要渠道。然而，众多公众号如雨后春笋般涌现，如何在激烈的市场竞争中脱颖而出，实现运营成功，却是许多运营者面临的一大挑战。那么，公众号运营成功的秘诀究竟是什么呢？本文将对此进行深入探讨。公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲身经历，四个月公众号流量主从0到日入过万！》公司旗下管理800+公众号矩阵账号。代表
客户谈判中，如何抓住成交信号 ZhaoWu1050
【ZhaoWu的听课笔记】美国经营大师--杰克·韦尔奇，有句经典名言是：不分时机的销售，都是死路一条。在销售谈判中，如果销售人员能够提前判断，客户何时有购买意向，就可以通过调整销售动作，促成客户签单。这节课和你分享，有助于销售人员抓住成交信号的3种方法。1、抓住客户的微表情变化在谈判过程中，客户一般会控制自己所说的话因为他们不想透露自己真正的想法。不过，他们脸上的表情是很难掩饰的。销售人员正好可以
web安全学习笔记（1）头发的天敌是代码 web安全学习笔记 web安全学习笔记
一、网络安全分支1.web安全——网站2.二进制安全物联网安全工控安全二、网站是如何搭建起来的1.服务器服务器与我们的家庭使用电脑有什么区别？①没有显卡②CPU+内存不同于家庭电脑2.操作系统家庭系统：WindowsXPWindows7Windows8Windows9Windows10Windows11服务器操作系统：Windows2000Windows2003Windows2008Windows
人工智能聊天机器人未来趋势：AI聊天机器人演变中会期待什么 AI甲子光年人工智能机器人
AI聊天机器人正在改变公司与客户沟通的方式，提供24/7的支持和个性化体验。随着技术的不断发展，AI聊天机器人也在变得越来越复杂和高效。本文将探讨AI聊天机器人的未来趋势，并指出预期将在未来几年塑造其发展的主要创新和发展。了解这些趋势对于希望在AI驱动的客户服务动态领域中保持领先地位的企业和开发者来说至关重要。当前的AI聊天机器人趋势1.自然语言处理的改进在最近过去的一段时间里，自然语言处理（NL
用100万字治愈自己（129）读书笔记19：猴面包树的祸害（2605）每日心流
第5章飞行员在和小王子聊天的时候了解到猴面包树的祸害。因为小王子突然问了一个问题：绵羊能把矮小的灌木吃掉吗？飞行员说可以的，小王子又说因为猴面包树在小的时候也是一棵幼苗。为什么要把猴面包树吃掉呢？那是因为他们的星球很小，里面有好植物或植物，好种子和坏种子，但是种子是看不见的，它们隐匿在沉睡的泥土里。如果它们发芽了，如果是坏的植物，那么你认出来以后马上要把它们拔掉，如果你发现得太晚了，你就再也不能把
No.31读书笔记《种子》第十五章:回到家乡，做回自己:真正厉害的人都是能够遵从内心做自己的小裙儿
董明珠的年轻女秘书火了，女秘书爆火的背后是这些年小姑娘的努力。小姑娘的个性耿直，不随波逐流，遵从自己的内心做自己，才有了现在的一切。遵从内心做自己，多么难得的品质。如果你能做到，我相信，你一定是一个优秀的人。在《种子》这本书中，乔希后面终于想明白了，开始遵从内心做自己:开车离开的时候，乔希最后看了餐厅一眼。他开始明白，无论他决定在哪儿播种种子，都不会是他以前待过的地方。虽然他跟着迹象回到了曾经让他
反射是一个新的AI模型，可以在一台性能良好的笔记本上运行并在测试中击败GPT-4o AI甲子光年人工智能
开源AI模型领域又迎来一位新的重量级选手。由初创公司HyperWrite开发的Reflection70B，凭借其创新的“反思”机制，正引发广泛关注，这一机制旨在解决大型语言模型的核心问题——幻觉。在早期的基准测试中，这个升级版的Meta的Llama3.1-70BInstruct架构已经超越了OpenAI的GPT-4o。Reflection70B引入了一种创新方法来增强语言模型的推理能力和准确性。通
《别对孩子说这样的话》之不要敷衍了事，保护孩子的好奇与敏感（3）静静朵朵开
文//静静的朵朵接上篇《别对孩子说这样的话》之不要敷衍了事，保护孩子的好奇与敏感（2）读书笔记1.父母不要强求孩子的性格与别人一致，更不要说孩子的性格不好，在这一点上应该给孩子足够的空间。对孩子宽容一点，即使孩子的性格具有某些不好的倾向，也不要强迫孩子改变自己的性格。此时父母应该做的是和孩子进行心与心的交流，抓住孩子的性格特点，找出孩子性格特别的原因所在对症下药。培养孩子个性的时候，不要逼迫孩子，
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

NLG一、seq2seq详解以及相应trick介绍

你可能感兴趣的:(笔记,NLP,自然语言处理)