smile909

EMNLP 2020 BiST: Bi-directional Spatio-Temporal Reasoning for Video-Grounded Dialogues

动机

基于视频的对话是非常具有挑战性的，这是因为(i)包含空间和时间变化的视频的复杂性，以及(ii)用户在视频或者多个对话轮中查询不同片段和/或不同目标的话语的复杂性。然而，现有的基于视频的对话方法往往关注于表面的时间级视觉线索，而不是从视频中获取更细粒度的空间信号。作者的方法旨在通过双向推理框架从视频中检索细粒度信息来挑战基于视频的对话来解决这一问题。
与视频对话相关的任务是视频问答和视频captioning。之前在这些研究领域的努力，如 Tgif-qa、GRU-EVE_hft+sem-(CI)明确地考虑了输入视频的空间和时间特征。这些模型根据对问题的重要性来学习概括空间特征，而不是对每个区域进行等同考虑。作者受到这些方法的激励，并提议将时空推理扩展到对话。
作者注意到，在某些情况下，例如长时间的扩展视频，在确定特定的感兴趣的主题之前，首先识别相关的视频片段，而不是固定地处理空间输入然后学习时间输入。考虑对话设置中的问题，假设问题与视频的不同时间位置相关是适当的，而不仅仅是一个小的固定片段。

方法

简介

通常，时空学习方法的目标是从复杂视频中获取更高分辨率的信息，这些复杂视频涉及每个视频帧中的多个目标或视频片段上的运动。作者提出了一种双向视觉语言推理方法，将该方法命名为双向时空学习（BiST），通过两个推理方向来充分利用空间和时间层面的特征。作者的方法包括两个并行网络，基于用户话语中的语言信号，从输入视频中学习相关的视觉信号。每个网络将基于语言的特征投射到一个三维张量，然后该张量被用于按照一个推理方向独立地学习视频信号，该推理方向可以是空间的→时间的或时间的→空间的。每个网络的输出由基于语言和视觉特征计算的重要性分数动态组合。加权输出被循环地用作推理模块的输入，以允许模型在多个步骤中递进地导出相关视频信号。直观地看，时空推理更适合于与特定实体相关的人类查询或涉及多个目标的输入视频。时空推理更适合于人类对特定视频片段或长视频的查询。

模型

输入包括视频V、(t-1)轮对话历史（其中t是当前轮），每轮包括一对（人类话语H、对话智能体响应A)(H₁, A₁, …, H_T-1, A_T-1)，以及当前人类的话语。输出是可以处理当前人类的话语的一个系统响应。输入视频可以包含不同模态的特征，包括视觉、音频和文本（例如视频caption或字幕）。在无泛化损失的情况下，作者可以将每个文本输入表示为一系列token，每个token由词汇集V中的唯一token索引表示：数据历史X_his、用户话语X_que、视频的文本输入X_cap、以及输出响应Y。作者还将L_S表示为序列S的长度。例如，L_que是X_que的长度。

作者的模型由四部分组成：

（1）编码器将文本序列和视频输入（包括视觉、音频和文本特征）编码成连续的表示。对于视觉和声音等非文本特征，作者遵循之前TVQA的工作，并假设访问预训练好的模型。

（2）多个神经推理组件学习用户话语/查询与多模态视频特征之间的依赖关系。对于视频视觉特征，作者提出在两个方向上同时学习空间和时间层面的依赖关系（参见图2）。具体地说，作者允许用户查询中的每个token与视频的每个空间位置或时间步骤之间进行交互。基于空间或基于时间的推理的输出在时间空间和空间时间两个方向上依次进行。这种双向策略使信息动态融合，并捕获对话中的文本信号和视频中的视觉信号之间的复杂依赖关系。

（3）解码器通过多个attention步骤传递编码的系统响应，每个attention步骤从文本或视频表示中提取信息。通过自回归方式，解码器输出传递给生成器以生成token。

（4）生成器计算词汇集上的三个分布，一个分布是从线性变换输出的，另一个分布是基于输入序列位置上的指针attention分数。

具体包括：

编码器。

1）文本编码器。作者使用编码器将基于文本的输入X嵌入到连续表示Z∈R^LX×d中。L_X是序列X的长度，d是嵌入维数。文本编码器包括token级嵌入层和层归一化。嵌入层包括一个可训练矩阵E∈R^|V|×d，其中每一行表示词汇表集合V中的一个token，作为维度D的向量。作者将E(X)作为查找输入序列X中每个token的向量的嵌入函数：Z_emb=E(X)∈R^LX×d。将位置编码层，作者采用Attention is all you need中的方法，每个token位置表示为正弦或余弦函数。位置编码和token级嵌入的输出通过点加和层归一化相结合。编码器输出包括对话历史Z_his、用户查询Z_que、视频caption Z_cap和目标响应Z_res的表示。对于目标响应，在训练期间，序列左移一个位置，以允许解码步骤i中的预测是在先前的位置1, … , (i-1)是自回归的。作者共享嵌入矩阵E来编码所有的文本序列。

2）视频编码器。作者利用3D-CNN视频模型提取时空视觉特征。输出结果的维度取决于采样步长和剪辑长度的配置。作者将预训练的视觉模型的输出表示为Z_vis^pre∈R^F×P×dvis^pre，其中F是采样视频片段的数量，P是来自3D CNN层的空间维度，d_vis^pre是特征维度。作者采用一个带有ReLU的线性层，再加上层归一化，将特征维度降至d。对于音频特征，作者遵循类似的步骤来获得音频表示Z_aud∈R^F×d。作者保留预训练好的视觉并直接将提取的特征用于作者的对话模型。
双向推理。作者提出了一种双向体系结构，其中文本特征用于选择在两个推理方向中的空间和时间维度上的相关信息（见图2）。

1）时间→空间。在一个方向上，用户查询是用来根据独立于每个空间区域的时间步骤，选择相关的信息。作者首先将编码的查询特征堆叠到P空间位置，并将堆叠的特征表示为Z_que^stack∈R^P×Lque×d。对于每个空间位置，模型通过一个attention机制学习问题和每一个时间步骤之间的依赖关系如下：

其中d_att是attention隐层的维数，W_t2s⁽¹⁾∈R^d×datt和W_t2s⁽²⁾∈R^d×datt。这个attention分数S_t2s⁽¹⁾被用来获得沿着Z_vis的每个空间位置的时间维度的加权和。得到的张量经过线性变换和ReLU层。输出包含时间关注的视觉特征，并通过跳连接与语言特征结合。作者用向量Z_t2s^t表示输出。

从时间相关的特征中，再次使用用户查询来获得空间维度上的依赖关系。作者使用一个相似的注意网络来模拟查询中每个token和每个时间关注的空间区域之间的交互。

其中W_t2s⁽³⁾∈R^d×datt和W_t2s⁽⁴⁾∈R^d×datt。attention得分S_t2s⁽²⁾用于从Z_t2s^t获得所有空间位置的加权和。输出是从时间到空间的视觉特征，并通过跳转连接整合到语言特征中。作者将结果输出表示为Z_t2s。

2）空间→时间。在这个推理方向上，相似的神经操作被用来计算空间上的关注特征，然后是时间上的关注特征。与其他推理方向的主要区别在于，作者将查询特征叠加到F个时间步骤以获得Z_que^stack∈R^F×Lque×d。其他网络组件，包括两个注意层，如公式1到6所述。最终输出表示为Z_s2t。

以往基于视频的NLP任务的研究方法主要关注问题的全局表征与视频的时间层面表征之间的交互作用。这种策略可能会丢失视频帧中空间变化的关键信息。作者的方法不仅强调空间和时间特征空间，而且允许神经模型以两种不同的方式从这些特征空间扩散信息。由于作者可以把空间信息看作局部信号，把时间信息看作全局信号，作者的方法实现了视频中视觉线索的全局到局部和局部到全局的扩散。这种方法类似于Learning spatio-temporal representation with local and global diffusion，其中局部和全局的视觉信号被学习和扩散。然而，与这种方法不同的是，作者的方法侧重于语言-视觉推理，以获得更精确的视觉信息查询。

3）多模态推理。除了语言-视觉推理之外，作者的模型还考虑了查询与音频输入或文本视频输入之间的其他信息依赖关系的学习。

• 语言音频推理。作者采用了语言-视觉推理的相似神经操作。不同的是，作者直接使用查询特征，而没有将特征堆叠到公式1到3中。文本-音频推理的结果输出被表示为Z_q2a，它包含Z_aud的查询引导、时间关注的特征。

• 语言→语言推理。该模块主要关注用户查询和视频caption（如果caption可用）之间的单峰相关性。由于caption可以包含视频内容的有用信息，作者采用了类似于音频特征的点积attention机制来获得Z_q2c。

4）多模态融合。考虑到这些特征，作者将它们结合起来，得到查询引导的视频表示，将来自所有模态的信息结合在一起。作者用以下方式表示拼接表示：

其中;是拼接操作。这些特征通过重要性评分矩阵组合起来：

其中W_q2vid∈R^5d×4。S_vid的得分被用于获得分量视频模态的加权和，从而得到来自多个模态的融合向量。作者将结果输出表示为Z_vid。与以前通常处理所有模态都一样的工作相比，作者的多模态特征是以问题依赖的方式融合在一起的。潜在的，作者的方法可以避免噪音或不必要的信号，例如由于问题只涉及视觉内容，音频特征是不被需要。
响应解码器。解码器旨在以自回归方式解码系统响应。在推断期间，一个特殊的token 被馈送到解码器。然后将输出token拼接到该特殊token作为解码器的输入，以再次解码第二个token。重复该过程直到解码轮数到达极限或当预测到特殊token 时。作者应用与MTN相似的解码架构。解码器包括三个attention层，用于从文本成分获取上下文线索到输出token表示。第一层是self-attention，学习不同的token之间的依赖关系。直观地说，这有助于塑造一个语义上更结构化的序列。第二和第三个attention步骤用于从对话历史和当前用户查询中捕获上下文信息，以使响应与整个对话上下文连贯地连接。为了结合来自视频分量的文本线索，作者的解码器与MTN略有不同。代替顺序地经过多个attention层，作者只需要一层的融合特征Z_vid。这是更有效的memory，因为它只需要一个单一的attention操作。也不依赖于attention层排序的设计决策。在解码步骤j中，作者表示解码器输出为Z_dec∈R^j×d。
指针生成器。给定解码器的输出，生成器网络用于将响应物化为自然语言。线性变换用于获得词汇集V上的分布。

其中，W_vocab∈R^d×|V|。由于源序列和目标响应之间的语义相似，作者共享W_vocab和E之间的权重。为了加强模型生成能力，作者采用指针网络来强调来自源序列的token，即用户查询和视频captions。作者将Ptr(Z₁, Z₂)表示为指针网络操作，即Z₂中的每个token通过一个可学习的概率分布“指向”Z₁中的所有token。得到的概率分布由Z中的所有token聚合得到Ptr(Z₁, Z₂)∈L_Z2×|V|。最终输出分布，表示为P_out∈R^j×|V|，它是三个分布的加权和：P_vocab、Ptr(Z_que, Z_dec)和Ptr(Z_cap, Z_dec)。该融合的权值是通过线性变换和softmax学习得到：a=Softmax(Z_genW_gen)∈R^Lres×3，其中Z_gen=[Z_res; Z_que^exp; Z_cap^exp]∈R^j×4d，W_gen∈R^4d×3，Z_que^exp和Z_cap^exp是caption的堆叠张量和到j维的用户查询。

优化。在训练过程中，作者通过最小化生成损失来学习所有模型参数：

实验

实验细节

数据集。作者使用来自DSTC7的AVSD基准，该基准包含基于Charades视频的对话。此外，作者将作者的模型适应视频QA基准TGIF-QA。（两个数据集的汇总见表1）。为了提取视觉和音频特征，作者使用在Kinetics上预训练好的3D-CNN ResNext-101以获得时空视觉特征，使用在YouTube视频上预训练好的VG-GISH以提取（时间）音频特征。作者在AVSD和TGIF-QA中分别对窗口大小为16帧、步幅为16和4的视频片段进行采样，以提取视觉特征。在TGIF-QA实验中，作者还从预训练好的ResNet-152中提取视觉特征，以便与现有工作进行公平比较。在AVSD实验中，作者利用视频摘要作为视频相关的文本输入X_cap。

训练过程。作者采用来自Attention is all you need的Adam优化器和学习率策略。作者设置了相当于5个epoch的学习率的预热步骤，训练模型最多达到50个epoch。作者根据验证集中每个epoch的平均损失来选择最佳模型。作者以均匀分布初始化所有模型参数。在训练期间，作者采用来自MTN的辅助自动编码器丢失功能。在作者的模型中采用Transformer attention并选择以下超参数：d=d_att=128，N_att=N_dec=3，和h_att=8，其中N_att和N_dec是多模态推理和解码器网络中Transformer块的数目，h_att是注意力头的数目。在验证集上进行网格搜索之后，作者调优了其他超参数。在AVSD实验中，作者通过在目标系统响应Y上应用标签平滑来训练作者的模型。作者采用beam搜索技术，一个beam大小为5。

视频QA的修改

在TGIF-QA等许多视频QA基准中，任务是基于检索的（例如，为每个输出CAN-DIDATE输出单个得分），而不是像许多对话任务那样基于生成的。作者首先将问题与每个候选答案单独拼接起来，并将其视为作者模型的Z_que。由于没有目标响应需要解码，作者通过使用一个可训练向量z_j∈R^d来表示一个候选响应R_j，代替对话中的Z_res ∈R^j×d作为解码器的输入，使作者的模型适应这种设置。将表示为Z_j,dec∈R^d的输出传递到线性变换层以获得分数s_j,out=Z_j,decW_out∈R，其中W_out∈R^d×1。在此设置中，作者删除了language→language和language→audio推理模块。损失函数是肯定答案s_out^p和每一个否定的答案s_out^p分数之间的相加成对hinge损失。

其中K为候选答案总数，m是一个超参数，用作正负答案之间的一个边际。

训练。在K=5和m=1的成对损失后训练多项选择任务，包括Action和Transition。Count任务用类似的方法训练，但它是一个回归问题，具有单一的输出分数s_out。损失函数被测量为输出s_out和标签Y之间的均方误差。开放式Frame任务被训练为一个生成任务，类似于对话响应生成任务，具有单token输出。作者使用向量z∈R^d作为解码器的输入。该生成器包括一个W_out∈R^d×|V|的线性层。在这种情况下，作者不采用指针网络，因为输出只是一个单token响应。

实验结果

AVSD结果。作者报告了客观评分，包括BLEU、METEOR、ROUGE-L和CIDEr。这些度量标准是从机器翻译和captioning等语言生成任务中借鉴来的，它描述了生成的和GT对话响应之间的词汇重叠。作者将作者所产生的响应与6篇参考响应进行比较。主要的基准模型有：（1）Baseline包括由基于LSTM的编码器组成，在用户查询和时间级的视觉和音频特征之间具有attention层。

（2） Baseline+GRU+HierAttn延伸（1）通过GRU和问题引导的self-attention和caption attention。

（3） FA+HRED采用FiLM神经块进行语言视觉依赖学习。

（4） Video Summarization将任务重新定义为视频摘要任务，并通过大规模摘要基准的迁移学习增强模型。

（5） Student-Teacher采用双网络架构，其中学生网络被训练成模仿教师网络，教师网络通过额外的视频相关文本输入进行训练。

（6）MTN通过一个Transformer解码器体系结构将不同模态的时间特征顺序地融合。

（7）FGA由所有模态对之间的attention网络组成，模型沿着attention图的边缘聚合attention分数。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210515235732959.png?x-oss-
在表2中，作者通过不同的特征组合给出了分数，包括视觉Z_vis、音频Z_aud和文本Z_cap。在所有情况下，作者的模型都优于现有的方法。作者的模型在纯视觉环境下的性能表明了作者的双推理语言-视觉推理方法所带来的性能增益。作者的双向语言-视觉推理方法所带来的性能增益。此外，当考虑视频中的文本特征时，还可以观察到性能的提升。然而，当作者添加音频特征时，性能增益并不显著。这揭示了作者工作中的一个潜在的未来扩展，以更好地结合视觉和音频特征表示。FGA报告在仅视觉设置下CIDEr得分为0.806。与FGA相比，作者的性能提高表明了在空间和时间两个层次上学习查询和视觉特征之间的细粒度依赖关系以从视频中选择相关信息的有效性。

TGIF-QA结果。作者给出了计算任务的L2损失和其他三个QA任务的准确性。从表3可以看出，作者的模型在所有QA任务中都优于现有的方法，使用帧级（外观）特征ResNet或序列级特征ResNext。作者的模型在使用ResNext时表现得更好，因为作者期望序列级特征比帧级特征更一致。在该基准测试上的实验表明，作者的双向语言-视觉推理方法的性能得到了更明显的提高，因为它不像AVSD实验那样受到生成组件错误的影响。通过从时空特征中学习高分辨率的依赖关系，作者的模型能够充分利用上下文线索，为视频问答任务选择更好的答案。

空间-时间学习的影响。作者考虑了基于时空-时间的模型的变体，并在表4中报告结果。作者注意到，当使用单一推理方向时，具有时间空间的模型比具有反向推理方向的模型性能更好。这种观察不同于以往的时空学习研究，如 Tgif-qa，它们局限于推理顺序空间→时间。这可以解释为AVSD基准中的视频通常比其他QA基准长。在选择单个帧中的空间区域之前，首先关注帧序列中的时间位置是实际的。此外，对话查询被定位在多轮设置中，由此，随着对话的发展，每一轮是和不同的视频段相关。这一观察结果潜在地表明了视频对话与视频问答的一个重要区别。其次，作者还观察到，当作者同时使用两个推理方向而不是只使用其中一个时，作者的模型性能有所提高。作者提出这种方法的动机与Bi-RNN相似，后者提出了一种双向策略来处理向前和向后两个方向的序列。同样，作者的方法通过一种双向信息扩散策略来利用视觉信息，该策略可以根据语言输入从空间和时间两个方面来解释信息。最后，作者认为使用时空特征是比只使用其中的一个更好，证明了信息在两个维度上的重要性。为了获得仅空间或仅时间特征的Z_vis，时空特征通过分别沿时间维度或空间维度做平均池化操作。

消融分析

作者用不同超参数集的模型变体进行实验。具体地说，作者改变attention轮数N_att和attention头数h_att。从表5中，作者注意到了多轮体系结构对语言-视觉推理的贡献，因为随着推理步骤的增加，即多达三轮attention，性能得到改善。然而，作者观察到当作者增加到超过3个推理步骤时，模型性能仅有轻微的改善。作者还注意到，使用多头attention机制适合于处理视频和视频等信息密集型媒体的任务。多头结构能够将特征投影到多个子空间，并捕获复杂的语言-视觉依赖关系。

定性分析

在图3中，作者给出了一些示例输出。作者注意到BiST模型的预测对话响应更接近于GT响应。特别是对于查询特定片段（示例B、C、D)和/或特定空间位置（示例D）的复杂问题，作者的方法通常能够产生更好的响应结果。另一个观察是，对于不明确的例子，如例子C（其中视觉外观不能清晰地区分“apartment”和“business office”），作者的模型可以返回正确答案。潜在地，这可以通过从空间级特征表示中提取的信号来解释。最后，作者注意到仍有一些错误使输出的句子部分错误，如不匹配的主语（例A)、错误的实体（例B)、或错误的动作（例C）。

贡献

（1）作者的方法不是只利用时间级信息，同时强调视频的空间和时间特征，以实现更高分辨率的视频线索查询。

（2）针对会话查询中信息的多样性，作者提出了一种双向策略，即时间↔空间策略，使信息在两个视觉特征空间之间得到全面的扩散。

（3）作者的模型在来自第七届对话系统技术测试(DSTC7)的“AVSD”（视听场景感知对话）基准上实现了具有竞争力的性能。作者将作者的模型应用于视频QA任务“TGIF-QA”，并实现了显著的性能提升。

（4）对本文提出的双向推理方法进行了全面的理论分析和定性分析，验证了本文提出的双向推理方法的有效性。

小结

作者提出了pose双向时空学习(BiST)是一种基于文本线索的视频高分辨率查询的视觉语言神经框架。具体地说，作者的方法不仅利用了空间和时间两个层次的信息，而且通过空间到时间和时间到空间的推理来学习信息在两个特征空间之间的动态扩散。双向策略旨在解决对话设置中用户查询的语义演变问题。检索到的视觉线索被用作上下文信息来构造对用户的相关响应。作者的实验结果和全面的量化分析表明，BiST在大规模AVSD基准测试中取得了良好的性能，并产生了合理的响应。作者还调整了作者的BiST模型以适应视频QA设置，并且在TGIF-QA基准测试上大大优于以前的方法。

2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
今日联对0306 诗图佳得
自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.1、试对肖老师联：烟销皓月临江浒，夜笼寒沙梦晚舟。耀哥求正2、试对萧老师联:烟销浩月临江浒，雾散乾坤解汉城。秀霞习作请各位老师校正3、自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.4、试对肖老师垫场联：烟销皓月临江浒，雾锁寒林缈葉丛。小智求正[抱拳]5、试对肖老师联：烟销皓月临江浒；风卷乱云入峰巅。一一五品6
2020.11.19 隆非凡
日精进，今日体验：在维修过程中遇到的问题，把源头找到，在进行下一步开始。不要停留在一个点上，合理调整心态，把当下事做好。
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
2020-12-16 长寿富贵
9：56不知今天哪位亲来说说话呀？成萌：尽尽皆是道。道道皆相同。不解呀？成萌：郁郁不得志，混混过日子。哦……说谁的呀？成萌：说自己呀……还能说谁呢？那如何办呢？成萌：回头……如何回头？成萌：回见心源。如何回见心源？成萌：不追不随诸相迁，如如不动在心田。啊？成萌：慢慢守心吧。
2020-12-24 我和我的天使们
阅读《老子的心事》391—403“将欲取之，必固与之”：想要得到什么，首先就要送出什么。我常常对孩子们说，你希望别人怎样对你你就怎样对待别人。想要得到别人的尊重，首先要尊重别人。我希望她们可以不迟到，因为不迟到是对别人的尊重，我就自己就先做到不迟到。哪怕是约朋友逛街，我尽量准时赴约。我严格要求孩子们，也同样严格要求自己，我跟孩子们一起把好的品格变成习惯。“是谓微明”：这就是微妙的智慧。看起来很少很
2021-02-13 琛周
今天ori居然在车站跟我说，自己要离婚还以为是开玩笑，md，这才大年初一呢虽然我也不把过年当回事这一年或者说，自2020年以来仿佛一切的事儿都变得顺了不少爆裂的事儿合肥的事儿等等上天发牌的事儿我觉得我脑子还是挺好使的我这些年的确没缺过钱可能做成一个事儿以后，往后也不会缺了头疼所谓当局者迷，就是我给自己安排工作的时候，懒得动给助理安排工作的时候，神神叨叨。淦
#开始记日记#1235 胃口不好吃饺子董克平日记
2020/06/24星期三北京吃个醋拌茄子消暑珠珠送了一个父亲节礼物，要我陪她一起去体检。这些年身上多了许多毛病，血压、血脂、血糖都需要吃药维持了，上一次体检知道血糖已经到了临界点，可是也没有予以重视，继续大吃大喝少锻炼，结果可想而知，现在是每一餐都离不开二甲双胍了。不过我还是不愿意去体检，总觉得体检没什么用，身体有毛病就去看医生，体检又不治病。我对体检的看法是“小病不用治，大病治不了”，通过体检
2020-8-19晨间日记：看过的电影盐大虾
今天是周三起床：6点半就寝：11点天气：晴心情：正常纪念日：周三任务清单今日完成的任务，最重要的三件事：1.整理写过的文档2.电影《电灯泡》3.这就是街舞第三季第五期改进：早睡早起习惯养成：早睡早起，看书周目标·完成进度两篇文章学习·信息·阅读电影艺术发展史相关教材健康·饮食·锻炼吃了挺多零食，还喝了果粒橙，还是得少吃，多锻炼，不然会慢慢死掉的。人际·家人·朋友淡定交流，不放在心上。工作·思考专心
骑昆明到北海—119 砚山县 61清风i
从十年前第一次长途骑行青海湖开始每年一次长途骑行看风景，尝各地美食，探访异域文化，记录途中美食美景美事，已逐渐形成习惯。每年春季详细规划好线路，夏季出行，2020年因为疫情迟迟不能确定线路和行程。总算到了暑期疫情逐渐消失，规划了50多天的云南昆明—广西北海计划。本次行程从云南昆明出发到广西北海市结束，五十一天骑行二千多公里线路昆明-官渡古镇-环滇池--澄江市一抚仙湖—路居镇--江川区--通海县—龙
趁吾身未老逍遥书生111
趁吾身未老池非2020年，一场突如其来的新冠脑炎疫情，打破了原有的状态。工作与生活的轨迹发生了不确定的变化。01因为隔离防疫，正常的教学不能进行，线上网课成为教学的新形式，年过五十的我面对新的教学形式有些应不暇。只得退而求次，不再负责高考班级的课程。这样，就不用上网课做直播了。感觉很轻松很闲的同时，也感觉到了英雄迟暮。不得不承认，老了。该交班了。因为不能出门，整天呆在家里，一开始还很兴奋，终于可以
准备胡珊珊乐平九小
尊敬的各位领导、各位同仁们：大家上午好！我是来自乐平九小的胡珊珊。今天很高兴能有机会给大家做“智慧作业”应用培训。说到“智慧作业”我感触颇多，我是在智慧作业中成长起来的，我也时常以自己是一名“智慧作业人”自居。早在2020年疫情期间，学校电教处周光杰主任在学校群里发出智慧作业抢题通知，我看了有些心动，一节微课相当于一次省级公开课，这对于我们普通老师是多么难得的机会啊。但想归想，我也不会用软件啊，再
蒸花卷蓝色逍遥398
2020年6月7日雨周日自昨天老婆第一次做包子大获成功后，她的自信心前所未有的爆棚。“猪爸，冰箱里还有多少馒头？”老婆问我。“应该还有两三个吧，一会儿我要去超市买馒头了。”我打开冰箱看后回答。“不用去了，今天我来给你们蒸馒头！”老婆颇为骄傲地说。“真的，要学者蒸馒头了？”我有些惊喜。“猪媽，你真的要蒸馒头了吗？”宝贝也有些不敢相信自己的耳朵，充满期待地看着妈咪。“那当然了，而且我还要给你们做花卷呢
【旅行故事】强个体与好组织相互成就@稀土永磁Amy@20220205@上海稀土永磁Amy
我们每个人都在组织当中。当你来到组织中，都要理解个体跟组织的关系和组织中个体的关系。一个组织产生高绩效的时候，其实是需要组织个体的发展跟组织发展之间要有一个匹配程度。有时也会看到一个组织当中，一些个体会觉得发展的不够充分，原因就在于个体的发展速度超过了组织的发展速度。还有一些时候我们会发现，组织要淘汰很多个体，原因也在于组织发展的速度超越了个体发展的速度。按照这个逻辑，无论是组织的视角还是个体的视
2020年学习什么知识比较好？互联网行业依然是发展较佳编程仔
2019年余额已不足，不少职场人心里也在盘点这一年的工作得失，琢磨新一年的奋斗策略，是继续冲刺还是换个跑道？今年跳槽更难吗？image互联网行业一直以相对较丰厚的薪酬和广阔的发展前景吸引着各界人才。但最近，互联网行业寒冬、互联网企业裁员等话题再次引起热议。正在从前些年的高速发展期转向发展调整期的互联网行业真的步入了“寒冬”？该行业依旧具有吸引力吗？什么职位又最热门呢？image互联网行业仍保持较高
6月复盘之重新认识自己插画君王木木
经历了漫长的疫情恐慌期，每个人都想重新开启的2020上半年一不小心就结束了，但疫情还在继续，趁着这段特殊时期，邀请你一起打开重新认识自己的大门。趁早图先来回顾一下关于你的上半年是怎样过来的呢？看看我们是不是有一样的状况呢？在1月份信誓旦旦的立下全年目标，可能经历了2周时间，这面旗子就倒了；1月底-2月中的春节期间，完全陷入了低谷期，面对大环境的变革，我该何去何从？2月底回上海，意识到真的不能这样堕
杨丽萍被diss上热搜：是谁在胡乱定义中国女性？果沐妈咪
最近，舞蹈大师杨丽萍因为60岁还没结婚没孩子，被某音网友diss上热搜，评论还被点赞1万多次，一度占据了热评第一名（目前已删）。很难想象在2020年，还有人揪着女性的衣领质问：你怎么不结婚呢？你怎么不生孩子呢？很快，这种言论引发了微博上的大讨论。几位女明星也站出来为杨丽萍发声，声援她。戚薇“一个人最大的失败是：时至今日还在给我们“女人”下定义，还把儿孙满堂当作女人唯一的成就。。。生育工具？！呵呵，
助力新能源汽车产业发展，2025第五届广州国际新能源汽车产业智能制造技术展览会将于11月在广州召开 ws201907 制造汽车
助力新能源汽车产业发展，2025第五届广州国际新能源汽车产业智能制造技术展览会将于11月在广州召开伴随着全球新一轮科技革命和产业变革，汽车与能源、半导体、物联网等领域有关技术加速融合，新能源汽车已成为全球汽车产业转型升级的主要方向。近年来，在相关政策的影响下，新能源汽车市场呈现出快速增长的态势，市场规模不断扩大。截至2020年，中国新能源汽车保有量已超过500万辆，成为全球最大的新能源汽车市场。随
LeetCode github集合，附CMU大神整理笔记 Wesley@ LeetCode github
GithubLeetCode集合本人所有做过的题目都写在一个java项目中，同步到github中了，算是见证自己的进步。github目前同步的题目是2020-09-17日之后写的题。之前写过的题会陆续跟新到github中。目前大概400个题目Github项目链接：https://github.com/sunliancheng/leetcode_github附上一份优秀的教材整合：这是卡内基梅隆(C
python实现规则引擎_规则引擎python weixin_39601511 python实现规则引擎
广告关闭回望2020，你在技术之路上，有什么收获和成长么？对于未来，你有什么期待么？云+社区年度征文，各种定制好礼等你！我正在用python编写日志收集分析应用程序，我需要编写一个“规则引擎”来匹配和处理日志消息。它需要具有以下特点：正则表达式匹配消息本身消息严重性优先级的算术比较布尔运算符我设想一个例子规则可能是这样的：(message~program:messageandseverity>=h
2020-10-05感恩日记第21-21天越努力越幸运_58b3
不知不觉，我已经写了21天日记了，这些天我收获了好多，谢谢小伙伴的鼓励和支持。感恩小哥哥帮我把桶盖打开，谢谢你的爱心。感恩今天来帮忙考察店铺的陈，谢谢你给的建议，也谢谢你让我看到了另外的自己。感恩今天来店里消费的每个人，谢谢你们带着爱把金钱回流给我。感谢建习和小迪宝贝，谢谢你们对我无条件的信任愿意把钱借给我。感恩小迪宝贝陪伴着我，谢谢你如此的爱我。感恩智琼，提供给我们那么舒服的房间。感恩依依老师的
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
2020年 12月3日渥太华阴一生守望一人
今天结课了。全面备战，准备期末考试了。最近看到纽约州立阿尔伯尼法学院和西奈山医学院有一个联合生命科学的硕士学位，有点心动，打算考完试以后找教授和相关负责人问一下。新闻方面，中国第一次实现了外太空运载器发射，嫦娥今天正式启程返家了。这也预示着我们面对载人登月又踏出了自己坚实的一步。同时，我们继美国之后在同一年制造出了量子计算机“九章”。“九章”量子计算机可以以200秒的速度计算出当前最强大超级计算机
读书打卡83天《孩子:挑战》青草萍
2021年4月20日#“王磊名班主任工作室”精进打卡#【打卡人】赵亚平【打卡始于】2020年1月28日【日精进打卡第83天】2021年4月20日【今日读书】书名：《孩子:挑战》第40—至63页作者：鲁道夫.德雷克斯薇姬.索尔兹版次：中国人民大学出版社【用时】三十分钟【读书感悟】1.孩子需要鼓励，就像植物需要水，没有鼓励孩子，性格就不能健康发展，孩子就没有归属感。鼓励孩子是一个持续的过程，重点在于给
2020-02-15 蔡卡
我是蔡卡，爱看日漫和美剧，一眨眼就成了爸爸，喜欢孩子的我总想给孩子最好的，于是开始了我的探索之旅。不爱看书的我开始认真看书和参与各种团体，通过自我学习以及思想的碰撞从而形成自己的知识体系。分享才能更好的提升，生活中每遇到一个困难，都需要我们用所学的知识点去解决。我的使命:让更多家庭的孩子不因地域和阶层导致认知以及成长上的差距更大。__________________________________
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
2020年12月一句日历连岳一闲下来就刷抖音
12.1（即使慢）不耻最后。即使慢，驰而不息，纵令落后，纵令失败，但一定可以达到他所向的目标。——鲁迅12.2（正确的礼节）礼节太烦，执意把过分的，别人受不了感到愚蠢，惭愧的礼节强加给别人，这种情形看起来与其说是尊重人家，还不如说是嘲弄人家。——洛克12.3（得意）日出而作，日入而息，逍遥于天地之间，而心意自得。——庄子12.4（真聪明）聪明的概念极小，有时它仅仅指的是一种勤勉和实事求是的态度。—
生活的复杂孙栋的故事
生活的复杂。2020.11.07忙完人生的一件大件，花费1个星期。工作堆了一大堆。提不起兴趣。有一些重复的事情。很多事情做到一半，暂时不能完结，要等到明天。最近，在交通上，来回4小时。早起很困顿。刷抖音控制不住。一个获得兰亭奖的书法家，是用嘴写的毛笔，他失去了双手。比一般人更加优秀。真是靠嘴养活了自己。他在寺院抄经书，做自己喜欢的事情，还有学习佛法。对书法，他是真正热爱的。很多事情，我们只看到结果
陈茹-中原焦点团队讲师6期坚持分享第755天202009028 陈妍羽2018
身体的提醒昨天下午正在工作，突然觉得心脏不舒服，有点一抽一抽的疼痛，赶紧自己吃了速效救心丸。同事扶着我，吃药喝水，并且让我去咨询室躺一会，随着药劲慢慢蔓延，身体那种疼痛的感觉也慢慢好起来了。我想，可能身体感受到我的压力太大了，也有点超负荷了，毕竟近期因为单位远，我早出晚归，还要负责孩子的早餐，晚上只有6个小时的睡眠时间，虽然中午也能补一觉，但是还是不够补充能量。既然身体已经提出警告，那么我要上心注
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号