Mr愚先森

NLP深度学习：近期趋势的总体概述

作者：Elvis Saravia

编译：Bot

编者按：Elvis Saravia是“国立清华大学”（台湾）的博士生，主要研究NLP和情感计算。今年8月，Tom Youn等人更新了去年发表在IEEE杂志上的重磅文章《Recent Trends in Deep Learning Based Natural Language Processing》，总结了到今年为止，基于深度学习的自然语言处理（NLP）系统和应用程序的一些最新趋势。为了方便更多人阅读，Elvis Saravia总结了这篇文章的主要内容，回顾和比较了各类NLP任务中的最新技术。

在这篇综述中，读者可以详细了解这一年来学界的一些大动作，它包含以下主题：

分布式表征的兴起（例如word2vec）
卷积、循环和RNN
在强化学习中的应用
句子的无监督表征学习的最新进展
深度学习模型与记忆增强的结合

什么是NLP？

自然语言处理是通过构建计算算法自动分析、表征人类自然语言的一个学科领域。如今，基于NLP的系统已经实现广泛应用，比如Google强大的搜索引擎、亚马逊的语音助手Alexa。NLP还可以帮助机器执行和复杂自然语言有关的任务，比如机器翻译和对话生成。

长期以来，研究人员进行NLP研究主要依赖各种机器学习模型，以及手工制作的特征。但这么做带来的隐患是由于语言信息被稀疏表征表示，会出现维度诅咒之类的问题。而随着近年来词嵌入（低维、分布式表征）的普及和成功，和传统机器学习模型（如SVM、logistic回归）相比，基于神经网络的模型在各种语言相关任务上取得了优异的成果。

分布式表征

如前所述，手工制作的特征主要用于模拟自然语言任务，它在神经网络被广泛应用于NLP前，一直使研究人员饱受维度诅咒困扰。

词嵌入

词嵌入是一种基于分布假设（出现在类似语境中具有相似含义的词）的分布向量，它的作用是把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中。通常情况下，词嵌入会在任务上进行预训练，用浅层神经网络基于上下文预测单词。下图是Bengio及其同事当年提出的神经语言模型：

词向量倾向于嵌入语法和语义信息，而这种做法在各种NLP任务中（如情感分析）都取得了最先进的成果。

事实上，分布式表征在过去已经被大量用于研究，但正是连续词袋模型（CBOW）和Skip-Gram模型正式进入这个领域后，它才真正流行起来。这也确实是当前一种非常受欢迎的方法，因为它不仅能有效构建高质量的词嵌入，还能被用于语义组合（如’man’+’royal’=’king’）。

Word2vec

2013年，Mikolav等人提出CBOW和skip-gram模型，这是Word2Vec模型中的两个主要类别。其中，CBOW模型是一种构建词嵌入的神经方法，它的目标是基于给定上下文和给定窗口大小，预测目标单词（input word）的条件概率。同样的，skip-gram模型也是一种构建词嵌入的神经方法，但不同的是，它的目标是在给定中心目标单词的情况下，预测上下文。

对于这两种模型，词嵌入的维度是由（以无监督的方式）计算预测的准确率确定的。

使用词嵌入的限制之一是当我们想要获得诸如“hot potato”或“Boston Globe”之类短语的向量表示时，我们不能简单地组合单个词的向量表示，因为这些短语不代表单个词的语义组合。因此当短语或句子很长的时候，整个问题会变得很复杂。

Word2vec模型的另一个限制是使用较小的窗口为对比单词产生类似的嵌入，比如 “good”和“bad”，在一些比较重视这类差异的任务中（如情感分析），这种做法并不可取。此外，词嵌入还高度依赖它们的应用场景。为每个新任务重新训练特定的嵌入确实有意义，但这通常意味着高昂的计算成本，而且我们能通过负采样达到一样的效果。

Word2vec模型还存在其他问题，比如没有考虑多义性因素、训练数据中存在偏见等……

字符嵌入

对于诸如词性标记（POS）和命名实体识别（NER）之类的任务，查看词汇的词法信息是有用的，尤其是像葡萄牙语、西班牙语和中文这些构词方法十分丰富的语言。我们是在字符级别分析文本，因此对于某些未知词汇，利用这种嵌入方法有助于我们在不引入大型词典的情况下，帮助模型解决问题。

最后需要注意的是，虽然字符级和字级的嵌入已经成功应用于各种NLP任务，但它们在长期内仍将受到质疑。例如，Lucy和Gauthier最近的一项研究发现，一些标准词嵌入无法编码许多显着的常规感知特征，而且这些缺陷和词与词之间的相似性预测误差密切相关。换句话说，如果我们只用分布式语义，它其实是无法理解单词背后的概念的。上个月，Jacob Andreas等人也在自然语言处理系统的背景下就意义表征进行了激烈辩论。

卷积神经网络（CNN）

CNN基本上就是一种基于神经的方法，它可以被看作是基于单词或n-gram提取更高级别特征的特征函数。如今，CNN提取的抽象特征已经被有效应用于情感分析、机器翻译和问答系统等任务。 Collobert和Weston是首批将基于CNN的框架应用于NLP任务的研究人员之一。他们的方法的目标是通过查找表将单词转换为向量表示，由此产生原始词嵌入，可以在网络训练期间学习权重（见下图）。

为了用CNN进行句子建模，首先，他们把句子标记成一个个单词，进一步将其转换为d维的词嵌入矩阵；然后，他们在该嵌入层上应用卷积filter，产生所谓的特征映射；之后再进行最大池化操作，对每个filter应用最大操作以获得固定长度输出并减小输出的维数；最后，产生最终的句子表示。

通过向上述基础CNN添加更多的复杂性因素，使其适应执行基于词的预测，我们可以用它研究诸如NER、情感分析和POS等问题。它的重点是需要一种基于窗口的方法，即对于每个词，考察它相邻词汇（子句）的窗口大小。有了这个窗口，我们就能把CNN应用于子句，预测窗口中心单词——这也被称为词级分类。

但CNN的一个缺点是无法建模长距离依赖关系，这对所有NLP任务来说都很重要。为了解决这个问题，现在研究人员已经把CNN和时延神经网络（TDNN）结合在一起，由后者在训练期间实现更大的上下文范围。另外，动态卷积神经网络（DCNN）也已经在不同任务上取得了成功，比如情绪预测和问题分类，它的特殊之处在于池化层，它用了一种动态k-max池化，能让filter在句子建模过程中动态地跨越可变范围，使句子中相隔甚远的两个词之间都能产生语义联系。

CNN还能基于长短不一的文本被用于更复杂的任务，比如目标检测、情感分析、短文本分类和讽刺检测。然而，其中一些研究论文称，当将基于CNN的模型用于分析twitter等微型文本时，我们必须引入外部知识。此外，CNN在query-document matching、语音识别、机器翻译和问答上也有一定的用处，在涉及从低级词汇中提取特征以形成高度语义概括的任务中，DCNN也经常出现。

总体而言，CNN是有用的，因为它们可以在上下文窗口中挖掘语义线索，但它们在包吃连贯性和长距离语义关系时，还有一定欠缺。相较之下，RNN还是个更好的选择。

循环神经网络（RNN）

RNN是一种专门处理序列信息的神经网络，它循环往复地把前一步的计算结果作为条件，放进当前的输入中。这些序列通常由固定大小的标记向量表示，按顺序逐个输入循环神经元。下面是RNN的简单图示：

相比CNN，RNN的优势是能把之前处理好的信息并入当前计算，这使它适合在任意长度的序列中对上下文依赖性进行建模。目前，RNN一直是各类NLP研究的常规选择，比如机器翻译、图像字幕和语言建模等。

但这并不意味着RNN相对CNN有绝对的优势，因为它们模拟的是数据完全不同的两个方面，所以两者能发挥多少作用需要看具体应用场景，取决于任务所需的语义。

一般来说，RNN的输入是one-hot编码或词嵌入，但它也能像CNN一样接收抽象表征。简单的RNN容易出现梯度消失，这意味着难以学习和难以调整较早层中的参数。为了解决这个问题，研究人员们陆续提出了LSTM、ResNets和GRU等多种变体。

RNN的变体

LSTM由三个门（输入、遗忘和输出）构成，它通过三者控制信息流，获取长距离依赖关系。GRU和LSTM很相近，不同的是它只有两个门，更简单，效率也更高。但一项研究也表明，目前我们很难判断RNN的哪些门更重要，它们的选用主要还是取决于可用的算力。现在基于LSTM的模型已经能解决序列到序列的映射（通过编码器-解码器框架），在机器翻译、文本摘要、人工对话建模、回答模型、基于图像的语言生成等任务中都有不错的应用。

总的来说，RNN在NLP领域的用处是广泛的：

字级分类（例如，NER）
语言建模
句子级别分类（例如，情感极性）
语义匹配（例如，将消息与对话系统中的候选响应相匹配）
自然语言生成（例如，机器翻译、视觉QA和图像字幕）

注意力机制

从本质上说，注意力机制的作用对象是基于编码器-解码器框架的RNN，它能让解码器利用最后的隐藏状态，以及基于输入隐藏状态序列计算的信息（如上下文向量），这对于需要上下文对齐的任务有奇效。

当前注意力机制已经成功被用于机器翻译、文本摘要、图像字幕、对话生成和情感分析。虽然有研究人员已经提出了各种不同形式和类型的注意力机制，但未来它仍是NLP领域的一大重点研究方向。

递归神经网络（Recursive Neural Network）

与RNN类似，递归神经网络是对连续数据建模的一种机制。而语言恰好可以被看成是“递归结构”，其中单词和子短语可以组成句子层次结构中更高级的短语。在这种结构中，非终端节点由其所有子节点的表征来表示，下面是一幅示意图：

基础递归神经网络计算高级别短语的方法是自下而上组合成分，在它变体的MV-RNN中，单词由矩阵和向量表示，这意味着每个成分（单词/短语）被表示为参数矩阵。这种做法的弊端是可能会出现特别大的参数，而为了解决这个问题，研究人员又提出了另一种变体：递归神经张量网络（RNTN）——它通过在输入向量之间添加更多交互，对参数大小进行了限制。

目前，递归神经网络比较常见于以下领域：

语法分析
利用短语级表征来进行情绪分析
语义关系分类（例如，主题消息）
句子相关性

强化学习

强化学习包含传统机器学习方法、训练智能体和设置奖励。近年来它在自然语言生成（NLG）任务中崭露头角，如文本生成，但这个趋势从本质上看是一种“被迫转型”。

和其他NLP任务一样，以往研究人员在研究NLG任务时用的大多也是RNN，但基于RNN的生成器存在一个难以解决的问题，就是它的原理是用模型输出单词代替句子原本单词，这就不可避免地会快速提高错误率。再加上我们不能用其他任务的性能衡量标准来评估语言生成模型，综合影响之下，现在的NLG模型只能生成重复、矛盾、平淡的表达。

为了解决上述问题，学界向强化学习伸出了橄榄枝，它也确实在图像字幕和机器翻译中表现出色。在NLP任务中，强化学习框架由一个智能体（基于RNN的生成模型）组成，它与外部环境（在每个时间步看到的输入词和上下文向量）相互作用。智能体根据策略（参数）选择一个动作，该策略涉及在每个时间步预测序列的下一个单词，每次完成预测后，智能体会更新其内部状态。预测完整个任务后，我们再统计智能体的奖励收集情况，奖励设置因任务而异，在NLG中，它们的奖励可能是信息流。

尽管强化学习给了学界希望，但具体在用它时需要适当地处理动作和状态空间，避免过大空间影响智能体训练、探索。此外，生成对抗也开始被用于训练语言生成模型，这在对话系统中可能有一些用处，可以区分哪些话是人类说的，哪些是机器生成的。

无监督学习

无监督句子表征学习涉及以无监督的方式将句子映射为固定大小的向量。它使用的分布式表征经辅助任务训练，能从语言中捕获语义和句法属性。

skip-thoughts模型，和学习词嵌入的算法类似，可以基于中心句预测上一个/下一个相邻句子。该模型采用了当下流行的seq2seq框架，其中解码器负责生成目标序列，编码器可以被看作是通用特征提取器——甚至能在提取过程中学习词嵌入。

深度生成模型

现如今NLP领域最流行的深度生成模型有变分自动编码器（VAE）和生成对抗神经网络（GAN），它们能在潜在空间生成逼真的句子，并从中发现丰富的自然语言结构。

众所周知，由于潜在空间没有约束，标准句子自编码器生成的文本通常很“假”。VAE通过在隐藏的潜在空间上施加先验分布，能使生成的句子接近人类自然语言表述。它由编码器和生成器网络两部分构成，执行任务时，编码器和生成器网络先将输入编码到潜在空间中，然后从潜在空间生成样本。它的训练目标是最大化生成器网络中的对数似然的变分下界。

下面是一个基于RNN的VAE：

GAN本身十分灵活，所以它在很多NLP任务上都有用武之地。比如，和标准自编码器相比，一个基于RNN的VAE生成模型可以产生形式更多样化、表述更规整的句子。而其他基于GAN的模型也能把结构化变量（如时态、情绪）结合进来，生成更符合语境的句子。

除此之外，GAN也可以被用来训练模型，使之能生成更贴近人类表述的文本。比如我们可以把LSTM用作生成器，把CNN作为区分真实数据和生成样本的判别器。

但它也有问题，一个是不能反向传播，第二个是这些深度生成模型本质上都是黑盒，它们目前还缺乏标准化的评估工具。

记忆增强神经网络

神经网络中可以存储的信息量称为网络容量（network capacity）。一般来讲，利用一组神经元来存储信息的容量和神经元的数量以及网络的复杂度成正比。如果要存储越多的信息，神经元数量就要越多或者网络要越复杂。为了增强网络容量，一种比较简单的方式是引入结构化的记忆模块，将和任务相关的短期记忆保存在记忆中，需要时再进行读取。这种装备外部记忆的神经网络也称为记忆网络（MN）或记忆增强神经网络（MANN）。

目前研究人员在这个方向做出的进展有动态记忆网络，它们在QA、语言建模、POS标记和情感分析等任务上有不错的表现。

结论

到目前为止，我们已经探讨了基于神经网络的模型（如CNN和RNN）的优点和局限，介绍了强化学习、无监督学习和深度学习在NLP任务上的可能性，也知道了注意机制和记忆增强网络在提高NLP神经网络模型性能上的能力。通过结合以上所有先进技术，我们已经能以令人信服的方式让机器理解语言的复杂性。

但正如《NAACL研讨会深思：NLP泛化模型背后的虚假和脆弱》这篇文章揭露的，现在的许多NLP模型依然充满脆弱和虚假，未来，我们还需要把研究重心放到引入常识性知识和人类行为建模上。

编辑于 2018-09-25

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
嘿，谢谢你小小玛拉沁
突然想对一个女孩子说，谢谢你！很久很久以前，总是觉得和你不会有太多交集，充其量也只是普通的舍友吧，毕竟有很多习惯，性格等方面相差甚远。其实特别感谢2017这一段经历和我遇见的人，只会慢吞吞的过自己生活的安小蜗是不会主动去结交朋友的，所以她来到了我的世界，让我在不知不觉中发现了自己太多太多的问题，而我正在逐渐去改变这些的习惯，成为更好的自己！我总是超级佩服她不管什么时候精力都超级旺盛，可以在上了一天
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
2021-08-09 杜永鹏
京❤️达总店：杜永鹏2021年8月9日落地真经严格就是爱，放纵既是害目标确认目标:产值目标165000台次目标100油卡目标10体验：在工作中遇到问题不要盲目的去干，要多方面考虑问题，找到问题的关键克服困难并解决问题！
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
第二期心理咨询师培训第1组分享第八天张云511
学会与问题共存—事情不会只有一个面读完本节，印象最深的点就是“扩大白色而非消灭黑色”。其实在班级管理中也是一样，我们暂时不要着急去消灭问题，而是注意学生哪些方面很不错，值得我们去扩大，我们要发现学生的资源与潜力，从正向的意义出发，发挥滴水穿石的力量，让一个个小改变汇集出巨大的改变！调整看事情的角度，不把生活问题扩大，是我们学习“与问题共存”的重要一步。换个角度看问题，会改变自己，也会感动别人！这样
生命如花坦释空
每个人的心中都有一株妙莲花。这是禅家语。禅家总是站在理性的高处，以超越红尘的洒脱来参悟人生和自省生命。那么，凡俗中人呢？生如夏花之绚丽，死如秋叶之静美。这是诗人语。多少人在赞美：姑娘好像花一样！又有多少人在咏歌：花儿与少年。的确，人生如花。花一样的生命，理应自诞生之日起，就一瓣一瓣地绽放她的美丽与清香，使这个原本死寂荒凉的世界五彩缤纷，充满快乐。事实上，人类自诞生起，就一代一代地做着这方面的努力，
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
2019-03-24 李飞720
姓名：李飞企业名称：临沂鑫道食品有限公司组别373期利他1组日精进打卡第338天】【知~学习】1、阿米巴经营一段2、活用人才1段3、活法、一段【行~实践】一、修身：读书、抽烟减量、俯卧撑个跑步3公里二、齐家、劝说老爸与姑姑和好三、建功、业务洽谈【经典名句分享】1、依据原理原则追求事物的本质，以“作为人，何谓正确”进行判断2、经营者必须为员工物质和精神两方面的幸福殚精竭虑，倾尽全力，必须超脱私心，让
“晚节不保”与“浪子回头” 锦瑟_db50
今天听音频，听到这两个熟悉的词——晚节不保、浪子回头。认真思量，对这两种情况，我们一般的认知中是缺乏公允的。我们听到“晚节不保”时，通常是痛惜不已，甚至感觉对方重要露出狐狸尾巴，有大快人心之感。很多人对古今名人，特别是对古今伟人的“背后的故事”很感兴趣，一方面是猎奇，一方面不能不说是一种险恶的用心——看看他也不过如此，和我们也没什么不同。这个“毁神”的过程，实际上是为自己的堕落找理由的方式。而“晚
mac 备份android 手机通讯录导入iphone,iphone如何导出通讯录（轻松教你iPhone备份通讯录的方法）... weixin_39762838 mac 备份android 手机通讯录导入iphone
在日新月异的手机更替中，换手机已经成为一个非常稀松平常的事情，但将旧手机上面的通讯录导入到新手机还是让不少小伙伴为难，本篇将给大家详细讲解这方面的知识：“苹果手机通讯录怎么导入到新手机”及“安卓手机通讯录导入到新手机”的方法。一、苹果手机通讯录导入到新手机常用方法(SIM卡导入)在苹果手机主频幕上找到“设置”，单击进入设置菜单，下拉菜单列表，点击“邮件、通讯录、日历”，然后找到“导入SIM卡通讯录
Android应用性能优化轻口味 Android
Android手机由于其本身的后台机制和硬件特点，性能上一直被诟病，所以软件开发者对软件本身的性能优化就显得尤为重要；本文将对Android开发过程中性能优化的各个方面做一个回顾与总结。Cache优化ListView缓存：ListView中有一个回收器，Item滑出界面的时候View会回收到这里，需要显示新的Item的时候，就尽量重用回收器里面的View；每次在getView函数中inflate新
2021-11-18 安安303
刘红雅中原焦点团队分享第135天筑基第4课社会心理学接上一课，心理现象。需要和动机所有的动机行为受需要的影响，现在的孩子很多方面不需要，是因为得到的太多需要使机体内部不平衡的状态，现在很多需要满足的过多，是“厌”，孩子要越用越有用，没有用到自己，自己没有价值感成就感，他就不需要开发自己的潜力。对自己和孩子的生活留白不断的学习成长，实现自己。所有有情绪的地方是触动了需求，需求没有被满足，当一个人知道
一个纯真姑娘被现实社会磨灭了热情幽律
每个初入社会的人，都是满怀憧憬，热情对待这个社会，可往往都是被回馈以欺骗，恐吓，磨灭了热情。我的一个朋友，小吴，来自安徽的姑娘，初出校门，来到这座南方经济发达的城市，善良单纯，待人对事充满了朝气与热情。当时小吴所在的房产中介公司有一位女客户，是退休教师，谈吐方面能感觉得到很有素质，和她先生想要买房，小吴接待的。了解情况后，客户感觉经济方面还是有点压力的，所以委托小吴先帮她卖自己的旧房，周转开来再买
圣诞节后的人气又回来了？好丽友、特斯拉们的生意却不好做| 每周热点汇总饭Sir看天下
新的一年来了大家好，今天是2022年12月26日，星期一，农历十二月初四。这个月，相信我们很多人都遇到了身体不适的情况，饭Sir上周也因为发烧不得不停更了一周，这几天才刚刚恢复，好在这一切最后都能过去。疫情之外，一些好消息也逐渐到来，例如北京等多座大城市在年底的圣诞节期间又恢复了生机，一些迹象也在预示着久违的热闹春节要回来了。但另一方面，明年不确定的经济形势又带来一些不利的消息，不禁让人有些担心。
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
人要有自知之明孟冬廿六
今天中午跟一学妹聊天，谈起结婚找对象的问题，小姑娘年龄不算大，二十七岁，但是整个人很清醒很现实，她如今在一国企上班，吃住都不花钱，再加上她经常出差，补助奖金这一块儿也不少，一年下来七七八八的有个小二十万，这对于一个小姑娘来说已经非常不错了，她计划这两年自己付首付买房，然后想要买辆MINI，小姑娘一米七六的个子，长得漂亮有气质，家庭条件也不错，所以对于择偶方面也有一定的要求，最好是事业单位的，父母有
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">