Arvid Y

BLEU 评价 NLP 文本输出质量

bb5.jpg" alt=“慎用！BLEU评价NLP文本输出质量存在严重问题”>

AI 前线导读：在评价机器翻译系统时，译文质量究竟如何，无法通过文本形式的输出直观地提现，因此需要采用一些适当的量化标准对机器翻译的译文输出进行评价，这也就催生了几个评价指标。而 BLEU 是一种流行的机器翻译评价指标。但是，Rachael 认为 BLEU 存在的问题比较严重，提醒 NLP 从业者要慎用，这究竟是怎么回事呢？

刚接触 NLP 的人经常问我的一个问题是，当系统的输出是文本时，如何对系统进行评价，而不是对输入文本进行某种分类。这些类型的问题，就是在模型中放入一些文本，然后从中取出一些文本，称为序列到序列或字符串转换问题。

这些问题真的很有趣！序列到序列建模的一般任务是 NLP 中一些最困难任务的核心，包括：

文本自动摘要
文本简化
问答系统
聊天机器人
机器翻译

这些技术完全源自科幻小说。通过这么多令人兴奋的应用，人们很容易明白为什么序列到序列建模比以往更受欢迎。但实际上，对这些系统进行评价并不是一件容易的事情。

然而不幸的是，对刚刚起步 NLP 的人来说，应该使用什么指标来评价模型，并没有简单的答案。更槽糕的是，BLUE—— 用于评价序列到序列任务的最流行的指标之一，存在很大的缺点，特别是在应用于它从未打算评价的任务时，这点尤为明显。

幸运的是，你遇到了这篇深度剖析的博文！在本文中，我将探讨这个流行的指标的工作原理（别担心，我不会用太多的方程式）。我们将研究 BLEU 存在的一些问题，最后，我们将探讨在自己的工作中，如何最大限度地避免出现这些问题。

Orange painted blue on a blue background.（对 NLP 评价指标而言，这张不是有多引人注目的照片。）

非常棘手的问题

BLEU 最初是为了评价机器翻译而开发的，所以让我们来通过一个翻译示例来进行测试。这里有一段文字是用语言 A 写的（也就是 “法语”）：

J’ai mangé trois filberts.

这里有一段语言 B （也就是“英语”）的参考译文。（请注意，在英语中，有时也将 “hazelnuts” 称之为 “filberts”，因此这些翻译也堪称完美。）

I have eaten three hazelnuts.

I ate three filberts.

下面是一段生成的 “神经网络系统的” 翻译。（这里的 “神经” 是 Rachael 自己想出的一种可能的翻译，但假设这是你正训练的网络生成的。）

I ate three hazelnuts.

现在，有一个非常棘手的问题是：我如何为这段翻译指定单个数值分数，仅仅根据给定的参考句子和神经系统的输出，来看这个翻译究竟有多好？

你为什么要用单一的数值分数呢？好问题！如果我们想用机器学习来构建机器翻译系统的话，我们就需要将一个实数分数来输入到我们的损失函数中。如果我们也知道潜在的最佳分数，就可以计算两者之间的差距了。这使得我们能够在训练时给我们的系统提供反馈，也就是说，潜在的变化是否会通过分数更接近理想分数来改进翻译，并通过查看同一任务中训练过的系统的分数来进行比较。

你可以做的一件事，就是查看输出句子中的每个单词，如果它出现在任何参考句子中，就给它打 1 分；如果没有出现，就打 0 分。然后，为了使分数归一化，使其始终在 0~1 之间，可以将参考译文中出现的单词数除以输出句子中的单词总数。这就为我们提供了一个叫做一元精度（unigram precision）的衡量方法。

因此，在我们那个例子中，“I ate three hazelnuts”，我们在至少一个参考句子总看到了输出句子中的所有单词。再除以输出的单词数 4，这段翻译的分数是 1。到目前为止还不错。但是下面这条句子会怎么样呢？

Three three three three.

使用同样的度量标准，我们也会得到 1 分。但是，实际并不太好：我们需要一些方法来告诉我们正训练的系统，第一条翻译的句子要比第二条句子更好。

你可以根据每个单词在任何参考句子中出现的最高次数来限制每个单词的次数，来略微调整分数。使用这一指标，我们的第一条句子仍然会得到 1 分，而第二条句子的得分只有 0.25 分。

这就解决了 “Three three three three” 的问题，但仍然无助于我们理解像下面这样的句子，因为某种原因，这些单子是按字母顺序排序的：

Ate hazelnuts I three

如果使用我们目前的方法，这条句子将得到 1 分，也就是最佳分数！我们可以通过计数来避免这种情况，不是使用某个单词而是通过彼此相邻的单词进行计算。这些称为 n 元语法（n-gram），其中 n 是每组单词的数量。一元语法（Unigrams）、二元语法（bigrams）、三元语法（trigrams）和四元语法（4-gram）分别由一个、两个、三个和四个单词组成。

在这个例子中，我们使用二元语法。一般来说，BLEU 分数是基于一元、二元、三元和四元精度的平均值，但为简单起见，这里我们只使用二元。同样为简单起见，我们也不会添加一个 “单词” 来告诉我们在句子的开头和结尾有一个句子边界。根据这些指导方针，这些单词按字母顺序排序的二元语法如下：

[Ate hazelnuts]

[hazelnuts I]

[I three]

如果我们使用和用这些二元语法计算单个单词一样的方法的话，那我们现在的分数就是 0：最差的分数。我们的那个 “Three three three three” 例子的得分也是 0，而不是 0.25。而第一个例子 “I ate three hazelnuts” 的得分是 1。不幸的是，这个例子也是如此：

I ate.

避免这种情况的一种方法是将我们目前的分数乘以一个惩罚比我们参考译文短的量值。我们可以通过将它与最接近的参考句子的长度进行比较来实现这一点。这就是对简短惩罚（brevity penalty）。

如果我们的输出与任何参考译文一样长或者更长，那么惩罚值就是 1。由于我们将得分乘以它，因此这并不会改变最终的输出。

另一方面，如果我们的输出比任何参考译文都短的话，那么我们就将最接近的句子的长度除以输出的长度，从中减去 1，然后取 e 的整次幂。基本上，最短的参考译文越长，输出越短，那么简短惩罚值就越接近 0。

在我们这个 “I ate” 例子中，输出的句子是两个单词长度，最接近的参考译文有四个单词的长度。我们就得到了一个 0.36 的惩罚，当我们的二元精度得分为 1 时，我们的最终得分下降到 0.36。

这种指标着眼于输出和参考译文之间的 n-gram 重叠，并以较短的输出为惩罚，被称为 “BLUE”（即双语评价基础研究的缩写：Bilingual evaluation understudy，人们在解释缩写时，就会这么说）。由 Kishore Papineni、Salim Roukos、Todd Ward 和 Wei-Jing Zhu 于 2002 年在 IBM 提出。它在 NLP 中是非常流行的指标之一，特别是对于系统输出的文本字符串而不是分类的任务。这包括了机器翻译、以及越来越多的自然语言生成。这就是我在本文开头提出的非常困难的问题的解决方案：开发一种方法，为翻译分配单个数字分数，告诉我们它有多 “好”。

然而，它也存在严重的缺陷。

BLEU 的缺陷

这时候你可能会想，“Rachael，如果这个指标有这么多缺陷，你为什么要要指导我们如何计算呢？” 我之所以这么做，主要是向你们展示这个指标有多合理。它是相当直观的，潜在的想法是，你可以通过将机器翻译系统的输出与参考译文进行比较来评价机器翻译的输出，这在 NLP 中有极大的影响力（尽管并非没有批评者）。

当然，BLUE 也有一些优势。从事 NLP 的研究人员最关心的是它有多方便。

BLUE 快速且易于计算，特别是与人工翻译速率模型输出相比的话尤为明显。
BLUE 无处不在，这使你将模型与同一任务的基准进行比较变得更为轻松。

不幸的是，由于这种便利性，人们都在过度使用它，即使对不是最佳指标选择的任务也是如此。

尽管我的例子只有一句话，但 BLEU 毕竟是一种语料库级别的指标。计算语料库中每条句子的 BLEU 分数，然后在他们之间取平均值会人为地夸大你的分数，如果你尝试在你所做的地方发表作品，肯定会被评论者的口水淹死。

即使你没有过度使用 BLEU，在你选择花时间去计算更好的 BLEU 分数之前，你应该知道这个指标也存在严重限制。虽然网上已经有很多关于 BLEU 缺点的讨论，但我认为，它的四个主要问题是：

它不考虑意义
它不直接考虑句子结构
它不能很好地处理形态丰富的语言
它与人类的判断并不相符

让我们逐一讨论这些缺陷，这样我就可以告诉你们为什么我认为这些都是缺陷。

BLEU 不考虑意义

对我来说，这是唯一最令人信服的理由：不单单依靠 BLEU 来评价机器翻译（Machine Translation，MT）系统。作为机器翻译的人类用户，我的主要目标是，能够准确理解原文的基本含义。主要输出的句子符合原文的意思，哪怕输出的句子存在一些怪异的句法或者语法，我也乐意接纳。

但是 BLEU 并不衡量意义。它只奖励参考系统中具有精确匹配的 n-gram 系统。这意味着虚词的差异（如 “an” 或 “on”）与更重要的实词的差异受到的惩罚一样严重。这也意味着，如果译文中，具有完全等效的同义词，但却没有出现在参考译文的话，那么将会受到惩罚。

让我们来看下面的一个例子，你就会明白为什么这是一个问题。

原文（法语）： J’ai mangé la pomme.

参考译文： I ate the apple.

如果照 BLEU 来看，这些都是 “同样槽糕” 的输出句子：

I consumed the apple.

I ate an apple.

I ate the potato.

作为机器翻译系统的最终用户，实际上我认为输出的前两句没有什么问题。即使它们与参考译文不完全相同，但它们能让人理解原文的意思。但是，第三句就完全不能接受了，因为它完全改变了原文的意思。

NIST 是基于 BLEU 的一种指标，它通过对错误匹配的 n-gram 的惩罚进行加权来解决这个问题。因此，更为常见的 n-gram（如 “of the”）的不匹配将会得到更轻的惩罚，而在更罕见的 n-gram（如 “buffalo buffalo”）的不匹配将会受到更严重的惩罚。但是，虽然解决了赋予虚词过多权重的问题，但它实际上却使惩罚同义词（如 “ambled” 和 “walked”）的问题变得更槽糕了，因为这些同义词只出现在更为罕见的 n-gram 中，因此受到更严重的惩罚。

BLEU 不考虑句子结构

也许你不完全相信 “即使你搞错了一些关键词，完全改变了句子的意思，也仍然能够得到相当不错的 BLEU 分数”。也许有些句法会让你信服？

句法研究的是句子的结构。正是这个研究领域，我们才能对像 “I saw the dog with the telescope” 这样的锯子进行正式建模，这可以意味着两个意思：我用望远镜观察狗，或者这条狗有望远镜。这两种含义之间的差异，只能通过建模的句子中的单词之间可以彼此具有不同关系的事实来提现。

我不是世界上最伟大的句法学家（绝对没有希望），但即使是我也知道在自然语言中有很多重要的内部句法结构，如果你随意打乱句子中的单词顺序，你要么会得到这两种结果中的一个：

1）毫无意义的句子。
2）意思完全不同的句子。

幸运的是，在开发系统来完成对该结构自动建模方面做了大量的工作，这被称为句法分析。

但不幸的是，BLEU 并没有建立在任何这项研究的基础上。我能理解为什么你可能想要避免这种情况。因为解析往往需要很大的算力，并且每次评价的时候，必须解析所有的输出，这确实会增加一些开销。（尽管有一些指标，如 STM 或子树指标，可以直接比较参考和输出翻译的解析。）

然而，不考虑句法结构的结果意味着，表面词序完全混乱的输出也可以得到与更为连贯的输出具有相同的分数。

在 Callison-Burch 等人于 2006 年提出的《Re-evaluating the Role ofBLEUin Machine Translation Research》中有一个很好的例子。我们来看一下这组参考句子：

Orejuela appeared calm as he was led to the American plane which will take him to Miami, Florida.

Orejuela appeared calm while being escorted to the plane that would take him to Miami, Florida.

Orejuela appeared calm as he was being led to the American plane that was to carry him to Miami in Florida.

Orejuela seemed quite calm as he was being led to the American plane that would take him to Miami in Florida.

他们得到了机器翻译输出的句子：

Appeared calm when he was taken to the American plane, which will to Miami, Florida.

这翻译并不完美：因为人名被删除了，而且在后半句的 “will” 后面没有动词，但这样的翻译也不是完全没有意义。然而，这个例子是：

which will he was, when taken appeared calm to the American plane to Miami, Florida.

出人意料的是，BLEU 居然为第一个输出和第二个输出给出了相同的分数，尽管第一个显然是更好的英语翻译。

BLEU 不能很好地处理形态丰富的语言

如果像地球上的大多数人一样，你碰巧使用的不是英语，那么你可能已经发现这个指标存在一个问题：BLEU 是基于单次级的匹配。对于形态丰富的语言来说，这很快就会成为一个问题。

语素是语言中最小的意义单位，它们组合在一次就构成了单词。英语中有一个例子是，“cats” 中的 “s”，这表示有不止一只猫。有些语言，比如土耳其语，在一个单词中就有很多语素；而在其他语言，如英语，每个单词的语素通常较少。

来看看秘鲁语 Shipibo 的以下几条句子。（这些例子来自 Pilar Valenzuela 的 Shipibo 语的言据性，以及 Panoan 语对该类别的比较概述。）

Jawen jemara ani iki.

Jawen jemaronki ani iki.

上面这两句话都是英语句子 “her village is large” 的完全可以接受的翻译。你可能会注意到以 “jemar-” 开头的单词在两条句子中有不同的结尾。不同的词尾表示不同的语素，表明说话者对于村庄很大的这一事实有多确定：最上面的一条表示他们确实去过那里，而最下面的一条表示他们从别人那里听说村庄很大。

这种特殊类型的语素被称为 “证据标记”，而英语中不存在这些。然而，在 Shipibo 语中，你需要这两个语素中的一个用于句子语法，因此我们的参考译文肯定会有两个中的一个。但如果我们没有碰巧生成我们在参考句子中的单词的确切形式，那么 BLEU 就会因此进行惩罚…… 即使这两条句子都能很好地表达了英语的意思。

BLEU 与人类的判断不能很好地相符

当我讲到语法部分的时候，如果你感到昏昏欲睡，那么现在是时候提提神了。

构建机器翻译、聊天机器人或问答系统的最终目标是什么？你最终希望人们使用这些，对吧？如果这个系统不能提供有用的输出，谁还会用这些系统呢？因此，你真正想要优化的就是，使用你的系统的人们有多喜欢它。我们使用的几乎所有指标都被涉及成不同的近似方法。

当 BLEU 首次被提出时，作者确实做了一些行为测试，以确保这些测量与人类判断相关（他们这么做值得鼓励！）。然而不幸的是，随着研究人员进行更多的实验来比较 BLEU 评分和人类的判断，发现这种相关性并不总是很强，而且根据具体的任务，其他测量结果往往更接近人类的判断。

例如，在 Turian 等人发表的论文《Evaluation of Machine Translation and its Evaluation》中，他们发现在三种测量中，BLEU 与机器翻译人类判断的相关性最差，简单的 F1 与人类判断相关性最强，NIST 次之。2006 年，Callison-Burch 等人研究了为一项共同任务而开发的系统（如学术界的 Kaggle 竞赛，但没有奖金），并发现这些系统的相对排名存在巨大的差异，这取决于你是一句 BLEU 分数还是人类评价者的判断。在 Yanli Sun 与 2016 年发表的《Mining the Correlation between Human and Automatic Evaluation》中，比较了三种不同的指标：BLEU、GTM 和 TER，并再一次发现 BLEU 分数确实与人类判断的相关性最小。

换句话说就是：如果你希望人们喜欢使用你的系统，你不应该只关注获得更高的 BLEU 分数。

我并非唯一持保留意见的人

也许你仍然不相信这一点：BLEU 并不总是适合这项工作的工具。没关系，事实上，我很欣赏你的怀疑精神！但是，我并不是唯一一个不是这个指标最大粉丝的 NLP 从业者。下面我罗列出了其他同行评审的论文的连接，这些论文更多地讨论了 BLEU 的其他一些缺点：

同行评审论文：

Reiter（2018）是 ACL 论文的荟萃综述，该综述同时使用 BLEU 和人工判断进行评价，发现它们仅针对机器翻译系统的系统级综述进行模式组合。

http://aclweb.org/anthology/J18-3002

Sulem 等人（2018）建议不要使用 BLEU 来简化文本。他们发现，BLEU 分数既不能很好地反映语法，也不能很好地反映保存的意义。

http://aclweb.org/anthology/D18-1081

Novicoca 等人（2017）研究表明，在评价 NLG（自然语言生成，Natural Language Generation）任务时，BLEU 以及一些其他常用的指标并不能与人类判断很好地相符。

https://www.aclweb.org/anthology/D17-1238

Ananthakrishnan 等人（2006）对 BLEU 提出了几个具体的反对意见，并深入探讨了 BLEU 评分较高的英语、印地语翻译中的具体错误。

https://core.ac.uk/download/pdf/23798335.pdf

下面罗列了一些未经同行评审的资源：（虽然对于评审研究论文的同行来说，这些资源可能不那么有说服力，但却有可能更容易让你的老板信服。）

其他资源：

Amazon Research 的 Matt Post 就预处理对 BLEU 分数的影响进行了精彩的讨论。

https://arxiv.org/pdf/1804.08771.pdf

从事翻译工作的 Kirti Vashee 撰写的这篇博文，从译者的角度讨论了 BLEU 的问题。

http://kv-emptypages.blogspot.com/2010/03/problems-with-bleu-and-new-translation.html

Yoav Goldberg 在 2018 年的国际自然语言生成会议上做了一场很棒的演讲，其中讨论了为什么不应该将 BLEU 用于 NLG。你可以在下面网址找到相关的 PPT（以 “BLEU can be Misleading” 为搜索关键词可搜到相关 PPT）。特别是，他和合著者发现，他们的句子简化模型即使通过添加、删除或重复信息也能得到很高的 BLEU 分数。

https://inlg2018.uvt.nl/wp-content/uploads/2018/11/INLG2018-YoavGoldberg.pdf

Ana Marasović撰写的博文《NLP’s generalization problem, and how researchers are tackling it》，讨论了包括 BLEU 在内的各个指标如何无法捕获模型处理不同于它们在训练期间所接触的数据的能力。

https://thegradient.pub/frontiers-of-generalization-in-natural-language-processing/

那么你应该用什么呢？

在评价将文本作为输出的系统时，我希望你使用的主要方法是谨慎，特别是在构建最终可能投入生产的系统时。对于 NLP 从业者来说，考虑我们的工作将如何应用，以及可能出现的错误是非常重要的。想想这名巴勒斯坦人吧，他之所以被捕，是因为 Facebook 把他的一篇内容为 “早安” 的帖子翻译成了 “攻击他们”！我并非对 Facebook 鸡蛋里挑骨头，而是想指出 NLP 产品的风险可能比我们有时意识到的还要高。

仔细地挑选我们优化的指标是确保我们所使用的系统实际可用的重要部分。例如，对于像机器翻译这样的任务，我个人认为，惩罚意义上的重大改变非常重要。

也就是说，有很多自动评价指标可以取代 BLEU。其中一些可以更好地完成不同的任务，所以花点时间来评价哪些指标最适合你的特定项目是值得的。

有两种流行的方法实际上是 BLEU 的衍生物，旨在帮助解决它的一些缺点：

NIST。正如我上面所提到的，NIST 是根据稀有性对 n-gram 进行加权。这意味着正确匹配罕见的 n-gram 比正确匹配一个常见的 n-gram 更能提高分数。
ROUGE。它是 BLEU 的一种改进，侧重于召回率而不是精确率。换句话就是，它关注的是参考译文中有多少 n-gram 出现在输出中，而不是相反。

还有很多方法可以用来评价不基于 BLEU 的序列到序列模型。其中有一些是从机器学习的 NLP 的其他领域采取的措施。

困惑度（Perplexity）是信息论中的一种指标，更常用于语言建模。它衡量单词的学习概率分布于输入文本的概率分布的匹配程度。
词错率（Word error rate，WER）是语音识别中常用的指标。它衡量的是在给定参考输入的情况下，输出序列中的替换（比如 “an” 替换为 “the”）、删除和插入的数量。
F-score，也就是通常所说的简短惩罚，是精确率的平均值（有多少预测是正确的）和召回率（有多少可能正确的预测是对的）的平均值。

还有一些是专门为序列到序列的任务开发的。

STM，或子树指标（我在前面已提及）比较了参考和输出翻译的解析，并惩罚具有不同句法结构的输出。
METEOR，类似于 BLEU，但包含了其他步骤，如考虑同义词和比较单词的词干（这样 “running” 和 “run” 视为相匹配）。与 BLEU 不同的是，它明确用于比较句子而不是语料库。
TER（Translation error rate），即翻译错误率，衡量将原始输出翻译成可接受的人工翻译所需的编辑次数。
TERp，或成 TER-plus，是 TER 的扩展，它还考虑了释义、词干和同义词。
hLEPOR，一种更适用于土耳其语或捷克语等形态更为复杂的语言的指标。除却其他因素之外，它还考虑了词性（名词、动词等）等有助于捕获局发信息。
RIBES，与 hLEPOR 一样，它不依赖于与英语具有相同品质的语言，其设计初衷是为亚洲语言（如汉语和日语）提供更丰富的信息，而且不受单词边界的限制。
MEWR，可能是列表中最新的指标，我发现它最让人兴奋的一点是：它不需要参考翻译！（这对于资源不足的语言来说是喜大普奔的好事，因为这些语言可能没有大量的平行语料库。）它结合了单词和句子的嵌入（瀑布哦・捕获意义的某些方面）和困惑度为翻译进行评分。

那你的意思是，这玩意儿很复杂？

这几乎就是问题的核心了。要知道，语言是很复杂的，这就意味着衡量语言自动化是很难的事情。我个人认为，开发自然语言生成的评价指标目前可能是 NLP 中最难的问题。（如果你跟我一样感兴趣的话，在 2019 年的 NAACL 上将会有一场关于这个问题的研讨会，来参加吧！）

不过，有一种很好的方法可以确保你的系统在做人类喜欢的事情上变得更好：你可以向人们咨询他们的想法。人类评价曾经是机器翻译的标准，我认为它在今天仍然有一席之地。是的，它挺贵的，而且花费的时间还挺长。但是至少对即将投入生产的系统，我认为你应该和人类专家进行至少一轮的系统评价。

需要提醒的是，在进入这一轮由人类专家进行的系统评价之前，你可能需要使用至少一个自动评价指标。我会强烈建议你们在当且仅当以下这种情况使用 BLEU：

你正进行机器翻译，并且
你正在对整个语料库进行评价，以及
你知道指标存在局限性，并已准备好接受它们。

否则的话，你还是多花点时间去找寻一个更适合你特定问题的指标吧。

你可能感兴趣的:(NLP)

免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
甘超波：NLP婚姻中如何与老人相处甘超波
哈喽，大家好我是甘超波，是一名NLP爱好者，每天一篇原创文章或视频，分享我的实战经验和案例，希望给你些启发和帮助看一下，在家庭中子女与老人观念不一致时案例1：在教育孩子方面，老人习惯用老一套教育方式教育孙子，子女受不了老人这种习惯，从而发生口舌之争？2：在生活习惯方面，老人喜欢吃剩菜剩饭，子女受不了老人这种习惯，从而发生口舌之争？.....这样的事情，我相信你或多或少都听过和看过，甚至了深有感悟。
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
《昇思 25 天学习打卡营第 25 天 | 基于 MindSpore 实现 BERT 对话情绪识别》 Sam9029 Mindscope模型学习深度学习
《昇思25天学习打卡营第25天|基于MindSpore实现BERT对话情绪识别》活动地址：https://xihe.mindspore.cn/events/mindspore-training-camp签名：Sam9029环境配置确保安装了正确版本的MindSpore和MindNLP库。!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirror
基于人工智能的智能语音助手人工智能发烧友人工智能
语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块，系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入，并将其转换为系统可以理解的命令或指令。在本项目中，我们将结合语音识别、自然语言处理和语音合成技术，构建一个功能简化的语音助手。一、项目背景与需求分析1.1项目目标本项目旨在创建一个语音助手系统，它可以：1.语音识别：从用户的语音输入中提取文本信息。2.
NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
Linux如何查看端口 lanhuazui10 linux操作系统 linux
方法一：lsof-i:端口号用于查看某一端口的占用情况，比如查看9092端口使用情况，lsof-i:9095可以看到9095端口已经被nginx占用方法二：netstat-tunlp|grep端口号，用于查看指定的端口号的进程情况，如查看5050端口的情况，netstat-tunlp|grep5050-t(tcp)仅显示tcp相关选项-u(udp)仅显示udp相关选项-n拒绝显示别名，能显示数字的
【笔记】自然语言处理NLP---概论 xhanZ NLP相关
（from人文学院开设课程）目录1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自然语言的特点1.1.2自然语言处理研究的意义1.1.3国外研究现状1.2NLP的方法、特点和规律1.2.1理性主义与经验主义1.2.2语料库语言学：经验主义研究方法1.2.3汉语语言处理的方法1.2.4基于知识图谱的深度学习1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自
【笔记与idea】——ACL2017论文报告会胖胖的飞象深度学习人工智能笔记 idea
这篇是2017年我有幸参加了中文信息学会组织的ACL2017论文报告会记的笔记，当时还是研一新生，对NLP感兴趣，偶然通过老师知晓了这次报告会，所以想去现场听听大牛们的idea、和大牛们交流（然而由于当时没有入门，啥也不懂，交流失败。。。）但是总的来说，非常感谢组织这次报告会的老师们，尽管没能和大牛们有效的交流，但是这次报告会相当于在最短的时间内读懂了数十篇精彩论文的核心内容，对我后面的学习起到了
如何利用AI技术来提升用户的个性化体验和社区参与度？ Itfuture03 AI前沿技术人工智能
要利用AI技术提升用户的个性化体验和社区参与度，可以采取以下几种策略：个性化推荐系统：通过AI算法分析用户的行为和偏好，提供定制化的服务和内容推荐，如智能推荐活动、健康管理等，让居民感受到社区的温暖和关怀。智能助手与聊天机器人：引入AI驱动的虚拟助手，提供实时帮助、个性化建议和交互式对话，改善客户体验。自然语言处理（NLP）：实现具有AI能力的NLP，创建对用户友好的应用程序，简化用户体验，如客服
【Python】成功解决IndexError: list index out of range 高斯小哥 BUG解决方案合集 python list 新手入门学习 debug
【Python】成功解决IndexError:listindexoutofrange下滑查看解决方法欢迎莅临我的个人主页这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地！博主简介：985高校的普通本硕，曾有幸发表过人工智能领域的中科院顶刊一作论文，熟练掌握PyTorch框架。技术专长：在CV、NLP及多模态等领域有丰富的项目实战经验。已累计一对一为数百位用户提供近千次专业服务，助力他们少走
使用Python和Jieba库进行中文情感分析：从文本预处理到模型训练的完整指南快撑死的鱼 Python算法精解 python 人工智能开发语言
使用Python和Jieba库进行中文情感分析：从文本预处理到模型训练的完整指南情感分析（SentimentAnalysis）是自然语言处理（NLP）领域中的一个重要分支，旨在从文本中识别出情绪、态度或意见等主观信息。在中文文本处理中，由于语言特性不同于英语，如何高效、准确地分词和提取关键词成为情感分析的关键步骤之一。在这篇文章中，我们将深入探讨如何使用Python和Jieba库进行中文情感分析，
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
第3篇：LangChain的架构总览与设计理念 Gemini技术窝 langchain 架构大数据人工智能 AIGC nlp
LangChain库是一个专为自然语言处理（NLP）设计的强大工具包，致力于简化复杂语言模型链的构建和执行。在本文中，我们将深入解析LangChain库的架构，详细列出其核心组件、设计理念及其在不同场景中的应用，并讨论其优缺点。文章目录1.LangChain库简介2.核心组件2.1数据输入模块作用2.2数据预处理模块作用2.3数据增强模块作用2.4数据加载与批处理模块作用2.5模型训练模块作用2.
读李中莹先生论“阿Q精神" 猫咪06
这阵子重读《重塑心灵》，对“阿Q精神"一段很有感慨，在我们从小的信念里，阿Q的精神胜利法是被贬低的，是对无能力改变自己的境遇时，似手只能采用自我安慰的人的讽刺。李中莹先生在他的书中结合对话者的认可，定义阿Q精神“只求精神胜利，罔顾真实情况"，他就针对这两句话，解析阿Q精神，并进行了肯定‘，。首先“精神胜利"指的是自己内心有成功的感觉，这很符合NLP!如果所有人都认为你成功，而你自己没有成功的喜悦，
书单用户5521
提高思维（13本）：影响力逻辑思维（理查德·尼斯贝特）离经叛道:不按常理出牌的人如何改变世界（只看最后一章总结即可）改变:问题形成和解决的原则语言的魔力:谈笑间转变信念之NLP技巧（意识到语言顺序的重要性）改变心理学的40项研究对伪心理学说不你的误区:如何摆脱负面思维掌控你的生活战胜拖拉你的灯亮着吗?别做正常的傻瓜学会提问:批判性思维指南不确定世界的理性选择小说（5本）：霍乱时期的爱情那些回不去的
【Python】解决AttributeError: ‘NoneType‘ object has no attribute ‘xxxx‘ 云天徽上 Pandas python 开发语言 pandas 机器学习 numpy
【Python】解决AttributeError:'NoneType'objecthasnoattribute'xxxx'报错欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是云天徽上，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其
【自然语言处理】自然语言处理NLP概述及应用 @我们的天空人工智能技术 nlp 人工智能深度学习 python 机器学习自然语言处理 scikit-learn
自然语言处理（NaturalLanguageProcessing，简称NLP）是一门集计算机科学、人工智能以及语言学于一体的交叉学科，致力于让计算机能够理解、解析、生成和处理人类的自然语言。它是人工智能领域的一个关键分支，旨在缩小人与机器之间的交流障碍，使得机器能够更有效地识别并响应人类的自然语言指令或内容。自然语言处理NLP概述基本任务：文本分类：将文本划分为预定义的类别，如情感分析、主题分类等
OPENAI中RAG实现原理以及示例代码用PYTHON来实现 dzend aigc python 开发语言 ai
OPENAI中RAG实现原理以及示例代码用PYTHON来实现1.引言在当今人工智能领域，自然语言处理（NLP）是一个非常重要的研究方向。近年来，OPENAI发布了许多创新的NLP模型，其中之一就是RAG（Retrieval-AugmentedGeneration）模型。RAG模型结合了检索和生成两种方法，可以用于生成与给定问题相关的高质量文本。本文将介绍RAG模型的实现原理，并提供使用Python
开源AI图像识别：支持扫描文件批量识别快速对接数据库存储思通数科x 人工智能计算机视觉图像处理 OCR 文本识别
随着数字化转型的不断深入，图像识别技术在各行各业中的应用越来越广泛。文件封识别作为图像识别技术的一个分支，能够有效地提高文件处理的自动化程度和准确性。本文将探讨文件封识别技术的原理、应用场景以及如何将识别后的内容批量对应数据库字段进行存储。开源项目介绍(可本地部署，支持国产化)思通数科研发了一款多模态AI能力引擎，专注于提供自然语言处理（NLP）、情感分析、实体识别、图像识别与分类、OCR识别和语
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，