Trouble..

SimCSE Simple Contrastive Learning of Sentence Embeddings论文解读

SimCSE: Simple Contrastive Learning of Sentence Embeddings

paper：[2104.08821] SimCSE: Simple Contrastive Learning of Sentence Embeddings (arxiv.org)

code：princeton-nlp/SimCSE: EMNLP’2021: SimCSE: Simple Contrastive Learning of Sentence Embeddings https://arxiv.org/abs/2104.08821 (github.com)

期刊/会议：EMNLP2021

摘要

本文介绍了SimCSE，一个简单的对比学习框架，极大地推进了最先进的句子嵌入。我们首先描述了一种无监督方法，该方法采用一个输入句子，并在一个对比目标中预测自己，仅使用标准dropout作为噪声。这个简单的方法出乎意料地有效，表现与之前有监督的方法相当。我们发现，dropout作为最小的数据增强，删除它会导致模型表示崩溃。然后，我们提出了一种监督方法，通过使用“蕴涵(entailment)”对作为正样本，“矛盾(contradiction)”对作为硬负样本，将来自自然语言推断数据集的标注对合并到我们的对比学习框架中。我们在标准语义文本相似性(STS)任务上评估SimCSE，使用 $BERT_{base}$ 的无监督和有监督模型分别实现了平均76.3%和81.6%的斯皮尔曼相关性(Spearman’s correlation)，与之前的最佳结果相比提高了4.2%和2.2%。我们还从理论上和经验上表明，对比学习目标将预训练的嵌入的各向异性空间(anisotropic space)正则化，使其更加均匀，并且当有监督信号可用时，它更好地对齐正样本对。

1、简介

学习通用句子嵌入是自然语言处理中的一个基本问题，其得到了广泛的研究。在这项研究中，我们提出了一个最先进的句子嵌入方法，证明对比目标与预训练语言模型(如BERT或RoBERTa)相结合时可以非常有效。我们提出了SimCSE，一个简单的对比句子嵌入框架，它可以从未标记或标记的数据中产生更好的句子嵌入。

我们的无监督的SimCSE只是预测输入句子本身，只使用dropout 作为噪声(图1(a))。换句话说，我们将相同的句子传递给预训练的编码器两次:通过两次应用标准dropout，我们可以获得两个不同的嵌入作为“正对”。然后我们将同一小批量中的其他句子作为“否定”，模型将在否定中预测积极的句子。虽然它看起来非常简单，但这种方法在预测下一个句子和离散数据增强(例如，单词删除和替换)等训练目标方面表现出色，甚至与以前的监督方法相匹配。通过仔细分析，我们发现dropout作为隐藏表示的最小“数据增强”，而删除它会导致表示崩溃。

我们监督的SimCSE建立在最近成功地使用自然语言推理(NLI)数据集进行句子嵌入的基础上，并在对比学习中纳入了注释句对(图1(b))。与之前的工作不同，我们将其视为3种分类任务(蕴涵、中性和矛盾)，我们利用了这样一个事实，即蕴涵对可以自然地用作积极实例。我们还发现，添加相应的矛盾对作为硬否定进一步提高性能。与之前使用相同数据集的方法相比，这种简单的NLI数据集的使用实现了实质性的改进。我们也对比了其他标签句子对数据集，发现NLI数据集对于学习句子嵌入特别有效。

为了更好地理解SimCSE的强大性能，我们借用了Wang和Isola的分析工具，该工具采用语义相关的正对之间的对齐和整个表示空间的均匀性来衡量学习嵌入的质量。通过实证分析，我们发现我们的无监督SimCSE本质上提高了均匀性，同时避免了通过dropout噪声退化对齐，从而提高了表示的表现力。同样的分析表明，NLI训练信号可以进一步改善正对之间的对齐，并产生更好的句子嵌入。我们还将其与最近的研究结果联系起来，即预训练词嵌入受到各向异性(anisotropy)的影响，并通过频谱视角(spectrum perspective)证明了对比学习目标“扁平化”了句子嵌入空间的奇异值分布，从而提高了均匀性。

我们在七个标准语义文本相似性(STS)任务和七个转化(transfer)任务上对SimCSE进行了综合评估。在STS任务中，我们的无监督和有监督模型使用 $BERT_{base}$ 分别实现了76.3%和81.6%的平均斯皮尔曼相关性，与之前的最佳结果相比提高了4.2%和2.2%。我们在转化(transfer)任务上也取得了有竞争力的表现。最后，我们在文献中发现了一个不连贯的评价问题，并巩固了不同设置的结果，以供将来评价句子嵌入的工作。

2、背景

对比学习的目的是通过将语义上接近的邻居拉到一起并将非邻居分开来学习有效的表示。它假设有一组配对的例子 $D=\{ (x_i,x_i^+) \}_{i=1}^m$ ，其中 $x_i$ 和 $x_i^+$ 在语义上是相关的。我们遵循Chen等人的对比框架，并采用批内负采样的交叉熵目标函数:设 $h_i$ 和 $h_i^+$ 表示 $x_i$ 和 $x_i^+$ 的表示， $x_i,x_i^+)$ 的训练目标为:
$l_i=-log \frac{e^{sim(h_i,h_i^+)/T}}{\sum_{j=1}^N e^{sim(h_i,h_j^+)/T}}$
其中， $T$ 代表的是温度超参数， $sim(h_1,h_2)$ 是余弦相似度 $\frac{h_1^T \ h_2}{\parallel h_1 \parallel \cdot \parallel h_2 \parallel}$ 。在这项工作中，我们使用预训练语言模型(如BERT或RoBERTa: $h = f_θ(x)$ )对输入句子进行编码，然后使用对比学习目标(公式 1)对所有参数进行微调。

正例：对比学习中一个关键的问题在于怎么去构建 $x_i,x_i^+)$ 对。在视觉表示中，有效的解决方案是对同一图像进行两次随机变换(例如裁剪、翻转、扭曲和旋转)作为 $x_i$ 和 $x_i^+$ 。最近在语言表示中也采用了类似的方法，通过应用增强技术，如单词删除、重新排序和替换。然而，由于NLP的离散性，数据扩充在本质上是困难的。正如我们将在§3中看到的，简单地在中间表示上使用标准dropout比这些离散运算方式要好。

在NLP中，类似的对比学习目标已经在不同的背景下进行了探索。在这些情况下， $x_i,x_i^+)$ 是从有监督的数据集中收集的，例如问答对。由于 $x_i$ 和 $x_i^+$ 的性质不同，这些方法总是使用双编码器框架，即对 $x_i$ 和 $x_i^+$ 使用两个独立的编码器 $f_{θ_1}$ 和 $f_{θ_2}$ 。对于句子嵌入，Logeswaran和Lee也使用双编码器方法进行对比学习，将当前句和下句形成为 $x_i,x_i^+)$ 。

对齐和均匀性(Alignment and uniformity)。最近，Wang和Isola确定了与对比学习相关的两个关键属性-对齐和均匀性-并建议使用它们来衡量表征的质量。给定正对 $p_{pos}$ 的分布，对齐计算成对实例嵌入之间的期望距离(假设表示已经标准化):
$\ell_{\text {align }} \triangleq \underset{\left(x, x^{+}\right) \sim p_{\text {pos }}}{\mathbb{E}}\left\|f(x)-f\left(x^{+}\right)\right\|^{2}$
另一方面，均匀性衡量嵌入均匀分布的程度:
$\ell_{\text {align }} \triangleq \underset{ \left(x, y\right) \sim p_{\text {data }}}{\mathbb{E}} e^{-2 \left\|f(x)-f\left(y\right)\right\|^{2}}$
其中 $p_{data}$ 表示数据分布。这两个指标与对比学习的目标很好地一致：正例应该保持接近，随机实例的嵌入应该分散在超球面上。在下面的小节中，我们还将使用这两个度量来证明我们的方法的内部工作原理。

3、无监督SimCSE

无监督SimCSE的思想非常简单:我们取一组句子 ${ x_i \}_{i=1}^m$ ，并使用 $x_i^+ = x_i$ 。要使这一方法适用于相同的正例对，关键因素是对 $x_i$ 和 $x_i^+$ 使用独立采样的dropout masks。在tranformer的标准训练中，在全连接层上放置了dropout mask以及attention概率(默认p = 0.1)。我们表示 $h_i^z = f_θ(x_i, z)$ ，其中 $z$ 是dropout的随机掩码。我们只需将相同的输入输入到编码器两次，获得两种不同的dropout masks的嵌入 $z, z^{'}$ ，训练SimCSE的目标函数将变成：
$l_i=-log \frac{e^{sim(h_i^{z_i},h_i^{z_i'})/T}}{ \sum_{j=1}^N e^{sim(h_i^{z_i},h_j^{z_j'})/T}}$
$N$ 是一个mini-batch中存在的句子数量。 $z$ 是Transformer中的标准dropout mask，我们没有使用其他的dropout。

Dropout噪声作为数据增强策略。我们将其视为数据增强的一种最小形式：正对采用完全相同的语句，它们的嵌入仅在dropout mask中有所不同。我们将这种方法与STS-B开发集上的其他训练目标进行比较。表1将我们的方法与常见的数据增强技术(如裁剪、单词删除和替换)进行了比较，可以将其视为 $h=f_{\theta}(g(x),z)$ ， $g$ 是 $x$ 上的随机离散算子。我们注意到，即使删除一个单词也会影响性能，而且没有一种离散增强的效果超过dropout噪声。

我们还将这种自我预测训练目标与Logeswaran和Lee中使用的下一句作为目标进行比较(NSP)，采用一个编码器或两个独立编码器。如表2所示，我们发现SimCSE的性能比下句目标要好得多(在STSB上是82.5 vs 67.4)，使用一个编码器而不是两个编码器在我们的方法中有显著差异。

为什么它能起作用：为了进一步理解dropout noise在无监督SimCSE中的作用，我们在表3中尝试了不同的dropout比率，并观察到所有变量的性能都低于transformer的默认dropout概率p = 0.1。我们发现了两个特别有趣的极端情况:“无dropout”(p = 0)和“fixed 0.1”(使用默认dropout p = 0.1，但对其使用相同的dropout掩码)。在这两种情况下，结果的嵌入是完全相同的，这将导致显著的性能下降。在训练过程中，我们每10步对这些模型进行一次检查点，并在图2中可视化对齐和一致性度量，以及一个简单的数据增强模型“删除一个单词”。如图所示，从预训练的检查点开始，所有模型都大大提高了一致性。然而，这两个特殊变体的对齐也急剧下降，而我们的无监督SimCSE由于使用了dropout噪声而保持了稳定的对齐。它还证明了从预先训练好的检查点开始是至关重要的，因为它提供了良好的初始对齐。最后，“删除一个词”改善了对齐，但在均匀度指标上获得了较小的增益，最终性能低于无监督SimCSE。

4、监督SimCSE

我们已经证明，添加dropout噪声能够保持正例 $x, x^+) ~ p_{pos}$ 的良好对齐。在本节中，我们研究是否可以利用监督数据集来提供更好的训练信号，以改善我们的方法的对齐。之前的工作Conneau , Reimers和Gurevych等人已经证明了监督自然语言推理(NLI)数据集通过预测两个句子之间的关系是蕴涵、中性还是矛盾(entailment, neutral, contradiction)，可以有效地学习句子嵌入。

标签数据的选择。我们首先探索哪些监督数据集特别适合构建正对 $x_i, x_i^+)$ 。我们用大量带有句子对示例的数据集进行了实验，包括1)QQP4: Quora问题对;2) Flickr30k:每张图像都有5个人工编写的标题，我们认为同一图像的任意两个标题为正对;3) ParaNMT:大规模反译释义数据集;最后4)NLI数据集:SNLI和MNLI。

我们使用不同的数据集按照公式1进行训练对比学习模型，并在表4中对比各种数据集的结果。为了进行公平的比较，我们还使用相同数量的训练组进行实验。在所有选项中，使用来自NLI (SNLI + MNLI)数据集的蕴涵对性能最好。我们认为这是合理的，因为NLI数据集由高质量和众包对组成。此外，人工标注人员应该根据前提手动编写假设，使两个句子的词汇重叠较少。例如，我们发现隐含对(SNLI + MNLI)的词汇重叠(F1在两词袋之间测量)为39%，而QQP和ParaNMT的词汇重叠分别为60%和55%。

矛盾是绝对的负样本。最后，我们进一步利用NLI数据集的优势，将其矛盾对作为绝对的负样本。在NLI数据集中，给定一个前提，标注者需要手动编写一个绝对为真(蕴涵)的句子，一个可能为真(中性)的句子，以及一个绝对为假(矛盾)的句子。因此，对于每个前提及其蕴涵假设，都有一个伴随的矛盾假设(参见图1的例子)。

形式上，我们将 $x_i, x_i^+)$ 扩展到 $x_i, x_i^+, x_i^-)$ ，其中 $x_i$ 是前提， $x_i^+$ 和 $x_i^-$ 是蕴涵假设和矛盾假设。训练目标函数 $l_i$ 定义为( $N$ 为mini-batch size):
$\frac{e^{sim(h_i,h_i^+)/T}}{\sum_{j=1}^N (e^{sim(h_i,h_j^+)/T}+e^{sim(h_i,h_j^+)/T})}$
如表4所示，添加绝对负样本可以进一步提高性能(84.9→86.2)，这是我们最终的监督SimCSE。我们还尝试添加ANLI数据集或将其与我们的无监督SimCSE方法相结合，但没有发现有意义的改进。我们还考虑了有监督的SimCSE中的双编码器框架，它会影响性能(86.2→84.2)。

5、与各向异性的连接(Connection to Anisotropy)

最近的工作确定了语言表示中的各向异性问题，即学习嵌入在向量空间中占据一个狭窄的锥，这严重限制了它们的表达能力。Gao等人证明了使用绑定输入/输出嵌入训练的语言模型会导致各向异性的词嵌入，Ethayarajh在预训练的上下文表示中进一步观察到了这一点。Wang等人表明，语言模型中词嵌入矩阵的奇异值急剧衰减:除了少数占主导地位的奇异值外，其他所有奇异值都接近于零。

缓解这一问题的一个简单方法是后处理，要么消除主导的主成分(dominant principal components)，或将嵌入映射到各向同性分布(anisotropic distribution)。另一个常见的解决方案是在训练期间添加正则化。在这项工作中，我们从理论上和经验上表明，对比目标也可以缓解各向异性问题。

各向异性问题自然与均匀性有关，两者都强调嵌入应该在空间中均匀分布。直观地说，优化对比学习目标可以改善均匀性(或缓解各向异性问题)，因为目标会将负实例分开。在这里，我们采用单光谱视角——这是一种常见的做法在分析词嵌入中，结果表明，对比目标可以“压扁(flatten)”句子嵌入的奇异值分布，使表示更加各向同性。

根据Wang和Isola的研究，当负实例数接近无穷大时(假设 $f (x)$ 是归一化的)，对比学习目标(Eq. 1)的渐近性可以用下式表示:
$-\frac{1}{\tau} \underset{\left(x, x^{+}\right) \sim p_{\mathrm{pos}}}{\mathbb{E}}\left[f(x)^{\top} f\left(x^{+}\right)\right] +\underset{x \sim p_{\text {data }}}{\mathbb{E}}\left[\log \underset{x^{-} \sim p_{\text {data }}}{\mathbb{E}}\left[e^{f(x)^{\top} f\left(x^{-}\right) / \tau}\right]\right]$
第一项保持正实例相似，第二项将负实例分开。当 $p_{data}$ 在有限样本 ${ x_i \}_{i=1}^m$ 上是一致的，且 $h_i = f(x_i)$ 时，我们可以用Jensen不等式从第二项推导出如下公式:
$\begin{aligned} & \underset{x \sim p_{\text {data }}}{\mathbb{E}}\left[\log \underset{x^{-}}{\mathbb{\sim} p_{\text {data }}} \mathbb{E}\left[e^{\left.f(x)^{\top} f\left(x^{-}\right) / \tau\right]}\right]\right. \\ = & \frac{1}{m} \sum_{i=1}^{m} \log \left(\frac{1}{m} \sum_{j=1}^{m} e^{\mathbf{h}_{i}^{\top} \mathbf{h}_{j} / \tau}\right) \\ \geq & \frac{1}{\tau m^{2}} \sum_{i=1}^{m} \sum_{j=1}^{m} \mathbf{h}_{i}^{\top} \mathbf{h}_{j} . \end{aligned}$
设 $W$ 为 ${x_i\}_{i=1}^m$ 对应的句子嵌入矩阵，即 $W$ 的第 $i$ 行为 $h_i$ 。优化Eq. 6中的第二项本质上是最小化 $WW^T$ 中所有元素总和的上界，即 $Sum(WW^T)=\sum_{i=1}^m \sum_{j=1}^m h_i^Th_j$ 。

由于我们将 $h_i$ 归一化，所以 $WW^T$ 对角线上的所有元素都是1，那么 $tr(WW^T)$ (所有特征值的和)是一个常数。根据Merikoski，如果 $WW^T$ 中的所有元素都是正的，根据图G.1大多数时候都是这样，那么 $Sum(WW^T)$ 是 $WW^T$ 最大特征值的上界。在最小化Eq. 6中的第二项时，我们减少了 $WW^T$ 的顶部特征值，并固有地“平坦”了嵌入空间的奇异值。因此，对比学习有望缓解表征退化问题，提高句子嵌入的均匀性。

与Li等人的后处理方法相比，Su等人仅旨在鼓励各向同性表示，对比学习还优化了通过Eq. 6中的第一项对齐正对，这是SimCSE成功的关键。§7给出了定量分析。

6、实验

6.1 评估设置

我们对7个语义文本相似性(STS)任务进行了实验。请注意，我们所有的STS实验都是完全无监督的，并且没有使用STS训练集。即使是有监督的SimCSE，我们也只是指在之前的工作之后，我们采用外部的标签数据集进行训练。我们还评估了7个迁移学习任务，并在附录E中提供了详细的结果。我们与Reimers和Gurevych有相似的观点，句子嵌入的主要目标是聚类语义相似的句子，因此将STS作为主要结果。

语义文本相似任务：我们评估了7个STS任务:STS 2012 - 2016 ，STS Benchmark和SICKRelatedness。当与以前的工作进行比较时，我们在评估设置中识别了已发表论文中的无效比较模式，包括(a)是否使用额外的回归量，(b) Spearman与Pearson的相关性，以及©结果如何聚合(表B.1)。我们在附录B中讨论了详细的差异，并选择在我们的评估中遵循Reimers和Gurevych的设置(没有额外的回归因子，Spearman的相关性和“全部”聚合)。我们还在表B.2和表B.3中报告了我们对以前工作的重复研究以及我们在不同环境下评估的结果。我们呼吁统一句子嵌入评价的设置，以供未来研究参考。

训练设置：我们从BERT (uncase)或RoBERTa(case)的预训练检查点开始，并将[CLS]表示作为句子嵌入9(参见§6.3不同池化方法的比较)。我们在106个随机抽取的英语维基百科句子上训练无监督SimCSE，并在MNLI和SNLI数据集(314k)的组合上训练有监督SimCSE。更多的训练细节可以在附录A中找到。

6.2 主要的结果

我们将无监督和有监督的SimCSE与以前最先进的STS任务中的句子嵌入方法进行了比较。无监督基线包括平均GloVe嵌入，平均BERT或RoBERTa嵌入，以及BERT-flow和bert-whitening等后处理方法。我们还比较了使用对比目标的几种最近的方法，包括1)IS-BERT ，它最大限度地提高了全局和局部特征之间的一致性;2) DeCLUTR ，将同一文档的不同跨度作为正对;3) CT，将来自两个不同编码器的同一句子的嵌入对齐。其他的方式包括InferSent，Universal Sentence Encoder, SBERT/SRoBERTa。我们提供详细的设置在附件C中。

表5显示了7个STS任务的评估结果。SimCSE在有或没有额外的NLI监督的情况下都可以显著改善所有数据集上的结果，大大超过了以前最先进的模型。具体来说，我们的无监督simsse - bertbase将之前的最佳平均斯皮尔曼相关性从72.05%提高到76.25%，甚至可以与有监督基线相媲美。当使用NLI数据集时， $SimCSE-BERT_{base}$ 进一步将最先进的结果推向81.57%。在RoBERTa编码器上的增益更加明显，我们的监督SimCSE在 $RoBERTa_{large}$ 上达到83.76%。

在附录E中，我们展示了与现有工作相比，SimCSE也实现了同等或更好的传输任务性能，并且辅助MLM目标可以进一步提高性能。

6.3 消融实验

我们调查了不同的池化方法和硬负样本的影响。本节中报告的所有结果都基于STS-B开发集。我们在附录D中提供了更多的消融研究(归一化、温度和MLM目标)。

池化方式：Reimers和Gurevych、Li等人表明，采用预训练模型的平均嵌入(特别是来自第一层和最后一层)会导致比[CLS]更好的性能。表6显示了无监督和有监督SimCSE中不同池化方法的比较。对于[CLS]表示，原始的BERT实现在其之上附加了一个MLP层。在这里，我们考虑了[CLS]的三种不同设置:1)保持MLP层;2)无MLP层;3)训练时保留MLP，测试时移除。我们发现，对于无监督的SimCSE，只在训练期间使用MLP的[CLS]表示效果最好;对于受监督的SimCSE，不同的池化方法关系不大。默认情况下，我们将[CLS]与MLP (train)用于无监督的SimCSE，将[CLS]与MLP用于有监督的SimCSE。

硬负样本：直观地说，将硬负样本(矛盾的例子)与其他批次负样本区分开来可能是有益的。因此，我们扩展了Eq. 5中定义的训练目标，以纳入不同负面的权重:
$\frac{e^{sim(h_i,h_i^+)/T}}{\sum_{j=1}^N (e^{sim(h_i,h_j^+)/T}+\alpha^{1_i^j} e^{sim(h_i,h_j^+)/T})}$
$1_i^j \in \{ 0,1\}$ 是当且仅当 $i = j$ 时等于1的指标。我们用不同的α值训练SimCSE，并在STS-B的开发集上评估训练的模型。我们也考虑将中性假设作为硬否定。如表7所示，α = 1表现最好，中性假设不能带来进一步的收益。

7、分析

在本节中，我们将进行进一步的分析，以理解SimCSE的内部工作原理。

一致性和对齐。图3显示了不同句子嵌入模型及其平均STS结果的均匀性和对齐性。一般来说，同时具有更好的对齐性和均匀性的模型可以获得更好的性能，这证实了Wang和Isola的发现。我们还观察到(1)虽然预训练的嵌入具有良好的对齐性，但它们的均匀性很差(即嵌入具有高度的各向异性);(2) BERT-flow、BERT-whitening等后处理方法在改善均匀性的同时，也会导致一致性的退化;(3)无监督SimCSE在保持良好对齐的同时，有效地提高了预训练嵌入的均匀性;(4)在SimCSE中纳入监督数据进一步修正对齐。在附录F中，我们进一步展示了SimCSE可以有效地平坦预训练嵌入的奇异值分布。在附录G中，我们演示了SimCSE在不同的句子对之间提供了更多可区分的余弦相似度。

定性比较。我们使用 $SBERT_{base}$ 和 $SimCSE-BERT_{base}$ 进行了小规模检索实验。我们使用Flickr30k数据集中的150k字幕，以任意一个随机句子作为查询，检索相似句子(基于余弦相似度)。如表8所示的几个例子所示，与SBERT检索的句子相比，SimCSE检索的句子质量更高。

8、相关工作

句子嵌入的早期工作建立在分布假设的基础上，通过预测给定句子的周围句子，表明简单地用n-gram嵌入来增强word2vec 的思想会带来强大的结果。最近(和并发)的几种方法采用了对比目标通过对同一句话或文件采取不同的观点——从数据增强或模型的不同副本。与这些工作相比，SimCSE使用了最简单的思想，从标准dropout中获取同一句话的不同输出，并在STS任务中执行得最好。

有监督的句子嵌入被承诺比无监督的句子嵌入有更强的性能。Conneau等人提出对NLI数据集上的Siamese模型进行微调，该模型进一步扩展到其他编码器或预训练模型。此外，Wieting和Gimpel ;Wieting等人证明双语和反译语料库为学习语义相似性提供了有用的监督。另一个工作重点是正则化嵌入来缓解表征退化问题(如§5所述)，并产生了比预训练语言模型的实质性改进。

9、总结

在这项工作中，我们提出了SimCSE，一个简单的对比学习框架，它极大地提高了语义文本相似任务中最先进的句子嵌入。我们提出了一种无监督方法来预测输入句子本身的dropout噪声和一种监督方法利用NLI数据集。通过分析SimCSE与其他基线模型的一致性和一致性，我们进一步证明了我们的方法的内部工作。我们相信，我们的对比目标，特别是无监督的目标，可能在自然语言处理中有更广泛的应用。它为文本输入的数据增强提供了一个新的视角，可以扩展到其他连续表示，并集成到语言模型预训练中。

相关阅读

对比学习（Contrastive Learning）:研究进展精要 - 知乎 (zhihu.com) 强烈推荐小白看一下

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后