赫凯

论文阅读 A Survey of Large Language Models 3

文章目录

能力评估
- 基础任务
- - 语言生成
  - 知识利用率
  - 复杂推理
- 高级能力评估
- - 人类对戏
  - 与外部环境的交互作用
  - 扩展能力范围
- 公共基准测试和经验分析
- - 评价基准
  - 对LLM的能力进行全面分析
结论和未来方向

能力评估

为了检验LLM的有效性和优越性，大量的任务和基准被用来进行实证评估和分析。我们首先介绍了LLM语言生成和理解的三种基本评估任务，然后介绍了LLM具有更复杂设置或目标的几个高级任务，最后讨论了现有的基准和实证分析。

基础任务

在这一部分中，我们主要关注LLM的三种评估任务，即语言生成、知识利用和复杂推理。值得注意的是，我们不打算完全覆盖所有相关的任务，而是只关注LLMs最广泛讨论或研究的任务。接下来，我们将详细介绍这些任务。

语言生成

根据任务定义，现有的语言生成任务大致可以分为语言建模任务、条件文本生成任务和代码合成任务。请注意，代码合成不是典型的NLP任务，我们将其包括在讨论中，因为它可以由大多数llm(在代码数据上训练)以类似于自然语言文本的生成方法直接解决。

语言建模是LLM中最基本的能力。它通过预测前面的token来预测下一个token，主要关注基本语言理解和生成的能力。常用的评估数据集包括Penn Treebank、WikiText-103和Pile，通常使用困惑度来评估零-shot下的模型性能。经验证明，LLM在这些评估数据集上的表现优于现有技术的方法。为了更好地测试长程依赖在文本中的建模能力，引入了LAMBADA数据集。在该数据集上，LLMs需要根据上下文段落来预测句子的最后一个单词，并使用预测的准确性和困惑度对模型进行评估。

条件文本生成是语言生成的重要主题，它致力于基于给定条件生成满足特定任务需求的文本。常用的自动度量标准（如Accuracy、BLEU和ROUGE）和人工评分被用于评估性能。由于强大的语言生成能力，LLMs在现有数据集和基准测试上取得了显着的性能，甚至超过了人类表现。因此，有人担心现有的生成任务基准测试是否能适当地评估和反映LLMs的能力。考虑到这个问题，研究人员尝试通过收集目前无法解决的任务或创建更具挑战性的任务（如超长文本生成）来制定新的评估基准（如BIG-bench Hard）。此外，最近的研究还发现，自动度量标准可能低估了LLMs的生成质量。因此，需要更多的努力开发更符合人类判断的新指标。

除了能够生成高质量自然语言，现有的LLMs还展现了强大的生成形式语言的能力，特别是满足特定条件的计算机程序（即代码），称为代码合成。与自然语言生成不同的是，由于生成的代码可以直接通过相应的编译器或解释器进行检查，因此现有的工作主要通过计算测试用例的通过率（即pass@k）来评估LLMs生成代码的质量。最近，提出了几个专注于功能正确性的代码基准，如APPS、HumanEval和MBPP。为了提高这种能力，关键是将LLMs微调（或预训练）到代码数据上，这可以有效地使LLMs适应代码合成任务。此外，现有的工作还提出了生成代码的新策略，例如采样多个候选解和计划引导解码，这可以被认为是程序员通过模仿错误修复和代码规划过程来做到。令人印象深刻的是，LLMs最近在编程竞赛平台Codeforces上实现了与人类竞争的表现，排名在前28%。此外，GitHub Copilot已经发布，以在编码IDE（如Visual Studio和JetBrains IDEs）中协助编程，并支持包括Python、JavaScript和Java在内的各种语言。ACM通信上的一篇名为“编程的结束”的观点文章讨论了AI编程对计算机科学领域的影响，强调了一个重要的变化，即高度适应性的LLM作为新的计算原子单位。

尽管LLMs在生成类似于人类的文本方面取得了出色的表现，但它们容易受到以下两个主要语言生成问题的影响。首先，对于LLMs，生成给定条件下的文本的主流方式是通过使用自然语言指令或提示。尽管这种机制十分简单，但对于对结构施加细粒度或结构化约束的生成文本的复杂条件，该机制在达成这些模型生成的输出方面面临重大挑战。为了解决这个问题，一种潜在的解决方案是将单通通过程扩展到LLMs的迭代提示。其核心思想是将语言生成分解成多个步骤，如规划、草案、改写和编辑，以模拟人类写作过程。其次，虽然LLMs已经学习了通用的语言模式生成连贯的文本，但它们在处理专业领域或任务时可能会面临挑战。直觉上，领域知识应该对模型的专业化至关重要。但是，将这种专业化知识注入到LLMs中不容易。因此，需要开发有效的模型专业化方法，能够灵活地使LLMs适应各种任务场景，同时尽可能地保持原始能力。

知识利用率

知识利用是智能系统在支持事实证据的基础上完成知识密集型任务(如常识问答和事实补全)的重要能力。具体来说，它要求LLM在必要的时候能够适当地利用预训练语料库中丰富的事实知识或检索外部数据。其中，问答(QA)和知识补全(knowledge completion)是评价该能力的两项常用任务。根据测试任务(问答或知识完成)和评估设置(有或没有外部资源)，我们将现有的知识利用任务分为三种类型，即闭卷QA、开卷QA和知识完成。

闭卷QA 闭卷QA任务测试LLM从预训练语料库中获得的事实知识，LLM应仅根据给定的上下文回答问题，而不使用外部资源。为评估这种能力，可以利用几个数据集，包括Natural Questions、Web Questions和TriviaQA，其中精度度量被广泛采用。经验结果表明，LLM在这种情况下可以表现良好，甚至可以与最先进的开放域QA系统的性能相匹配。此外，LLM在闭卷QA任务中的表现在模型大小和数据大小上也表现出缩放定律模式:缩放参数和训练令牌可以增加LLM的容量，帮助它们从预训练数据中学习(或记忆)更多的知识。此外，在相似的参数尺度下，拥有更多与评估任务相关的预训练数据的LLMs将获得更好的性能。此外，闭卷QA设置也为探究LLM编码的事实知识的准确性提供了一个测试平台。然而，如现有工作所示，即使在预训练数据中存在细粒度知识，LLM在依赖于细粒度知识的QA任务中也可能表现不佳。

开卷QA 与闭卷式QA不同，在开卷式QA任务中，LLM可以从外部知识库或文档集中提取有用的证据，然后根据提取的证据回答问题。典型的开卷质检数据集（如Natural Questions、OpenBookQA和SQuAD）与闭卷质检数据集有重叠之处，但它们结合了外部数据源，如维基百科等。准确度和F1分数的指标被广泛用于开卷QA任务的评估。为了从外部资源中选择相关知识，LLM通常与文本检索器（甚至是搜索引擎）配对，后者是独立或与LLM共同训练的在评估方面，现有的研究主要集中在测试LLM如何利用提取的知识来回答问题，并表明检索的证据可以在很大程度上提高生成答案的准确性，甚至使一个较小的LLM胜过10倍大的LLM。此外，开卷的QA任务还可以评估知识信息的时效性。预先训练或从过时的知识资源中检索可能会导致LLM对时间敏感的问题产生错误的答案。

知识补全在知识补全任务中，LLM可能（在某种程度上）被视为一个知识库，可以利用它来完成或预测知识单元（例如，知识三要素）的缺失部分。这样的任务可以探测和评估LLM从预训练数据中学习了多少知识和哪种知识。现有的知识完成任务大致可分为知识图谱完成任务（如FB15k237和WN18RR）和事实完成任务（如WikiFact），它们分别旨在完成知识图谱中的三要素和关于特定事实的不完整句子。经验研究表明，现有的LLM很难完成特定领域的知识完成任务。如对WikiFact的评估结果所示，LLM在预训练数据中出现的几种频繁关系（如货币和作者）上表现良好，而在罕见关系（如发现者_或发明者和出生地）上则表现不佳。有趣的是，在相同的评估设置下（如incontext learning），InstructGPT（即text-davinci-002）在WikiFact的所有子集上都胜过GPT-3。这表明指令的调整有助于LLMs完成知识完成任务。

主要问题尽管LLM在获取和利用知识信息方面取得了关键性的进展，但它们存在着以下两个主要问题。

生成事实型文本时，一个具有挑战的问题是幻觉生成，即生成的信息与现有来源相冲突（内在幻觉）或不能被现有来源验证（外在幻觉），这在图7中用两个例子说明。幻觉在现有LLMs中经常发生，甚至是最优秀的LLMs，如GPT-4。 LLMS似乎“无意识地”利用任务解决中的知识，仍然缺乏准确控制内在或外部知识使用的能力。幻觉会导致LLMs生成不良输出并且大部分是性能下降，这在实际应用中可能存在潜在风险。为了缓解这个问题，已有研究开发了对齐调整策略来求解高质量数据或使用人类反馈对LLMs进行调整。还提出了一些幻觉检测任务，例如TruthfulQA用于检测模型模仿的虚假性。另一个主要障碍是LLMs遇到需要最新知识的任务时可能会遇到困难。解决这个问题的一个直接方法是定期使用新数据更新LLMs，但这是非常昂贵的，同时还可能导致灾难性遗忘问题。因此，需要开发高效的方法将新知识集成到现有LLMs中，使它们保持最新。现有研究探索如何利用外部知识源（例如搜索引擎）来补充LLMs，可以与LLMs一起进行优化或作为即插即用模块使用，例如ChatGPT就利用检索程序访问最新的信息源。通过将提取的相关信息纳入上下文，LLMs可以获得新的事实知识，并在相关任务上表现更好。然而，这种方法似乎仍处于表面级别，直接修改内在知识或将特定知识注入LLMs仍然是一个未解决的研究问题。

复杂推理

复杂推理指的是理解和利用支持性证据或逻辑来得出结论或做出决策的能力。根据推理过程中涉及的逻辑和证据类型，我们考虑将现有的评估任务分为三个主要类别，即知识推理、符号推理和数学推理。

知识推理任务依赖于逻辑关系和与事实知识相关的证据来回答给定问题。目前的研究主要使用特定数据集来评估不同类型知识的推理能力，例如，CSQA/StrategyQA用于常识知识推理，ScienceQA用于科学知识推理。任务要求LLMs根据事实知识进行逐步推理，直到找到答案。为了引出逐步推理能力，CoT提示策略被提出来增强LLM的复杂推理能力。这种方式大大提高了LLM的推理性能，并在多个复杂知识推理任务上取得了最新成果。然而，由于知识推理任务的复杂性，LLM的性能仍然落后于人类结果。其中最常见的错误是LLM可能会根据错误的事实知识生成不准确的中间步骤，导致最终的错误结果。为了解决这些问题，现有研究提出了专门的解码或集成策略以提高整个推理链的准确性。最近的实证研究表明，LLM可能难以明确推断特定任务所需的常识知识，尽管它们可以成功解决问题。此外，似乎利用自生成的知识对提高推理性能没有帮助。

符号推理任务主要集中在在正式规则设置中操作符号以实现某些特定目标上，操作和规则可能从未在LLMs的预训练中出现。现有研究通常在最后一个字母连接和抛硬币的任务上评估LLMs。这些任务要求LLMs理解符号操作的语义关系，并在复杂的情境中进行运算。LLMs还需要理解符号操作的复合过程，尤其在“跨域测试”中，因为它涉及到更复杂的符号操作。现有研究使用 scratchpad 和tutor 策略来帮助LLMs更好地操作符号操作，以生成更长且更复杂的推理过程。另一方面，一些研究利用形式化编程语言来表示符号操作和规则，需要LLMs生成代码并使用外部解释器执行推理过程。这种方法将复杂的推理过程分解为LLMs和解释器的代码合成和程序执行，从而导致简化的推理过程和更准确的结果。

主要问题尽管LLMs取得了进展，但在解决复杂推理任务方面仍存在一些限制。

不一致性。通过改进推理策略（例如CoT提示），LLMs可以通过基于支持逻辑和证据的逐步推理来解决一些复杂推理任务。尽管这样做有效，但不一致性问题经常会在分解推理过程中出现。具体而言，LLMs可能会按照无效的推理路径生成正确的答案，或者在正确推理后产生错误的答案，导致所得出的答案和推理过程之间存在不一致性。为了缓解这个问题，现有的工作提出了通过外部工具或模型指导LLMs的整个生成过程，或者重新检查推理过程和最终答案以纠正它们的方法。作为一个有前途的解决方案，最近的方法将复杂的推理任务转化为代码生成任务，其中生成的代码的严格执行确保了推理过程和结果之间的一致性。此外，已经发现，具有类似输入的任务之间也可能存在不一致性，任务描述中的小变化可能导致模型产生不同的结果。为了减轻这个问题，多个推理路径的组合可以应用于增强LLMs的解码过程。
数值计算。对于复杂的推理任务，LLMs在涉及到罕见符号的数值计算方面仍然面临困难，例如大数字的算术。解决这个问题的直接方法是在综合算术问题上调整LLMs。一系列研究遵循这种方法，并通过特殊训练和推理策略（例如scratchpad跟踪）进一步改进数值计算性能。此外，现有的工作也包括外部工具（例如计算器），特别用于处理算术操作。最近，ChatGPT提供了一个插件机制来使用外部工具。通过这种方式，LLMs需要学会如何正确地操纵工具。为此，研究人员已经通过工具（甚至LLMs本身）来调整LLMs，或者设计指南和示例以进行现场学习。虽然如此，这些LLMs仍然依赖于文本上下文来捕捉数学符号的语义意义（在预训练阶段），这本质上并不适合数值计算。

高级能力评估

除了上述基本的评估任务，LLM还表现出一些优越的能力，需要在评估时特别考虑。在这一部分，我们讨论几个有代表性的高级能力和相应的评价方法，包括人的排列、与外部环境的交互和工具操作。接下来，我们将详细讨论这些高级能力。

人类对戏

LLMs需要与人类价值和需求相符，即需要实现人类对齐，这是LLMs在现实世界应用中广泛使用的关键能力。现有研究使用多个标准来评估LLMs的人类对齐程度，如有用性、诚实和安全。对于有用性和诚实性，可以使用对抗性问答任务来测试LLMs检测文本可能虚假的能力。此外，还可以使用CrowS-Pairs和Winogender等现有基准来评估安全性。尽管以上数据集可以进行自动评估，但进行人工评估仍是一种更直接有效的测试LLMs人类对齐程度的方法。为了解决其他人类对齐问题，一些研究提出了使用具体指令和制定标注规则来指导标注过程的方法。实证研究表明，这些策略可以大大提高LLMs的人类对齐能力。例如，通过与专家交互收集数据进行对齐调整后，LLMs处理敏感或不允许的提示时的错误行为率可以大大降低。此外，高质量的预训练数据可以降低对齐的工作量。

与外部环境的交互作用

除了标准的评估任务外，LLMs还能够从外部环境接收反馈并按照指令执行操作，如生成自然语言行动计划来操纵代理。此能力在能够生成详细且高度逼真的行动计划的LLMs中也是 emergent 的，而较小的模型（如 GPT-2）则往往生成较短或毫无意义的计划。为测试这种能力，可以使用多种基于身体的AI基准进行评估，如VirtualHome、ALFRED和BEHAVIOR。现有工作要么采用基准中的常规指标（例如生成的行动计划的可执行性和正确性），要么直接进行现实世界的实验并测量成功率来评估这种能力。现有工作已经显示了LLMs在与外部环境互动和生成准确的行动计划方面的有效性。最近，已经提出了几种改进的方法来增强LLMs的交互能力，例如设计代码式提示和提供现实世界的基础。

扩展能力范围

在解决复杂问题时，LLMs可以使用外部工具。通过封装API调用可用的工具，现有工作已涉及各种外部工具，例如搜索引擎、计算器和编译器，以提高LLMs在特定任务上的性能。最近，OpenAI支持在ChatGPT中使用插件，这可以装备LLMs更广泛的能力 beyond language modeling，例如使用web浏览器插件，ChatGPT可以访问新鲜信息。为了检查工具操作能力，现有工作主要采用复杂的推理任务进行评估，例如数学问题解决或开放书籍问答，其中成功利用工具对于提高LLMs无法胜任的技能（例如数值计算）非常重要。现有工作已经发现，在工具的帮助下，LLMs变得更具处理不擅长的问题（如方程计算和使用实时信息）的能力，从而提高最终性能。

总之，LLMs的以上三种能力：符合人类价值和偏好（人类对齐）、在真实场景中表现正确（与外部环境交互）和扩展能力范围（工具操作）都对LLMs的实际表现非常有价值。此外，LLMs可能还会显示出其他与某些任务特别相关的能力（例如数据注释）或学习机制（例如自我提升），发现、衡量和评估这些新兴能力将是一个开放的方向，以更好地利用和改进LLMs。

公共基准测试和经验分析

在前面的部分中，我们已经讨论了LLMs的评估任务及其相应的设置。接下来，我们将介绍现有的LLMs评估基准和经验分析，重点是从一个总体的角度探索更全面的讨论。

评价基准

本部分介绍了用于评估LLMs的几种有代表性和广泛使用的基准测试，包括MMLU、BIG-bench和HELM。这些基准测试包括众多任务和知识领域，涵盖了语言学、数学、自然科学、社会科学等多个领域，难度不等。在这些基准测试中，LLMs的性能越大模型则表现出更强的优越性。其中，GPT-4在MMLU的5-shot设置中取得了令人瞩目的记录。BIG-bench由204个任务组成，也是一个全面综合的基准测试，包括几个领域的任务。与此同时，考虑到整个基准测试的评估成本较高，还有一种轻量级的基准测试BIG-bench-Lite，包括了24个小而有挑战性的任务。在BBH任务中，LLMs通常比人类表现更劣。还有一个名为HELM的全面基准测试，对LLMs进行了全方位和细致的评估，对提高LLMs的准确性、鲁棒性和公平性提供了指导，同时预训练对理解代码语料库的LLMs对推理任务具有显著优势。

对LLM的能力进行全面分析

上述基准测试覆盖了评估LLMs的各种主流任务。除此之外，还有一些基准测试专注于评估LLMs的特定能力，如TyDiQA用于多语言知识利用和MGSM用于多语言数学推理。为了进行评估，可以根据具体目标选择适合的基准测试。此外，还有一些开源评估框架供研究人员在现有基准测试或新的评估任务上进行评估，例如Language Model Evaluation Harness和OpenAI Evals。

除了构建大规模评估基准之外，越来越多的研究正在进行全面的分析，以研究LLMs的优点和局限性。在本部分中，我们将其主要方面进行简要讨论，即普适能力（通用容量）和专家能力（特定领域容量）。

普适能力方面，由于表现突出，现有的研究已经系统地评估了LLMs的普适能力，以探索它们在各种不同任务或应用中的能力。通常，这些研究主要关注之前尚未得到充分研究的新出现的LLMs（例如ChatGPT和GPT-4），如下所述：

掌握程度。为了评估LLMs在解决一般任务方面的掌握水平，现有的研究通常收集一组涵盖各种任务和领域的数据集，然后在少/零样本设置下测试LLMs。实证结果表明，LLMs在成为通用任务解决者方面具有卓越的能力。GPT-4在各种任务（例如语言理解，常识推理和数学推理）方面已经超越了最先进的基于特定测试集训练的方法，并且可以在为人类设计的实际考试中达到类似于人类的表现。虽然有着令人振奋的结果，但是LLMs仍然存在着严重的局限性。此外，它在需要计划（例如解决“汉诺塔”的问题）或概念跃迁（例如提出新的科学假设）的任务上表现较差。此外，几项研究还表明，LLMs可能会误解陌生的概念，在特定领域的信息提取任务上面临挑战，并且在解决涉及情感的实用任务时（例如个性化情感识别）表现不佳，比特定的精细调整模型差。
除了掌握程度，另一个需要考虑的方面是LLMs对噪声或扰动的稳健性，这对于实际应用尤为重要。为了评估LLMs对噪声或扰动的稳健性，现有的研究采用对抗攻击（例如令牌替换）对输入进行测试，然后根据输出结果的变化评估LLMs的稳健性。研究表明，在各种任务中，LLMs比小型语言模型更为稳健，但可能遇到关于稳健性的新问题，例如稳定性不稳定和提示敏感性。具体而言，LLMs往往会在使用同一输入的不同表达时提供不同的答案，甚至与其自身生成的内容相矛盾。这样的问题也会导致在使用不同提示时评估稳健性的结果不稳定，从而使稳健性分析的评估结果本身不太可靠。

专家由于LLMs已在大规模混合源语料库上进行了预训练，因此它们可以从预训练数据中获取丰富的知识。因此，最近的研究广泛探索了LLMs在解决特定领域任务和评估LLMs适应能力方面的应用。通常，这些研究收集或构建特定领域的数据集，使用上下文学习评估LLMs的性能。由于我们的重点不是覆盖所有可能的应用领域，我们简要讨论了研究社区得到广泛关注的三个代表性领域，即医疗保健、教育和法律。

医疗保健是与人类生命密切相关的重要应用领域。自ChatGPT问世以来，一系列研究已经将ChatGPT或其他LLMs应用于医学领域。已经表明，LLMs能够处理各种医疗保健任务，例如生物信息提取、医疗咨询和报告简化，甚至可以通过为专业医生量身定制的医学执照考试。然而，LLMs可能会制造医学错误信息，例如误解医学术语并建议与医学指南不一致的建议。此外，上传患者的健康信息也会引起隐私方面的担忧。
教育也是一个重要的应用领域，LLMs在其中可能产生显著影响。现有研究发现，LLMs在数学、物理、计算机科学等科目的标准化测试中，无论是多项选择还是自由回答问题，都可以达到学生水平的表现。此外，实证研究表明，LLMs可以作为教育中的写作或阅读助手。最近的一项研究表明，ChatGPT能够在跨学科问题上生成逻辑一致的答案，平衡深度和广度。另一项量化分析表明，在计算机安全领域的一些课程中，利用ChatGPT的学生表现比采用不同使用方法（例如将LLMs的结果作为自己的答案保留或精炼）的普通学生表现更好。然而，LLMs的日益普及也引起了对合理使用此类智能助手的担忧（例如作弊作业）。
法律是一个建立在专业领域知识基础上的专业领域。最近，许多研究已经应用LLMs来解决各种法律任务，例如法律文件分析、法律判决预测和法律文件撰写。最新的GPT-4模型在模拟司法考试中与人类考生相比获得了前10的分数。然而，在法律应用LLMs也引起了有关版权问题、个人信息泄露、偏见和歧视等法律挑战的担忧。

除了上述工作外，LLMs的能力也从其他方面进行了分析。例如，最近的一些工作研究了LLMs的人类样态特征，如自我意识、心智理论和情感计算。此外，另一条研究方向调查了现有LLMs评估设置的公平性和准确性，例如大规模混合源预训练数据可能包含测试集中的数据。

结论和未来方向

本综述回顾了大型语言模型(LLMs)的最新进展，介绍了理解和利用LLMs的关键概念、发现和技术。我们重点讨论了大型模型(即大小超过10B的模型)，同时排除了已经被广泛研究的早期预训练语言模型(BERT和GPT-2)的内容。特别地，我们讨论了LLMs的四个重要方面，即预训练、适应性调整、利用和评估。对于每个方面，我们都强调了对LLMs成功的关键技术或发现。此外，我们还总结了开发LLMs的可用资源，并讨论了复现LLMs的重要实施准则。这份综述试图涵盖LLMs的最新文献，并为研究人员和工程师提供一个良好的参考资源。

在本节中，我们总结了本综述的讨论，并介绍了LLMs的挑战和未来方向，包括理论和原则。要理解LLMs的基本工作机制，一个最大的谜团是信息如何通过非常大且深的神经网络分布，组织和利用。必须揭示建立LLMs能力的基本原理或元素。尤其是，缩放似乎在增加LLMs容量方面起着重要作用。当语言模型参数规模增加到临界大小(例如10B)时，会出现一些突然的性能提升，通常包括上下文学习、遵循指令和逐步推理等 emergent abilities 是迷人但也是难以理解的。最近的研究要么进行了广泛的实验证明 emergent abilities 的影响和产生这种能力的因素，要么用现有的理论框架解释特定的能力。一篇技术文章特别讨论了这个话题，以GPT系列模型为目标。然而，为了理解、表征和解释LLMs的能力或行为，更多形式化的理论和原则仍然缺失。由于 emergent abilities 与自然界的相变密切相关，跨学科的理论或原则(例如，LLMs是否可以被视为某种复杂系统)可能有助于解释和理解LLMs的行为。这些基本问题值得研究社区去探索，对于开发下一代LLMs很重要。

模型架构 由于其可扩展性和有效性，由堆叠的多头自注意力层组成的Transformer已成为构建LLMs的事实标准架构。已经提出了各种策略来改进这种架构的性能，如神经网络配置和可扩展的并行训练(详见第4.2.2节的讨论)。为了进一步增强模型的能力(例如，多回合对话能力)，现有的LLMs通常会保持较长的上下文长度，例如，GPT-4-32k的上下文长度非常大，达到了32768个标记。因此，一个实践考虑是减少标准自注意力机制产生的时间复杂度(原先是二次成本)。重要的是调查更高效Transformer变体对构建LLMs的影响，例如，稀疏自注意力已经被用于GPT-3。此外，灾难性遗忘一直是神经网络的长期挑战，也会对LLMs产生负面影响。当使用新数据微调LLMs时，原始学习的知识可能受到损害，例如，根据某些特定任务微调LLMs将影响LLMs的通用能力。当LLMs与人类价值观达成一致时也会出现这种情况(称为对齐税)。因此，有必要考虑通过更灵活的机制或模块来扩展现有的架构，以有效支持数据更新和任务特化。

模型训练 在实践中，由于计算量大、对数据质量和训练技巧敏感，预训练有效的LLMs非常困难。因此，考虑到模型的有效性、效率优化和训练稳定性等因素，开发更系统、经济的预训练方法变得尤为重要。需要开发更多的模型检查或性能诊断方法(如GPT-4中的可预测扩展)，以便在训练期间及早发现异常问题。此外，还需要更灵活的硬件支持或资源调度机制，以更好地组织和利用计算集群中的资源。由于从零开始预训练LLMs的代价非常昂贵，因此需要设计适当机制，根据公开可用的模型检查点(如LLaMA和Flan-T5)持续预训练或微调LLMs。为此，需要解决一系列技术问题，包括数据不一致、灾难性遗忘和任务特化。然而，迄今为止仍缺乏具有完整预处理和训练日志(例如准备预训练数据的脚本)的LLMs开源模型检查点，以实现复现。我们认为，拥有更多的开源模型对LLMs的研究将具有重要价值。此外，还需要开发更多的改进调整策略，并研究有效激发模型能力的机制。

模型利用 由于实际应用中微调非常昂贵，提示已成为使用LLMs的主要方法。通过将任务描述和演示示例组合成提示，上下文学习(提示的一种特殊形式)赋予LLMs在新任务上表现良好的能力，甚至在某些情况下超过了完全数据微调模型。为了提高复杂推理能力，提出了高级提示技术，例如以链式推理(Chain-of-Thought，CoT)策略为代表，将中间推理步骤包含在提示中。然而，现有的提示方法仍存在以下几个不足之处。首先，在提示设计中涉及相当大的人工努力。自动生成解决各种任务的有效提示将非常有用。其次，一些复杂任务(例如形式证明和数值计算)需要特定的知识或逻辑规则，这些规则可能不是用自然语言描述或通过例子演示最好的方法。因此，开发信息更加丰富、灵活的任务格式化方法对提示非常重要。第三，现有的提示策略主要集中在单轮表现上。开发交互式提示机制(例如通过自然语言交互)用于解决复杂任务是非常有用的，这已经被ChatGPT证明了。

安全与对齐性 尽管LLMs具有很强的能力，但它们也存在与小型语言模型类似的安全挑战。例如，LLMs会产生幻觉文本，即看起来合理但可能事实不正确的文本。更糟糕的是，恶意系统可能会有意指示LLMs生成有害、偏见或有毒的文本，导致潜在的误用风险。要详细讨论LLMs的其他安全问题(例如隐私、过度依赖、虚假信息和影响操作)，读者可以参考GPT-3 / 4技术报告。作为避免这些问题的主要方法，从人类反馈中进行强化学习(RLHF)已被广泛用于将人类纳入培训循环中以开发良好对齐的LLMs。为了提高模型安全性，在RLHF过程中包括与安全相关的提示也很重要，如GPT-4所示。然而，RLHF严重依赖于来自专业标注人员的高质量人类反馈数据，这使得它难以在实践中得到适当实施。因此，有必要改进RLHF框架以减少标注人员的工作量，并寻找一种更有效的注释方法，以保证数据质量。例如LLMs可用于协助标注工作。最近，红队测试已被采用来改善LLMs的模型安全性，它利用收集的对抗信息来完善LLMs(即避免来自红队测试的攻击)。此外，建立LLMs的学习机制与人类进行交流也是有意义的，通过聊天给出的反馈可以直接被LLMs用于自我改进。

应用和生态系统 LLMs展示了在解决各种任务方面的强大能力，因此可以在广泛的现实世界应用中使用（例如遵循特定的自然语言指令）。ChatGPT的推出是一项重大进步，可能改变了人们获取信息的方式，促进了New Bing的发布。预计在不久的将来，LLMs将在信息寻找技术（包括搜索引擎和推荐系统）中发挥重要影响。此外，随着LLMs技术的升级，智能信息助手的开发和使用也将得到高度推广。在更广泛的范围内，这一技术创新浪潮有助于建立LLM赋能应用程序的生态系统（例如ChatGPT的插件支持），这将与人类生活密切相关。最后，LLMs的兴起探索了人工智能的普适性（AGI）。现在可以开发比以往更智能的智能系统（可能带有多模式信号），但在这个发展过程中，AI的安全性应该是主要关注的问题，即让人工智能带来的是益处而不是威胁。

这份报告是在我们研究团队的一次讨论会议上计划的，旨在为我们的团队成员以易读性高的方式总结近期大语言模型的进展。第一版草稿于2023年3月13日完成，我们的团队成员尽力以相对客观、全面的方式包含了与LLMs相关的研究。然后，我们进行了多次广泛的写作和内容修订。然而，这份调查仍然远未完善：我们可能会遗漏重要的参考资料或主题，并可能存在不够严谨的表述或讨论。我们将不断更新此调查，尽可能提高质量。对我们来说，学习LLMs的调查写作也是一个学习过程。对于有建设性意见的读者，欢迎在我们的调查GitHub页面上留下评论，或直接给我们的作者发送电子邮件。我们将根据收到的评论或建议在未来的版本中进行相应的修订，并感谢在我们的调查中提出建设性建议的读者。

你可能感兴趣的:(#,论文阅读,论文阅读,语言模型,人工智能)

LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
【有啥问啥】刷爆各大榜单的Reflection 70B模型背后的错误自我纠正（Reflection-Tuning）技术解析：一种革新AI模型的方法 Chauvin912 大模型行业调研人工智能算法
刷爆各大榜单的Reflection70B模型背后的错误自我纠正（Reflection-Tuning）技术解析：一种革新AI模型的方法在快速发展的AI领域，尤其是大型语言模型（LLM）的竞争中，错误自我纠正技术（Reflection-Tuning）正逐步成为提升模型性能的关键突破。该技术通过赋予模型自我检测和纠正错误的能力，显著提高了输出的准确性和可靠性。本文将深入解析Reflection-Tunn
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
HALTT4LLM：大型语言模型的幻觉检测指标谢忻含Norma
HALTT4LLM：大型语言模型的幻觉检测指标haltt4llmThisprojectisanattempttocreateacommonmetrictotestLLM'sforprogressineliminatinghallucinationswhichisthemostseriouscurrentprobleminwidespreadadoptionofLLM'sformanyrealpur
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，