hy098543

《科研领域借助 RAG 技术：文献检索与研究新飞跃》

在当今数字化信息爆炸的时代，如何快速、准确地从海量数据中获取有价值的知识，成为了众多领域面临的关键挑战。检索增强生成（Retrieval-Augmented Generation，RAG）技术应运而生，它通过巧妙地结合语言模型的生成能力与强大的检索技术，为人们开启了一扇高效获取知识的大门。特别是在医疗、法律、金融等对专业知识要求极高的领域，RAG 技术展现出了巨大的应用潜力，能够显著提升信息获取的准确性与可靠性。本文将深入探讨 RAG 技术的发展历程、核心原理、应用场景以及未来的发展趋势，带您全面了解这一引领自然语言处理新潮流的前沿技术。

一、RAG 技术简介

（一）定义

RAG，即检索增强生成，是一种先进的自然语言处理技术。它打破了传统生成模型的局限，在生成回答之前，会先深入到海量的文档或数据库之中，检索与问题相关的信息。然后，将这些精心筛选出的信息作为重要的上下文，与原始查询一同输入到强大的语言模型中，最终生成更为精准、丰富的回答。这种独特的架构设计，使得 RAG 模型能够充分利用外部数据源的丰富知识，弥补了传统生成模型在信息获取和利用上的不足。

（二）解决的问题

尽管大型语言模型（LLM）在自然语言处理任务中取得了令人瞩目的成就，但仍然存在一些亟待解决的问题。例如，幻觉问题使得 LLM 可能会生成看似合理但实际上并不准确的信息，这在对信息准确性要求极高的场景中是一个严重的缺陷；同时，由于其知识截止于训练数据，面对不断更新的现实世界，LLM 对于最新信息往往无能为力；此外，LLM 的决策过程如同一个 “黑箱”，难以解释和验证其推理的正确性，这也限制了其在一些对可解释性要求较高的领域的应用。

而 RAG 技术则为这些问题提供了有效的解决方案。通过检索最新的、权威的数据源，RAG 能够极大地增强信息的准确性，有效减少幻觉问题的出现；并且，其能够动态地从外部数据源检索信息，使得模型能够实时访问到最新的知识，克服了知识过时的难题；另外，RAG 的检索过程和生成过程都可以被清晰地监控和审查，显著提高了模型的可解释性，让用户对模型的输出更加放心。

（三）核心步骤

索引（Indexing）：在这一关键步骤中，大量的文档或数据源需要经历一次 “数字化变身”，被转换成机器能够理解的格式。具体而言，文档会被精细地分割成小块，然后借助嵌入模型将这些小块转换成向量形式，最后存储在专门的向量数据库中。这一精心构建的向量数据库就如同一个高效的知识仓库，为后续的快速检索奠定了坚实的基础。

检索（Retrieval）：当用户提出问题时，RAG 系统会迅速行动。首先，它会使用与索引阶段相同的嵌入模型，将用户的问题也转换成向量形式。接着，在已经构建好的向量数据库中，通过精确计算问题向量与文档块向量之间的相似度，寻找与问题最相关的文档块。通常情况下，系统会根据相似度的高低，检索出最具相关性的几个文档块，这些文档块将成为后续生成回答的重要信息来源。

生成（Generation）：检索到的文档块与原始问题会被巧妙地结合在一起，形成一个内容丰富的扩展上下文提示。这个提示就如同给语言模型提供了一份详细的 “参考资料”，然后输入到大型语言模型中。语言模型基于这些丰富的信息，发挥其强大的生成能力，最终产生出准确、连贯且符合用户需求的回答。通过这三个紧密相连的步骤，RAG 技术成功地将外部数据源的信息与 LLM 的生成能力有机结合，为用户提供了高质量的回答。

二、RAG 的发展历程

（一）Naive RAG 阶段

基本流程和特点：Naive RAG 代表了 RAG 技术发展的初始阶段，它遵循着经典的 “Retrieve - Read” 框架。在这个阶段，RAG 系统首先对文档进行全面的索引操作，将文档分割成小块并编码成向量后存储起来。当接收到用户的查询时，系统会迅速将查询转换为向量表示，然后在向量数据库中进行检索，找出与查询最相似的文档块。最后，这些检索到的文档块与原始问题一起被输入到大型语言模型中，由语言模型生成最终的回答。这种处理方式简单直接，易于理解和实现，但也正是这种简单性，在一定程度上限制了其性能和应用范围。

面临的挑战和限制：Naive RAG 在实际应用中面临着诸多挑战。首先，在检索准确性方面，由于其技术的局限性，往往难以精准地检索到与查询最相关的文档块，导致检索结果的质量参差不齐。其次，在召回率与准确率的平衡上，系统常常陷入两难境地。在努力召回更多相关信息的同时，往往会引入大量不相关的文档，而如果过于追求准确率，又可能会遗漏一些重要的相关信息。再者，生成的回答在质量上也存在问题，可能会缺乏连贯性，或者不能完全贴合用户查询的需求。此外，Naive RAG 严重依赖于静态知识库，无法动态更新知识库中的信息，这使得在面对快速变化的现实世界时，其提供的信息很容易过时。

（二）Advanced RAG 阶段

预检索和后检索策略：为了克服 Naive RAG 阶段存在的问题，Advanced RAG 阶段引入了预检索和后检索策略。预检索策略主要聚焦于优化索引结构和改进查询表达，通过对索引结构的精心设计和对查询表达的精准优化，使得系统在检索前就能更有效地筛选信息，提高检索的针对性。而后检索策略则着重于对检索到的文档块进行重新排序和上下文压缩。通过重新排序，可以将最相关的文档块放在更靠前的位置，方便后续处理；而上下文压缩则能够去除冗余信息，使检索到的信息更加精炼，从而提高生成回答的相关性。

优化索引技术和查询：在索引优化方面，Advanced RAG 采用了更细粒度的分段方式，将文档分割得更加细致，同时巧妙地合并元数据，通过这种方式极大地改进了索引技术，使得检索的准确性得到了显著提升。在查询优化上，Advanced RAG 运用了查询重写和查询扩展等先进技术。查询重写能够将用户较为模糊或复杂的原始问题转化为更清晰、更准确的查询表述，使其更适合检索任务；查询扩展则通过添加相关的关键词或概念，扩大了查询的范围，增加了检索到有用信息的可能性。

（三）Modular RAG 阶段

模块化特性和灵活性：Modular RAG 阶段标志着 RAG 技术迎来了一次重大的架构变革，向模块化架构转变。这种模块化设计赋予了 RAG 系统前所未有的灵活性，使得系统能够根据不同的特定任务或需求，轻松地替换或重新配置特定的模块。就如同搭积木一样，用户可以根据实际情况，选择最合适的模块进行组合，从而构建出最适合自己需求的 RAG 系统。

关键模块和它们的功能：

- Search 模块：具有极强的场景适应性，它能够利用 LLM 生成的代码和查询语言，直接在各种数据源中进行高效搜索，大大提高了搜索的效率和准确性。

- RAG - fusion：通过创新的多查询策略，成功解决了传统搜索的局限性。它利用并行向量搜索和智能重新排序技术，能够发现那些隐藏在数据中的显性和变革性的知识边缘，为用户提供更具深度和价值的信息。

- Memory 模块：巧妙地利用 LLM 的内存来指导检索过程，创建了一个无界内存池。通过不断的迭代自我提升，使得文本与数据分布能够更紧密地对齐，从而提高了检索的精准度和效率。

- Routing 模块：它就像是一个智能的导航员，能够为查询选择最佳的路径。无论是涉及摘要提取、特定的数据库搜索，还是合并不同的信息流，Routing 模块都能准确地判断并选择最适合的方式，确保查询能够得到最有效的处理。

- Predict 模块：通过直接利用 LLM 生成上下文，有效地减少了冗余和噪声信息，确保了生成内容的相关性和准确性，大大提高了模型的性能。

- Task adapter 模块：这个模块的作用是将 RAG 技术适配到各种下游任务中。它能够为 zero - shot 输入自动生成提示进行检索，同时为 few - shot 查询生成创建特定于任务的检索器，使得 RAG 系统能够更好地适应不同类型的任务需求。

三、RAG 与其它增强模型性能技术的对比

在自然语言处理领域，为了提升模型的性能和适应性，出现了多种技术，RAG、Fine - tuning 和提示词工程（Prompt Engineering）是其中具有代表性的技术，它们各自具有独特的特点和应用场景。

（一）RAG（Retrieval - Augmented Generation）

核心机制：如前文所述，RAG 通过检索外部数据源中的信息，并将这些信息作为重要的上下文与用户查询一起输入到语言模型中，以此生成更准确、丰富的回答。它就像是一个知识渊博的学者，在回答问题之前，会先查阅大量的书籍和资料，然后结合问题进行综合分析，给出最恰当的答案。

优势：RAG 最大的优势在于能够动态地利用最新的数据，这使得它在面对各种复杂查询时，都能提供具有高度相关性和准确性的回答。尤其是在需要大量外部信息支持的场景中，RAG 的表现尤为出色。例如在智能客服领域，面对用户各种各样的问题，RAG 能够迅速从知识库中检索相关信息，并生成准确、自然的回答，大大提升了用户体验。

应用场景：RAG 广泛应用于问答系统、事实核查、知识增强等领域。在问答系统中，它能够准确回答用户的问题，提供详细的解释和参考资料；在事实核查中，通过检索权威数据源，能够快速判断信息的真实性；在知识增强方面，能够为模型提供更多的知识支持，提升模型的性能。

（二）Fine - tuning

核心机制：Fine - tuning 是一种微调技术，它以预训练的语言模型为基础，通过在特定任务上进行进一步的训练，使模型能够更好地适应并执行该特定任务。就好比一个运动员，在进行了全面的基础训练后，针对特定的比赛项目进行专项训练，以提高在该项目中的表现。

优势：通过 Fine - tuning，模型能够将特定任务的知识内化，从而显著提高任务执行的效率和效果。在一些对任务特定性要求较高的场景中，如文本分类、情感分析、机器翻译等，Fine - tuning 能够使模型更好地理解任务的特点和要求，生成更符合任务需求的输出。

应用场景：在文本分类任务中，通过在特定的文本类别数据上进行 Fine - tuning，模型能够准确地对文本进行分类；在情感分析中，能够更精准地判断文本所表达的情感倾向；在机器翻译领域，能够根据特定的语言对和翻译需求进行优化，提高翻译的质量。

（三）提示词工程（Prompt Engineering）

核心机制：提示词工程通过精心设计构造的提示（Prompts）来引导语言模型生成特定的输出，而无需对模型的权重进行调整。它就像是给语言模型一个明确的指令，告诉它应该朝着哪个方向进行思考和生成。

优势：提示词工程的最大优势在于无需重新训练模型，就能通过灵活调整提示来适应新任务。这使得在面对一些快速变化的任务或数据时，能够迅速做出响应，节省了大量的时间和计算资源。例如，在一些临时的数据分析任务中，通过设计合适的提示词，能够让语言模型快速生成相关的分析结果。

应用场景：适用于需要快速适应新任务或数据的场景，如在创意写作中，通过巧妙的提示词，可以引导语言模型生成富有创意的故事、诗歌等；在信息提取任务中，能够通过提示词让模型准确地从文本中提取出所需的信息。

四、RAG 技术的应用场景

（一）智能客服系统

在智能客服领域，RAG 技术发挥着至关重要的作用。它能够从庞大的知识库中迅速检索出用户常见问题的相关信息，然后借助生成式模型，将这些信息转化为自然、流畅、准确的回答。这不仅大大提高了客服的响应速度，还显著提升了回答的质量，使用户能够得到更满意的服务体验。例如，在电商平台的客服中，面对用户关于商品信息、订单状态、售后服务等各种问题，RAG 技术能够快速准确地给出解答，有效减轻了人工客服的压力。

（二）内容创作与优化

在内容营销领域，RAG 技术展现出了巨大的价值。它能够自动生成高质量的文章、报告、市场分析等内容。通过检索相关的资料和数据，结合生成模型的能力，RAG 可以将现有信息进行有机整合，并生成富有逻辑、内容丰富的文本。这为企业节省了大量的人力和时间成本，同时生成的内容还具有较高的专业性和可读性。例如，企业在进行市场推广时，需要撰写大量的宣传文案、产品介绍等内容，RAG 技术能够快速生成初稿，然后再由人工进行适当的润色和调整，大大提高了内容创作的效率。

（三）智能化运营

在企业的运营管理中，RAG 技术也有着广泛的应用。它能够帮助运营人员从海量的数据中提取并分析有价值的信息，并生成简洁明了的分析报告。通过对业务数据、市场动态等信息的检索和分析，RAG 可以为企业提供决策支持，帮助企业更好地把握市场机会，优化运营策略。例如，在企业的销售运营中，RAG 可以分析销售数据、客户反馈等信息，为销售团队提供销售策略建议，提高销售业绩。

五、RAG 技术的未来发展趋势

（一）更高效的检索与生成算法

随着技术的不断发展，未来 RAG 技术将致力于研发更高效的检索与生成算法。在检索方面，将进一步优化索引结构和检索算法，提高检索的速度和准确性，能够在更短的时间内从海量数据中找到最相关的信息。在生成方面，将不断改进语言模型的架构和训练方法，提高生成内容的质量和多样性，使生成的回答更加自然、流畅、富有逻辑。例如，可能会出现更加智能的向量检索算法，能够更好地理解语义和上下文，提高检索的精准度；同时，语言模型也可能会采用更先进的训练技术，如强化学习等，使其生成的内容更符合用户的需求。

（二）多模态数据的融合

目前 RAG 技术主要应用于文本数据，但未来随着多媒体技术的发展，多模态数据的融合将成为一个重要的发展趋势。RAG 将不仅仅局限于从文本中检索信息，还将能够整合图像、音频、视频等多种模态的数据。例如，在回答一个关于某个产品的问题时，RAG 系统不仅能够检索相关的文本资料，还能检索到产品的图片、视频介绍等信息，并将这些信息融合起来生成更全面、生动的回答。这将极大地拓展 RAG 技术的应用场景和能力边界。

（三）与其他技术的深度融合

RAG 技术将与其他新兴技术进行更深度的融合，以进一步提升其性能和应用效果。例如，与知识图谱技术的融合，能够更好地利用知识图谱中丰富的语义关系和知识结构，提高检索和生成的准确性和可解释性；与区块链技术的结合，可以确保数据的安全性和可信度，在一些对数据安全要求较高的领域，如金融、医疗等，具有重要的应用价值。

（四）在更多领域的广泛应用

随着 RAG 技术的不断成熟和完善，它将在更多领域得到广泛的应用。除了目前已经应用的医疗、法律、金融、电商等领域，未来还将在教育、科研、政务等领域发挥重要作用。在教育领域，RAG 可以为学生提供个性化的学习辅导，帮助教师更好地进行教学；在科研领域，能够辅助科研人员进行文献检索和研究思路的启发；在政务领域，可以提高政府服务的智能化水平，为民众提供更便捷、高效的服务。

六、结论

RAG 技术作为自然语言处理领域的一项重要创新，通过将检索技术与生成模型有机结合，为人们提供了一种高效、准确获取知识的新方式。从其发展历程来看，RAG 技术不断演进，从最初简单的检索 - 生成框架，逐渐发展成为具有模块化、智能化特性的复杂系统。与其他增强模型性能的技术相比，RAG 具有独特的优势，尤其在处理需要大量外部信息支持的复杂任务时表现出色。目前，RAG 技术已经在智能客服、内容创作、智能化运营等多个领域得到了广泛应用，并取得了良好的效果。展望未来，随着技术的进一步发展，RAG 有望在算法效率、多模态数据融合、与其他技术的深度融合以及应用领域拓展等方面取得更大的突破，为推动人工智能技术的发展和各行业的数字化转型发挥更加重要的作用。我们有理由相信，RAG 技术将在未来的科技发展中书写更加辉煌的篇章，为人类的生活和工作带来更多的便利和创新。

大语言模型（LLM）课程学习（Curriculum Learning）、数据课程（data curriculum）指南：从原理到实践
在人工智能的浪潮之巅，我们总会惊叹于GPT-4、Llama3.1、Qwen2.5这些顶尖大语言模型（LLM）所展现出的惊人能力。它们似乎无所不知，能写诗、能编程、能进行复杂的逻辑推理。一个自然而然的问题是：它们是如何“学”会这一切的？大多数人会回答：“用海量数据喂出来的。”这个答案只说对了一半。如果你认为只要把互联网上能找到的所有数据（比如15万亿个token）随机打乱，然后“一锅烩”地喂给模型，
Tuning Language Models by Proxy 樱花的浪漫对抗生成网络与动作识别强化学习因果推断大模型与智能体人工智能机器学习深度学习自然语言处理计算机视觉神经网络
TuningLanguageModelsbyProxyhttps://arxiv.org/html/2401.08565v41.概述尽管大型预训练语言模型的通用能力越来越强，但它们仍然可以从额外的微调中受益，以更好地实现所需的行为。例如，它们通常被微调以遵循指令（Ouyang等人，2022年）、特定的兴趣领域（Gururangan等人，2020年）或特定任务（Raffel等人，2020年）。然而，
巨兽的阴影：大型语言模型的挑战与伦理深渊田园Coder 人工智能科普人工智能科普
当GPT-4这样的庞然大物能够流畅对话、撰写诗歌、编写代码、解析图像，甚至在某些测试中媲美人类专家时，大型语言模型（LLM）仿佛成为了无所不能的“智能神谕”。然而，在这令人目眩的成就之下，潜藏着复杂而严峻的挑战与伦理困境，如同光芒万丈的科技巨兽脚下那片难以忽视的深邃阴影。这些挑战并非技术进步的偶然副作用，而是深植于LLM的运作本质、训练数据来源以及其与社会交互的复杂性之中。它们警示我们，在追逐能力
从被动检索到主动思考：Naive RAG 到 Agentic RAG 的架构演进与关键技术解析一休哥助手人工智能架构 RAG
摘要随着大语言模型（LLMs）的广泛应用，检索增强生成（Retrieval-AugmentedGeneration,RAG）技术已成为解决模型知识滞后与幻觉问题的核心方案。本文深入剖析从基础NaiveRAG到新一代AgenticRAG的架构演进路径，聚焦关键技术创新点（如递归检索、自适应查询改写、工具集成、多智能体协作），并通过架构图对比与案例分析，揭示其在复杂任务处理中的范式转变。全文超过500
AI LLM架构与原理 - 预训练模型深度解析陈乔布斯 AI 人工智能大模型人工智能架构机器学习深度学习大模型 Python AI
一、引言在人工智能领域，大型语言模型（LLM）的发展日新月异，预训练模型作为LLM的核心技术，为模型的强大性能奠定了基础。预训练模型通过在大规模无标注数据上进行学习，能够捕捉语言的通用模式和语义信息，从而在各种自然语言处理任务中展现出卓越的能力。本文将深入探讨AILLM架构与原理中预训练模型的方法论和技术，结合图解、代码解析和实际案例，为读者呈现一个全面且易懂的预训练模型图景。二、预训练模型的基本
【AI论文】GLM-4.1V-思考：借助可扩展强化学习实现通用多模态推理东临碣石82 人工智能
摘要：我们推出GLM-4.1V-Thinking这一视觉语言模型（VLM），该模型旨在推动通用多模态推理的发展。在本报告中，我们分享了在以推理为核心的训练框架开发过程中的关键发现。我们首先通过大规模预训练开发了一个具备显著潜力的高性能视觉基础模型，可以说该模型为最终性能设定了上限。随后，借助课程采样强化学习（ReinforcementLearningwithCurriculumSampling，R
【AI论文】FineWeb2：一个管道，规模适配所有语言——使预训练数据处理适应每一种语言东临碣石82 人工智能深度学习机器学习
摘要：预训练最先进的大型语言模型（LLMs）需要大量干净且多样的文本数据。尽管近期在开放开发大型高质量英文预训练数据集方面取得了显著进展，但训练性能出色的多语言大型语言模型仍面临挑战，这很大程度上是因为难以针对大量语言定制过滤和去重流程。在本研究中，我们基于FineWeb引入了一种全新的预训练数据集整理流程，该流程可自动适配任意语言。我们通过一组涵盖九种不同语言的实验，对流程设计进行了广泛消融研究
2025主流AI大模型终极指南：横向对比+实战测评+官方注册教程 AI新视界 AI工具全指南：从入门到精通解锁高效生产力人工智能
《2025主流AI大模型终极指南：横向对比+实战测评+官方注册教程》在人工智能技术飞速发展的今天，大型语言模型(LLM)已成为推动数字化转型的核心引擎。作为CSDN资深AI技术专家，我将通过本文为您全面剖析2025年主流大模型的技术特点、应用场景和性能差异，并提供详细的官方注册和使用指南，帮助您快速掌握这些强大的AI工具。一、2025年主流大模型全景概览1.1大模型技术发展现状2024-2025年
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
模型微调方法Prefix-Tuning ballball~~ 大模型人工智能算法大数据
简介：个人学习分享，如有错误，欢迎批评指正。随着大规模预训练语言模型（如GPT系列、BERT等）的广泛应用，如何高效、经济地针对特定任务对这些模型进行微调（Fine-Tuning）成为研究热点。传统的微调方法通常需要调整模型的大量参数，导致计算资源消耗大、适应新任务的速度慢。为了解决这一问题，Prefix-Tuning（前缀调优）作为一种高效的微调技术被提出，旨在通过引入少量可训练的前缀参数，达到
star31.6k，Aider：让代码编写如虎添翼的终端神器
ider是一款运行在终端中的AI结对编程工具，它能与大型语言模型（LLM）无缝协作，直接在您的本地Git仓库中编辑代码。无论是启动新项目，还是优化现有代码库，Aider都能成为您最得力的助手。它支持Claude3.5Sonnet、DeepSeekV3、GPT-4o等顶级AI模型，几乎可以连接任何LLM，让编程体验如虎添翼。Stars数35,188Forks数3,230主要特点Git操作：Aider
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
目前最火的agent方向-A2A快速实战构建（二）： AutoGen模型集成指南：从OpenAI到本地部署的全场景LLM解决方案
引言：打破模型壁垒，构建灵活AI应用在AI应用开发中，大语言模型（LLM）的选择往往决定了系统的能力边界。AutoGen通过标准化的模型客户端协议，实现了对OpenAI、AzureOpenAI、本地模型等多源LLM的统一接入，让开发者能够根据场景需求自由切换模型服务。本文将深入解析AutoGen的模型集成框架，从云端服务到本地部署，助你构建弹性可扩展的AI代理系统。一、模型客户端核心架构：统一接口
在 Dify 平台中集成上下文工程技术由数入道人工智能数据库大数据人工智能软件工程 dify
1.提升LLM问答准确率的上下文构建与提示策略大语言模型在开放领域问答中常面临幻觉和知识过时等问题。为提高回答准确率，上下文工程的关键是在提示中注入相关背景知识与指导。具体策略包括：检索增强(RAG)：通过从知识库中检索相关内容并将其纳入提示，可以显著提升回答的准确性和可信度。Dify提供了知识检索节点，支持向量数据库存储外部知识，并将检索结果通过上下文变量注入LLM提示中。例如，在知识库问答应用
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
文心一言插件：使用插件探索无限可能前端
文心一言作为一款强大的语言模型，为我们提供了丰富的功能和应用场景。而文心一言插件的出现，进一步拓展了其功能，为用户带来了更多的便利和可能性。本文将详细介绍文心一言插件的使用方法，并通过一个具体的实例展示其在实际应用中的强大之处。一、文心一言插件的安装和启用访问文心一言官方网站，登录你的账号。在页面左侧的菜单中，点击“插件”选项。在插件页面中，你可以浏览可用的插件列表，选择你需要的插件并点击“安装”
Python+AI十分钟自动生成小说！程序员：这工具让我月入5万+ 小筱在线人工智能人工智能开发语言
引言：AI写作革命已来，你准备好了吗？2025年的今天，AI写作已经从科幻概念变成了现实生产力。一位名叫李明的程序员在社交媒体上晒出他的收入截图：单月稿费突破5万元，而他的"秘密武器"竟是用Python开发的AI小说生成工具。这不是天方夜谭，而是正在发生的技术革命。随着GPT-4、Claude3等大语言模型的成熟，结合Python强大的自动化能力，任何人都可以在十分钟内生成一部完整的小说初稿。AI
DeepSeek Chat 虾条_花吹雪 Spring AI ai
SpringAI支持DeepSeek的各种AI语言模型。您可以与DeepSeek语言模型交互，并基于DeepSeek模型创建多语言会话助手。Prerequisites您需要使用DeepSeek创建一个API密钥来访问DeepSeek语言模型。在DeepSeek注册页面创建一个帐户，并在API密钥页面上生成一个令牌。SpringAI项目定义了一个名为Spring.AI.deepseek.api-ke
Chat Memory 虾条_花吹雪 Spring AI ai 人工智能
大型语言模型（LLM）是无状态的，这意味着它们不保留有关以前交互的信息。当您想在多个交互中维护上下文或状态时，这可能是一个限制。为了解决这个问题，SpringAI提供了聊天记忆功能，允许您在与LLM的多次交互中存储和检索信息。ChatMemory抽象允许您实现各种类型的内存来支持不同的用例。消息的底层存储由ChatMemoryRepository处理，其唯一职责是存储和检索消息。由ChatMemo
Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
动手实践OpenHands系列学习笔记3：LLM集成基础 JeffWoodNo.1 笔记人工智能
笔记3：LLM集成基础一、引言大型语言模型(LLM)是OpenHands代理系统的核心驱动力。本笔记将深入探讨LLMAPI调用的基本原理，以及如何在实践中实现与Claude等先进模型的基础连接模块，为构建AI代理系统奠定基础。二、LLMAPI调用基础知识2.1LLMAPI基本概念API密钥认证:访问LLM服务的身份凭证提示工程:构造有效请求以获取预期响应推理参数:控制模型输出的各种参数流式响应:增
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
语言模型之谜：提示内容与格式的交响诗步子哥 AGI通用人工智能语言模型人工智能自然语言处理
当代人工智能领域中，语言模型（LLM）正以前所未有的规模和深度渗透到各行各业。从代码生成到数学推理，从问答系统到多项选择题，每一次技术的跃进都离不开一个看似简单却充满玄机的关键环节——提示（prompt）的设计。而在这场提示优化的探索中，内容与格式的双重奏正逐渐揭开其神秘面纱，谱写出一曲宏大的交响诗。本文将带您走进“内容格式集成提示优化（CFPO）”的奇幻世界，揭示如何透过细腻的内容雕琢和精妙的格
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
Xtuner：大模型微调快速上手潘达斯奈基~ AIGC AIGC
一、XTuner是什么？简单来说，XTuner是一个轻量级、易于使用的、为大语言模型（LLM）设计的微调工具库。它由上海人工智能实验室（OpenMMLab）开发，是其强大AI工具生态（MMCV,MMEngine等）的一部分。它的核心设计理念是“用一个配置文件搞定一切”，让开发者和研究人员可以极大地简化微调流程。二、为什么选择XTuner？（核心优势）轻量且用户友好：命令行驱动：你不需要编写复杂的训
【GitHub开源项目实战】Agent-Zero 多模态 Agent 框架的架构实现与实战落地观熵 GitHub开源项目实战 github 开源架构
开源项目实战解析：Agent-Zero多模态Agent框架的架构实现与实战落地关键词：Agent-Zero、LLMAgent、多模态融合、LangGraph、结构化对话、函数调用、RAG、真实场景实战、开源项目分析摘要：Agent-Zero是一个以LangGraph为核心构建的多模态智能体框架，专注于大语言模型（LLMs）驱动下的多模态Agent系统实现，具备高度模块化、支持结构化对话状态流转、工
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul