图学习小组

Talk Like a Graph: Encoding Graphs for Large Language Models

基本信息

博客贡献人

鲁智深

作者

Bahare Fatemi, Jonathan Halcrow, Bryan Perozzi

摘要

图是表示和分析现实世界应用中复杂关系的强大工具，如社交网络、推荐系统和计算金融。对图进行推理对于推断复杂系统中实体之间的关系，以及识别隐藏的模式和趋势是必不可少的。尽管在使用自然文本的自动推理方面取得了显著进展，但对使用大语言模型（LLM）的图推理仍然是一个有待研究的问题。
这项工作对将图结构数据编码为文本以供LLM使用进行了首次全面研究。证明了LLM在图推理任务上的表现在三个基本层次上有所不同： (1)图编码方法，(2)图任务本身的性质，以及(3)考虑的图结构。这些新的结果为将图编码为文本的策略提供了有价值的见解。利用这些见解，文章说明了正确选择编码器如何可以将LLM的图推理任务的性能提高4.8%到61.8%。

目前LLM的设计和实现方法存在一些局限性：
(1) 依赖于非结构化文本，导致模型有时会错过明显的逻辑含义或产生不正确的结论。
(2) LLM从本质上受到了训练时间的限制，而且很难整合关于已发生变化的世界状态的“新鲜”信息。
图结构数据是表示信息的最灵活的方式之一，可能是解决这两个挑战的一个很有前途的解决方案

图1. 使用LLM对图进行推理的框架

用于图推理的LLMs prompt

符号定义

设 $f$ 为生成式AI模型的接口函数，模型采用高维离散输入tokens ，并在同一token空间中产生输出（ $f ： W \mapsto W$ ）。在不丧失一般性的情况下，将在整个工作中将 $f$ 称为预先训练的大型语言模型（LLM），但这里的讨论适用于任何具有这种离散接口的生成式AI模型。在这项工作中，考虑编码图 $G = (V, E)$ ，其中 $V$ 是顶点（或节点）的集合，而 $E \in (V \times V)$ 是连接它们的边集。

prompt 工程

prompt工程的目标是找到正确的方法来表述一个问题 $Q$ ，这样一个LLM $f$ （或其他生成模型）将返回相应的答案 $A$ ，（ $Q \in W, A \in W$ ）。换句话说：
$A = f (Q)$
这项工作的目标是为LLM $f$ 提供图信息，以便它可以更好地推理需要访问任意结构化关系信息的问题/答案对。
$A = f (G, Q)$
有多种方法可以修改LLM $f (.)$ ，使它能更好地执行具有图数据的任务，如微调、软提示等。这项工作中，感兴趣的是 $f (.)$ 及其参数是固定的，系统只能用于黑盒设置中使用，其中LLM只使用和产生文本（即LLM $f ： W \mapsto W$ ）。随着可用的专有模型的数量和其硬件需求的增加，这种设置很有价值。
因此，引入图编码函数 $g (G)$ 和问题转述函数 $q (Q)$ ，其中 $g ： W \mapsto W$ 和 $q ： W \mapsto W$ （其中 $W$ 是用于训练LLM的token的大离散域）。
$A = f (g (G), q (Q))$
对基于图的提示系统的训练输入 $D$ 是一组 $G, Q, S$ 三元组，其中 $G$ 是一个图， $Q$ 是一个问题，而 $S ， S \in W$ ，是 $Q$ 的一个解。我们试图在训练数据集 $D$ 上，找到一个 $g (.)$ 和 $q (.)$ 使答案的模型的预期得分（ $score_f$ ）最大化。
$max_{(g,q)} E_{(G,Q,S∈D)} score_f (g(G),q(Q),S)$
由于 $W$ 是一个非常大的离散空间，所以目前的许多方法都使用启发式方法来进行优化（通过改变提示符 $Q$ ）。这项工作的新贡献是考虑了图编码函数 $g (.)$ ，问题重述函数 $q (.)$ ，以及图结构 $G$ 在上式优化中的作用。

prompt启发

绝大多数的提示启发式方法都是通过优化用于查询模型的提示文本 $Q$ 来操作。这里简要介绍本文中进一步研究的方法：

Zero-shot提示(ZERO-SHOT)：这种方法简单地为模型提供了一个任务描述，并要求它生成所需的输出，而不需要事先对任务进行任何训练。
Few-shot上下文学习(FEW-SHOT)：这种方法为模型提供了少量的任务示例，以及所需的输出。然后模型从这些例子中学习，以便对新的输入执行任务。
思维链提示(CoT)：这种方法为模型提供了一系列示例，每个示例都展示了如何逐步解决任务。然后模型学习生成其思维链来解决新的问题。
Zero-shot思维链提示(ZERO-COT)：这种方法类似于思维链提示，但不需要任何事先的训练示例。相反，模型使用一个简单的提示符来生成它自己的思维链。正如原论文所建议的那样，我们使用了“让我们一步一步地思考”。
Bag提示(COT-BAG)：提出该技术是为了提高LLM在图相关任务上的性能。它的工作原理是将“让我们先构造一个包含节点和边的图”附加到图的描述中。

本研究的目标是优化基本图任务上的图编码函数。这些基本任务是在图上进行更复杂的推理任务的基本中间步骤。对图编码函数、问题和图生成器函数进行了广泛的实验，提供了对黑盒LLM使用的图编码方法的研究。

像图一样说话：通过文本来编码图

图编码是将图结构信息转换为供语言模型使用的序列的必要步骤。本节将研究一个图编码函数 $g (.)$ 的细节，它将图数据映射到tokens，供LLM使用。在本节中的实验结果试图理解图编码和提示工程的最佳形式，以最大化图推理任务的性能。
分析中发现的一些结果：

R1：LLM在基本的图形任务上表现不佳（3.1）
R2：图编码函数对LLM的图推理有显著影响（3.1）
R3：模型容量对LLM的图推理能力有显著影响（3.4）

图2. 通过文本编码图的框架的概述。

图编码函数：本节研究了将图表示为文本的各种方法。将图编码为文本的过程可以分为两个关键查询：首先是图中节点的编码，其次是节点之间的边的编码。关于节点和边的编码，我们研究了几种技术。上图显示了所使用的图编码函数的概述。

附录图编码函数
将图编码为文本的过程可以分为两个关键查询：节点的编码，节点之间的边的编码
编码节点：关于节点的编码，我们研究了几种技术，包括：
• 整数编码（例如，节点0）
• 使用著名的英语名字（如David）
• 在电视剧《权力的游戏》和《南方公园》中使用的流行的角色名字
• 采用了美国政治家的名字
• 使用字母表字母作为表示形式
表示边：关于边的编码，我们研究了以下技术：
• 括号：将边描述为（源节点，目标节点）
• 友谊：源节点和目标节点是朋友
• 合著者：源节点和目标节点共同撰写了一篇论文
• 社交网络：源节点和目标节点相互连接
• 箭头：源节点→目标节点
• 入射：源节点连接到目标节点
结合节点编码和边缘编码，我们采用了以下的图编码函数：
•Adjacency。使用整数节点编码和圆括号边编码。
•Incident。使用整数节点编码和入射边编码
•Friendship。使用著名的英语名作为节点编码和友谊边编码
• Co-authorship。使用著名的英语名作为节点编码和合著者边编码
• SP。使用《南方公园》的角色名称作为节点编码，使用友谊作为边编码
• GOT。使用《权力的游戏》的角色名称作为节点编码，使用友谊作为边编码
• Social network。使用著名的英语名字和社交网络边编码
• Politician。使用美国政治家的名字和社交网络边编码
• Expert。使用字母表字母作为节点编码，使用箭头作为边缘编码。编码以“你是一个图形分析员”（专家提示）开始

实验1：变化的图编码函数

在本实验中，我们衡量预训练好的LLM在图任务上的性能：边的存在性、节点度、节点计数、边缘计数、连接节点和回路检查。在附录A.2中详细描述了这些任务和包含它们的图基准测试（GraphQA）。

附录图任务
GraphQA由一系列不同的基本图问题组成，包括：
• 边的存在性。确定图中是否存在一条给定的边
• 节点度。计算图中给定节点的度
• 节点数。计算图中的节点数
• 边数。计算图形中的边数
• 连接的节点。在图中查找连接到给定节点的所有节点
• 循环检查。确定图形中是否包含一个循环
• 断开连接的节点。查找图中未连接到给定节点的所有节点
这些任务都相对简单，但它们要求LLM能够推理图中的节点和边之间的关系。在坚持基本的图任务的同时，我们的目标是一组不同的任务，包括区别性（例如，循环检查）和生成性（例如，连接或断开的节点）挑战。这些任务涵盖了图分析的各个方面，从存在性检查（例如，边缘存在性）到定量评估（例如，节点计数）、路径分析（例如，循环检查）、基于recall的任务（例如，连接的节点），以及null空间探索（例如，断开连接的节点）。

表1. 使用PaLM 62B对不同图任务的不同图编码器函数的准确性进行比较。最有效的提示启发式用下划线突出显示，其性能最好的图编码器函数用粗体突出显示。总体结果表示其最佳和最差图编码器的平均值（µ）和绝对差值(δ)。

实验结果

表1显示了实验中不同的图编码和提示技术的实验结果。显示了几个有趣的结论，简要地总结为：
LLM在基本的图任务上表现不佳：LLM在实验的几乎所有基本图任务上都表现不佳。对于边缘存在性和回路检查任务，其中边缘存在任务的53.96%的情况不存在边缘，而循环检查任务的81.96%的情况存在循环。因此LLM的表现比大多数基线的要差。（这个实验中对ER图进行了实验，且ER图很可能有一个循环。）
简单的提示最适合用于简单的任务：在基本的图任务中，ZERO-COT提示的模型性能更差。这可能是因为ZERO-SHOT提示对于这些任务就足够了，而这些任务不需要多跳推理。ZERO-COT提示对于需要多跳推理的任务是有效的，比如算术问题，但对于大多数基本的图任务是不必要的。对于更复杂的任务，添加few-shot示例和思维链提示通常可以提高模型的性能。这主要是因为few-shot示例使LLM能够更好地理解它正在解决的任务。思维链提示还可以通过帮助LLM找出如何找到问题的答案来提高性能。
图编码函数对LLM推理有重要影响：结果表明，图编码函数的选择对LLM在图相关任务上的性能有显著影响。这是因为不同的编码器函数捕获了图结构的不同方面。例如，在图中寻找与节点相连的节点，Adjacency达到19.8%的准确率，Incident准确率达到53.8%。对于节点度和连接节点，Incident编码的性能都优于其他编码器函数。这可能是因为Incident编码器以一种使相关信息更容易访问的方式编码图结构，即，非常接近LLM。
整数节点编码提高了算术性能：节点（如节点0）的整数编码可以提高LLM在整数输出任务上的性能，如预测节点度、节点计数和边计数。这是因为LLM的输入和输出在同一个空间中，这使得模型更容易学习两者之间的关系。然而，有趣的是，具有特定名称的（如David）的编码器函数在非整数输出任务中工作得更好，例如用于边缘存在的GOT或用于循环检查的Friendship。
总结：选择正确的图编码函数对LLM在基本图算法的性能有显著影响。因此，为特定的任务选择一个仔细和适当的函数是很重要的。这一发现特别重要，因为有许多推理任务包含图问题。例如，在社交网络中寻找有影响力的节点类似于在图中寻找节点的度。以正确的方式编码这样的图可以改进任务。

实验2：不同的提示问题

本实验使用Friendship作为图编码函数，并使用两种不同的问题编码器函数进行实验：图问题编码器和应用问题编码器。
图问题编码器负责编码与图相关的任务，例如确定一个特定节点的度（例如，“节点i的度是多少？”）。
应用程序问题编码器在一个更实际的，日常的上下文中解释图问题。在应用场景中，使用一个基于Friendship的场景，将任务转换为：边缘存在成为“评估友谊存在”，节点度成为“计算朋友的数量”，节点数成为“计算提到的人数”，边缘数成为“计算友谊的数量”，连接节点成为“朋友列表”。

表2. 比较PaLM 2 XXS和PaLM 62B的准确性。针对各自的LLM的性能最好的问题编码器以粗体突出显示。

结果：表2总结了对问题编码器函数的实验结果。结果显示，应用编码器在几乎所有任务上都优于图编码，尽管这两个编码器都具有相同的图编码功能，并且在提出问题的方式上仅略有不同。例如，在使用PALM 2 XXS的ZERO-SHOT边缘存在任务上，图编码的准确率为42.8%，而应用编码器的准确率为60.8%。
总结：在处理基本的图算法时，问题编码器函数的选择会影响LLM的性能。因此，在使用LLM进行推理时，将给定的任务转换为更有上下文意义的文本信息变得很重要。

实验3：多重关系编码

在此实验设置中，对Friendship图编码函数进行了修改，基于一系列不同的关系类型，包括朋友、同事、配偶、兄弟姐妹、邻居、熟人、队友、同学、同事或室友。关系类型的选择是从这个预定义的集合中随机化的，使用多个词来指代节点之间关系的存在。

表3. PaLM 2 XXS边缘编码的多关系结果。

结果：如表3所示，使用多个单词来表示关系并没有影响LLM的性能，甚至在某些情况下提高了性能。这种改进可能是因为不同的关系集为LLM提供了更多的文本信息来执行任务，并且与之前的设置相比，最终的编码更接近于LLM在训练过程中可能看到的文本。

实验4：模型计算能力和图推理能力

此实验测量了模型容量对图任务的影响。比较了PaLM 2 XXS、XS、S和L的结果，它们具有不同的参数数量，因此具有不同的容量。我们报告了大多数基线以供参考。

图3: 模型容量对PaLM 2-XXS、XS、S、L的图推理任务的影响。

结果：模型容量对LLM的图推理能力有显著影响。实验结果显示了较大的模型在图推理任务中通常更好。这是因为它有更多的能力来学习和存储复杂的信息。模型容量对边缘存在性的影响较小。结果还表明，即使容量较大，该模型也不能超过边缘存在的多数基线。

实验5：在没有边的情况下进行推理

此实验评估了LLM在断开节点任务上的性能。这个任务与之前的不同之处在于，它需要对图中隐含的信息进行推理，即在图编码函数的输出中没有明确提到的信息。
结果：LLM缺乏对图的全局建模。ZERO-SHOT提示方法的准确率为0.5%，而ZERO-COT、FEW-SHOT、COT和COT-BAG方法的准确率接近0.0%。这些结果表明，LLM在断开节点任务上的表现明显比在连接节点任务上更差。我们认为，这是因为图编码函数主要编码关于已连接节点的信息，而不是显式地编码关于未连接节点的信息。因此，LLM在处理连接节点之间的关系方面比在捕获没有连接的情况方面更好，这导致在与断开相关的任务中性能次优。

4.图的结构对LLM很重要吗？

本节试图衡量LLM对具有不同结构的图的推理能力。

图4: 使用不同的图生成器生成的图的样本。

随机图生成

为了能够在图上实验LLM，使用各种图生成器算法生成随机图。

涵盖了广泛的属性：不同的图生成器产生具有不同属性的图。例如：ER图较稀疏，Barab´asi-Albert图较稠密。
避免在图问题评估中的偏差：根据图的性质，图问题的难度可能会有所不同，因此使用一组不同的图来避免偏差。
提供现实的基准：真实世界的图显示了广泛的属性，没有一个图生成器能够完美地捕获所有这些属性。通过使用一组不同的生成器，我们创建了一个更能代表真实世界图的基准测试。

实验使用Erd˝os-R´enyi (ER)图、scale-free网络（SFN）、Barab´asi–Albert (BA)模型和stochastic block模型(SBM)，以及星型图、路径图和完整图生成器。使用NetworkX来生成随机图。

随机图生成器的结果

之前的实验使用ER模型生成的随机图研究LLM在基本图任务上的性能。但ER图往往不能准确地表示真实世界的图的特征。本实验研究不同的随机图生成器对LLM的图推理任务性能的影响。为了使实验更加真实，我们从使用不同算法生成的图中随机抽取几个例子。表4中报告了这个实验的结果。

表4: 在PaLM 62B上比较不同图任务上的不同图生成器。最有效的提示启发式用下划线突出显示，而针对各自启发式的最有效图生成器算法用粗体突出显示。

图的结构对LLM的性能有重要的影响：结果表明，用于生成图的算法对LLM对图任务的性能有显著影响。例如，循环检查任务在完整图上的准确率达到91.7%，在路径图上的准确率达到5.9%。这是因为LLM对具有循环的图有很强的优先性。因此，对于总是有循环的完整图的精度很高，而对于从来没有循环的路径图的精度很低。通过添加一些有循环和一些没有循环的例子，在路径图上的循环检查的精度从5.9%提高到19.7%。
图编码函数中的干扰语句会破坏LLM的性能：星形图和路径图的节点度、节点数和连接节点任务的精度最高。这可能是因为星形图和路径图更有可能有更少的边，而它们的图编码很可能更短，对这些任务的干扰更少。这也可以从这些任务的准确性在完整的图中得到明显看出，这些完整的图有许多边需要指定，因此有许多干扰。
总结：大语言模型在图任务上的性能受到图结构和图编码函数中的干扰语句的显著影响。具有较少边和较少复杂编码的图往往在大多数任务上表现得更好。

总结

[亮点]

研究在大语言模型中使用图结构提示技术
研究将图编码为可在大语言模型中使用的文本
提出了一个新的图测试基准（GraphQA）来帮助社区进一步研究图结构对大语言模型的影响

BibTex

@article{fatemi2023talk,
  title={Talk like a graph: Encoding graphs for large language models},
  author={Fatemi, Bahare and Halcrow, Jonathan and Perozzi, Bryan},
  journal={arXiv preprint arXiv:2310.04560},
  year={2023}
}

知识图谱与大语言模型：构建智能问答系统 AGI大模型与大数据研究院大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
1.背景介绍在当今的信息时代，数据的获取和处理已经成为了我们生活中不可或缺的一部分。然而，随着数据量的爆炸性增长，如何从海量的数据中提取有用的信息，进而为用户提供精准的服务，已经成为了一个重要的研究课题。在这个背景下，知识图谱和大语言模型应运而生，它们通过对数据的深度挖掘和智能处理，为构建智能问答系统提供了可能。2.核心概念与联系2.1知识图谱知识图谱是一种新型的数据结构，它以图的形式表示实体之间
Deepseek技术浅析（一）爱研究的小牛 AIGC—概述大模型 AIGC 人工智能深度学习自然语言处理
DeepSeek是北京深度求索人工智能基础技术研究有限公司推出的人工智能技术品牌，专注于大语言模型（LLM）的研发与应用。其技术涵盖了从模型架构、训练方法到应用部署的多个层面，展现出强大的创新能力和应用潜力。以下将详细介绍DeepSeek的核心技术、工作原理以及具体实现方式。一、核心技术1.大语言模型（LLM）DeepSeek的核心产品是自研的大语言模型，其主要特点包括：(1)基于Transfor
AI学习指南Ollama篇-Ollama的多模态应用探索俞兆鹏 AI学习指南 ai
AI学习指南应用篇-Ollama的多模态应用探索一、引言（一）背景介绍随着大语言模型（LLM）的发展，多模态应用（结合文本、图像、语音等）成为新的趋势。多模态模型能够处理多种类型的数据，如文本、图像和语音，从而提供更丰富、更智能的交互体验。Ollama作为本地部署工具，支持多模态模型的运行，为开发者提供了强大的功能。（二）文章目标本文将探讨Ollama在多模态应用中的可能性，并通过实际案例展示如何
大语言模型原理与工程实践：残差连接与层归一化 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着自然语言处理（NLP）的发展，深度学习在过去几年中取得了令人瞩目的成果。其中，循环神经网络（RNN）和卷积神经网络（CNN）在图像和文本分类、语义角色标注、机器翻译等领域表现出色。然而，这些网络在训练过程中经常遭遇梯度消失和梯度爆炸的问题。为了解决这些问题，我们引入了残差连接（ResidualConnections）和层归一化（BatchNormalization）来改善模型性能。
用自然语言与mysql数据库对话几种方案的思考闲云野鹤_SG 数据库 mysql AI text2sql 自然语言本地部署大模型
如何用自然语言与mysql数据库对话,而不是用sql语句去查询数据库?处于安全考虑,可训练一个本地大语言模型来完成此项任务,mysql服务器中的数据大约有两万多条记录,服务器的作用主要是记录设备的出库和回库的流水账(即以时间为序的记录),但有一些sql查询比较复杂,必须根据特定的sql语句查询,否则很难得到准确稳定的答案,调试和训练大模型的方法有多种方式,比如lora训练模型,提示词方式,rag方
大型语言模型构建指南：从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF AGI大模型学习语言模型 pdf 人工智能大模型大模型学习大模型教程大模型书籍
通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。在这本富有洞察力的书中，畅销书作家塞巴斯蒂安·拉施卡（SebastianRaschka）将指导你逐步创建自己的LLM，用清晰的文字、图表和示例解释每个阶段。你将从最初的设计和创建到通用语料库的预训练，一直到特定任
书籍推荐：《从零构建大型语言模型》附免费PDF下载大模型入门学习语言模型 pdf 人工智能产品经理大模型学习大模型教程大模型入门
通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。在这本富有洞察力的书中，畅销书作家塞巴斯蒂安·拉施卡（SebastianRaschka）将指导你逐步创建自己的LLM，用清晰的文字、图表和示例解释每个阶段。你将从最初的设计和创建到通用语料库的预训练，一直到特定任
LLM based Single Agent System AGI大模型与大数据研究院大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM-BasedSingleAgentSystem:ANewEraofIntelligentAutomation关键词：大语言模型，单智能体系统，强化学习，自然语言处理，智能自动化1.背景介绍近年来，随着深度学习技术的快速发展，大语言模型(LLM)在自然语言处理(NLP)领域取得了突破性进展。LLM凭借其强大的语言理解和生成能力，正在改变着人们与信息交互的方式。同时，人工智能领域的另一个重要研究
【AI论文】Omni-RGPT：通过标记令牌统一图像和视频的区域级理解东临碣石82 人工智能
摘要：我们提出了Omni-RGPT，这是一个多模态大型语言模型，旨在促进图像和视频的区域级理解。为了在时空维度上实现一致的区域表示，我们引入了TokenMark，这是一组在视觉特征空间中突出目标区域的标记。这些标记通过使用区域提示符（例如，边框或掩码）直接嵌入到空间区域中，并同时融入到文本提示符中以指定目标，从而在视觉标记和文本标记之间建立了直接联系。为了进一步支持无需轨迹的稳健视频理解，我们引入
DeepSeek 模型：架构创新与实际应用详解汪子熙人工智能架构语言模型人工智能
DeepSeek模型是近年来在自然语言处理（NLP）领域备受瞩目的开源大规模语言模型系列。其最新版本DeepSeek-V3采用了混合专家（Mixture-of-Experts，MoE）架构，拥有6710亿个参数，每个词元（token）激活370亿个参数。该模型在多项基准测试中表现出色，性能媲美GPT-4和Claude等领先的闭源模型。以下将详细介绍DeepSeek模型的架构、用途，并通过具体案例和
Mooncake：面向大语言模型服务的以 KVCache 为中心的架构步子哥 AGI通用人工智能语言模型架构人工智能
摘要Mooncake是Kimi的服务平台，Kimi是由MoonshotAI提供的领先的LLM服务。它采用以KVCache为中心的分解架构，将预填充和解码集群分离。它还利用GPU集群未充分利用的CPU、DRAM和SSD资源来实现KVCache的分解缓存。Mooncake的核心是其以KVCache为中心的调度器，它在满足延迟相关的服务水平目标(SLO)的同时，平衡了最大化整体有效吞吐量。与假设所有请求
Deepseek爆火背后的多Token技术预测明哲AI AIGC 人工智能大模型 RAG 多token预测 deepseek
近年来，大语言模型（LLMs）的发展如火如荼，它们在聊天机器人、文档生成、代码编写等领域大放异彩。然而，随着模型规模的增加，生成效率也成为了一大瓶颈。传统的自回归语言模型需要逐字生成（token-by-token），这种方式不仅耗时，还限制了模型在实时场景中的表现。那么，有没有一种方法可以加快生成速度，同时保持文本质量？答案是：多Token预测（Multi-TokenPrediction,MTP）
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-LangGraph-链式处理（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型 langchain
一、前言在当今人工智能快速发展的时代，大语言模型不断迭代升级，为各种复杂任务的处理提供了强大的支持。LangGraph作为一种创新的架构，其链式处理机制为充分发挥LLMs的潜力提供了新的途径。Qwen2.5模型是一款备受瞩目的大语言模型，它具备出色的语言理解和生成能力，在广泛的自然语言处理任务中都展现出了卓越的性能。其在语言的准确性、逻辑性以及对复杂语义的把握上都有着突出的表现，为基于它进行的各类
DeepSeek简介 RobinDevNotes 人工智能
一、DeepSeek是什么？DeepSeek是由中国顶尖AI团队深度求索（DeepSeekInc.）自主研发的通用大语言模型体系，其研发始于2023年，致力于突破认知智能的边界。作为国内首个全面对标GPT-4技术架构的AI大模型，DeepSeek系列涵盖从7B到超千亿参数的完整模型矩阵，在数学推理、代码生成、多轮对话等核心能力上达到国际领先水平。目前已衍生出DeepSeek-R1、DeepSeek
9.1 LangChain深度解析：大模型应用开发的“万能胶水”与核心架构设计少林码僧 AI大模型应用实战专栏 langchain gpt 人工智能 chatgpt
LangChain深度解析：大模型应用开发的“万能胶水”与核心架构设计关键词：LangChain教程、大模型应用开发、AI开发框架、LangChain核心模块、智能体开发一、LangChain是什么？重新定义大模型应用开发范式LangChain是一个专为大语言模型（LLM）应用开发设计的开源框架，由HarrisonChase于2022年创建。它被开发者社区称为“AI应用开发的乐高积木”——通过标准
为什么提到各种本地化部署模型软件时总要提到 llama.cpp? 风雅GW 人工智能 llama 人工智能机器学习 LLM ai
为什么提到各种本地化部署模型软件时总要提到llama.cpp?llama.cpp是一个完整的开源项目，而不是单独的.cpp文件。尽管名字里有“cpp”，它实际上指的是基于C++开发的一整套工具，用于高效地在本地运行大语言模型（LLM）。1.核心角色：为本地化LLM部署提供高效底层支持llama.cpp是许多本地化LLM部署工具的基础，它不仅是一个单独的工具链，更是一个通用的解决方案，其核心角色体现
Llama.cpp与Python的完美结合：快速入门指南 nseejrukjhad llama python 开发语言
Llama.cpp与Python的完美结合：快速入门指南引言在现代AI的浪潮中，Llama.cpp提供了一种便捷的方法，将大型语言模型(LLM)集成到您的项目中。本文将介绍如何在Python中使用llama-cpp-python，并结合LangChain框架进行推理操作。通过本指南，您将逐步掌握如何安装、配置和使用Llama模型。主要内容Llama模型转换首先，新版本llama-cpp-pytho
[如何在LangChain中实现安全集成：最佳实践与应对策略] dsndnwfk langchain 安全数据库 python
如何在LangChain中实现安全集成：最佳实践与应对策略在现代应用开发过程中，安全集成是一个非常重要的环节。LangChain作为一个拥有广泛生态系统的库，支持与各种外部资源进行集成，如本地和远程文件系统、API和数据库。这些集成使开发人员能够创建结合LLM（大语言模型）强大功能和外部资源交互的多样化应用。然而，安全问题不容忽视。本文将深入探讨在LangChain应用中实现安全集成的最佳实践，并
万字精研：大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南汀、人工智能 LLM工业级落地实践 LLM技术汇总语言模型人工智能自然语言处理 P-tuning LoRA prompt tuning adapter
万字精研：大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南LLM训练时间和的成本太过庞大，况且个人卷训练经验极为困难，不妨从微调开始搞起。本文对正经的微调方法进行了总结，继续打怪，继续升级～提示：本文对当前常见的微调技术都进行了罗列，由于结合了论文和网络资料导致文章很长，可以先看总结部分先对概念有些印象，如果需要用到对应的微调技术再进行原理探究。1.Fine-
LLM（大语言模型）——Springboot集成文心一言、讯飞星火、通义千问、智谱清言 1telescope 大模型语言模型文心一言自然语言处理 java spring boot
目录引言代码完整地址入参出参ControllerServiceService实现类模型Service入参转换类文心一言实现类讯飞星火实现类通义千问实现类智谱清言实现类引言本文将介绍如何使用Java语言，结合SpringBoot框架，集成国内热门大模型API，包括文心一言、讯飞星火、通义千问、智谱清言。在开始前，请确保您已经按照各模型官网的指引，完成了相应的资源申请和配置。这些资源是调用大模型API
RAG：AI大模型联合向量数据库和 Llama-index，助力检索增强生成技术 AI学习不迷路人工智能数据库 llama 语言模型 RAG 大模型 AI大模型
RAG：AI大模型联合向量数据库和Llama-index，助力检索增强生成技术在大模型爆发的时代，快速准确地从大量数据中检索出有价值的信息变得至关重要。检索增强生成（RAG）技术，结合了传统的信息检索和最新的大语言模型（LLM），不仅能够回答复杂的查询，还能在此基础上生成信息丰富的内容。RAG技术的核心在于其能够将大型语言模型的生成能力与特定数据源的检索相结合。这意味着，当模型面对用户提出的问题时
Qwen-VL论文解读 dream_home8407 人工智能
Qwen-VL：用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中，我们介绍了Qwen-VL系列，这是一组大规模的视觉-语言模型（LVLMs），旨在感知和理解文本和图像。从Qwen-LM开始，我们通过精心设计的（i）视觉受体，（ii）输入-输出接口，（iii）3阶段训练管道，以及（iv）多语言多模态清洗语料库，赋予其视觉能力。除了传统的图像描述和问答，我们还通过图像-标题-框元组的对齐实现
三种国产大语言模型Python免费调用小软件大世界 python 人工智能
基础三大模型，需要先去官方注册获得key；后续可以使用下列代码调用1.腾讯安装：pip install -i https://mirrors.tencent.com/pypi/simple/ --upgrade tencentcloud-sdk-python实例：importjsonimporttypesfromtencentcloud.commonimportcredentialfromtenc
LangGraph系列-1：用LangGraph构建简单聊天机器人梦想画家机器学习 LangGraph LangChain
在快速发展的人工智能和大型语言模型（llm）世界中，开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。虽然LangChain已经改变了这个领域的游戏规则，允许创建复杂的链和代理，但对代理运行时的更复杂控制的需求也在不断增长。LangGraph是建立在LangChain之上的重要模块，它将彻底改变我们设计和实施人工智能工作流的方式。在这篇博客中，我们提供了一个关于构建聊天机器人和彻底改
ChatGPT：OpenAI SDK 是什么？ XRT_knives #知识图谱 chatgpt openai
ChatGPT：OpenAISDK是什么？OpenAISDK是OpenAI提供的软件开发工具包（SoftwareDevelopmentKit），用于简化与OpenAIAPI的交互。SDK提供了高层次的接口，使得开发者可以更容易地在应用程序中集成OpenAI的语言模型和其他功能。具体来说，OpenAISDK主要有以下几个作用：简化API调用：SDK封装了底层的API调用细节，提供了更简洁、易用的接口
我们为什么要用大语言模型来迭代数据安全能力？大模型. 语言模型人工智能自然语言处理架构深度学习大数据大模型
在当今科技飞速发展的时代，大语言模型无疑是最炙手可热的话题之一。从OpenAI的GPT系列到谷歌的BERT，这些拥有海量参数的模型宛如智能巨人，正重塑着自然语言处理（NLP）的格局。你或许好奇，大语言模型究竟为何如此备受瞩目？这得从自然语言处理领域的核心任务——文本分类说起。文本分类，就像是给五花八门的文本信息贴上合适的“标签”，无论是判断一封邮件是正常邮件还是垃圾邮件，分析社交媒体上的评论是积极
Ollama 可以设置的环境变量刘贤松工具服务器运维
在Ollama的世界里，环境变量如同神秘的符文，它们是控制和定制这个强大工具的关键。通过精心设置这些环境变量，我们可以让Ollama更好地适应我们的需求，就像调整一把精密的乐器，使其奏出最和谐的旋律。以下是一些可以设置的环境变量，它们将帮助我们驾驭Ollama，让它成为我们探索数据海洋的得力助手。Llama3.1是Meta（Facebook的母公司）发布的一系列最先进的开源大语言模型。Llama3
轻松实现 vLLM Chat：用 LangChain 替代 OpenAI API ahdfwcevnhrtds langchain python
引言在现代应用中，使用语言模型进行自动化对话生成已经成为一个重要趋势。vLLM作为开源的语言模型实现，可以部署成一个模拟OpenAIAPI协议的服务器，方便成为应用中的替代方案。本篇文章将介绍如何使用LangChain的langchain-openai包来轻松实现vLLMChat。主要内容vLLM概述vLLM可以作为一个服务部署，模拟OpenAIAPI协议，从而成为OpenAIAPI的替代方案。通
LLM架构与优化：从理论到实践的关键技术 XianxinMao 人工智能
标题：“LLM架构与优化：从理论到实践的关键技术”文章信息摘要：文章探讨了大型语言模型（LLM）开发与应用中的关键技术，包括Transformer架构、注意力机制、采样技术、Tokenization等基础理论，以及模型部署、应用开发、优化等实践技能。重点分析了预训练、后训练、监督微调（SFT）和偏好对齐（PreferenceAlignment）在提升模型性能中的作用，并对比了直接偏好优化（DPO）
大语言模型LLM在地理信息GIS中应用场景 GISer_Jinger 人工智能 GIS模型与应用语言模型人工智能自然语言处理 arcgis
AI&地理AI大语言模型在地理中的应用主要体现在以下几个方面：一、地理信息检索与查询AI大语言模型能够理解复杂的自然语言查询，包括地名、地理位置、地理特征等，从而提供更加精准的地理信息检索服务。例如，用户可以通过自然语言输入查询某个地点的详细信息，模型能够返回包括地理位置、周边设施、交通状况等在内的全面信息。AI与地理信息检索与查询的结合为地理信息的获取和利用带来了革命性的变化。以下是对AI在地理
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

Talk Like a Graph: Encoding Graphs for Large Language Models