啾啾啾666

文献翻译与阅读《ChatRule: Mining Logical Rules with Large Language Models for Knowledge Graph Reasoning》

知识图谱与大模型如何结合？

一、预备知识

1 prompt 提示词

2 AI指令的实用意义

3 AI指令编写的方法，编写AI提示词（Prompt）的一般步骤

4 AI提示词（Prompt）的学习重点与意义：

4 Prompt的应用场景

5 Prompt也存在一些挑战和限制

6 大语言模型的预训练：思维链(Chain-of-thought，CoT)原理详解

6.1 背景

6.2 定义

6.3 思维链用于上下文学习的方法(In-context learning)

6.3.1 Few-shot CoT

6.3.2 Zero-shot CoT

6.4 结论

6.5 未来对思维链的思考

6.6 关键知识点总结

二、大模型可解释性的必要性《LARGE LANGUAGE MODELS AS OPTIMIZERS》

三、翻译与阅读论文：《ChatRule: Mining Logical Rules with Large Language Models for Knowledge Graph Reasoning》

1 摘要

1 摘要提纲

2 引用

2 引用提纲

3 相关工作

3.1 逻辑规则挖掘

3 相关工作提纲

3.1 逻辑规则挖掘

3.2 大语言模型

4 准备工作和问题界定

5 方法

5.1 基于LLM的规则生成器

5.1.1 规则采样器

5.1.2 基于LLM的规则生成

5.1.3 基于LLM的规则摘要

5.2 逻辑规则排序

5.2.1 支持度

5.2.2 覆盖率

5.2.3 置信度

5.2.4 PCA置信度

5.3 用于规则验证的Cot推理

5.4 基于规则的逻辑推理

6 实验

6.1 数据集

6.2 基线

6.3 度量

6.4 实验设置

6.5 知识图谱补全

6.6 规则质量评价

6.7 消融研究

6.7.1 各成分分析

6.7.2排名措施分析

6.7.3 COT验证分析

6.8 案例研究

6.9 局限性

7 Conclusion

8 引用LLM网址

知识图谱与大模型如何结合？

《ChatRule: Mining Logical Rules with Large Language Models for Knowledge Graph Reasoning》：《ChatRule:基于大模型进行知识推理规则挖掘方法》

论文原文pdf下载地址：https://arxiv.org/pdf/2309.01538.pdf

一、预备知识

1 prompt 提示词

prompt是人工智能提示词，是一种利用自然语言来指导或激发人工智能模型完成特定任务的方法（是一种自然语言处理技术，可以通过提示和激励的方式来帮助人工智能模型更好地理解和响应用户的输入）。是近年来在自然语言处理（NLP）领域兴起的一种新范式，也被称为“预训练-提示-预测”（pretrain-promot-predict）

作用：给AI模型提示输入信息的上下文和输入模型的参数信息。训练有监督学习模型或无监督学习模型时，prompt可以帮助模型更好的理解输入意图，并作出相应的响应；此外，prompt还可以提高模型的可解释性和可访问性。

AI提示词的出现，是受到了OpenAI公司开发的GPT-3模型的启发。GPT-3是一个基于Transformer架构的大规模预训练语言模型，拥有1750亿个参数，使用45TB的数据进行训练。具有惊人的泛化能力，可以在零样本或少样本的情况下，通过给定自然语言的提示信息和任务示例，执行任何NLP任务，不需要对模型进行任何微调。

2 AI指令的实用意义

① 帮助预训练模型快速定位关键信息。

② 节约人力成本和时间成本。

③ 可解释性更强。

④ 降低模型因决策不合理而引起的overfitting的风险。

3 AI指令编写的方法，编写AI提示词（Prompt）的一般步骤

① 明确任务描述：在提交Prompt时，应该尽可能清晰明确地描述任务的具体信息，包括任务目标、所需操作、相关条件等。例如，在与AI聊天机器人交互时，可以通过简单的问题来引导机器理解用户需求。如：“你需要我帮你做什么？” “你需要查询什么信息？” 能够尽量明确任务描述，让机器能够更好地理解用户需求并给出相应建议。

② 使用常用词汇：在提交Prompt时，应使用常见的词汇和语言表达方式，避免使用生僻单词和复杂的句式，以便机器更容易理解。

③ 考虑语境和上下文：在提交Prompt时，应该考虑到所处的语境和上下文环境，以便机器能够从语言环境中获取更多的信息来理解用户的意图。

④ 编写Prompt：根据任务描述，选择合适的词汇和语言表达方式，编写AI提示词（Prompt）。AI提示词（Prompt）应该简洁明了，易于理解，并且与任务描述相关。

一个简单的AI提示词（Prompt）的示例：

当用户输入“查询信息”时，AI提示词（Prompt）应该提示用户输入所需的信息类型，如“查询公司介绍”、“查询产品信息”等。

4 AI提示词（Prompt）的学习重点与意义：

① 提高效率：AI提示词（Prompt）可以帮助人工智能模型更快速地理解用户意图，提高回答问题和执行任务的效率。

② 降低错误率：AI提示词（Prompt）是一种有监督的学习方法，可以通过回答用户问题来不断改进和优化模型的表现，从而降低错误率。

③ 提高可解释性：AI提示词（Prompt）可以让模型更好地理解输入的意图，从而提高模型的可解释性和可访问性。

④ 节约人力成本和时间成本：使用AI提示词（Prompt）可以避免人工编写Prompt的繁琐过程，节约人力成本和时间成本。

⑤ 增强模型的泛化能力：使用AI提示词（Prompt）可以让模型更好地适应不同的输入，增强模型的泛化能力。

4 Prompt的应用场景

非常丰富。

在聊天机器人领域，Prompt可以用来生成更加人性化、智能的对话；

在搜索引擎领域，Prompt可以用来优化搜索结果的质量；

在智能客服领域，Prompt可以用来提高客服的响应速度和解决率。

甚至在艺术领域，Prompt也可以用来生成艺术作品，比如诗歌、绘画等。

5 Prompt也存在一些挑战和限制

Prompt的设计需要考虑到任务的特定要求和语境，需要具备较高的技术水平和专业知识。

此外，Prompt还需要考虑到隐私和安全等问题，确保AI在使用过程中不会泄露用户的个人信息和敏感数据。

总的来说，Prompt是人工智能领域的一个重要趋势，它可以让AI更加高效、准确、智能化地完成任务，使用AI提示词（Prompt）可以让模型更好地适应不同的输入，提高模型的泛化能力，更好地服务于人类用户，为人类的生活带来更多的便利和创新。随着Prompt技术的不断发展，我们相信它将成为人工智能未来的重要驱动力之一。

6 大语言模型的预训练：思维链(Chain-of-thought，CoT)原理详解

以下内容摘抄自：https://baijiahao.baidu.com/s?id=1771926480948343579&wfr=spider&for=pc

6.1 背景

在 2017-2019 年之间，随着 Transformer 模型的提出，计算资源与大规模语料库不断出现，自然语言处理领域发生了翻天覆地的变化，传统的全监督学习的范式逐渐达到了瓶颈，很难在传统的训练方式上取得大幅度提升。这时大规模预训练模型的如 Bert、RoBERTa 等模型的出现使得研究方向转向了以预训练模型为基础 + 下游任务 Fine-tune 的范式。

然而随着语言模型规模的不断增大，Fine-tune 的成本变得越来越高，以 GPT-3 为例，其参数量已经达到了惊人的 175B，对于这样大规模的参数，仅依靠传统 Fine-Tune 已经很难对模型起到有效的迁移，且如此大规模的参数量使得梯度的反向传播的代价也急剧增加。在这样的背景下，提示学习应运而生。提示学习通过改造下游任务、增加专家知识等形式，使得目标任务的输入输出更加贴合原始语言模型训练时的数据。

2021 年，提示学习经历了以离散提示学习（提示词的组合）为开始，连续化提示学习（连续空间表示）为复兴的多个阶段，逐步达到高潮。但基于连续空间的提示学习同样存在较多的局限性，比如资源消耗与训练不稳定等多种问题。这一时期，虽然大多数研究者普遍认同提示学习将会带来自然语言处理领域下一代革命，但这一时期大多数研究工作主要还是与模型训练或新的语言模型结构相关。

直到 2022 年，大规模语言模型的效果 “肉眼可见” 的变好，同时随着模型规模的不断增大，模型也变得更好“提示”，尤其是之前一些没有办法做很好的任务不断取得突破。但是大模型在做算术推理、常识推理和符号推理时的表现还不够好。大模型的 in-context few shot 能力是极强的，但是创建很多的中间步骤用来做监督 finetune 是非常耗时的，而且传统的 prompt 方式在数学计算、常识推理等做的又不好，怎么结合 in-context few shot 和中间步骤来改善算术推理、常识推理和符号推理等能力是一个问题。思维链的一系列工作就是在这样的大环境下诞生的。

6.2 定义

思维链 (Chain-of-thought，CoT) 的概念是在 Google 的论文 "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" 中被首次提出。思维链（CoT）是一种改进的提示策略，用于提高 LLM 在复杂推理任务中的性能，如算术推理、常识推理和符号推理。CoT 没有像 ICL 那样简单地用输入输出对构建提示，而是结合了中间推理步骤，这些步骤可以将最终输出引入提示。简单来说，思维链是一种离散式提示学习，更具体地，大模型下的上下文学习（即不进行训练，将例子添加到当前样本输入的前面，让模型一次输入这些文本进行输出完成任务），相比于之前传统的上下文学习（即通过x1,y1,x2,y2,....xtest作为输入来让大模型补全输出ytest），思维链多了中间的中间的推导提示，以下图为例：

可以看到，类似的算术题，思维链提示会在给出答案之前，还会自动给出推理步骤：

“罗杰先有 5 个球，2 罐 3 个网球等于 6 个，5 + 6 = 11” “食堂原来有 23 个苹果，用 20 个做午餐，23-20=3；又买了 6 个苹果，3+6=9”

思维链提示给出了正确答案，而直接给出答案的传统提示学习，结果是错的，连很基本的数学计算都做不好。简单来说，语言模型很难将所有的语义直接转化为一个方程，因为这是一个更加复杂的思考过程，但可以通过中间步骤，来更好地推理问题的每个部分。

一个有效的思维链应该具有以下特点：

逻辑性：思维链中的每个思考步骤都应该是有逻辑关系的，它们应该相互连接，从而形成一个完整的思考过程。
全面性：思维链应该尽可能地全面和细致地考虑问题，以确保不会忽略任何可能的因素和影响。
可行性：思维链中的每个思考步骤都应该是可行的，也就是说，它们应该可以被实际操作和实施。
可验证性：思维链中的每个思考步骤都应该是可以验证的，也就是说，它们应该可以通过实际的数据和事实来验证其正确性和有效性。

6.3 思维链用于上下文学习的方法(In-context learning)

6.3.1 Few-shot CoT

是ICL 的一种特殊情况，它通过融合 CoT 推理步骤，将每个演示〈input，output〉扩充为〈input，CoT，output〉。

【CoT prompt 的设计】作为一种直接的方法，研究表明，使用不同的 CoT（即每个问题的多个推理路径）可以有效地提高它们的性能。另一个直观的想法是，具有更复杂推理路径的提示更有可能引发 LLM 的推理能力，这可以导致生成正确答案的准确性更高。然而，这两种方法都依赖于带标注的 CoT 数据集，这限制了在实践中的应用。为了克服这一限制，Auto-CoT 建议利用 Zero-shot-CoT，通过专门提示 LLM 来生成 CoT 推理路径，从而消除了手动操作。为了提高性能，Auto-CoT 进一步将训练集中的问题划分为不同的聚类，然后选择最接近每个聚类中心的问题，这应该很好地代表训练集中的提问。尽管 Few-shot CoT 可以被视为 ICL 的一种特殊提示情况，但与 ICL 中的标准提示相比，演示的顺序似乎影响相对较小：在大多数任务中，重新排序演示只会导致小于 2% 的性能变化。
【增强的 CoT 策略】除了丰富上下文信息外，CoT 提示还提供更多选项来推断给定问题的答案。现有的研究主要集中在生成多条推理路径，并试图在得出的答案中找到共识。例如，在生成 CoT 和最终答案时，提出了 self-consistency（自洽性）作为一种新的解码策略。它首先生成几个推理路径，然后对所有答案进行综合（例如，通过在这些路径中投票来选择最一致的答案）。self-consistency 在很大程度上提高了 CoT 推理的性能，甚至可以改进一些 CoT 提示通常比标准提示差的任务。此外，将自一致性策略扩展到更通用的集成框架（扩展到提示上的集成），发现不同的推理路径是提高 CoT 推理性能的关键。

6.3.2 Zero-shot CoT

与 Few-shot CoT 不同，Zero-shot CoT 在 prompt 中不包括人工标注的任务演示。相反，它直接生成推理步骤，然后使用生成的 CoT 来导出答案。其中 LLM 首先由 “Let's think step by step” 提示生成推理步骤，然后由 “Therefore, the answer is” 提示得出最终答案。他们发现，当模型规模超过一定规模时，这种策略会大大提高性能，但对小规模模型无效，显示出显著的涌现能力模式。为了在更多的任务上解锁 CoT 能力，Flan-T5 和 Flan-PaLM 进一步在 CoT 标注上执行指令调优，并且改进了在不可见任务上的零样本性能。

6.4 结论

CoT 对小模型作用不大，模型参数至少达到 10B 才有效果，达到 100B 效果才明显。并且，从小模型的输出可以看出，它们大部分是输出了流畅但不合逻辑的 CoT，因此得到错误的结果。
CoT 对复杂的问题的性能增益更大，例如 GSM8K（更难，因为基线最低）上 GPT-3 和 PaLM 的性能增加了一倍多。而对于 MAWPS-SingleOp（更简单的任务），性能改进非常小甚至是负面的
加上 CoT 的 PaLM 540B 超过了任务特定的用监督学习训练的模型的最优结果。不加 CoT 的话 GSM8K 和 MAWPS 任务上 LLM 的结果比不过最优的监督学习模型。

思维链是解决推理任务时人类思维过程遵循的一系列典型步骤。它可以帮助我们将一个问题分解成一系列的子问题，然后逐个解决这些子问题，从而得出最终的答案。在大型语言模型中，思维链可以用来引出推理。思维链方法带来以下好处：

CoT 允许模型将多步推理问题分解为中间步骤，这意味着额外的计算可以分配到需要推理的复杂问题上；
CoT 使大语言模型更具可解释性，更加可信，并提供了调试推理路径错误的机会；
CoT 推理能够被用于数学应用题、常识推理和符号操作等任务，并且可能适用任何人类需要通过语言解决的问题；
CoT 可以通过将其加入到 few-shot prompting 示例中，从而在足够大的语言模型中引导出推理能力。

当前的思维链也存在着许多局限性：

首先，尽管设计的思维链是在模拟人类的推理过程，但模型是否真正的学会了推理仍需进一步进行验证。
人工设计思维链仍然是代价过大，大规模的人工标注思维链是不可行的。
思维链只在大规模模型上有效（10B 以上）

6.5 未来对思维链的思考

（1）什么时候 CoT 对 LLMs 有用

由于 CoT 是一种涌现能力，只对足够大的模型（例如，通常包含 10B 或更多的参数）有积极影响，但对小模型没有影响。此外，由于 CoT 通过中间推理步骤增强了标准提示，因此它主要有效地改进了需要逐步推理的任务，如算术推理、常识推理和符号推理。然而，对于不依赖于复杂推理的其他任务，它可能显示出比标准提示更差的性能，例如 GLUE 的 MNLI-m/mm、SST-2 和 QQP。

（2）为什么 LLMs 可以执行 CoT 推理

关于 CoT 能力的来源，人们普遍假设它可以归因于对代码的训练，因为在代码上训练的模型显示出强大的推理能力。从直觉上讲，代码数据通过算法逻辑和编程流程进行了良好的组织，这可能有助于提高 LLM 的推理性能。然而，这一假设仍然缺乏消融实验的公开报道证据。此外，指令调优似乎不是获得 CoT 能力的关键原因，因为经验表明，对非 CoT 数据的指令调优并不能提高保持的 CoT 基准的性能。

总之，CoT 提示为诱导 LLM 的推理能力提供了一种通用而灵活的方法。也有一些初步尝试将该技术扩展到解决多模态任务和多语言任务。除了将 LLM 与 ICL 和 CoT 直接结合使用外，最近的一些研究还探讨了如何将 LLM 的能力专门化到特定任务，这被称为模型专门化。例如，研究人员通过微调 LLM 生成的 CoT 推理路径上的小规模 Flan-T5，专门研究 LLM 的数学推理能力。模型专业化也可用于解决各种任务，如问答、代码合成和信息检索。

6.6 关键知识点总结

有效的思维链应具备的特点是：逻辑性、全面性、可行性
思维链只能在大语言模型中起作用。
Few-shot CoT是ICL的一种特殊情况。
Zero-shot CoT在prompt中不包括人工标注的任务演示。
CoT使大语言模型更具可解释性，更加可信。

二、大模型可解释性的必要性《LARGE LANGUAGE MODELS AS OPTIMIZERS》

以下内容摘抄自： https://mp.weixin.qq.com/s/NCCoEQs8GKOctx7eMBJy7w

DeepMind团：《LARGE LANGUAGE MODELS AS OPTIMIZERS》（https://arxiv.org/abs/2309.03409 ）提出了"提示优化"（OptimizationbyPROmpting，简称OPRO），利用大型语言模型（LLM）作为优化器的简单而有效的方法，其中的优化任务是用自然语言描述。

在每个优化步骤中，LLM会从包含先前生成的解决方案及其值的提示中生成新的解决方案，然后对新解决方案进行评估，并将其添加到下一个优化步骤的提示中，其目标是找到能最大限度提高任务准确性的指令。

通过各种LLM，证明OPRO优化后的最佳提示在GSM8K上优于人类设计的提示达8%，在Big-BenchHard任务上优于人类设计的提示达50%。

例如，用这个新“咒语”（Take a deep breath）结合大家已经熟悉的“一步一步地想”（Let’s think step by step），大模型在GSM8K数据集上的成绩就从71.8提高到80.2分。

这感觉大模型越来越玄学，但从直觉上来说，这种效果应该本质上与其所使用的训练数据有直接关系。

因此，我们更对大模型这种不可解释的黑盒现象表示十分的无奈。

所以，我们再来看看知识图谱与大模型的结合工作，我们知道，在大模型黑盒化的今天，人们越来越需要可解释的KG推理，它可以帮助用户理解推理过程，并提高高风险场景中的可信度，如医疗诊断和法律判断。

而知识图谱推理从现有事实中推断出新知识，是知识图谱中一项有趣的任务，也是许多应用所必需的，例如知识图谱补全、问题解答和推荐。

例如，可以确定一个逻辑 cal规则：GrandMather(X,Y)←Mother(X,Z)∧Father(Z,Y)来预测关系"Grand-Mather"的缺失事实。

进行知识图谱推理规则挖掘，基本思想很简单，给定种子规则，针对规则来生成进一步的规则候选，然后利用打分函数对规则进行打分排序，最终形成最终的挖掘结果。

三、翻译与阅读论文：《ChatRule: Mining Logical Rules with Large Language Models for Knowledge Graph Reasoning》

1 摘要

逻辑规则对于揭示关系之间的逻辑联系至关重要，可以提高推理性能，并在知识图谱( knowledge graphs，KGs )上提供可解释的结果。尽管已经有很多工作在KG上挖掘有意义的逻辑规则，但是现有的方法在规则空间上进行计算密集型搜索，并且对于大规模的KGs缺乏可扩展性。此外，它们往往忽略了关系的语义，而关系的语义对于揭示逻辑联系至关重要。近年来，大型语言模型( Large Language Models，LLMs )由于其涌现性和可推广性，在自然语言处理和各种应用领域中表现出令人印象深刻的性能。在本文中，我们提出了一个新颖的框架，ChatRule，释放了大型语言模型在知识图谱上挖掘逻辑规则的能力。具体来说，该框架由一个基于LLM的规则生成器启动，利用了语义和结构信息。为了精化生成的规则，规则排序模块通过结合已有KG中的事实来估计规则质量。最后，规则验证器利用LLMs的推理能力，通过思维链推理验证排序规则的逻辑正确性。ChatRule在四个大规模的KGs上，通过不同的规则质量度量和下游任务进行评估，表明了我们方法的有效性和可扩展性。

1 摘要提纲

1）背景

逻辑规则重要！！！

可提高推理性能
可在KGs上提供可解释的结果

2）现有方法：

在规则空间上进行计算密集型搜索
对于大规模的KGs缺乏可扩展性
忽略了关系的语义

3）启发点

LLMs涌现性和可推广性，在NLP及其他领域中表现出impressive性能

4）本文工作

提出了一个ChatRule框架
框架由一个基于LLM的规则生成器启动，利用了和结构信息
规则质量通过KGs中已有的事实来估计
通过思维链推理验证排序规则的逻辑正确性

2 引用

知识图谱( knowledge graph，KGs )以三元组的结构形式存储了大量的现实世界知识。KG推理旨在从已有的事实中推断出新的知识，是KG中的一项基本任务，对许多应用至关重要，例如KG补全( 2019年曲和唐)、问答( Atif , El Khatib和Difallah 2023)和推荐( Wang et al . 2019)。近年来，对可解释性KG推理的需求日益增加，它可以帮助用户理解推理过程，提高高风险场景下的可信度，如医疗诊断( Liu et al.2021)和法律判决(钟甫宁等2020)。因此，逻辑规则(Barwise1977 )被广泛用于KG推理(Hou et al. 2021; Liu et al. 2022; Wang et al. 2023)；例如，由图1，我们可以识别出一条逻辑规则：Grand Mather ( X , Y)←Mother ( X , Z)∧Father ( Z , Y)来预测关系" Grand Mather "的缺失事实。为了从KGs中自动发现有意义的规则进行推理，逻辑规则挖掘在研究社区( Yang , Yang , and Cohen 2017 ; Sadeghian等2019)中获得了重要的关注。

早期的逻辑规则挖掘研究通常通过发现KG结构( Gal ' arraga et al.2013 ; Chen et al.2016)中频繁模式的共现来发现逻辑规则。然而，它们通常需要在KG上枚举所有可能的规则，并通过估计的重要性( Lao和Cohen 2010)对它们进行排序。虽然，最近的研究提出使用深度学习方法对规则进行排序。它们仍然受到穷举规则的限制，无法扩展到大规模的KGs ( Yang , Yang , and Cohen 2017 ; Sadeghian等2019)。

最近的一些方法通过从KGs中采样路径并在其上训练模型来捕获形成规则( Qu et al 2020 ; Cheng et al 2022 ; Cheng , Ahmed和Sun 2022 )的逻辑联系来解决这个问题。但是，它们通常忽略了关系语义对于表达逻辑联系的贡献。例如，在常识中，我们知道一个人的"父亲"的"母亲"就是他的"祖母"。基于此，我们可以定义一个像GrandMather( X , Y)←Mother( X , Z)∧Father( Z , Y)这样的规则来表达逻辑联系。然而，由于KGs中关系的数量，要求领域专家为每个关系注释规则可能是一种负担。因此，自动结合关系的结构和语义来发现知识库中的逻辑规则是非常重要的。

大型语言模型( LLMs )如ChatGPT和BARD在理解自然语言和处理许多复杂任务( Zhao et al.2023)方面表现出强大的能力。在大规模语料库上训练的LLMs存储了大量的常识性知识，这些知识可以用于促进KG推理(潘文卿等2023)。同时，LLMs并不是为了理解KGs的结构而设计的，难以直接应用于挖掘KGs上的逻辑规则。此外，被广泛认可的幻觉问题会使LLMs产生无意义的逻辑规则( Ji et al 2023)。

为了缓解LLMs与逻辑规则挖掘之间的鸿沟，我们提出了一个新颖的框架ChatRule，该框架利用KGs的语义和结构信息来提示LLMs生成逻辑规则。具体来说，我们首先提出了一个基于LLM的规则生成器来为每个关系生成候选规则。我们从KGs中采样一些路径来表示结构信息，然后在一个精心设计的提示中使用这些路径来利用LLMs的规则挖掘能力。为了减少幻觉问题，我们设计了一个逻辑规则排序器来评估生成规则的质量，并通过包含（encompassing：包含，围绕）KGs中的观测事实来过滤掉无意义的规则。在逻辑推理阶段进一步使用质量分数，以减少低质量规则的影响。最后，为了去除KGs支持但逻辑错误的伪规则( Hou et al 2021)，我们利用LLM的逻辑推理能力，通过思维链推理( Wei et al 2022)，用规则验证器验证规则的逻辑正确性。在我们的框架中，挖掘出的规则可以直接用于下游任务，而不需要任何模型训练。在4个大规模知识图谱上的大量实验表明，ChatRule在知识图谱补全和规则质量评估方面都显著优于现有方法。本文的主要贡献总结如下：

我们提出了一个名为ChatRule的框架，该框架利用LLMs的优势来挖掘逻辑规则。据我们所知，这是第一个将LLMs应用于逻辑规则挖掘的工作。

我们提出了一个端到端的流水线，利用LLMs的推理能力和KGs的结构信息进行规则生成、规则排序和规则验证。

我们在四个数据集上进行了广泛的实验。实验结果表明，ChatRule显著优于现有方法。

2 引用提纲

1）KG推理应用

KG补全( 2019年曲和唐)
问答( Atif , El Khatib和Difallah 2023)
推荐( Wang et al . 2019)

2）近年来，对可解释性KG推理的需求日益增加，可以帮助用户理解推理过程，提高高风险场景下的可信度，如：

医疗诊断( Liu et al.2021)
法律判决(钟甫宁等2020)

∴ 逻辑规则广泛应用于：KG推理

3）早期的逻辑规则挖掘研究：

通过发现KG结构( Gal ' arraga et al.2013 ; Chen et al.2016)中频繁模式的共现来发现逻辑规则

缺点：

需要在KG上枚举所有可能的规则，并通过估计的重要性( Lao和Cohen 2010)对它们进行排序

4）最近的研究

提出使用深度学习方法对规则进行排序

缺点：

仍然受到穷举规则的限制，无法扩展到大规模的KGs

5）为克服以上缺点，最近的一些方法

从KGs中采样路径并在其上训练模型，捕获形成规则的逻辑联系

缺点：

忽略了关系语义对于表达逻辑联系的贡献。

6）如果考虑关系语义贡献，则：

KGs中关系的数量多，要求领域专家为每个关系注释规则可能是一种负担。

∴ 自动结合关系的结构和语义来发现知识库中的逻辑规则是非常重要的。

7）在大规模语料库上训练的LLMs存储的大量的常识性知识，可以用于促进KG推理。

但

LLMs并不是为了理解KGs的结构而设计的，难以直接应用于挖掘KGs上的逻辑规则
幻觉问题会使LLMs产生无意义的逻辑规则

8）为了缓解LLMs与逻辑规则挖掘之间的鸿沟，提出ChatRule，利用KGs的语义和结构信息来提示LLMs生成逻辑规则。

具体来说，本文

提出了一个基于LLM的规则生成器：为每个关系生成候选规则
为利用结构信息：从KGs中采样一些路径来表示结构信息；在一个精心设计的提示中使用这些路径来利用LLMs的规则挖掘能力
为了减少幻觉问题：设计了一个逻辑规则排序器来评估生成规则的质量
为过滤掉无意义的规则：通过包含（encompassing：包含，围绕）KGs中的观测事实
为减少低质量规则的影响：在逻辑推理阶段进一步使用质量分数
为了去除KGs支持但逻辑错误的伪规则：通过思维链推理( Wei et al 2022)，用规则验证器验证规则的逻辑正确性

在本文框架中，挖掘出的规则可以直接用于下游任务，而不需要任何模型训练。在4个大规模知识图谱上的实验表明，ChatRule在知识图谱补全和规则质量评估方面都显著优于现有方法。

本文的主要贡献总结如下：

提出了一个名为ChatRule的框架，利用LLMs的优势来挖掘逻辑规则。
提出了一个端到端的流水线，利用LLMs的推理能力和KGs的结构信息进行规则生成、规则排序和规则验证。
在四个数据集上进行了广泛的实验。实验结果表明，ChatRule显著优于现有方法。

3 相关工作

3.1 逻辑规则挖掘

逻辑规则挖掘，专注于从KG中提取有意义的规则，已经被研究了很长时间。传统方法通过枚举候选规则，然后通过计算权重分数( Lao和Cohen 2010 ; Gal ' arraga等2013)来评估候选规则的质量。随着深度学习的推进，研究人员探索了以( Yang , Yang , and Cohen 2017 ; Sadeghian等2019)可微的方式同时学习逻辑规则和权重的思路。然而，这些方法仍然在规则空间上进行了大量的优化，这限制了它们的可扩展性。最近，研究人员提出从KGs中采样路径并在其上训练模型来学习逻辑连接。RLvLR ( Omran , Wang , and Wang 2018)从子图中采样规则，并提出一种基于嵌入的得分函数。RNNLogic ( Qu et al 2020)将规则生成和规则加权分开，可以相互增强，缩小搜索空间。R5( Lu et al . 2021)提出了一种在KG上进行启发式搜索并挖掘潜在逻辑规则的强化学习框架。RLogic ( Cheng et al 2022)和NCRL ( Cheng , Ahmed和Sun 2022 )预测出规则体的最佳组成，是目前该领域最先进的方法。然而，它们没有考虑关系的语义，可能导致次优的结果。

3 相关工作提纲

3.1 逻辑规则挖掘

传统方法：

枚举候选规则-->计算权重分数-->评估候选规则的质量

深度学习方法：

以可微的方式同时学习逻辑规则和权重

传统方法、深度学习方法，仍然在规则空间上进行了大量的优化，这限制了它们的可扩展性

4 准备工作和问题界定

知识Graphs( KGs ) 以三元组的形式表示事实集合，G = { ( e , r , e′) ⊆ ε × R × ε }，其中e、e′∈ε和r∈R分别表示实体和关系集合。

逻辑规则是一阶逻辑的特例(Barwise1977 )，可以促进对KGs的可解释推理 ( Yang , Yang , and Cohen 2017)上的可解释性推理。逻辑规则ρ以如下形式表示逻辑蕴涵

ρ := rh (X, Y ) ← r1(X, Z1) ∧ · · · ∧rL(ZL-1, Y ) (1)

其中body ( ρ )：= r1(X, Z1) ∧ · · · ∧rL(ZL-1, Y )表示一系列称为规则体的关系的合取，rh (X, Y )表示规则头，L表示规则长度。如果规则体上的条件得到满足，那么规则头上的陈述也成立。

该规则的一个实例是用KGs中的实际实体替换变量X，Y，Z*实现的。例如，给定一个规则Grand Mather( X , Y)←Mother( X , Z1)∧Father( Z1、Y)，一个规则实例δ可以为

Grandmather(Alice, Charlie)←Mother(Alice, Bob) ∧ Father(Bob, Charlie), ( 2 )

也就是说，如果Alice是Bob的母亲，Bob是Charlie的父亲，那么Alice就是Charlie的祖母。

问题定义:给定一个目标关系rh ∈R作为规则头，逻辑规则挖掘的目标是找到一组有意义的规则 = Prh{ ρ1 ，· · ·，ρK }来捕获其他关系的逻辑联系，以表示KGs中的目标关系rh。

5 方法

在这一部分，我们将介绍我们提出的框架ChatRule，用于在具有大型语言模型的KG上挖掘逻辑规则。整体框架如图2所示，包含三个主要部分：1 )基于LLM的规则生成器，利用语义和结构信息生成有意义的规则。2 )一个规则排序器来评估生成的规则在KG上的质量，3 )一个思维链( CoT )规则验证器来验证规则的逻辑正确性。

图2：ChatRule的整体框架。1 )对于给定的目标关系rh，我们首先从知识图谱中抽取少量的规则实例。2 )促使大型语言模型(例如, ChatGPT)生成一组粗候选规则。3 )我们提出了一个规则排序器来估计KGs中基于事实生成的规则的质量。4 )利用思维链推理验证了排序规则的逻辑正确性。5 )最终的规则可以应用于逻辑推理和解决下游任务，如知识图谱补全。

5.1 基于LLM的规则生成器

传统的逻辑规则挖掘研究通常集中于使用结构信息( Gal ' arraga et al.2013 ; Cheng , Ahmed和Sun 2022 )，忽略了关系语义对表达逻辑联系的贡献。为了利用大语言模型( Large language models，LLMs )的语义理解能力，我们提出了一种基于LLM的规则生成器，该生成器同时利用了KGs的语义和结构信息来生成有意义的规则。

5.1.1 规则采样器

为了使LLMs能够理解用于规则挖掘的KG结构，我们采用广度优先搜索( BFS )采样器从KG中采样一些闭合路径，这些闭合路径可以作为逻辑规则( Omran , Wang , and Wang 2018 ; Cheng et al 2022)的实例。给定一个三元组(e1、rh、eL)，闭合路径被定义为KGs中连接和的关系序列r1，· · ·，rL，即e1--r1→e2--r2-→· · · rL-→eL。例如，给定一个三元组(Alice, GrandMother, Charlie)，可以找到一条闭合路径p：

从而闭合了KGs中的三元组(Alice, GrandMother, Charlie)。通过将三元组作为规则头，闭路径作为规则体，我们可以得到方程( 2 )中的规则实例δ。

【即，规则头：(Alice, GrandMother, Charlie)

规则体：

====》规则实例δ：Grandmather(Alice, Charlie)←Mother(Alice, Bob) ∧ Father(Bob, Charlie)

】

给定一个目标关系，我们首先从KGs中选择一组种子三元组{ ( e ,rh , e′) }，然后利用BFS采样一组长度小于L的闭路径{ p }构成一组规则实例{ δ }。然后，用变量替换规则实例中的实际实体，得到规则样本 Srh = { ρ }。规则样本以序列的形式表达了KG的结构信息，这些结构信息可以被输入到大语言模型中以促进规则的生成。

5.1.2 基于LLM的规则生成

在大规模语料库上训练的大型语言模型( Large Language Models，LLMs )表现出理解自然语言语义的能力，并且能够利用常识知识(周黎安等2020 ; Tan et al.2023)进行复杂的推理。为了对结构进行整合并利用LLMs进行规则挖掘的能力，在语义信息方面，我们设计了一个精心设计的提示。对于目标关系rh的规则采样器得到的Srh中的每一条规则，我们通过移除关系名中的特殊符号将其动词化为自然语言句子，这可能会恶化LLMs的语义理解。对于一个原始关系(即 )的逆序，我们通过添加一个" inv "符号将其动词化。然后，我们将口头化的规则样本放入提示模板中，并将其输入到LLMs (例如, ChatGPT)中生成规则。关系"丈夫( X , Y) "的规则生成提示和LLMs结果的例子如图3所示。

图3：关系"丈夫( X , Y) "的规则生成提示和LLMs结果的示例。

规则生成提示：

逻辑规则定义了两个实体X和Y之间的关系。每条规则都以逻辑蕴涵的形式写入，它指出如果右边(规则体)上的条件被满足，那么左边(规则头)上的语句就成立。

现在我们有以下规则样本：

丈夫( X , Y) < - -妻子( X , Y)

丈夫( X , Y) < - -父亲( X , Z _ 1) &女儿( Z _ 1 , Y)

...

丈夫( X , Y) < - -父亲( X , Z _ 1) &姐姐( Z _ 1、Z _ 2) &女儿( Z _ 2 , Y)

基于以上规则，请生成许多最重要的规则头部：'丈夫( X , Y) '

输出：

丈夫( X , Y) < - -妻子( X , Y)

丈夫( X , Y) < - -父亲( X , Z _ 1) &女儿( Z _ 1 , Y)

丈夫( X , Y) < - -侄子( X , Z _ 1) &姑姑( Z _ 1 , Y)

丈夫( X , Y) < - -丈夫( X , Z _ 1) &弟弟( Z _ 1、Z _ 2)

...

5.1.3 基于LLM的规则摘要

由于大量的规则样本，它们不能被同时输入到LLMs中，从而超出了上下文限制。因此，我们将规则样本拆分为多个查询，以提示LLM生成规则。然后收集LLMs的响应，请LLMs对结果进行汇总，得到一组候选规则Crh = { ρ }。详细的提示可参见附录。

5.2 逻辑规则排序

众所周知，LLMs具有幻觉问题，这可能会产生错误的结果( Ji et al 2023)。例如，在图3的结果中所显示的生成规则"丈夫( X , Y)←丈夫( X , Z1) &兄弟( Z1 , Y) "是不正确的。因此，我们开发了一个规则排序器来检测幻觉，并根据KGs中的事实来估计生成规则的质量。规则排序器旨在为候选规则集Crh中的每个规则ρ分配一个质量分数s ( ρ )。受先前规则挖掘工作( Gal ' arraga等2013)的启发，我们使用四种度量，即支持度、覆盖率、置信度和PCA置信度，来评估规则的质量。各项措施的详细介绍和示例见附录。

5.2.1 支持度

表示KGs中满足规则ρ的事实个数，定义为

supp ( ρ )：= # ( e , e′)：∃( e , r1 , e2)∧，· · ·，∧( eL-1 , rL , e′)：body ( ρ )∧( e , rh , e′)∈G，( 4 )

其中，( e1 , r1 , e2)，· · ·，( eL-1 , rL , e′)表示KGs中满足规则body ( ρ )的一系列事实，( e , rh , e′)表示满足规则head rh的事实。

显然，具有零支持度的规则可以很容易地从候选集中剪枝出来，而不需要任何进一步的精化。然而，支持度是一个绝对数字，对于KGs中事实较多的关系而言，支持度可能更高，并提供有偏的排序结果。

5.2.2 覆盖率

覆盖率通过KGs中每个关系的事实数来规范支持度，定义为

覆盖率量化了规则ρ所隐含的KG中存在事实的比例。为了进一步考虑规则的错误预测，我们引入置信度和PCA置信度来估计规则的质量。

5.2.3 置信度

定义为KGs中满足规则ρ的事实数量与规则体( ρ )满足的次数之比，定义为

置信度假设从规则库中导出的所有事实都应该包含在KGs中。然而，实践中KGs往往是不完整的，这可能导致证据事实的缺失。因此，我们引入PCA置信度来选择能够更好地泛化到看不见的事实的规则。

5.2.4 PCA置信度

定义为KGs部分完成时满足规则ρ的事实数与规则体( ρ )满足的次数之比，定义为

PCA置信度的分母不是来自规则体的整个事实集的大小。相反，它是基于我们知道的事实数量是真的，以及我们假设的事实数量是假的。因此，PCA置信度能更好地估计不完备KGs中规则的质量和可推广性。规则质量评估的实验结果也支持了这一说法。

5.3 用于规则验证的Cot推理

经过逻辑规则排序，我们得到了目标关系rh的一组排序规则Rrh = { ( ρ , s ( ρ) ) }。虽然我们可以对支持度为零的规则进行剪枝，以提高生成规则的质量，但需要注意的是，KGs中可能存在噪声，会导致伪规则的存在。这些规则在KGs中似乎得到了事实的支持，但在逻辑上是错误的( Hou et al 2021)，这可能会导致下游任务中错误的预测。因此，我们利用LLM的推理能力，使用思维链( CoT )推理( Wei et al 2022)来验证规则的逻辑正确性。

对于每一条规则ρ∈Rrh，我们将其输入到CoT提示模板中，并要求LLM验证其逻辑正确性。排序后有8个支持度的伪规则的例子如图4所示。完整的CoT提示模板见附录。验证结束后，可以自动去除伪规则，得到最终的规则Prh。

图4：规则"丈夫( X , Y)←侄子 ( X , Z1) & 姑姑 ( Z1 , Y) "的CoT规则验证提示示例及结果。

Cot规则验证提示

逻辑规则定义了两个实体X和Y之间的关系，现在请逐步分析这种关系规则路径，检查其是否正确。规则：丈夫( X , Y) < - -侄子( X , Z _ 1) &姑姑( Z _ 1 , Y)

输出

我们对给定的规则进行逐步分析：

1 . ' 侄子( X , Z _ 1) '：这个条件暗示了存在一个关系，其中X是Z _ 1的侄子。换句话说，Z _ 1是X的父亲的舅舅或姑姑。

2 . ' 姑姑( Z _ 1 , Y) '：这个条件暗示了存在一种关系，其中Z _ 1是Y的姑姑，换句话说，Z _ 1是Y的父亲的姐姐。

现在，将这两个条件结合在规则中：

3 . "丈夫( X , Y) "：这个条件意味着存在这样一种关系，其中X是Y的丈夫。

给定的规则似乎描述了一种情况，根据给定的条件，如果X是某人( Z _ 1 )的侄子，Z _ 1是某人( Y )的姨妈，那么X是Y的丈夫。然而，这个结论在逻辑上并没有从前提中得到遵循。

因此，对该规则的分析揭示了它是(不正确的)。

5.4 基于规则的逻辑推理

最后的规则可以用于逻辑推理和解决下游任务，例如知识图谱补全，通过应用现有的算法，如前向链( Salvat和米尼耶1996)。给定一个查询( e、rh、?)，设A为候选答案集合。对于每一个e′∈A，我们可以应用Prh中的规则来获得分数

式中，body ( ρ ) ( e , e′)表示满足规则体的KGs中的路径，s ( ρ )表示规则的质量分数，可以是收敛的，也可以是置信度，也可以是PCA置信度。然后，根据得分对候选答案A进行排序，选择前N个答案作为最终结果。

6 实验

6.1 数据集

在实验中，我们根据之前的研究( Cheng et al 2022)选取了4个广泛使用的数据集：Family ( Hinton等( 1986 ))、WN18RR (德特默斯等2018)、FB15K237 (图塔诺瓦和陈2015)和YAGO3 - 10 (苏查内克、Kasneci和Weikum 2007)。数据统计汇总如表1所示。

家庭( Hinton等( 1986 ))是一个知识图谱，它定义了家庭中成员之间的关系，例如"父亲"，"母亲"和"姑姑"。
WN18RR (德特默斯等2018)是一个英语词汇知识图谱，旨在根据单词之间的语义关系来组织单词。词之间通过一系列关系连接，包括"上位词"，"派生词"等。
FB15k-237 (图塔诺瓦和陈2015)是从Freebase中提取的知识图谱的子集，它收集了广泛的主题范围内的数据和237种不同的关系。
YAGO3-10 (苏查内克、Kasneci和Weikum 2007)是由Wikipedia，词网和GeoNames等多个数据源构建的另一个大规模知识图谱，它包含许多关系，例如"出生在"，"生活在"和"...的政治家"。

6.2 基线

我们将我们的方法与SOTA规则挖掘基线：AIME ( Gal ' arraga等2013)，NeuralLP ( Yang , Yang , and Cohen 2017)，DRUM ( Sadeghian等2019)，RNNLogic ( Qu et al 2020)，RLogic ( Cheng et al 2022)和NCRL ( Cheng , Ahmed和Sun 2022 )在知识图谱补全和规则质量评估任务上进行了比较。

AIME ( Gal ' arraga等2013)是一种常规的逻辑规则挖掘方法，通过归纳逻辑编程从KG中发现规则；
Neural LP ( Yang , Yang , and Cohen 2017)提出了一种神经逻辑编程，以端到端的差分方式学习逻辑规则；
DRUM ( Sadeghian等2019)将Neural LP与LSTM和注意力机制相结合，挖掘可变长度规则；
RNNLogic ( Qu et al 2020)提出了一个规则生成器和一个带有逻辑规则的推理预测器。它开发了一种基于EM的算法来优化和学习用于推理的高质量规则。
Rlogic ( Cheng et al 2022)引入了一个在采样路径上训练的评分模型，并使用演绎推理来估计每个规则的质量。
NCRL ( Cheng , Ahmed和Sun 2022 )通过递归地合并规则体中的成分来推断规则，从而检测出一个规则体的最佳组成结构，用于表达规则头。

6.3 度量

对于知识图谱完成任务，我们屏蔽每个测试三元组的尾部或头部实体，并使用每个方法生成的规则进行预测。根据之前的研究（Cheng，Ahmed，和Sun 2022），我们使用平均倒数排名（MRR）和hits@N作为评价指标，并将N设置为1和10。对于规则质量评估任务，我们使用前上一节关于规则排序中讨论的度量（例如，支持、覆盖率、置信度和PCA置信度）。

6.4 实验设置

对于ChatRule，我们分别使用ChatGPT和GPT - 4作为LLMs进行规则生成和验证。我们选择PCA置信度作为最终的规则排序度量，并将最大规则长度L设置为3。在知识图谱补全任务中，我们遵循与先前研究( Cheng et al 2022 ; Cheng , Ahmed和Sun 2022 )相同的设置。因此，我们直接使用这些论文中报告的结果，以避免重新实施偏倚。关于设置的详细讨论可以在附录中找到。

6.5 知识图谱补全

知识图谱补全是利用基于规则的逻辑推理对缺失事实进行预测的经典任务。该任务已被各种现有的规则挖掘方法所采用，如Neural - LP ( Yang , Yang , and Cohen 2017)，RLogic ( Cheng et al 2022)和NCRL ( Cheng , Ahmed和Sun 2022 )，以评估生成规则的质量。我们采用每种方法生成的规则，并使用前向链( Salvat和米尼耶1996)来预测缺失的事实。结果见表2。

从结果中，我们可以观察到ChatRule在所有数据集上始终优于基线。具体来说，传统的AIME方法仅利用了归纳逻辑编程的结构信息，已经取得了较好的性能。但是，AIME在大规模的KGs (例如, FB15K - 237和YAGO3 - 10)中由于关系和三元组数量的增加而失败。最近基于深度学习的方法(如Neural - LP，DRUMP，andRNNLogic )通过利用神经网络的能力来实现更好的性能。然而，由于规则搜索空间的密集性，它们在处理大型KG时很容易成为内存溢出。现有的(例如, RLogic和NCRL)方法通过近路径采样来缩小搜索空间，但仍然忽略了关系的语义，从而导致次优的性能。相比之下，ChatRule通过结合KGs的结构和语义信息，可以生成高质量的规则。因此，ChatRule可以在所有数据集上达到最好的性能。

6.6 规则质量评价

为了进一步说明(即支持度、覆盖率、置信度和PCA置信度)在规则排序中采用的4种度量方法的有效性，我们用它们来评估每种方法生成的规则。结果见表3。

从结果中，我们可以观察到ChatRule可以生成支持度、覆盖率和置信度均高于基线的规则。具体来说，我们可以观察到度量的得分与知识图谱补全中的表现是一致的。这说明所选取的度量指标能够很好地量化规则的质量。此外，ChatRule生成的规则质量优于基准规则。值得注意的是，即使ChatRule ( ChatGPT )在YAGO3 - 10的支持度和覆盖度上取得了较高的得分，其知识图谱补全结果仍然被ChatRule ( GPT-4 )击败。这是因为ChatRule ( GPT-4 )生成的规则具有更好的PCA置信度，更适合于不完备KG中规则的评估。较高的PCA置信度得分表明，ChatRule(GPT-4)可以生成具有更好的泛化能力的规则，而不是仅仅依赖于提示中提供的样本规则。因此，ChatRule (GPT-4)在知识图补全任务中可以取得更好的性能。

6.7 消融研究

6.7.1 各成分分析

我们首先测试ChatRule中各个组件的有效性。我们使用GPT - 4作为LLM，PCA置信度作为规则排序度量。结果见表4。

GPT (零样本学习)是指在没有任何规则样本的情况下，直接使用GPT - 4生成规则。规则样本、摘要、排序和验证分别表示ChatRule中提出的组件。

从结果中我们可以观察到ChatRule的性能是随着各个组件的加入而逐渐提高的。具体来说，通过增加规则样本，ChatRule的性能得到了显著的提高，这表明了融入图结构信息对于规则挖掘的重要性。通过使用摘要、排序和验证，ChatRule的性能得到了进一步的提升。这说明这些组件可以进一步细化规则，提高ChatRule的性能。

6.7.2排名措施分析

然后，我们测试了规则排序中采用的每个度量(即覆盖率、置信度和PCA置信度)的有效性。这些规则都是由GPT - 4在Family和WN18RR数据集上生成的。结果见表5。

从结果可以看出，与没有使用排序测度(即,无)相比，使用排序测度后，ChatRule的所有性能都得到了提升。这表明排序度量可以有效地降低低质量规则的影响。在所有排序测度中，PCA置信度取得了最好的表现。这说明PCA置信度能够量化不完备KGs中规则的质量，选择泛化性更好的规则，也被选为最终的排序指标。

6.7.3 COT验证分析

在实验中，我们评估了使用不同的LLMs (例如ChatGPT和GPT - 4)进行CoT规则验证的性能。这些规则都是由GPT - 4在Family和WN18RR数据集上生成的。结果见表6。

从结果可以看出，GPT4比ChatGPT取得了更好的性能。这说明GPT-4具有更好的逻辑推理能力，能够识别隐含的逻辑联系，检查规则的有效性。

6.8 案例研究

我们在表7中给出了在Family和Yago数据集上生成的一些逻辑规则。结果表明，本文方法生成的规则既具有可解释性，又具有较高的质量。例如，"妻子"直观上是"丈夫"的反向关系，ChatRule在考虑关系语义的情况下成功挖掘出了"丈夫←inv妻子"规则。类似地，' playFor '是' isAffiliatedTo '的同义词，构成规则playFor←isAffiliatedTo。生成的规则也揭示了隐含的逻辑联系。规则为PoliticianOf←hasChild∧isPoliticianOf表示子女通常继承父母的政治立场，支持度和PCA得分都支持这一观点。

6.9 局限性

一个主要的限制是ChatRule严重依赖于关系的语义。即使我们输入采样规则来促使LLMs理解图结构，如果关系的语义没有明确给出，LLMs仍然无法生成高质量的规则。如表8所示，我们展示了Kinship数据集(科克和多明戈斯2007)上的知识图谱补全结果，其中每个关系用一个模糊名称(例如, "词条1 "和"词条2 ")表示。

从实验结果可以看出，ChatRule算法的性能并不优于STOA算法(例如, RNNLogic和NCRL)。在未来，我们将探索一种更好的方法(例如图神经网络( Wu et al 2020 ) )，使LLMs能够理解图结构，并在没有语义的情况下生成高质量的规则。

7 Conclusion

在本文中，我们介绍了一种新的方法，叫做ChatRule，以弥补KG上逻辑规则挖掘的不足。在ChatRule中，我们提出了一个基于LLMs的规则生成器，该生成器融合了语义和结构信息，以生成有意义的规则。此外，还开发了一个规则排序器和一个CoT规则验证器来评估规则的质量并剔除错误的规则。

在多个数据集上的大量实验表明ChatRule可以为下游任务生成高质量且可解释的规则。未来，我们将探索集成高级模型来增强LLMs对结构信息的理解，提高规则挖掘的性能。

8 引用LLM网址

ChatGPT：https://openai.com/blog/chatgpt

BARD：https://bard.google.com/

ChatGPT4：https://openai.com/gpt-4

创作不易，您的鼓励是我创作做大的动力！！！

点个关注再走呗~

你可能感兴趣的:(文献阅读,机器学习,语言模型,知识图谱,人工智能)

SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
深入解读MaaS技术架构：从模型服务到智能部署的全流程分析 Cc不爱吃洋葱架构人工智能大语言模型大模型智能部署 MaaS技术架构 LLM
随着人工智能（AI）的迅速发展，MaaS（ModelasaService，模型即服务）技术架构应运而生。它通过将复杂的AI模型封装为标准化服务，降低了模型的开发和部署门槛，帮助企业快速实现业务场景的智能化升级。本文将深入解析MaaS技术架构，详细阐述其各个组成部分以及如何在实际应用中高效发挥其功能。一、使用方层：从应用接入到业务赋能MaaS技术架构的顶层是使用方层，它主要面向第三方应用，是企业与M
Spring Boot + 本地部署大模型实现：安全性与可靠性保障代码老y spring boot bootstrap 后端
在将大语言模型集成到SpringBoot应用中时，安全性和可靠性是两个关键因素。本地部署的大模型虽然提供了强大的功能，但也可能带来一些安全风险，如数据泄露、模型被恶意利用等。本文将介绍如何在SpringBoot应用中保障本地部署大模型的安全性和可靠性，确保应用的稳定运行。一、安全性保障（一）数据加密传输加密：确保模型生成的结果在传输过程中被加密，防止数据在传输过程中被窃取。可以使用HTTPS协议来
MCP客户端请求MCP服务器资源的Python SDK实现 AI天才研究院计算 AI人工智能与大数据 Python实战 python 开发语言 ai 服务器
我将为您提供一个详细的指南，说明如何使用PythonSDK让MCP客户端请求MCP服务器的资源。MCP客户端请求MCP服务器资源的PythonSDK实现核心概念ModelContextProtocol(MCP)是一个标准化协议，允许应用程序以标准化的方式为大语言模型(LLM)提供上下文，将提供上下文的关注点与实际的LLM交互分离。MCP中的资源(Resources)是一种核心原语，允许服务器暴露数
人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程 H-大叔人工智能大模型实战与教程人工智能
在实战开发大语言模型的过程中，经常会遇到各种API-KEY的配置问题，例如GPTOpenAIKEY的配置，而且目前大部分都要求将其配置在环境变量中，下面将会讲解如何在Linux、macOS、Windows中配置，本文一文通教程。您可以使用配置环境变量的方法，避免在调用各种SDK时显式地配置API-KEY，从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析 G皮T #大语言模型人工智能 LLM 大语言模型 chatgpt deepseek DeepSeek-R1 DeepSeek-V3
ChatGPT、DeepSeek-R1、DeepSeek-V3辨析1.ChatGPT对比DeepSeek1.1技术相似点1.2主要差异1.3关键区别1.4如何选择1.5总结2.DeepSeek-R1对比DeepSeek-V32.1DeepSeek-R12.2DeepSeek-V32.3核心区别总结2.4如何选择3.R1和V3有什么含义3.1DeepSeekR1的"R"3.2DeepSeekV3的"
「论文导读」LLM高效推理与模型量化雷羿 LexChien prompt 人工智能 LLM 论文阅读
1.论文背景作者：HugoTouvron等人，來自MetaAI来源：arXiv:2302.13971，2023年2月主题：介绍LLaMA系列模型（LLaMA-7B、13B、33B、65B），专为研究用途设计，强调高效能与低资源需求的语言模型推理。论文探讨如何通过优化训练数据、模型架构和推理技术，在有限硬体资源（如单一GPU或CPU）上实现高效推理。学术背景：随着大型语言模型（LLM）如GPT-3的
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
AlphaEvolve：谷歌的算法进化引擎 | 从数学证明到芯片设计的AI自主发现新纪元大千AI助手人工智能 Python #OTHER 算法人工智能深度学习 AlphaEvolve google gemini
AlphaEvolve：谷歌的算法进化引擎|从数学证明到芯片设计的AI自主发现新纪元——结合大语言模型与进化计算，重塑科学发现与工程优化的通用智能体本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！⚙️一、核心定义与技术架构AlphaEvolve是由谷歌DeepMind开发的通用科学AI智能体，其核心
2025 年机器学习工作流程的 7 个 AI 代理框架盖瑞理 AI Agent 人工智能
介绍机器学习从业者花费大量时间在重复性任务上：监控模型性能、重新训练流程、检查数据质量以及跟踪实验。虽然这些操作任务至关重要，但它们通常会占用团队60%到80%的时间，几乎没有留下任何创新和模型改进的空间。传统的自动化工具可以处理简单的、基于规则的工作流程，但它们难以应对机器学习操作所需的动态决策。何时应该根据性能漂移重新训练模型？当数据分布发生变化时，如何自动调整超参数？这些场景需要能够推理复杂
vLLM 的逻辑与运作机制 a李兆洋大模型推理
vLLM的逻辑与运作机制vLLM作为一种高效的推理框架，逐渐成为研究和应用的热点。vLLM的核心在于如何高效地管理和调度模型推理任务，以最大化利用计算资源并提高推理效率。一、vLLM是如何运作的？vLLM是一种虚拟化的大语言模型推理框架，它通过高效的资源管理和调度机制，使得大规模语言模型的推理任务能够更加高效地运行。vLLM的核心逻辑是LLMEngine，它负责处理和调度推理请求，管理KVcach
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
Manus AI与多语言手写识别 tonngw 人工智能
技术文章大纲：ManusAI与多语言手写识别引言手写识别技术的发展背景与市场需求ManusAI的定位与核心技术优势多语言场景下的挑战与机遇ManusAI的核心技术架构基于深度学习的端到端手写识别模型多模态数据融合（笔迹压力、书写轨迹等）自适应语言模型与字符集扩展机制多语言手写识别的关键技术非拉丁语系（中文、阿拉伯语等）的笔迹特征提取小样本语言数据的迁移学习策略上下文感知与语法纠错在低资源语言中的应
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
大模型开源与国产化突围：技术路径与产业机遇深度解析梦玄海开源架构 golang 开发语言后端大数据
引言：大模型时代的双轨竞速2023年全球大语言模型（LLM）参数量突破万亿级，GPT-4、LLaMA等模型引领技术浪潮。中国在这场竞赛中面临双重命题：既要融入全球开源生态，又要构建自主可控的技术体系。本文将从技术架构、训练范式、生态建设三个维度，深入剖析大模型开源与国产化的突围路径。一、全球开源格局与中国大模型现状1.1国际开源生态的演进特征技术民主化加速：LLaMA-2（700亿参数）、BLOO
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
人工智能-基础篇-23-智能体Agent到底是什么？怎么理解？（智能体=看+想+做） weisian151 人工智能人工智能
1、智能体是什么？想象你有一个超级聪明的小助手，它能：自己看环境（比如看到天气、听到声音、读到数据）；自己做决定（比如下雨了要关窗，电量低要去充电）；自己动手干活（比如帮你订外卖、打扫房间、开车）；越用越聪明（比如记住你的习惯，下次不用你提醒）。这个“小助手”就是智能体（Agent）——它是一个能自主感知、思考、行动并学习的系统，可以是软件（比如手机里的AI助手）、硬件（比如机器人），或者软硬结合
多角色AI Agent：基于LLM的虚拟角色扮演系统 AI天才研究院 AI人工智能与大数据人工智能 ai
多角色AIAgent：基于LLM的虚拟角色扮演系统关键词多角色AIAgentLargeLanguageModel(LLM)虚拟角色扮演系统人工智能自然语言处理程序设计摘要本文旨在探讨多角色AIAgent的基础知识以及其如何在虚拟角色扮演系统中发挥作用。我们将首先介绍多角色AIAgent的概念、历史背景和基本原理。随后，我们将深入探讨LLM（大语言模型）在虚拟角色扮演系统中的应用，包括其工作原理、核
【算法】解数独：C++ 实现与策略探讨 master_chenchengg 算法提升算法 java 开发语言
【算法】解数独：C++实现与策略探讨一、引言：C++算法技术的魔力与解数独的智慧二、技术概述：数独求解的艺术定义与技术框架核心特性和优势代码示例：基础回溯解法三、技术细节：解数独的逻辑与挑战原理解析难点分析四、实战应用：从游戏到人工智能应用场景解决方案展示五、优化与改进潜在问题改进建议六、常见问题与解决方案七、总结与展望一、引言：C++算法技术的魔力与解数独的智慧在算法领域，C++凭借其高效、灵活
FastMCP：用于构建MCP服务器的开源Python框架 NetX行者 AI编程服务器开源 python
在人工智能领域，模型上下文协议（ModelContextProtocol，简称MCP）作为一种标准化的协议，为大型语言模型（LLM）提供了丰富的上下文和工具支持。而FastMCP作为构建MCP服务器和客户端的Python框架，以其简洁的API设计、高效的开发体验以及强大的扩展能力，正逐渐成为开发者们的首选工具。一、FastMCP简介FastMCP是一个用于构建MCP服务器和客户端的Python框架
ReAct (Reason and Act) OR 强化学习（Reinforcement Learning, RL） SugarPPig 人工智能人工智能
这个问题触及了现代AI智能体（Agent）构建的两种核心思想。简单来说，ReAct是一种“调用专家”的模式，而强化学习(RL)是一种“从零试错”的模式。为了让你更清晰地理解，我们从一个生动的比喻开始，然后进行详细的对比。一个生动的比喻想象一下你要完成一项复杂的任务，比如“策划一场完美的生日派对”。ReAct的方式（像一位经验丰富的活动策划师）你是一位知识渊博的专家（大语言模型LLM）。你首先会思考
Python在人工智能领域的实际应用：示例代码解析辣条yyds python python 人工智能开发语言
摘要：本文将通过几个典型的人工智能应用场景，展示Python在图像识别、自然语言处理、推荐系统等方面的高级用法。通过示例代码，带大家深入理解Python在人工智能领域的实际应用。正文：Python作为一门流行的编程语言，凭借其简洁的语法、丰富的库和框架，成为了人工智能（AI）领域的主流开发语言。下面，我们将通过几个示例，探讨Python在人工智能方向的实际应用。示例一：图像识别-使用OpenCV进
【文献精读笔记】Explainability for Large Language Models: A Survey （大语言模型的可解释性综述）（五）百万年薪天才少女人工智能人工智能机器学习深度学习
****非斜体正文为原文献内容（也包含笔者的补充），灰色块中是对文章细节的进一步详细解释！五、解释评估（ExplanationEvaluation）在前面的章节中，我们介绍了不同的解释技术和它们的用途，但评估它们如何忠实地反映模型的推理过程仍然是一个挑战。我们将评估大致分为两类：传统微调范式的局部解释评估（第5.1节）和提示范式中自然语言CoT解释的评估（第5.2节）。评估的两个关键维度是对人类的
Tansformer的Multi-Head Attention组件数字化与智能化大模型基础 Transformer框架 transformer 多头注意力机制
一、Transformer的注意力机制Transformer的注意力机制是对传统序列建模方法的颠覆性创新。它通过全局并行的关联计算解决了RNN的效率与长距离依赖瓶颈，通过动态权重和多头设计增强了模型对复杂信息的捕捉能力，最终成为现代人工智能的核心技术基石。其意义不仅在于提升了模型性能，更在于提供了一种“计算关联”的通用思路，推动了人工智能向更高效、更通用的方向发展。在Transformer之前，循
生成式人工智能实战 | 条件生成对抗网络（conditional Generative Adversarial Network, cGAN）盼小辉丶生成对抗网络神经网络深度学习生成式人工智能 pytorch
生成式人工智能实战|条件生成对抗网络0.前言1.条件生成对抗网络1.1GAN基础回顾1.2cGAN核心思想2.cGAN网络架构2.1数学原理2.2网络架构3.实现cGAN3.1环境准备与数据加载3.2模型构建3.3模型训练0.前言生成对抗网络(GenerativeAdversarialNetwork,GAN)是近年来深度学习领域最具突破性的技术之一，能够生成逼真的图像、音频甚至文本。然而，传统的G
【人工智能】Maas（模型即服务）（Model as a Service）是一种基于云计算的商业模式，通过API将预训练的人工智能模型作为服务提供给用户，使其无需自行管理底层基础设施即可调用AI能力。本本本添哥 A -AIGC 人工智能大模型人工智能云计算
ModelasaService（模型即服务，MaaS）是一种基于云计算的商业模式，通过API将预训练的人工智能模型作为服务提供给用户，使其无需自行管理底层基础设施即可调用AI能力。MaaS通过云原生架构和标准化服务，正在重塑AI技术的开发和消费方式，推动人工智能从“技术专有”向“普惠工具”转变。以下是其核心要点：1.定义与核心理念MaaS将大模型（如GPT-3、多模态模型等）封装为标准化服务，用户
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- 实例化 OCR 对象的 predict() 方法介绍
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
NumPy：科学计算的超能引擎[特殊字符]（深入剖析+实战技巧）码海漫游者8 numpy 其他
文章目录为什么NumPy是Python科学计算的绝对核心？三维痛点直击ndarray：NumPy的核武器剖析内存布局揭秘（超级重要‼️）维度操作黑科技广播机制（Broadcasting）性能屠杀现场️高级技巧武装包️内存映射大文件爱因斯坦求和约定结构化数组真实世界应用场景图像处理机器学习数据预处理踩坑预警⚠️视图vs副本整数溢出性能压榨终极指南避免复制四法则终极加速方案你知道吗？就在你刷短视频的几
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc