数据派THU

比利时皇家科学院院士Luc De Raedt：从统计关系人工智能到神经符号计算

来源：AI科技评论

本文约5600字，建议阅读10分钟 
本文介绍了比利时皇家科学院院士在AAAI Fellow Luc De Raedt做了主题为《从统计关系人工智能到神经符号计算》的报告。

近年来，以神经网络为代表的机器学习技术和知识表征、符号推理技术的结合受到了越来越多研究者的关注。曾经，人们通过「数据驱动 vs 知识驱动」、「符号 vs 子符号」、「求解器 vs 学习器」等概念来区分学习和推理。如今，人们更常用「系统 1」和「系统 2」来代表能够迅速思考的系统和较慢推理的系统。

图 1：学习与推理

在2021年中国人工智能大会上，比利时皇家科学院院士,鲁汶大学计算机科学院教授,人工智能研究所主任,IJCAI-22程序委员会主席，AAAI Fellow Luc De Raedt做了主题为《从统计关系人工智能到神经符号计算》的报告。

Luc De Raedt 的研究领域包括人工智能、机器学习和数据挖掘及其应用。他以其在学习和推理领域的贡献而闻名，特别是对统计关系学习、概率和归纳编程的贡献。

他近期在研究下一代编程语言（可以自动从数据中学习），结合概率和逻辑推理和学习，研究（数据）科学的自动化，以及验证学习人工智能系统和机器人技术。他还专注于将概率逻辑与神经网络相结合，并希望将其应用于强化学习和程序归纳。

Luc De Raedt 的许多学生都获得了重要奖项，其中Guy Van den Broeck 是 2019 年 IJCAI 计算机与思想奖的获得者，该奖是人工智能领域 35 岁以下研究人员的最高奖项。

以下为演讲全文，我们进行了不改变原意的整理。

1 系统 1 与系统 2

系统 1 看到一张图片就可以直接识别其中包含的人或物体。当我们面对一个复杂的问题（例如，数学问题或规划任务），就需要经过多步推理才能得出结论，此时就要用到较慢的系统 2。

图 2：生活中的学习与推理

我们在生活中也需要将学习和推理结合起来。在驾照考试中，我们需要将感知和推理相结合才能回答图 2 中的问题。首先，我们需要识别出场景中的车辆和交通信号。接着，我们需要基于这些观察结果进行推理，推理时会考虑到交通规则。通常情况下，交通规则可以表示为一些逻辑规则。除了回答这些问题，我们在考驾照时还需要判断图中那辆车应该先通过，而自动驾驶汽车也需要具备这种能力。

图 3：融合学习与推理

就系统 1 而言，神经网络是如今最主要的学习范式，它在计算机视觉、语音识别、自然语言处理等感知任务中十分有效。就系统 2 而言，在较慢地推理和思考时，同样也有两种主要的范式：逻辑和概率。在过去的 20 年间，该领域的研究被称为「统计关系学习」（StarAI）或「概率编程」。如今，我们希望将神经网络和统计关系学习结合的基本范式起来。

2 神经符号计算

图 4：统计关系学习和神经符号计算的相似之处

有关「如何将逻辑和神经网络结合起来」的研究被称为「神经符号计算」。我们在统计关系学习和神经符号计算领域中遇到的一些问题是相似的，因此统计关系学习领域的一些解决方案也很有可能适用于神经符号计算。

图 5：神经符号计算最新进展

目前大多数最先进的神经符号计算方法都会将逻辑和知识嵌入到神经网络中，然后由神经网络完成接下来的工作。然而，这样做的弊端在于，它并不依赖于逻辑和神经网络中任何一项技术，丧失了纯粹的逻辑推理所具备的能力（可解释性和可信计算）。

图 6：融合方法

因此，我们需要提出不同的方法来结合逻辑和神经网络——DeepProbLogic。Luc De Raedt 教授认为，逻辑、神经网络都是这种新的神经符号方法的特例。

3 StarAI 与 NeSy 类似的解决方案

图 7：逻辑、图模型、神经符号模型

统计关系学习和神经符号计算都涉及到系统 1 和系统 2。其中，一种系统是有向的、另一种是无向的；一种系统是基于证明的、另一种是基于模型的。这种差异存在于逻辑、图模型，以及神经符号模型中。

图 8：逻辑编程——事实

图 8 展示了一个编程语言 Prolog 实现的命题逻辑程序。橙色方框中有一些事实，例如，发生了入室盗窃、Mary 听到了警报、发生了地震、John 听到了警报。

图 9：逻辑编程——命题

接下来，在基于规则的系统中，橙色方框中的部分表示：如果响起了警报，且 Mary 听到了警报，那么 Mary 就会呼救。如果我们通过 Prolog 或逻辑编程建立了知识库，就可以通过它来判断某个命题的真假。逻辑也有理论模型，在 SAT 求解器中，我们可以将一些逻辑作为约束。

图 10：两种概率图模型和统计关系学习系统

图 10 展示了两种概率图模型和统计关系学习系统。在马尔科夫逻辑和概率软逻辑等系统中，逻辑经常被用作约束，这些系统可以被表示为无向图模型。而贝叶斯网络等有向图模型的思路则与概率逻辑编程十分相近，我们在这里将重点介绍 ProbLog。

图 11：两种神经符号系统

类似地，在神经符号系统中，我们可以将逻辑作为一种神经程序，这与贝叶斯网络等有向的统计关系学习方法和逻辑编程相类似；此外，我们还可以将逻辑作为正则化项，这与马尔科夫网络等无向的统计关系学习方法和软约束相类似。一些神经符号计算系统会进行基于知识的模型构建，其中逻辑将被用作模板。

4 神经编程逻辑

图 11：将逻辑作为一种神经程序

在神经编程逻辑中，我们首先将逻辑程序编码到神经网络中。上世纪 90 年代中期，Towell 和 Shavlik 等人提出了 KBANN 方法，首次融合了逻辑和神经网络。他们首先得到了命题 Prolog 程序，然后以此为依据得到了一些证明结构，形成了具有合取、析取关系的证明树。得到的证明树可以作为神经网络的基础结构。

图 12：神经理论证明器

得到了神经网络的结构后，他们会为网络的输入、边添加权重，并使用传统的训练机制来学习。这种有向的神经编程方法取得了很好的效果，至今仍十分流行。《Lifted Relational Neural Networks》、《Neural Theorem Prover》等论文都使用了这种方法。

在 NeurIPS 2017 上发表的论文《Neural Theorem Prover》中，作者并没有使用命题逻辑，而是使用 ProLog 构建了神经证明器，推导出了神经网络的架构，并将其用作计算图。在这种情况下，逻辑被编码到神经网络中，从而丧失了纯粹的逻辑推理能力。

5 将逻辑作为约束/正则化项

图 13：逻辑约束

在一个多分类任务中，神经网络需要预测出样本从属于某一个特定类型。因此，预测的结果需要满足如图 x 右侧所示的约束。基于类似的思想，我们可以得到更复杂的逻辑表示，也可以实现更有趣的应用。

图 14：逻辑约束——软概率

在具体的实现过程中，作者计算了满足上述条件的软概率，并将其作为一种语义损失函数，用来惩罚不满足约束的神经网络预测结果。

图 15：逻辑正则化项

作者将这种语义损失函数与传统的损失函数相加，从而引入约束。当预测结果满足约束的程度越高时，语义损失越小。这种将逻辑作为约束的方法在「逻辑张量网络」和「基于语义的正则化」等神经符号计算系统中十分流行。

图 16：逻辑、概率、模糊逻辑

由于逻辑以数字和权重的形式被编码到了神经网络中，我们也试图研究这些数字究竟有什么意义。受统计关系学习的启发，我们至少可以从逻辑、概率、模糊逻辑三个层面上探究该问题。

图 17：逻辑、概率、模糊逻辑举例

具体而言，Dai 等人在 NeurIPS 2019 上提出了纯逻辑的神经符号计算方法，但该方法试图仅仅针对网络中纯逻辑的方法优化神经网络，导致优化十分困难。

我们还可以使用统计关系学习中概率图模型的工具来实现神经符号计算，例如：算术环路和知识补全。然而，概率方法的弊端在于其运算速度较慢。

因此，有些研究人员试图通过模糊逻辑实现神经符号计算，将逻辑运算转化为神经网络。通常而言，这种方法的优化速度较快。但是模糊逻辑的效果并不完全等同于纯逻辑方法，有一些在纯逻辑中成立的结论在模糊逻辑中不一定成立。

图 18：马尔科夫逻辑

如前文所述，我们可以通过语义损失函数，将逻辑转化为概率化的约束，为可能出现的事实赋予概率。在马尔科夫逻辑中，我们为约束赋予权重，权重越高的约束越重要。

图 19：概率软逻辑

为了解决概率软约束方法的一些弊端，人们提出了其模糊逻辑变体。该方法目前成为了神经符号计算领域的主流方法，代表性的工作包括「Logic Tensor Networks」、「Semantic based Regularization」、「Lifted Relation Neural Networks」等，这些模型更加关注效率而不是底层的概率的语义。该方法使用的语法与概率软约束类似，但优化速度大幅提升。其弊端在于，一些纯逻辑、软约束方法下成立的结论在此不一定成立，可能会出现一些意想不到的情况，难以解释语义。

6 DeepProbLog

图 20：DeepProbLog

为了同时兼具神经网络和逻辑推理的优势，Luc 教授坚信真正实现神经符号计算的方法需要能将逻辑和神经网络囊括为其特例。为此，我们需要在逻辑和神经网络之间构建一个信息能够双向流通的接口——DeepProbLog。

图 21：DeepProbLog 与 NeSy

DeepProbLog 是 ProbLog 的深度学习拓展版本，相较于其它的神经符号计算方法，其优势在于它能够同时保留底层的概率框架、逻辑框架、神经网络框架的完整的表达能力。因此，逻辑和神经网络都是 DeepProbLog 的特例。从语义的层面上说，DeepProbLog 继承了 ProbLog 的语义。

7 从 Prolog 到 ProbLog

图 22：概率逻辑编程

在命题逻辑中，我们会用到一些事实和规则，并以此证明一些结论。为了将概率引入该框架，将逻辑和概率统一，我们首先需要统一二者的底层概念，即「命题」和「随机变量」。我们以此为依据构建逻辑和概率之间的接口，将概率化的事实转化为 ProbLog 的命题逻辑，通过规则根据这些概率化的事实推导出概率分布。同时，我们还可以计算出一些证明的概率。

图 23：概率逻辑编程——语义

如图 23 所示，在概率逻辑程序中，「地震」的概率为 1。以此为根节点，我们构造出了一棵生成树，树上的节点为可能发生的事件及其为真概率，将每一条路径上节点的概率相乘就可以得到一系列事件同时为真的概率。

图 24：概率逻辑编程——贝叶斯网络

研究人员注意到，ProbLog 程序和贝叶斯网络等有向图模型之间有很紧密的联系，同时 ProbLog 的表达能力要强于贝叶斯网络。首先，ProbLog 是一种编程语言，它是 Prolog 的扩展。其次，它兼具统计关系学习和概率化数据库的优点。

图 25：概率逻辑编程举例

在如图 25 所示的例子中，左侧的方框代表学生，右侧的方框代表课程，二者交叉的部分代表学生的成绩。我们可以根据相关的规则，基于学生的智力和课程的难度，对学生的课程成绩进行关系推理。在这里，概率之间是互斥的。我们还可以通过逻辑和 ProbLog 将该方法扩展到本体知识上。

图 26：ProbLog 示例

通过上述方式，我们可以对任意数量的本体进行抽象，并捕获它们之间的关系。输入学生和课程的信息，我们就可以得到如图 26 右下角所示的贝叶斯网络，将学生的表现、课程组合等信息组织到一个复杂的模型中。

8 ProbLog 的推理

图 27：ProbLog 推理

使用 ProbLog 进行推理往往包含以下四个步骤：（1）将查询中的变量替换为相应的常量，得到对应的程序（2）将程序改写为命题逻辑公式（3）将命题逻辑公式编译为算术环路（4）对算术环路进行估计。

ProbLog 可以被应用于游戏等动态网络中。在游戏的每一个状态下，场景中都会出现大量的目标和实体。我们可以通过统计关系学习的方式对其建模，从而预测世界将会如何变化。ProbLog 推理还可以被用于行为识别，对包含的物体进行推理和跟踪。在机器人领域，ProbLog 可以被用于通过关系学习物体的功能可见性，进而规划行为。在生物学领域，我们使用 ProbLog 解释分子结构。通常而言，分子结构是一个非常大的交互网络，ProbLog 可以推理出导致出现某种现象的子网络。

9 从 ProbLog 到 DeepProbLog

图 28：神经谓词

同样，如果我们想要统一逻辑和神经网络，就需要统一底层的基本概念。「谓词」是一阶逻辑的基本概念之一。为了构建逻辑和神经网络之间的接口，我们试图使用「神经谓词」。

图 29：神经谓词举例——MNIST

以 MNIST 手写数字分类为例，神经网络的输入为一张图像，输出为各个数字的概率分布，我们将这一过程表示为神经谓词。

图 30：MNIST addition

如图 30 右侧所示，在更为复杂的任务中，我们向 DeepProbLog 指定加法的规则，前两个 MNIST 数字的和为第三个数字。当我们得到两张 MNIST 图像和对应的和之后，可以更准确地推理出 MNIST 数字的类别，这相当于施加了一种约束。

以往，要想通过传统的 CNN 实现两个 MNIST 数字的加法，我们需要将两个数字拼接起来，并进行分类。这样的收敛速度比使用 DeepProbLog 要慢得多。然而，如果我们要计算一连串 MNIST 数字的加法，就很难使用传统的 CNN 实现。因此，我们的网络还需要学会将 MNIST 数字映射为数值。

10 推理与学习

图 31：梯度半环

以加法为例，在推理和学习的过程中，我们首先需要将加法转化为环路中的各个节点，叶子节点为神经谓词。神经谓词下方是识别图像的神经网络。这些神经谓词就是神经网络和符号计算之间的接口。在计算梯度时，我们从最上方的加法节点开始使用交叉熵计算损失，通过随机梯度下降等方法传播误差。

11 实验评估

图 32：实验评估——程序归纳

符号计算系统经常被用于归纳规则。在该任务中，人们通常会使用模板，使用具体的谓词替换其中的谓词变量。任务的目标在于找到正确的谓词，使规则成立。显然，这里的搜索空间十分巨大，学习十分困难。神经符号方法会赋予每条规则一定的权重，从而进行学习。具体而言，作者在排序、加法、单词代数问题这三个任务上测试了程序归纳方法。此外，DeepProbLog 还可以被用于数据中带噪声的加法，我们可以学习出噪声出现的概率。在扑克游戏等场景下，我们可以通过 DeepProbLog 处理不确定性问题，预测获胜的概率。

12 软统一

图 33：软统一

神经理论证明器（NTP）使用神经网络的嵌入进行软统一，例如：「grandpa」和「grandfather」是同义词，则计算出的二者统一的概率很高。

图 34：MNIST 中的嵌入

我们可以通过 DeepProbLog 实现软统一谓词，以 MNIST 为例，我们首先将 MNIST 图像映射到参数上并进行嵌入。接着，我们通过径向基函数计算两个嵌入的距离。与 TransE 的想法类似，我们还可以将一些具体的操作、关系嵌入到计算图中。

图 35：CLUTRR 数据集

我们也在 CLUTRR 数据集上测试了这种思想。CLUTRR 是一个被神经符号方法广为使用的数据集，其任务为根据给定的句子预测家庭成员之间的关系。通过使用 DeepProbLog，我们可以显式地给出家庭关系的规则。

13 未来的挑战

图 36：未来的挑战

未来，DeepProbLog 等神经符号方法需要扩展其规模，不仅仅局限于推理环节。研究人员目前正试图通过一些近似方法来提升这类模型的规模和速度。此外，神经符号方法还应该被应用于更多的真实应用场景。

14 结语

在本次演讲中 Luc De Raedt 院士从两个方面介绍了将统计关系学习和神经符号计算融合在一起的思路。

图 37：StarAI 与 NeSy 共享研究问题和解决方案

首先，统计关系学习和神经符号计算有许多共同的研究问题，因而也拥有共同的设计空间和解决方案，例如：有向图与无向图，基于逻辑的方法与基于概率的方法，纯逻辑与模糊逻辑。因此，研究神经符号计算可以借鉴许多统计关系学习研究的思路。

图 38：构建神经网络和符号计算之间的接口层

其次，Luc De Raedt 教授试图构建一种新的神经符号计算方法，而不仅仅是直接将逻辑和知识嵌入到神经网络中。Luc 教授倡导在神经网络和符号计算之间构建一个接口层。这种接口并不是简单的流水线，而是双向的信息通道。

编辑：王菁

校对：林亦霖

回归任务训练--MNIST全连接神经网络（Mnist_NN）豆芽819 深度学习框架PyTorch pytorch 深度学习人工智能机器学习回归
importtorchimportnumpyasnpimportloggingfromtorch.utils.dataimportTensorDataset,DataLoaderfromtorch.utils.dataimportDataLoader#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname
LLM-Agent方法评估与效果分析 agent人工智能ai开发
1.引言近年来，随着大型语言模型（LLM）的快速发展，基于强化学习（RL）对LLM进行微调以使其具备代理（Agent）能力成为研究热点。从基础的单智能体强化学习算法（如PPO）到多智能体协作、语料重组以及在线自学习等新技术不断涌现，研究人员致力于探索如何提高LLM在实际应用中的决策能力、推理能力和任务执行效率。本文主要聚焦于当前LLM-Agent方法的检索与评估，旨在全面探讨各类方法的技术实现、实
人工智能和云计算带来的技术变革：工业自动化的新趋势 AI天才研究院 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能（AI）和云计算技术的发展，我们正面临着一场巨大的技术变革。这些技术正在改变我们的生活方式、工作方式和社会结构。在工业自动化领域，人工智能和云计算技术正在为我们提供新的可能性和挑战。本文将探讨这些技术如何影响工业自动化，以及未来的发展趋势和挑战。1.1人工智能的基本概念人工智能（ArtificialIntelligence，AI）是一种试图使计算机具有人类智能的技术。AI的
《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造” 耘瞳科技科技
在江宁开发区，机器人已不再是科幻电影里的遥远想象，他们就像人类的“同事”，在工地上忙着贴砖、刷墙、搬运、检测；在体育训练场上帮助运动员矫正姿势；在医院里帮助医生发现帕金森早期征兆，在智慧工厂里与人类分工协作……作为南京市机器人产业“一核多翼”布局的“核”，江宁开发区当前聚集人工智能产业核心及上下游关联企业超百家。近日，《南京日报》走访了多家链条上的“明星企业”，耘瞳科技作为中国领先的智能检测与测量
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
双一流软件工程大二听闻 Java 前景堪忧，是否该转C++或人工智能或者读研？程序员yt java c++人工智能
今天给大家分享的是一位粉丝的提问，双一流软件工程大二听闻Java前景堪忧，是否该转C++或人工智能或者读研？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：yt老师好，我是双一流软件工程的大二学生，一直在学习java方向，目前掌握了数据库，spring框架等内容，大一暑假在老家一个小公司找了段实习，有蓝桥杯java组b组国一，专业排名前2（保研名
【架构设计】前置知识 GIS程序媛—椰子架构设计架构设计
架构设计是软件开发的进阶技能，需要结合理论知识和实践经验。以下是掌握架构设计所需的前置知识及其重要性，以及学习路径建议：一、基础编程能力1.编程语言与核心概念掌握至少一门主流语言（如Java、Python、C#、Go等），理解其语法、特性及生态。核心概念：面向对象（OOP）、函数式编程（FP）、并发/异步、内存管理等。示例：通过Java理解接口、多态、设计模式。通过Go学习并发模型（Gorouti
编程行业必备！12个热门AI工具帮你写代码~ DevSecOps选型指南人工智能软件供应链安全工具代码安全开发助手 SAST 安全
到今年，AI编程工具的发展已经非常成熟了，它们可以极大地提高开发效率，帮助程序员解决复杂问题，并优化代码质量。拒绝废话，今天给大家推荐12款AI编程工具！1悬镜安全灵脉AI开发安全卫士灵脉AI开发安全卫士是基于多模智能引擎的新一代静态代码安全扫描产品，通过自动化审查流程来定位潜在缺陷、提升审计效率和代码质量，并显著减少手动审查所需的时间和精力。该平台利用人工智能技术，提供逐行的代码反馈，建议改进和
算法刷题记录——LeetCode篇(1) [第1~100题](持续更新) Allen Wurlitzer 实战-算法解题算法 leetcode 职场和发展
更新时间：2025-03-21LeetCode刷题目录：算法刷题记录——专题目录汇总技术博客总目录：计算机技术系列博客——目录页优先整理热门100及面试150，不定期持续更新，欢迎关注！1.两数之和给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以
python接口自动化全世界最帅的男人 python 自动化开发语言
Python是一种非常流行的编程语言，也是许多接口自动化测试框架的首选语言。下面是一个简单的接口自动化测试框架的思路：1.安装必要的库和工具：在Python中，我们可以使用requests库来发送HTTP请求，使用unittest库来编写测试用例，使用HTMLTestRunner库来生成测试报告。此外，我们还需要安装一个代码编辑器，如PyCharm或VSCode。2.创建测试用例：编写测试用例是接
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
集成学习（上）：Bagging集成方法万事可爱^ 机器学习修仙之旅 #监督学习集成学习机器学习人工智能 Bagging 随机森林
一、什么是集成学习？在机器学习的世界里，没有哪个模型是完美无缺的。就像古希腊神话中的"盲人摸象"，单个模型往往只能捕捉到数据特征的某个侧面。但当我们把多个模型的智慧集合起来，就能像拼图一样还原出完整的真相，接下来我们就来介绍一种“拼图”算法——集成学习。集成学习是一种机器学习技术，它通过组合多个模型（通常称为“弱学习器”或“基础模型”）的预测结果，构建出更强、更准确的学习算法。这种方法的主要思想是
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
Redis 哨兵模式的选举算法是什么？少林码僧 redis sentinel
Redis哨兵模式中的选举算法主要用于在主节点出现故障时，从多个Sentinel节点中选出一个领导者（Leader）来执行故障转移操作。Redis哨兵的选举算法基于Raft算法的简化版本，但不完全等同于标准的Raft算法。以下是其主要过程：一、发现主节点故障当一个Sentinel节点主观地认为主节点不可达时（通常是在一定时间内没有收到主节点的PING回复），它会将主节点标记为主观下线（Subjec
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
Kafka 的消息压缩机制：优化存储与传输的利器阿贾克斯的黎明 java linq c#java
目录Kafka的消息压缩机制：优化存储与传输的利器一、消息压缩机制的重要意义1.减少存储成本2.提升网络传输效率二、Kafka常用的消息压缩算法1.GZIP压缩2.Snappy压缩3.前端展示压缩状态（Vue3+TS）在消息中间件的大家族中，Kafka以其卓越的性能而备受瞩目。其中，Kafka的消息压缩机制是一项非常重要的特性，它就像是一个高效的“压缩包”，在不损失数据内容的前提下，有效减少数据的
关于AI OS那点事大囚长科普天地大模型人工智能
AIOS（人工智能操作系统）作为面向智能时代的操作系统，其功能定位和架构设计与传统操作系统（如Linux、Windows、iOS等）存在显著差异。一、AIOS需具备的核心功能智能体全生命周期管理智能体调度与并发：需支持多智能体任务的优先级排序、资源分配及并发执行，例如通过轮询调度或动态优先级算法优化LLM资源利用率。上下文感知与切换：通过上下文管理器实现智能体交互状态的快照保存与恢复，解决LLM生
贪心算法之分发饼干努力小子 #刷题（简单难度）#贪心算法
假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值gi，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸sj。如果sj>=gi，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。注意：你可以假设胃口值为正。一个小朋友最多只能拥有一块饼干。示例1:输入:[1
JAVA刷Leecode-贪心算法-分配问题-分发饼干搬砖的水鱼 leetcode 算法 java python leetcode 贪心算法
JAVA刷Leecode-贪心算法算法思想分配问题-分发饼干（135，hard)算法思想采用贪心的策略，保证每次操作都是局部最优解，从而最终的结果是全局最优。贪心算法不是对所有问题都能得到整体最优解，选择的贪心策略必须具有无后效性，即某个状态以前的过程不会影响以后的状态，只和当前的状态相关。包括分配问题（455，135）和区间问题（435）；练习：605，452，763，122，406。分配问题-
【贪心算法】1、分发饼干念奕玥【Java】数据结构与算法 java leetcode 贪心算法
贪心算法或贪心思想采用贪心的策略，保证每次操作都是局部最优的，从而使最后得到的结果是全局最优的。可用于解决分配问题e.g.leetcode455分发饼干解题思路：目标：尽可能满足越多数量的孩子。根据目标，可以容易想到，先去满足胃口值小的孩子。为了尽量使饼干可以满足更多的孩子，所以要把饼干尺寸大于等于孩子胃口值的饼干中挑尺寸最小的饼干给孩子。满足了这个孩子之后，再采取同样的策略去考虑剩下的孩子，直到
C++有哪些高级特性值得学习？ c++
C++是一种功能丰富且复杂的编程语言，其中许多高级特性可以帮助开发者编写更高效、更安全、更灵活的代码。以下是一些值得深入学习的C++高级特性：模板编程（Templates）模板是C++中实现泛型编程的核心机制，允许开发者编写与数据类型无关的代码。模板函数cpp复制templateTmax(Ta,Tb){return(a>b)?a:b;}优点：模板函数可以处理多种数据类型，避免了代码重复。应用场景：
流浪地球 - 华为OD机试真题(E卷、C++) 什码情况华为od c++算法数据结构面试机试
针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。有兴趣的同学可以扫码添加我们的微信（code5bug）了解，免费试课一下。题目描述流浪地球计划在赤道上均匀部署了N个转向发动机，按位置顺序编号为0~N。1).初始状态下所有的发动机都是未启动状态;2).发动机启动的方式分为”手动启动”和”关联启动”两种方式;3).如果在时刻1一个发动机被启动，下一个时刻
鸿蒙开发：ArkTs字符串string
前言本文代码案例基于Api13。字符串在实际的开发中还是非常重要的，牵扯到的用法也是比较多的，比如字符串中的查找，替换，切割等等。字符串（String）是由零个或多个字符组成的有限序列，在计算机编程和数据处理中广泛使用。字符串可以包含字母、数字、标点符号、空格，甚至可以是空字符串（即不包含任何字符的字符串）。字符串是文本信息的基本表示形式，在几乎所有编程语言中都有专门的字符串数据类型或类来处理它们
基于 Redis 的分布式锁实现与优化 Blossom.118 分布式系统与高性能计算领域 redis 分布式数据库 python3.11 算法数据结构推荐算法
在分布式系统中，锁机制是保障数据一致性和并发控制的关键技术之一。Redis作为一种高性能的内存数据库，常被用于实现分布式锁。本文将详细介绍基于Redis的分布式锁的实现原理、代码示例以及优化策略，帮助读者更好地理解和应用这一技术。一、分布式锁的概念与需求在单机系统中，锁的实现相对简单，可以通过操作系统的同步机制或编程语言提供的锁机制来完成。然而，在分布式系统中，多个进程或线程可能运行在不同的机器上
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
Yolo系列之Yolo的基本理解是十一月末 YOLO python 开发语言 yolo
YOLO的基本理解目录YOLO的基本理解1YOLO1.1概念1.2算法2单、多阶段对比2.1FLOPs和FPS2.2one-stage单阶段2.3two-stage两阶段1YOLO1.1概念YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位
贪心算法-455分发饼干工大一只猿贪心算法算法
classSolution{public:intfindContentChildren(vector&g,vector&s){sort(g.begin(),g.end());sort(s.begin(),s.end());intcount=0;inti=g.size()-1;intj=s.size()-1;for(i;i>=0;i--){if(j>=0&&s[j]>=g[i]){j--;count
455. 分发饼干（贪心算法）穿过漫长林径 LeetCode
455.分发饼干题目描述：有一群孩子和一堆饼干，每个孩子有一个饥饿度，每个饼干都有一个大小。每个孩子只能吃一个饼干，且只有饼干的大小不小于孩子的饥饿度时，这个孩子才能吃饱。求解最多有多少孩子可以吃饱。示例1:输入:g=[1,2,3],s=[1,1]输出:1解释:你有三个孩子和两块小饼干，3个孩子的胃口值分别是：1,2,3。虽然你有两块小饼干，由于他们的尺寸都是1，你只能让胃口值是1的孩子满足。所以
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

比利时皇家科学院院士Luc De Raedt：从统计关系人工智能到神经符号计算

你可能感兴趣的:(神经网络,人工智能,大数据,算法,编程语言)