开放知识图谱

图谱实战 | 蚂蚁集团大规模语义知识管理关键技术及实践

转载公众号 | DataFunTalk

导读自从2012年谷歌在搜索领域提出知识图谱的概念并应用之后，国内外科技公司在知识图谱领域争先布局。随着知识图谱在各个行业应用的逐渐落地，如何实现大规模语义知识的管理成为研究热点。今天和大家分享下蚂蚁知识图谱平台语义知识管理关键技术实现及应用，今天的介绍会主要分为4个部分：

全文目录：

1.蚂蚁知识图谱平台介绍

2.语义知识表示模型

3.语义知识管理关键技术及应用

4.展望

5.Q&A

分享嘉宾｜易鹏蚂蚁集团高级技术专家

编辑整理｜杨科

出品社区｜DataFun

蚂蚁金融知识图谱平台介绍

首先介绍知识图谱的发展和蚂蚁知识图谱平台的现状。

1.知识图谱的发展

根据《艾瑞咨询：2022年中国知识图谱行业研究报告》，2021年，知识图谱在国内的核心市场规模预计达到百亿元级别。到2026年，相应规模将超过296亿元，每年复合增长率超过20%。其中金融和公安两大行业的占比较高而且增长的速度更快一些。

在学术和产业界，自从2012年谷歌在搜索领域提出了知识图谱的概念并应用之后，随后的10年时间，国内外科技公司在知识图谱包括图数据库和图计算上都争先布局。从谷歌学术发表的知识图谱文章来看，最近5到10年时间，越来越多的技术人员投入到知识图谱领域研发中。

2. 蚂蚁知识图谱平台目标

蚂蚁知识图谱平台建设初期遇到了几个挑战：

大量复杂的跨业务域多元关系。在金融领域，面临的业务场景是多元化的，如支付、安全、保险、财富等。
多个不同职能的用户群体。面向不同职能的用户群体比较多，比如算法、运营、数据等。
分析/决策实时化要求。图谱的分析或者决策的实时性要求比较高。比如面向C端的保险理赔这些场景。
专家规则的复杂性。比如安全风控领域的专家规则就十分复杂。

蚂蚁知识图谱平台的目标就是建设面向金融领域的一站式知识研发和管理平台，提供面向业务的知识建模、知识构建、可视化分析、专家经验决策和图谱算法推理等全场景知识生命周期解决方案。

3. 蚂蚁金融知识图谱建设现状

经过4-5年时间的建设，蚂蚁金融知识图谱已经覆盖了整个金融领域的安全、消费金融、支付、保险、财富、网商、智能资金等很多场景，实体、概念、关系类型超过了5000，知识规模从最初的亿级别快速增长到万亿级别，知识应用调用量也已经超过了每天千亿级别。这也说明金融领域业务对知识图谱的应用需求越来越多。

语义知识表示模型

知识图谱作为一种语义网络，是大数据时代知识表示的重要方式之一。接下来我们首先介绍语义化的作用、知识的定义和分类以及语义知识表示等基本概念，并引出蚂蚁语义知识表示模型。

1.语义化的作用

语义化的概念，源于语义网络（Semantic Network），这个概念由奎林(J. R. Quillian)于1968年提出，是一种以网络格式表达人类知识构造的形式，使用语义和语义的关系表示知识的网络结构。语义网络图中，包含两种类型的知识。一种是人们总结的常识类知识。比如从猫到哺乳动物再到动物，它是一种概念的分类体系。另外一种是面向事实类的知识，比如不同猫的个体和人的个体之间的被饲养（has）的关系。

语义化的作用主要是两点，一是让数据表示标准化，实现数据的复用。二是不同领域的数据可交互，促进数据编织（Data Fabric）。例如一所医院和一个自然人，他们都有地理位置的信息，有可能是简称，也有可能是全称。要通过地理位置建立医院和自然人之间的联系，就要实现地址位置信息的表示标准化，之后才能实现其之间的关联。

2. 知识分类和定义

结合业务场景，我们把知识分成三种类型。

实体。比如用户、企业、商户等这些业务相关性比较强的客观存在的实例，它是一些个体。
概念。概念是对一类实体的抽象概述。比如人的个体，可以分成喜欢运动的，喜欢旅游的，等等，给一类人群贴上标签，就成为人群的概念。
事件。第三类是会动态发生变化的事件，它对实体类型加入了时间、空间等约束，比如企业的事件、诊疗的事件，或者交易的事件。

事件、实体及关系、概念构成的语义网络，相互之间会发生连接，整体构成了知识图谱的分类能力。

3. 语义知识表示- SPG(Semantic enhanced Property Graph)

语义知识表示，即知识建模，业界主要分为标记属性图（Labeled Property Graph）和资源描述框架（Resource Description Framework，RDF）两种主流的模型。两种模型各有优势。LPG基于点边属性实现知识表示，这种建模方式更贴近于图的数据结构表示，相对来说更清晰、更简单，建模成本更低。RDF采用三元组的表示方式，实体之间通过属性建立了丰富的连接，但RDF在工业界的落地相对差一些。

在知识图谱构建过程中，面临从业务数据到知识标准化的演化过程。因为在业务建设初期，很多属性的类型都是文本类型。随着概念网络的完善，这些文本类型需要不断地演化到标准类型，从而实现知识的复用，以及与更多其他领域的数据进行连接。

因此，我们提出了一种语义增强的属性图模型，它是结合了LPG和RDF优势的混合模型，更适合业务数据到知识标准化的演化过程。它提供业务易理解的表达，更利于知识复用，可规模化落地。

这种语义增强的属性图模型，有一些语义约束的范式。我们参考了OWL的表达方式，大概分成如下几类：

逻辑推演。包括symmetric（spouse），transitive（located_in）等。以可传递性为例，比如说某个人位于成都市，那他一定位于四川省。
数据完整性约束。包括mutexOf等。以互斥类型为例，如果两个人是兄弟关系，就一定不是父子关系。
属性类型约束。语义增强的属性图模型，它支持int、string这些基础属性类型，也支持City等标准类型。区别于String类型，标准类型可枚举，支持实体间可传播计算，基础类型演化到标准类型，即可实现属性图到语义图内置转换。
实体衍生/链指。包括subClassOf、equivalent、fuse等，主要是知识复用的约束范式。

语义知识管理关键技术及应用

接下来重点介绍语义知识管理的底层关键技术和在业务上的应用。

1.语义知识管理核心能力

语义知识管理的核心能力分成以下几个部分：

语义增强。主要是结合语义知识的表示，提供语义增强的能力。
知识演化。是实现业务数据到知识标准化的过程，包括图谱Schema及其绑定算子的增、删、改，比如把属性类型从string等基础类型变更为Brand等可枚举标准语义类型。
跨域融合。在金融业务场景通常会面临多领域的图谱构建，领域和领域之间的数据要互通，实现业务价值增益。
推理预构图。是在应用端通过分布式推理实现计算的加速。整个知识的管理，底层以语义图layout方式表示，上层对接图计算引擎提高推理的效率。
多场景构建。对于事件、概念、实体及关系，不同场景有不同更新频率，需要支持多种场景下实时和批量知识更新的需求。

2. 基于DFS的知识管理架构

我们整个知识图谱的知识管理架构分成两层，下层为存储层，基于DFS（分布式文件系统）实现全量知识的管理。上层为应用层，通过SDK对接到图数据库、图计算等引擎，支持知识服务、知识推理分析以及知识构建等应用。

这种架构的优势和特点为：

基于DFS的万亿级知识管理及演化。采用存算分离架构具有更好的扩展性和伸缩性，知识演化效率高，成本也比较低。
语义增强的属性图模型。底层支持RDF和属性图混合模型，实现了概念挂载、实体继承等语义图能力扩展。
零拷贝知识复用。底层根据不同的领域数据按照name space管理，实现了多租户数据的隔离管理，以及零拷贝的知识复用。
多引擎对接。上层通过多引擎对接，支持知识构建、分析和推理等不同的应用；通过预构图加速推理；支持流批知识增量更新等。

3. 语义知识生产及算子演化

下面介绍知识生产的过程。一般的，知识图谱的知识生产过程包括知识抽取、属性标准化、实体链指及融合等几个关键部分。语义知识生产链路提供的核心能力包括：

基于搜索（向量/文本/LBS索引等）实现大规模的实体链指和融合能力。这里面会用到向量、文本或者LBS的索引能力。举一个例子，线下支付场景一般存在一个商户有多个店铺、一店多码这种情况，识别商户同店，就需要用到向量或者LBS索引。
知识生产过程支持用户通过Python/Java SDK自助研发pipeline，并支持算子版本演化。比如事件抽取服务是通过Python SDK去调用NLP服务实现知识的抽取。
知识生产链路可适配到blink、spark等通用流批计算引擎，来支持多云部署。目前完成在蚂蚁内部blink适配，以及中信spark等私有云环境适配。

接下来以事理图谱构建为例，介绍语义知识生产过程。

4. 案例：事理图谱构建

首先我们从中国地震台网发布的一则地震新闻信息，通过NLP模型进行事件抽取，抽取得到地震事件发生的地理位置和时间等关键要素。通过属性的标准化，可以把地震事件的地理位置标准化，归属到相应的省市区，然后和中国行政区的标准概念网络进行关联。同时，这个事件也会归属到事件分类的概念网络里面，比如它属于这个地域的事件，或者是气象的事件。这样的好处就是通过这个地震事件，关联到周边的一些房地产企业，地震事件对它们的经营产生影响，从而有利于支撑我们对这些企业进行风险评估。

5. 语义增强模型实现

下面介绍如何基于hybrid layout实现语义增强模型。首先，底层有两种类型的layout，一种就是LPG，通过属性和图结构的表示方式实现。另一种是RDF，主要通过SPO三元组索引实现，这也是典型RDF存储的实现方案。其次，上层通过语义解释器和schema语义模型联动，把对图谱的读写流程转化为底层针对两种不同layout的读写IO。

6. 概念模型实现

概念模型是一个树状的分类分层体系，我们对概念树进行分层编码，形成概念词典。这样的好处是在概念改名时，只需要更新概念词典信息，而不需要更新索引或者关系的数据。因为和一般的概念关联的实体非常多，概念一变就涉及整个树的变更，变更量非常大，用概念词典就能很好的解决这个问题。

另外，属性的ID化能够让实体的属性连接到唯一的概念实例，通过构建RDF的SPO索引实现属性到实体到概念的正反向传播。这样的好处是减少了大量的概念到实体之间的物理边的维护成本。

7. 事件模型实现

事件模型的实现有两个比较关键的要求：一是事件具有时序特性，一般需要支持时间窗口查询表达，以及TTL版本控制能力。比如通过时间的分片，把所有数据按时间切割成不同的分片，从而提升构建或者推理的效率。

二是事件表达的是多元的关系，需要通过多要素索引支持事件与实体要素的传播计算。比如线下购买事件，通常会关联到一个用户、一个商品，也会关联到一个商店和它的地理位置信息。这和传统的pairwise二元关系还是有区别的。为了实现事件到实体要素之间的传播，我们需要构建它的多维索引，包括事件关联的实体要素索引，以及实体要素到事件的索引。

8. 基于事件模型构建资金图谱案例

接下来我们通过蚂蚁资金图谱的一个例子介绍如何通过事件模型构建图谱。蚂蚁资金图谱构建的背景是公安反诈。公安部门接到一笔资金报案之后，需要查看资金的流向，判断资金流向涉及的个人信息。资金溯源的过程牵扯到很多人工线下操作，查控操作繁琐，通常要耗费好几个小时，分析成本很高。我们提供了两个能力来解决这个问题。

一是通过事件模型把千亿级的资金交易事件，与交易发生的WIFI和地理位置等信息融合，来构建蚂蚁资金图谱，把交易事件、设备和时空的信息关联起来，更便于分析洗钱的账户及黑产信息，辅助公安部门侦查。

二是基于大规模资金交易事件进行资金的深度追踪，结合沉淀的大量资金事件专家规则，能够实时洞察每一笔资金的流向，提升案件侦查的效率。

资金图谱支持资金追踪的可视化分析、一键处理，大幅提升了侦查效率，目前在多个省市的几十家公安部门中试用，冻结折还的资金已经达到了数百万。

9. 分布式推理构图实现

分布式知识推理过程基于图计算引擎实现，整个推理的流程包括构图和图迭代两个部分。我们采用图表示的存储模型，能更高效对接GeaFlow等图计算引擎，实现无shuffle构图，提升推理效率。测试表明，我们现在的这种知识管理方案，比以前直接基于table的关系模型，实现了构图效率的大幅提升。后续我们也会和TuGraph团队合作，更好地实现引擎衔接，做到无序列化推理构图。另外我们也在探索局部性友好的知识编码，提升图迭代效率。

10. SPO索引：语义圈人

语义图推理一个比较重要的场景是语义圈人，特别是营销推荐。语义图推理本质上是一个子图匹配的过程，如图所示。比如我们圈选一些商家，通过品牌偏好、城市、职业和收入等级去圈选需要投放的营销用户群体。这可以转化为RDF SPO索引的join问题。面临的技术难点是，这个语意图热点问题非常突出。比如一个运动的品牌或者一个城市，它关联的用户和商家非常多。我们提出了两个解决方案。

一是在分布式的计算场景上实现subject分区优化，提升计算的局部性，减少消息的传递。二是在多条件情况下选择合适的join算法（如BinaryJoin、WCOJ等），优化dense/sparse下的搜索空间。

11. 知识复用-实体继承

实体继承是语义知识复用的一个非常典型的场景。在蚂蚁的内部场景中，我们的POI/AOI，支付宝用户等亿级别的实体复用，已经用到了实体继承。实体继承类似面向对象的继承概念，比如一个公司实体，它有一些通用属性。而在这个公司上面还有上市公司，上市公司会有市值等特有属性信息。实体继承就是要解决子父类属性的冗余和一致性问题，即通过一种方案，使得查询或者推理在获取子类属性的时候，能够动态拼接父类的属性。我们的解决方案首先是子类和父类实体的ID相同，各自属性保持独立更新和互为索引。然后在读取端通过语义解释器，生成readPlan，实现子父类实体的属性动态IO合并。

12. 知识复用-图谱融合

图谱融合是知识管理的一个难点，也是非常重要的业务场景。图谱融合简单来说就是把两个领域的图谱通过某种方式融合到一起，实现两个领域的图谱互通，解决数据孤岛问题。由于图本身的连通性，实现两个图谱融合，涉及的数据范围非常广，所以首先要解决数据冗余的问题。我们把图谱融合分成两个阶段，第一个阶段叫做链指，第二个阶段叫做归一。链指是指在两个不同的领域图谱里面选择一个锚点实体，通过链指算法建立这个锚点实体的关联。归一是指对这个锚点实体对应的子图信息进行合并的过程。

如果把归一的过程放在构建端，每一次锚点实体的更新，都会触发图数据的归并，这个成本非常高。因为一个点关联的周边关系或者一度子图，可能是非常庞大的。所以我们在构建融合实体的时候，都是把它作为一个虚拟的实体存在，仅存储链指的idmap和它的局部子图信息。更重要是融合算法或者规则发生更新的时候，链指关系的变化只会触发增量更新，更好地适应算法的迭代。

13. 蚂蚁图谱融合案例：金融消费

我们举一个金融消费的例子解释蚂蚁知识图谱的融合场景。在这个例子里，我们有两个不同领域的图谱，一个是用户消费侧的知识图谱，另一个是商家供给侧的知识图谱，两个都是数百亿的知识图谱。消费侧知识图谱关注消费的场景信息，供给侧知识图谱关注的是商家的品牌、类目、门店以及地理位置等信息。通过把用户或者商户作为锚点实体就可以建立两个图谱之间的零拷贝关联。商户作为消费金融产业链重要的一环，串联起了用户和消费场景。通过关联，这样围绕商户的关系就更加丰富，表征能力更强，提升了商户的画像刻画能力。

展望

我们对大规模语义知识管理的未来展望，一个是面向DataFabric的企业级知识管理平台，另一个是跨领域知识共享与应用。

1.面向DataFabric的企业级知识管理平台

我们的目标是建设面向DataFabric的企业级知识管理平台，主要方向包括：

知识图谱的数据管理平台，位于数据湖或者数据仓储之上，它可以集成并管理结构化、非结构化等多源数据。
通过语义增强模型实现数据到知识的约束和统一表示。同时，通过开放的API，支持不同的企业应用场景。
在知识管理过程中，需要遵循企业数据管理标准，实现血缘追踪、数据安全和质量保证等机制。

2. 跨领域知识共享与应用

我们的最终目标是实现跨领域的知识共享和应用，主要方向包括：

推进知识语义化、标准化，兼顾工业界落地和业务的理解成本。
在实现跨机构、跨主体的知识互联的时候，需要更多的考虑隐私计算。另外就是沉淀行业解决方案，辅助更多的机构应用知识图谱。
知识管理和大模型结合，例如利用高质量知识图谱，提升大模型在推理上准确率和专业性，增强大模型的在金融等特定领域的知识深度。

Q&A

Q1：知识管理平台底层有属性图和RDF图，两者是相对独立的存储，那他们是怎么融合的？在查询引擎上是用哪种方式融合的？

A：我们知识管理平台提供语义增强的图谱schema和底层仓储SDK，包括build、query、scan等构建和读取图谱的API或tool。这些API里面植入了一些语义和我们的语义模型去联动，通过语义解释器实现底层的RDF或者是LPG文件的读取IO。

上层和GeaFlow图计算引擎衔接，它调用query或scan等SDK实现对图谱语义数据的加载，这些SDK的输出会转换成图计算引擎能识别的属性图。

Q2：归一的结果是将不同领域的同一实体在融合图中形成了同一个主键吗？

A：归一是将两个实体的图结构合并为一个实体图结构的过程，包括属性和关系的合并和冲突解决。两个图结构分别维护不同领域的数据，最后在应用的时候，用户看到的是一个新的实体类型，我们把它叫做融合实体，融合实体在读取时按需做图结构合并，解决了存储冗余的问题。

Q3：知识管理平台融合了很多的引擎，比如GeaFlow、GeaBase、Flink等，现在有没有一种语言能把它们都包装起来，实际使用的时候的入口是同一个？

A：现在整个应用端分成两部分，一个叫做构建侧或者叫生产侧，另一个叫做推理侧或者服务侧。在服务侧，现在正在推进的就是通过接口统一去表达。在生产侧，因为知识的构建是一个并行计算场景，不一定是图计算场景，它通过一个流水线SDK去表示。这个流水线SDK会植入一些算子或者组件，比如我们刚才提到的实体链指组件，然后通过执行计划的翻译，适配运行在Flink或spark等不同计算引擎上。

今天的分享就到这里，谢谢大家。

分享嘉宾

INTRODUCTION

易鹏

蚂蚁集团

高级技术专家

11年毕业于西安交通大学，计算机硕士，现任蚂蚁集团高级技术专家，负责蚂蚁知识图谱的构建引擎团队。之前在百度担任搜索资深研发工程师，经历了搜索数据架构的规模化和实时化演进，18年加入蚂蚁，从0到1构建了万亿级金融知识图谱的数据管理平台。

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
读书笔记五 ---大数据之路--数仓分层 qq_38215991 big data 大数据
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据（进行了数据清洗）,包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。（原始数据
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
使用LangGraph迁移MapReduceDocumentsChain进行长文档的摘要 dgay_hua python
在大数据处理和文本分析领域，MapReduce是一种非常重要的策略，用于处理和分析大型数据集。具体到文本处理方面，MapReduceDocumentsChain구현了一种map-reduce策略，可以有效地处理长文本。本文将介绍如何从MapReduceDocumentsChain迁移到LangGraph，并探讨LangGraph在流处理、检查点恢复等方面的优势。技术背景介绍MapReduceDoc
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
Python用Bokeh处理大规模数据可视化的最佳实践一键难忘 Bokeh python 开发语言
用Bokeh处理大规模数据可视化的最佳实践在大规模数据处理和分析中，数据可视化是一个至关重要的环节。Bokeh是一个在Python生态中广泛使用的交互式数据可视化库，它具有强大的可扩展性和灵活性。本文将介绍如何使用Bokeh处理大规模数据可视化，并提供一些最佳实践和代码实例，帮助你高效地展示大数据集中的重要信息。1.为什么选择Bokeh？Bokeh是一个专为浏览器呈现而设计的可视化库，它支持高效渲
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
分页优化之——游标分页 PhilipJ0303 Java面试 java 数据库优化游标分页分页查询
游标分页（Cursor-basedPagination）是一种高效的分页方式，特别适用于大数据集和无限滚动的场景。与传统的基于页码的分页（如page=1&size=10）不同，游标分页通过一个唯一的游标（通常是时间戳或唯一ID）来标记分页的位置，避免了传统分页在数据变动时的重复或遗漏问题。以下是游标分页在前后端的实现方式：1.游标分页的核心概念游标（Cursor）：游标是一个唯一标识符，通常是数据
轻松入门Apache SeaTunnel：数据集成利器窝窝和牛牛 SeaTunnel ETL 数据集成
文章目录轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnel基本原理运行流程SeaTunnelvsDataX：两大数据集成工具对比实战场景：MySQL数据同步至ElasticsearchSeaTunnel实现方案DataX实现方案实现原理对比底层依赖环境方案优缺点分析快速上手环境准备简单示例总结轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnelAp
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
探索数据安全新境界：Apache Spark SQL Ranger Security插件深度揭秘乌昱有Melanie
探索数据安全新境界：ApacheSparkSQLRangerSecurity插件深度揭秘项目地址:https://gitcode.com/gh_mirrors/sp/spark-ranger随着大数据的爆炸性增长，数据安全性成为了企业不可忽视的核心议题。在这一背景下，【ApacheSparkSQLRangerSecurityPlugin】以其强大的数据访问控制能力脱颖而出，成为数据处理领域的明星级
Java 大视界 -- Java 大数据在智能医疗远程会诊与专家协作中的技术支持（146）青云交大数据新视界 Java 大视界 java 大数据智能医疗远程会诊专家协作数据安全病例诊断
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
深入探讨盘古大模型的高精度多尺度能力 Hardess-god WRF 人工智能算法
随着人工智能技术的快速发展，大模型的研究逐渐进入新的阶段。其中，盘古大模型以其卓越的高精度和多尺度处理能力成为研究热点。本文将详细分析盘古模型在高精度多尺度问题上的技术特征、优势和应用潜力，并探讨其深入研究的方向。一、盘古模型概述盘古模型是华为推出的中文预训练大模型系列，拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础，通过海量文本数据进行训练，表现出优异的自然语言理解和生成能
AI巨浪中的安全之舵：天空卫士助力人工智能落地远航天空卫士人工智能安全数据安全网络安全大数据
"AI时代的安全战场，不在云端在本地；数据治理的胜负手，不在防御在认知。"近期，众多企业纷纷接入DeepSeek大模型，迅速推动了大型模型应用的广泛铺开。无论是在制造业、金融业，还是在医疗、教育等领域，DeepSeek大模型的应用都如火如荼，遍地开花，展现出了其广泛的应用前景和巨大的商业价值。顺势而来的是DeepSeek一体机以"低成本、高算力、私有化部署"的优势席卷企业市场。因为DeepSeek
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

图谱实战 | 蚂蚁集团大规模语义知识管理关键技术及实践

你可能感兴趣的:(人工智能,大数据)