开放知识图谱

图谱实战 | 基于金融场景的事理图谱构建与应用

分享嘉宾：肖楠京东科技算法专家

编辑整理：付村云融创新

出品平台：DataFunTalk

导读：今天分享京东科技近期在事理图谱构建和应用方面的研究成果，主要分为以下五个部分：

京东科技图谱简介
金融事理图谱构建
因果关系抽取技术
事理对齐技术
事理图谱在金融领域的应用

京东科技图谱简介

1. 京东科技知识图谱能力全景图

京东科技的知识图谱能力由五个部分构成，包括：多源异构数据、基础技术、核心能力、图谱平台、图谱应用。

其中，多源异构数据包括结构化数据、半结构化数据和非结构化数据。基础技术覆盖了NLP以及知识图谱等各领域的技术。核心能力概括为信息抽取技术、文本解析技术以及图存储和图可视化技术等。图谱平台产品的应用领域覆盖了金融领域、电商领域、医疗领域，支持了京东科技、京东商城、京东健康等模块的核心业务。除此之外，在搜索推荐、资管科技、智能客服及采销等场景都有很好的落地。今天的分享主要聚焦在金融图谱。

2. 京东科技知识图谱全景图

上图为金融图谱的全景图。

数据层面

主要包含企业工商数据、研报、新闻和公告。研报分为上市公司研报、行业研报、期货研报和基金研报；公告分为上市公司公告、发债主体公告和基金公告；新闻分为行业新闻和金融新闻。从数据可信度和数据质量来看，企业工商数据、研报、公告的数据比较可靠，由于所在网站规范性、新闻发布时间和撰写人员等原因，新闻的可信度相对较低。所以，新闻数据在数据获取后录入图时，我们会进行机器校验和人工校验。

金融图谱

实体主要包括公司、人员、产品和指标；关系主要包括供应链、供应商、子公司、参股、客户、董监高、业务、指标八类关系；节点共计2亿多。金融图谱构建时，主要使用NER、关系抽取、实体抽取、指标抽取等几个核心模型。

事理图谱

共有100万多节点，覆盖了45个产业链的行业知识，主要应用事件抽取、事理抽取、事理对齐、论元抽取四类模型进行构建。其中，事理抽取和事理对齐是本次分享的核心内容。

金融事理图谱构建

1. 事理图谱简介

在金融领域，文本中存在大量的金融行业知识，有效的获取和使用这些知识可以极大提升AI能力在金融领域的应用，且具有极大的商业价值。

① 事理图谱定义

事理图谱是由事理节点和因果关系组成的有向图。事理节点有别于知识图谱，一般是由短语或一组语义实体构成，事理可以认为是对事件的抽象归纳，它将事件映射为网络（见上图右的演示）。

② 事理和事件的区别

先来看个例子，这是一个产品发布的事件：“西部时间9月12日上午10点，苹果发布Apple TV在史蒂夫.乔布斯剧院”，事件抽取包括触发词的发现和事件元素的发现，事件元素包括：发布方、发布时间、发布地点、被发布的产品。

从上述例子可以发现，对于不同的事件，需要用不同的事件schema来描述，因为数据标注成本巨大，即便已经定义了84类事件，但仍然无法扩展至覆盖整个行业。我们引入了事理基于语义的schema，它可以用简单的表述方式或用统一的schema来表述事理，这种方式降低了事理表述的难度。

③ 事理的获取流程

上图中右半部分，展示了事理获取的整个流程：首先将文本进行结构化，构建成事件网络，在网络中找到核心的事件节点，进行抽象归纳，映射成抽象的事理节点。

2. 事理图谱构建示例

事理图谱的构建主要分为因果关系抽取、论元抽取、事理对齐三个部分。下面以石油产业链的为例，来说明如何获取一条事理。

原句：由于国际上的原油市场需求下降，10月原油价格大幅下滑，导致石油开采、石油加工产业价格回落。

① 因果关系抽取

原句蕴含着一个事理，它由两个因果关系组成，通过因果关系抽取，得到了两条因果对，结果见上图表格所示。

这两组因果关系中，蕴含了石油产业的行业知识，展示了石油上游原料价格与下游产业价格的传导关系。

② 论元抽取

将因果对分别按照主体、谓词、及对主体的修饰词进行论元元素抽取，将上述的因果对解析为结构化信息，如上图所示。

③ 事理对齐

将事件映射成对齐事理，进一步得到石油产业链知识，如上图所示。这条知识经过机器校验和人工校验，录入到事理图谱中，可以应用到推理、价格定价等方面。

这个例子展示了知识抽取的过程，是通过路径搜索进行知识推理的一种形式。拓展了图中的因果知识，用路径的结构加以实现。接下来将三个步骤分别展开介绍。

因果关系抽取技术

1. 因果关系抽取概述

① 因果关系抽取的挑战

因果关系抽取的问题和挑战主要有：

因果关系存在显示和隐式两种，隐式关系抽取难度大。
因果词不只是因果连词，还有其他多种可能，比如助词、介词、形容词、名次等，这增加了因果识别的难度。
因果对存在嵌套情况。

下面举例解释以上挑战难点（可参照上图右半部分）：

隐式因果关系：“俄乌战争爆发，石油价格上涨。”
动词为因果词：“俄乌战争带动石油价格上涨。”
非因果句，导致误抽取（这种样本进入到模型中，会降低模型效果）： “俄乌战争爆发，石油交易仍然正常进行。”

② 因果关系抽取 vs SPO抽取

相同点：二者都是三元组抽取任务；三元组出现在句中的情况相同。

不同点：SPO由实体组成，因果关系由短语或短句组成；因果抽取分为隐式关系和显示关系，而SPO抽取不做任何区分，在实际应用中，以SPO抽取大部分是显性。

③ 因果关系抽取类型

因果关系抽取大致分为三类：单句单组因果；单句多组因果关系且因果元素不重合；单句多组因果关系且且因果元素嵌套。相关示例见上图右下部分。

2. 因果关系抽取模型

因果抽取模型借鉴了事件抽取模型，事件抽取模型是由触发词和事件元素组成，用这种方法解决了前面提到的问题与挑战。大量实验证明使用文本处理隐式关系存在许多误抽取，接下来的模型建设暂时不考虑隐式关系的处理。

上图右侧展示了因果抽取模型的整体框架。模型分为两个任务：

预测因果连接词；
预测因果连接词对应的原因和结果。原因和结果不是唯一的，原因可以多组，结果也可以多组。

重点介绍模型中京东科技进行的两处优化：

我们设计了新的任务来提升预训练的表示。首先预测一个句子是否是因果句，判断后得到的embedding作为下游任务的补充。通过这种训练方式，可以对整个训练任务提升1个点至2个点。
我们使用了GCN编码代替传统的CN编码等方式。之所以选择GCN编码是因为GCN对句子特征的传导和过滤有更好的效果。使用GCN编码，构建图时，我们尝试了多种方式，比如句法遗存、TFIDF、词频等，实验对比发现句法遗存的效果最好，针对句法遗存产生的噪声，我们在GCN编码矩阵的每一条边上设置门控机制，通过门控机制判断该条边是否起作用。使用GCN编码进行事件抽取，可以对整个训练任务提升5个点。

总结起来，通过设置了联合抽取任务解决了因果关系抽取问题，主要用于显示的因果抽取。

事理对齐技术

1. 论元抽取定义

① 语义角色标注

语义角色标注是浅层的语义分析技术，以句子为单位，分析句子的谓词和论元结构。语义角色框架主要有PropBank-style annotation、FrameNet-style annotation、NomBank三个，其中使用最多的是PropBank-style annotation，它常用的数据集是Propbank、Chinest Proposition Bank、CoNLL三个。

京东科技主要使用的是Chinest Proposition Bank，它分为三个主要成分：Predict，谓词作为整个句子的核心词；Core Argument，核心论元是围绕着谓词的主体、客体或间接宾语，主要修饰谓词；Semantic Adjuncts，对谓词、核心元素的补充，比如时间、地点、目的、原因等。

② 论元的定义

论元为语义角色标注中的标签
论元抽取任务实际是语义角色标注任务

我们在使用论元时，参考的是CPB框架，并在此基础上进行了修改。SRL将相同语义不同表达的句子转为统一表达形式，在论元抽取中有重要作用。

2. 论元抽取方案

① 方案选择

我们做事理对齐时，考虑了两种方案：

一是用文本相似度的方法，因为事理是图结构的，但抽取的因果对大部分是短语，经过实验发现效果并不是特别好，原因在于短文本的特征比较有限。

所以提出了第二种方法：文本和图相结合来做映射的方法，也就是将短语和事理分别展示成子图的方式，进一步对节点进行如引入概念、词表等的再处理，提升实体携带的信息量和表征纬度。从图的结构层面，采用图谱对齐的方案，把潜在的子图进行对齐。

两种方法对比，方案二的效果较好。把短文本相似计算的问题转换为图谱对齐任务。首先是丰富了输入特征，引入了图的结构信息，丰富了实体的信息，运用知识库对实体进行了扩充。其次是处理对齐的方法，使用图结构的对齐，这相对于文本计算有明显优势。

② 对齐任务

上图右边三个方框中，左边两个是抽取的待对齐的因果对，右边是事理图谱中的一个事理。经过论元抽取处理，将短语结构化为子图，以左边上图为例进行解读：根节点是下降，下降的主体是需求，需求的范围描述——国际上，其他描述——原油市场，下图及事理图可以用同样方法解读。

接下来进行对齐和映射。上面子图的“国际上”节点是不需要的，将其排除在外，“下降”和“下滑”对齐，“需求”和“需求”对齐，“原油市场”和“原油”对齐，见图中黄色虚线示意。下面子图同样，排除“2008年”节点，“暴跌”和“下滑”对齐（通过同义词或概念词的方法进行的对齐），“需求”和“需求”对齐，“原油”和“原油”对齐，见图中绿色虚线示意。

对齐任务的核心思想是将短文本转换成图的信息。

③ 论元元素介绍

论元的元素

与语义角色标注部分CPB相同，这里不再展开。

非核心语义角色

原本语义角色很复杂，可以处理复杂句或多句的关系，经过很多实验，我们选择只保留了9类关系，因为在事理中这9类已经可以描述出事物的发展情况。

第一类是ArgM-Loc，描述物理空间元素。

第二类是ArgM-Sco，认知或概念的范围空间。

第三类是ArgM-Time，时间元素。

第四类是ArgM-Tool，工具元素，一般由“用”整个词引出。

第五类是ArgM-Mnr，事件的方式、方法。

第六类是ArgM-Reas，缘由元素。

第五类是ArgM-Purpose，目的元素。

第五类是ArgM-Polarity，极性元素，表示否定意义的词。

第五类是ArgM-Tense，时态元素，包括过去、现在和未来时。

3. 论元抽取方法

论元抽取应用的是关系抽取的框架，主要分为Pipeline版本和联合抽取版本两种。

① Pipeline版本

该版本是论元实体和语义关系抽取独立进行。

优势介绍

（a）便于针对各自任务的问题设计模型，没有共享编码的限制。

（b）减少因下游任务不一致导致的预训练模型的性能损失。

（c）显式的将上游任务的记过作为标记，用于提升下游任务的效果。

通用方法介绍

（a）实体论元发现，采用Spild结构，对所有的窗口进行扫描，是牺牲算力提升模型精度的一种方式。

（b）关系发现，对关系进行两两全匹配，并进行关系的预测。

② 联合抽取版本

将两个任务结合在一起，使用共享编码，是多任务的训练。在应用中需要根据任务难度、数据量不匹配程度等影响迭代收敛效果的内容调整多任务的执行策略。

方法介绍

（a）标注框架，将关系和实体设计成统一的标注框架，它的局限是单个词只能打一个标签，对于嵌套问题比较局限。

（b）联合编码，将句子长度*句子长度作为一个向量，把所有情况进行建模，建模中会将所有的关系和实体在句子特征中进行表征。在基本保证模型效果的情况下，降低运算强度。

总结起来，论元抽取时，需要根据句子的情况选择不同的方案。

4. 事理对齐

考虑到数据计算量大小，将事理对齐分三步进行。

首先，基于规则进行初步召回，一般是数据量大于10（50左右）时应用，主要使用规则、词匹配进行召回。

第二步，基于文本的粗排，主要使用文本相似度计算的方法进行再召回，目标是将候选集降低到10个以内。

最后，使用图谱对齐的精排模型，对5个元素以内的每个节点进行计算，得到相似度，进一步进行排序。

5. 事理精排模型

事理精排模型，主要使用了因果句和事理子图中句子的文本信息以及子图中每个节点临近节点的信息。

将图中的每个节点用Bert进行编码，形成关于一度节点的关系矩阵和文本特征向量。通过操作算子将关系矩阵中可能有用的特征抽取出来，经过MLP网络计算损失。

该模型在公司实体链接中应用过，效果也非常不错。

6. 事理对齐总结

事理对齐模型的核心思想是引入图结构，用论元的方法将短文本任务转为图结构，通过图的方式进行事理对齐。

事理图谱在金融领域的应用

1. 应用概述

① 金融领域数据的特点

渠道来源多（新闻、财报、研报）、信息庞杂。
企业、人员、产品等关系负责、数据量大。
具有一定专业性，数据标注成本高。

② 事理图谱的价值

通过路径搜索丰富推理知识，可以为舆情系统提供多维度的连接关系。
通过产业知识的构建，可以为智能投研系统自动发现投资逻辑。
通过事理链接和因果分析，可以为金融预测模型提供丰富的潜在特征，场景例如价格预测等。

2. 事理图谱在智慧研报的应用

应用事理图谱，对一份研报的资讯内容进行正负面的抽取、事件的抽取、事理方面会做延伸文章的推导，从而进行一度或二度关系文章的推荐。

3. 事理图谱在行业龙头推荐的应用

通过产业链图谱和事理图谱的方式，根据每个节点的出度、入度对公司的权重进行计算。因为政策的传导对产业链龙头影响很大，事理图谱在其中的作用便是增加行业在计算中的权重信息，提高龙头推荐的精度。

总结与展望

1. 总结

事理对齐同样可运用到短文本理解场景

这是因为事理对齐主要将短文本信息用图的方式进行对齐，在图中的每个节点上引入了更多信息。

事理图谱增强知识图谱的认知能力，存储事物规律
事理图谱提升新闻舆情场景、定价场景、智能投研场景的智能程度

2. 展望

探索隐式因果关系的处理

本文介绍的因果关系抽取和事理对齐技术主要是针对显式因果关系的处理，关于隐式关系的探索不足，也造成了一定程度的知识缺失。

事理知识大规模自动发现

从量级看，目前的数据量100万左右，节点有两亿多，随着数据的积累和收集，数据量会更大。

增加事理表征难度

目前的事理大部分以论元表示，在实际中（尤其投资决策方面），有时精准度会稍显不足。比如有些因果关系的成立是有因果前提的，现在大部分是对核心元素的谓词关系建模，有些信息（比如条件等）未引入进来，造成表征不够丰富。

Q&A

Q：带条件的事理如何表达？

A：首先，可以在论元角色上进行更多建模，但是条件不是简单的一个词或短语，它还可能是更复杂的一种表达，有时条件本身就构成了一个图，造成构建时的复杂度大大提升，不能通过简单再引入一套条件的schema解决。比如白条、金条还款时，都是在固定的条件下发生的，这时会发现条件相对复杂，没办法简单具化为一个schema。

建议具体处理时，先控制范围，可以先从简单（条件也是分为几个层次的）的入手，比如时间、地域等条件的表达，其他复杂结构的条件处理优先级排后。

Q：论元抽取时的人工校验工作，大概占多大比重？

A：需要根据具体的业务场景决定需要投入的人力，比如舆情场景，人工校验采用抽查的方式即可；在数据或数据运算场景，需要全量校验。

Q：金融事理图谱方案是否可以迁移到其他领域（比如娱乐等）应用？如果可以，有哪些注意事项？

A：事理图谱的方案是通用的，它的实现只跟数据源有关，论元、抽取和领域无关，在各领域具有通用性。

分享嘉宾：

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
2014-2023年各区县数字普惠金融指数数据 -夜深- 数据区县区县数字普惠金融指数
2014-2023年各区县数字普惠金融指数数据1、时间：2014-2023年2、来源：北大数字普惠金融指数3、范围：2800个县4、指标：综合指数、覆盖广度、使用深度、支付业务、保险业务、货币基金业务、投资业务、信用业务、信贷业务、数字化程度5、参考文献：郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征6、下载链接：2014-2023年各区县数字普惠金融指数数据
小白学AI量化：DeepSeek+Python构建强大的金融数据挖掘与多维分析机器人老余捞鱼 AI顾投高级策略 AI探讨与学习人工智能 python 金融 deepseek
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：在机构主导的量化交易时代，普通投资者如何用一杯奶茶的钱（15元/天）打造专业级智能量化产品？本文将为您揭秘一个革命性的解决方案——基于国产大模型DeepSeek和Python构建的智能数据挖掘分析机器人。它不仅适用于通用网页数据抓取，更能深度应用于金融领域，精准捕捉市场信号。本文“干货”很多，请务必耐心读完。一、颠覆认知的性价比革命1.
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
高频交易：当速度与智慧在金融市场中“飙车”（策略＋算法）西蒙斯.果 python numpy pandas
高频交易：当速度与智慧在金融市场中“飙车”高频交易（High-FrequencyTrading,HFT）就像金融市场的“闪电侠”，利用强大的计算机和复杂的算法，在毫秒甚至微秒内完成交易。它的目标是抓住市场中的微小机会，赚取“快钱”。以下是对高频交易策略和算法的详细介绍，带点幽默感，让你在了解金融科技的同时也能会心一笑。---一、高频交易策略：金融市场的“快闪族”1\.做市策略：买卖价差的“中间商”
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
区块链在医疗数据共享中的应用：解锁安全与透明的新维度 Echo_Wish 人工智能前沿技术区块链安全
区块链在医疗数据共享中的应用：解锁安全与透明的新维度近年来，区块链技术在金融领域取得了显著的突破，然而，它的潜力不仅仅局限于数字货币和支付领域。随着医疗数据的数字化和信息化程度不断提升，区块链技术在医疗数据共享中的应用正逐渐成为一个热门话题。区块链以其去中心化、不可篡改、透明且高效的特点，为医疗行业的数据管理提供了全新的解决方案，尤其是在患者隐私保护、数据共享以及医疗服务的透明度方面。那么，区块链
大佬都在用的桑基图到底怎么做？告诉你个最简单的方法永洪科技 python
桑基图，即桑基能量分流图，也叫桑基能量平衡图。因1898年MatthewHenryPhineasRiallSankey绘制的“蒸汽机的能源效率图”而闻名，此后便以其名字命名为“桑基图”。桑基图常被用于能源损耗情况、材料成分分析、金融数据可视化；追踪用户状态；追踪跑票、变动、迁移；追踪人口流动情况等等业务场景，表现分配、归类、变化、流动情况。桑基图好在哪？它是一种特定类型的流图，图中延伸的分支的宽度
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
软件架构设计关键点：平衡高可用、性能、扩展性及成本的系统化实践 yinhezhanshen 程序人生系统架构
在数字化转型的浪潮中，软件系统已成为企业运营的核心支撑。从电商平台的秒杀活动到金融系统的实时交易，从物联网设备的百万级连接到政务服务的全天候响应，软件架构的设计质量直接决定了系统能否在复杂环境中稳定运行。本文将从高可用性、高性能、可扩展性、安全性、成本控制、规模承载和弹性伸缩七个维度，剖析现代软件架构设计的核心要点。一、高可用性：构建业务连续性的基石‌冗余设计‌：采用主从复制、多活数据中心架构（如
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
Oracle证书靠谱吗？值得考吗？噗老师 Oracle认证 oracle 数据库
Oracle认证在数据库管理领域享有极高的声誉和价值，是许多专业人士职业生涯中的重要里程碑。那么，Oracle认证是否值得投入时间和精力去考取呢？这个问题的答案很大程度上取决于你的职业规划、个人兴趣和对未来的展望。首先，Oracle认证的价值还体现在其广泛的行业需求上。在金融、医疗、政府等多个行业中，对数据库管理和分析的依赖性日益增加，这导致了对Oracle专业人才的巨大需求。Oracle数据库在
Oracle OCP认证是否值得考？博睿谷IT99_ 数据库 oracle 开闭原则数据库
OracleOCP（OracleCertifiedProfessional）认证是数据库领域的传统权威认证，但随着云数据库和开源技术的崛起，其价值正面临分化。是否值得考取，需结合你的职业定位、行业需求及长期规划综合判断。以下是关键分析：一、什么情况下值得考？1.职业定位明确：扎根传统数据库领域适用人群：从事金融、电信、能源等传统行业的DBA（数据库管理员）；需维护Oracle旧版本（如11g/12
知识图谱系列文章——文物知识图谱 weixin_43407382 知识图谱
文章介绍背景1、文物可以提供创意，如哥窑面饰的照相机2、目前文物数字化工作非常少，没有纳入设计元素3、文物知识图谱建成后具有很多好处&#￥方法一、本体构建1、明确领域和目的——文物知识图谱&设计创意2、领域信息采集与分析——文物信息，３４０件文物实例，3、定义文物本体概念和结构层次4、定义概念属性和属性约束5、本体编码（建模语言和工具）6、本体评估——Jena的内嵌推理机，基于描述的逻辑7、本体实
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

图谱实战 | 基于金融场景的事理图谱构建与应用

你可能感兴趣的:(金融,知识图谱,人工智能)