weixin_39943750

实体对齐算法_知识图谱中的实体对齐方法及装置与流程

本发明涉及计算机领域，具体而言，涉及一种知识图谱中的实体对齐方法及装置。

背景技术：

在构建大规模知识库的任务中，需要处理大量来自多源知识库的实体数据。在构建知识库之初，首先需建立一个知识描述体系，然后向体系中挂载实体数据.由于不同知识库的信息来源不同，以及人工定义及校对的差异，语义上相同的实体在不同的知识库中会有不同的表现形式。具有相同条目名称的实体也许表示着语义上的同一事物，也许表示着两种事物。

在现有的实际运作过程中，主要通过两种方法进行实体融合：

1)传统实体对齐

传统的实体对齐方法主要通过属性相似度匹配的方式实现，利用有监督学习的机器学习模型，如：决策树、支持向量机、集成学习等。依赖实体的属性信息，通过属性相似度，进行跨平台实体对齐关系的推断。由于属性的类别不同，需要设计不同的属性相似度计算函数，且不同的领域需要设计不同的属性相似度函数。但是该对齐方式，存在以下缺点：a)耗费人力；b)难以在多领域间迁移；c)由于属性的表达是离散的，这种计算方式忽略了属性的语义相似度，限制了实体对齐的效果。

2)基于知识表示学习

通过将知识图谱中的实体和关系都映射低维空间向量，直接用数学表达式来计算各个实体之间相似度，例如transe方法等。

知识表示学习是使用建模的方法，将知识图谱中的实体和关系表示成为低维的向量，然后对其进行计算和推理。transe是最早的知识表示学习模型。它将每个三元组关系(h，r，t)表示成从头实体h到尾实体r的向量。transe希望三元组尾实体t应该尽量接近于头实体h与关系r的和，即h+r＝t.transe定义损失函数:‖h+r－t‖l1/l2，并在模型中使用随机梯度下降的方法对参数进行更新。传统训练知识库中三元组建模的方法参数过多，导致模型太复杂难以解释，并且需要很大的计算代价，很容易出现过拟合或欠拟合问题。而transe作为一种将实体与关系嵌入到低维向量空间中的简单模型，弥补了传统方法训练复杂、参数过多的缺点。虽然transe模型在大规模数据集上取得了很好的效果，但其只能针对一对一关系进行计算，而无法对一对多、多对一、多对多的复杂关系进行计算。因此，出现了很多对transe进行改进的模型，如transh、transr、transsparce、transa、htransa、ptranse等。与transe模型相比，这些新的trans系列模型能够计算知识库中更加复杂的实体关系建模，如一对多、多对一、多对多的关系。如transh、transr和transsparce模型都是将头实体h和尾实体t投射到另一个超平面上；transa和htransa则使用局部特征自适应的方式得到最优损失函数，无须事先指定参数的封闭候选值集合；ptranse是一种基于路径分布表示的方法，将实体、关系以及路径都在低维的向量空间中表示。

上述实体对齐关系推断方法均为单网络关系推断算法，近年来开始有基于知识表示学习的跨网络关系推断算法。但是，如果将知识表示学习算法直接应用到实体对齐任务中，采用多网络联合表示学习，并不能取得令人满意的效果。因为实体对齐是一种特殊的跨网络关系，需要分析并依据实体对齐关系的特点，设计面向实体对齐的联合表示学习模型。因此，目前已经有方法采用知识表示学习的方法进行实体对齐工作，并取得了较好的效果，如cross-kg和seea。其中cross-kg首次提出对两个知识图谱进行联合学习，这样能够利用两个数据源的互补信息进行关系推断。但该方式，存在以下缺点：a)仅仅通过知识表示学习建模语义信息，忽略了知识图谱的结构化属性信息；b)基于知识表示学习的方法依赖大量标注数据；c)未利用知识图谱中属性等结构化信息，限制了实体对齐的效果。

针对相关技术中的上述问题，目前尚未存在有效的解决方案。

技术实现要素：

本发明实施例提供了一种知识图谱中的实体对齐方法及装置，以至少解决相关技术中基于知识表示学习的方法依赖大量标注数据实体对齐不佳的问题。

根据本发明的一个实施例，提供了一种知识图谱中的实体对齐方法，包括：从多个平台中获取多个实体作为实体训练集；根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，所述特征用于指示多个实体中同一类可用信息之间的相似度；根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义。

根据本发明的另一个实施例，提供了一种知识图谱中的实体对齐装置，包括：获取模块，用于从多个平台中获取多个实体作为实体训练集；生成模块，用于根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，所述特征用于指示多个实体中同一类可用信息之间的相似度；对齐模块，用于根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义。

根据本发明的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明，从多个平台中获取多个实体作为实体训练集，并根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，所述特征用于指示多个实体中同一类可用信息之间的相似度，进而根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义，实现了挖掘不同结构化知识库中实体间的连接关系，以面向知识库内部实体间的语义消歧，解决了相关技术中基于知识表示学习的方法依赖大量标注数据实体对齐不佳的问题，提高了实体对齐的效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种知识图谱中的实体对齐方法的终端的硬件结构框图；

图2是根据本发明实施例的知识图谱中的实体对齐方法的流程图；

图3是根据本发明实施例的知识图谱中的实体对齐装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

首先对本申请中涉及到的术语进行解释；

知识图谱，知识图谱是由以下方式构成的三元组:kg＝(e，r，f)，其中e＝{e1，e2，…，ene}代表实体集合，包括实例及其属性的取值；r＝{r1，r2，…，rnr}代表二元关系集合，用来描述实体与实体间的关系；代表事实三元组集合。

知识图谱实体对齐：给定两个知识图谱kg1，kg2，分别找出知识图谱kg1(或kg2)中的能对齐到kg2(或kg1)中的所有实体。即:alignentity(kg1，kg2)＝{(e，e′)|e∈e1，e′∈e2}。

半监督协同训练的实体对齐方法框架：半监督学习算法主要包含模型训练和训练样本，更新这2个关键部分。

其中，训练过程为训练：集中的每个标注实体对生成特征，用于模型的学习；样本更新过程中，利用学习得到的模型预测未标注实体对是否同义，并将分类置信度高的实体对及其预测标签加入到训练集中。半监督学习迭代地执行这2个过程直到满足停止条件，如达到最大迭代次数或未标注数据集为空。

协同训练是半监督方法的一种，其核心思想是：在模型的训练阶段将特征空间划分为相对独立的2部分(视图)，并分别在2个视图上训练分类模型；在样本更新过程中，分别将每个模型分类结果中置信度高的样本加入到另一个模型的训练样本集。

实施例1

本申请实施例一所提供的方法实施例可以在终端、计算机终端或者类似的运算装置中执行。以运行在终端上为例，图1是本发明实施例的一种知识图谱中的实体对齐方法的终端的硬件结构框图。如图1所示，终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104，可选地，上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述终端的结构造成限定。例如，终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的知识图谱中的实体对齐方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括终端10的通信供应商提供的无线网络。在一个实例中，传输设备106包括一个网络适配器(networkinterfacecontroller，简称为nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备106可以为射频(radiofrequency，简称为rf)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于上述终端的知识图谱中的实体对齐方法，图2是根据本发明实施例的知识图谱中的实体对齐方法的流程图，如图2所示，该流程包括如下步骤：

步骤s202，从多个平台中获取多个实体作为实体训练集；

步骤s204，根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，所述特征用于指示多个实体中同一类可用信息之间的相似度；

步骤s206，根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义。

通过上述步骤s202至步骤s206，从多个平台中获取多个实体作为实体训练集，并根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，所述特征用于指示多个实体中同一类可用信息之间的相似度，进而根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义，实现了挖掘不同结构化知识库中实体间的连接关系，以面向知识库内部实体间的语义消歧，解决了相关技术中基于知识表示学习的方法依赖大量标注数据实体对齐不佳的问题，提高了实体对齐的效果。

可选地，本实施例中的步骤s202中涉及到的从多个平台中获取多个实体作为实体训练集的方式，包括：

步骤s202-11，对多个平台的多个实体的可用信息进行提取，其中，所述可用信息至少包括以下之一：实体名、实体所包含的文本、关键离散值、实体属性；

步骤s202-12，将提取过可用信息的实体作为所述实体训练集中的实体。

可选地，本实施例的中步骤s204中涉及到的根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征的方式包括：

步骤s204-11，确定多个实体的所述实体名之间的相似度；或，确定多个实体的实体所包含的文本中的标题、正文以及属性组合之后每种组合中2段文本之间的相似度；或，确定多个实体的关键离散值集合中2关键离散值之间的相似度；或，确定多个实体的属性提取2维特征，并确定2实体属性的相似度；

步骤s204-12，将所述相似度作为用于进行协同训练的特征。

可选地，本实施例中步骤s206中涉及到的额根据所述特征对基于协同训练的模型进行训练的方式，可以包括：

步骤s206-11，将所述特征分为文本视图和关键离散值视图，其中，实体名和实体所包含的文本的划分到所述文本视图中；属性与关键离散值划分到所述关键离散值视图中；

步骤s206-12，基于文本视图和关键离散值视图对基于协同训练的模型进行训练。

需要说明的是，本实施例中的模型可选为二分类器。

下面结合本实施例的可选实施方式对本申请进行举例说明；

本文提出了一种基于半监督协同训练的实体对齐方法，将实体对齐建模为一个带约束的二分类问题，充分利用实体名、属性、博客文字内容及其中的时间、数值等关键信息，组合生成多维特征；将特征划分为2个相对独立的视图，通过2个视图上分类器的协同训练，迭代地从未标注数据中学习同义实体的分布情况。

为了实现上述目的，本可选实施方式的方法步骤：

步骤s11，对2个平台进行数据预处理，包括实体信息抽取、属性值规范化、文本中时间值与数值的抽取与规范化等。

步骤s12，基于倒排索引生成同义实体候选集。

步骤s13，综合利用各类型信息为候选实体对生成特征表示。

步骤s14，训练基于协同训练的二分类器并使用学习到的模型判别候选实体对是否同义。

对于上述步骤s11至步骤s14具体实施方式按照如下步骤依次进行：

1.数据预处理

1)特征抽取

以实体为微博账户为例，在微博账户数据中，每个微博用户通常代表一个实体，因此实体的可用信息主要包括实体名称、属性、微博文章文本以及各部分的时间值、数值、超链接等关键离散值。

其中，实体名称是实体的重要标识符，仅仅通过名称的匹配可以获得较高的基准结果，但无法很好地解决名称中的同义与多义问题。属性是实体的部分基本信息的结构化描述，通常可从微博账户信息中抽取。微博文章文本是对实体的具体说明，通常包括标题和正文2部分。最后，各文本中出现的时间、数值以及超链接等在识别实体是否同义时具有较高的区分度，称之关键离散值，可以通过正则匹配方法完成时间值与数值的抽取，并进行时间表述以及数值单位的规范化。

2)特征工程

从实体名、微博文本、关键离散值和属性等4类信息中生成特征，用于后续的模型训练。

与实体名相关的特征共2维，包括：候选实体对的名称是否严格匹配，以及名称间的相似性；其中，可以使用编辑距离计算相似性。

每一个实体的博客文本包括：标题、正文以及属性文本3类，对这3类文本进行完全组合并计算每种组合中2段文本的相似性，得到9维特征。其中的相似度采用传统的余弦相似度进行计算。

关键离散值来源于不同的描述文本，因而对于每种类型的关键值，也需要基于各部分内容的组合生成特征，于每部分文本中的离散值构成集合，故计算2关键离散值集合，s1和s2之间的相似性作为一个特征。

最后，从结构化属性中提取2维特征，分别度量2实体的属性相似性和不相似性作为一个特征。

2.学习过程

1)特征空间的视图划分

将所提取的特征分为文本视图和关键离散值视图，其中实体名和描述文本方面的特征在形式和计算方法上属于文本范畴，将这2部分特征划分到文本视图；属性与关键离散值的特征则被统一划分到关键离散值视图中。

2)协同训练过程

给定2个待对齐的知识库d1和d2，以及标注实体对集合l＝{〈ei，ej〉，label|ei∈d1，ej∈d2，label∈{0，1}}，以及未标注实体对u＝{〈ei，ej〉|ei∈d1，ej∈ec}，其中，ec为ei在d2中的候选同义实体集合，可利用倒排索引通过检索获得，则基于协同训练的实体对齐方法如下所示。

基于协同训练的实体对齐算法：

输入:u，l，最大迭代次数nmax，迭代中每次向训练集中添加的正样本数npos，添加的正负样本比r

输出:二分类器f1(文本视图上)，二分类器f2(关键离散值视图上)初始化:训练集l1＝l，l2＝l，迭代次数niter＝0；

1)用训练集l1在文本视图上训练分类器f1，用训练集l2在关键离散值视图上训练分类器f2。

2)利用f1，f2分别对u中的实体对进行分类。

3)取u中f1，f2分类标签一致的实体对构成集合s，从s中选择f1(f2)分类置信度最高的npos个正样本及置信度最高的npos/r个负样本添加到l2(l1)中，并将所选样本从u中去除。

4)niter＝niter+1，若niter＜nmax且u非空，则迭代1-3，否则停止迭代。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种知识图谱中的实体对齐装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明实施例的知识图谱中的实体对齐装置的结构框图，如图3所示，该装置包括：获取模块32，用于从多个平台中获取多个实体作为实体训练集；生成模块34，用于根据与实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，特征用于指示多个实体中同一类可用信息之间的相似度；对齐模块36，用于根据特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义。

可选地，本实施例中的获取模块32还可以包括：提取单元，用于对多个平台的多个实体的可用信息进行提取，其中，可用信息至少包括以下之一：实体名、实体所包含的文本、关键离散值、实体属性；第一处理单元，用于将提取过可用信息的实体作为实体训练集中的实体。

可选地，本实施例中的生成模块34包括：确定单元，用于确定多个实体的实体名之间的相似度；或，确定多个实体的实体所包含的文本中的标题、正文以及属性组合之后每种组合中2段文本之间的相似度；或，确定多个实体的关键离散值集合中2关键离散值之间的相似度；或，确定多个实体的属性提取2维特征，并确定2实体属性的相似度；第二处理单元，用于将相似度作为用于进行协同训练的特征。

可选地，本实施例中的对齐模块36包括：划分单元，用于将特征分为文本视图和关键离散值视图，其中，实体名和实体所包含的文本的划分到文本视图中；属性与关键离散值划分到关键离散值视图中；训练单元，用于基于文本视图和关键离散值视图对基于协同训练的模型进行训练。

可选地，本实施例中的模型为二分类器。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

s1，从多个平台中获取多个实体作为实体训练集；

s2，根据与所述实体训练集中各个实体相关的可用信息生成用于进行协同训练的特征，其中，所述特征用于指示多个实体中同一类可用信息之间的相似度；

s3，根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义。

可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(read-onlymemory，简称为rom)、随机存取存储器(randomaccessmemory，简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

s1，从多个平台中获取多个实体作为实体训练集；

s3，根据所述特征对基于协同训练的模型进行训练，并根据训练得到的模型判别待处理的实体对是否同义。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

你可能感兴趣的:(实体对齐,算法)

自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用山海青风人工智能 gpt 自然语言处理 python
在前面的学习中，我们已经了解了如何使用一些经典的方法和模型来处理自然语言任务，如文本分类、命名实体识别等。但当我们需要更强的语言生成能力时，往往会求助于更先进的预训练语言模型。OpenAI旗下的GPT系列模型（如GPT-3、GPT-3.5、GPT-4等）在生成文本方面拥有强大的表现。它们不仅能进行语言生成，也可用于诸多NLP任务，包括文本摘要和情感分析。本章将重点介绍：GPT的文本生成原理和应用场
考研导师选择方法 herosunly 考名校研究生经验分享考研选择导师考研导师选择方法
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
梯度下降法(Gradient Descent) -- 现代机器学习的血液 AOIWB 机器学习人工智能 python
梯度下降法(GradientDescent)–现代机器学习的血液梯度下降法是现代机器学习最核心的优化引擎。本文从数学原理、算法变种、应用场景到实践技巧，用三维可视化案例和代码实现揭示其内在逻辑，为你构建完整的认知体系。优化算法一、梯度下降法的定义与核心原理定义：梯度下降法是一种通过迭代更新参数来最小化目标函数的优化算法，其核心思想是沿着当前点的负梯度方向逐步逼近函数最小值。数学表达：参数更新公式为
环境会影响你的决策：K近邻算法（KNN) AOIWB 机器学习基础近邻算法人工智能算法
环境会影响你的决策：K近邻算法（KNN)1.核心思想与流程KNN是一种基于局部相似性的分类算法，核心思想是“近朱者赤”：待测样本的类别由其最近的k个邻居的多数类别决定。关键步骤：定义空间与距离：通常采用欧式空间，计算两点间直线距离：dis(a,b)=∑i=1n(ai−bi)2\text{dis}(a,b)=\sqrt{\sum_{i=1}^n(a_i-b_i)^2}dis(a,b)=i=1∑n(a
3 算法1-3 火星人咚咚轩算法数据结构
题目描述一个火星人用一个人类的手演示了如何用手指计数。如果把五根手指――拇指、食指、中指、无名指和小指分别编号为1,2,3,4和5，当它们按正常顺序排列时，形成了5位数12345，当你交换无名指和小指的位置时，会形成5位数12354，当你把五个手指的顺序完全颠倒时，会形成54321，在所有能够形成的120个5位数中，12345最小，它表示1；12354第二小，它表示2；54321最大，它表示120
OpenSSL 基础使用流程 TsuanS 网络 OpenSSL
理解OpenSSL的基础使用流程是学习如何进行安全通信的关键，特别是在实现SSL/TLS连接时。以下是OpenSSL基础使用流程的一个简要总结，并附上一个简单的示例代码，帮助你理解如何通过OpenSSL建立一个基本的安全通信连接。OpenSSL基础使用流程初始化OpenSSL在使用OpenSSL之前，你需要先初始化OpenSSL库。这个初始化过程会加载加密算法、SSL库等所需的组件。创建SSL上下
前沿计组知识入门（二） tianyunlinger 计组人工智能笔记
第2页：并行计算与编程硬件：多处理器多内存互连网络系统软件：并行操作系统用于表达和协调并发的编程构造应用软件：并行算法目标：利用硬件、系统和应用软件实现加速（速度提升）：Tp=TspT_p=\frac{T_s}{p}Tp=pTs解决需要大量内存的问题第3页：并行算法/公式化并行公式化：并行化串行算法。并行算法：可能与串行算法完全不同。重点：主要讨论如何开发并行公式化。也会涉及一些非串行算法的并行例
嵌入式Qt的动平衡仪完整设计方案 m0_55576290 Balance qt 网络开发语言
一、系统架构总览硬件层硬件接口层数据采集模块动平衡算法模块数据存储模块UI模块通信模块系统服务层所有模块二、硬件接口层实现1.传感器驱动抽象//drivers/sensor_driver.hclassSensorDriver{public:virtualboolinit()=0;virtualQVectorreadData()=0;virtualboolcalibrate(floatbaseVal
【十大排序算法】（一）冒泡排序算法（优化） 2401_84408404 程序员算法排序算法数据结构
intborder=len-1,lastIndex=0;for(inti=0;iarr[j+1]){inttemp=arr[j];arr[j]=arr[j+1];arr[j+1]=temp;lastIndex=j;isSorted=false;}}border=lastIndex;if(isSorted){break;}}}但是，优化第二版仍不是最优方案，上面的两种优化方案只是减少每轮的操作次数，
Datawhale 数学建模导论国赛B学习笔记瓜瓜蛋数学建模学习笔记
贪心算法贪心算法(Greedyalgorithm)（贪婪算法）基本思想：多机调度问题是一个多项式复杂程度的非确定性问题(Non-deterministicPolynomial)，具有一定的复杂程度，当前没有有效的解决方法。相较于其它算法，贪心算法求解不从整体最优上加以考虑,。而是寻求某种意义上的局部最优解，从而做出当下最好的选择。因此，在求解并行机调度问题上，贪心算法容易获得近似最优解的答案，更有
react原理面试题前端react
以下是一些关于React原理的面试题：一、虚拟DOM（VirtualDOM）请简要解释React中的虚拟DOM是如何工作的？答案：当组件的状态发生变化时，React首先会在内存中创建一个新的虚拟DOM树来表示更新后的UI结构。然后，React会将这个新的虚拟DOM树与旧的虚拟DOM树进行比较（这个过程称为Diff算法）。Diff算法会找出两个虚拟DOM树之间的差异，例如哪些节点被添加、删除或者修改
2021年最新社招字节跳动 go 后端开发工程师一二三四五面面经 AI乔治 java 面试架构 Java 架构面试程序人生编程语言
因为公司原因，所以就换了工作，第一目标就是字节，12月份找朋友内推的上海教育部门，朋友让我多准备准备，过了两周才开始一面。附上新鲜的一二三四五面面经。写在前面面试字节一定要提前复习，能提前多久就提前多久。尤其是算法，绝对是重中之重，因为我已经刷了3年LeetCode了，所以算法没怎么复习，三次面试一共6题也全写出来了，基本上都是原题。然后就是数据库、网络、消息中间件、架构等等。校招的话架构可以不用
【算法学习之路】4.简单数论（4）零零时算法学习之路算法学习 c++开发语言数据结构数学高精度
简单数论（4）前言三.高精度1.什么是高精度2.解决办法精度乘除法一.精度乘法1.数据的存储2.步骤3.例题：高精度乘法二.精度除法1.例子2.步骤3.例题：高精度除法前言我会将一些常用的算法以及对应的题单给写完，形成一套完整的算法体系，以及大量的各个难度的题目，目前算法也写了几篇，滑动窗口的题单正在更新，其他的也会陆陆续续的更新，希望大家点赞收藏我会尽快更新的！！！三.高精度1.什么是高精度对运
三七互娱，蓝禾，顺丰，oppo，游卡，汤臣倍健，康冠科技，作业帮，高途教育25届春招内推 weixin_53585422 java 算法游戏美术嵌入式硬件求职招聘
三七互娱，蓝禾，顺丰，oppo，游卡，汤臣倍健，康冠科技，作业帮，高途教育25届春招内推①康冠科技【职位】算法、软件、硬件、技术，结构设计，供应链，产品，职能，商务【一键内推】https://sourl.cn/2Mm9Lk【内推码】EVBM88②蓝禾（秋招投过还可投）【岗位】国内/国际电商运营，设计，营销，职能，工作地：深圳【请选择“校园大使推荐码”】71T3HES【一键内推】https://so
软考程序员各模块知识点对应的分值分布及考试形式总结水瓶丫头站住考试排序算法算法数据结构
软考程序员考试分为基础知识（综合知识）和应用技术两个科目，各科目满分均为75分，合格标准通常为45分。以下是各模块知识点对应的分值分布及考试形式总结：一、综合知识（上午考试）题型：75道客观选择题（含5道专业英语题），每题1分，总分75分。核心模块及分值（基于近10次考试统计）：数据结构和算法（11-13分）重点：顺序表、链表、树、图、排序与查找算法等。计算机系统基础知识（7-11分）包含进制转换
算法001-奇偶统计-给你若干个数字，最后一个数字是 0，让你统计这些数字中有多少个偶数，以及所有奇数的和 m0_66127918 c++
奇偶统计【题目描述】给你若干个数字，最后一个数字是0，让你统计这些数字中有多少个偶数，以及所有奇数的和。【输入格式】一行，若干个数字，最后一个数字是0。【输出格式】第一行是这些数字中的偶数的个数。第二行是这些数字中奇数的总和。【样例】输入数据：125372399436542899933660输出数据：8257#includeusingnamespacestd;intmain(){intn,num_
冒泡排序算法优化 kupeThinkPoem c++算法 c++算法
一概述冒泡排序是一种简单的交换排序算法，其核心思想是通过相邻元素比较和交换将最大元素逐步移动到数组末尾。二、基础冒泡排序voidbubbleSort(intarr[],intn){for(inti=0;iarr[j+1]){swap(arr[j],arr[j+1]);}}}}三、优化方案及实现1提前终止优化（最优情况时间复杂度O(n)）voidoptimizedBubble1(intarr[],i
苹果AI生态再扩容！iOS 18.4代码泄密：Find My定位将获Gemini多模态能力加持北京自在科技 ios findmy 前沿技术科技 google Gemini
2025年2月24日，开发者社区通过iOS18.4测试版后端代码发现重大升级——苹果正将谷歌Gemini模型深度整合至FindMy定位体系，这标志着全球超20亿苹果设备组成的FindMyNetwork将迎来智能进化。FindMy技术升级路径多模态定位算法增强代码显示，当用户通过Siri调用FindMy查找AirTag或第三方设备时，系统将优先调用Gemini2.0的视觉-语义联合模型。例如查找丢失
介绍下pdf打印工具类 JasperPrint 东方巴黎～Sunsiny web java 数据库开发语言
JasperPrint工具类深度解析JasperPrint是JasperReports框架中实现PDF打印的核心载体类，其本质是填充数据后的可打印报表对象，承担着从模板编译、数据填充到格式输出的全流程控制。以下从7个维度展开深度解析：一、核心定位与生命周期中间态实体角色JasperPrint处于报表生成流程的中间阶段（生命周期模型）：JRXML（设计模板）→Jasper（编译模板）→JasperP
leetcode 0004 寻找两个正序数组的中位数 - hard SuperCandyXu Leetcode leetcode 算法职场和发展
1题目：寻找两个正序数组的中位数给定两个大小分别为m和n的正序（从小到大）数组nums1和nums2。请你找出并返回这两个正序数组的中位数。算法的时间复杂度应该为O(log(m+n))。示例1：输入：nums1=[1,3],nums2=[2]输出：2.00000解释：合并数组=[1,2,3]，中位数2示例2：输入：nums1=[1,2],nums2=[3,4]输出：2.50000解释：合并数组=[
入门SpringBoot-mybatis ``Lotus。 Spring Boot MyBatis mybatis spring boot java
通上次学的SpringBoot来整合一、使用注解版的Mybatis整合SpringBoot1、实体类（entity）packagecom.cxy.entity;importlombok.Data;@DatapublicclassUser{privateLongid;privateStringname;privateIntegerage;privateStringemail;}2、mapperpac
强化学习探索与利用：多臂老虎机的UCB与Softmax策略海棠AI实验室智元启示录深度学习人工智能机器学习 USB Softmax
目录引言多臂老虎机问题概述ε-贪心算法（ε-Greedy）上置信界（UCB，UpperConfidenceBound）软max策略（Softmax）算法对比与评估实验与结果总结与展望参考文献引言多臂老虎机问题（Multi-ArmedBandit,MAB）是强化学习领域中的一个经典问题，广泛应用于广告推荐、网页优化、金融交易、医疗决策等场景。其核心挑战在于如何平衡探索（exploration）和利用
mysql怎样更改加密算法及修改密码加密方式 IT_狂奔者 MySQL mysql 数据库
MySQL是一种流行的关系型数据库管理系统，可以用来存储和管理数据。MySQL默认使用的加密算法是sha256_password，但有时候我们需要更改加密算法。本篇文章将介绍如何更改MySQL的加密算法。mysql全局修改加密算法步骤如下：1.查看当前加密算法SELECT@@default_authentication_plugin;2.停止MySQLsudo/etc/init.d/mysqlds
2022-11-11 mysql-表间关联算法—BNL 悟世者 mysql mysql 算法数据库
在MySQL中，多表关联一直是其处理不太好的地方。MySQL本身只支持一种表间关联方式，就是嵌套循环（NestedLoop）。如果关联表的规模较大，则执行时间会非常长。在5.5以后的版本中，MySQL通过引入多种算法来优化嵌套执行。下面就介绍其中的一种，BlockNested-Loop。1.准备工作(1).创建结构CREATETABLE`big_emp`(`empno`int(4)NOTNULL,
python蓝桥杯备赛（day8）[KMP算法] kiki坤哥蓝桥杯职场和发展
第四章字符串part02[KMP算法]今日任务28.实现strStr()题目链接：28.找出字符串中第一个匹配项的下标-力扣（LeetCode）文章链接：代码随想录这题要用kmp算法，一下是我认为搞清楚kmp需要知道的前缀表是什么：记录下标i之前（包括i）的字符串（即子串）中，最大长度相同前缀后缀前缀表有什么作用：前缀表是用来回退的，它记录了模式串与主串(文本串)不匹配的时候，模式串应该从哪里开始
mysql的算法再见，再也不见(๑>؂<๑） mysql 算法数据库
MySQL是一个关系型数据库管理系统，其内部实现了许多算法来支持各种数据库操作和功能。以下是MySQL中一些常用的算法：查询优化算法：查询执行计划生成：MySQL使用查询优化器来生成最优的查询执行计划，以提高查询性能。优化器会考虑索引、表的统计信息、连接顺序等因素来选择最佳的执行计划。索引选择算法：MySQL会根据查询条件和表结构来选择合适的索引进行查询，常见的索引选择算法包括最左前缀匹配、覆盖索
【洛谷贪心算法】P1090合并果子 Reese_Cool 洛谷贪心算法算法 c++蓝桥杯开发语言
为了使消耗的体力最小，每次都应该选择当前重量最小的两堆果子进行合并。可以使用优先队列（小根堆）来实现这个过程，优先队列可以自动维护元素的顺序，每次取出堆顶的两个元素（即最小的两个元素）进行合并，然后将合并后的结果重新插入堆中，重复这个过程直到堆中只剩下一个元素。【算法思路】优先队列的定义：使用priority_queue,greater>pq;定义一个小根堆，这样每次从堆中取出的元素都是当前最小的
NCCL学习笔记-拓扑和算法 MatsumotoChrikk NVIDIA NCCL 学习笔记算法
集合通信数据并行：all-reduce或reduce-scatter和all-gather张量并行：all-reduce流水并行：点对点p2p序列并行：all-gather和reduce-scatter专家并行：all-to-all集合通信-MPI标准进程间通信也是消息传递最基本的消息传递包括sendreceive等等MPI系统的通信方式都是p2p可以阻塞可以非阻塞而openMPI中就有多个集合通
前后端数据传输加密：Python 与 Vue 的实践风清扬【coder】 Web应用 vue.js python 前端
Python与Vue实现接口数据加密传输在当今互联网应用开发中，数据安全是重中之重。尤其是在前后端进行数据交互时，确保传输数据的保密性、完整性和可用性，是每一位开发者不可忽视的关键环节。本文将深入探讨如何运用Python后端和Vue前端技术，实现接口数据传输过程中的加密处理，为大家揭开数据安全保护的神秘面纱。加密基石：AES算法我们选用的加密算法是AES（AdvancedEncryptionSta
基于问答对的实体识别和意图识别的知识图谱问答推理风清扬【coder】自然语言分析处理知识图谱人工智能自然语言处理
问答对数据questionanswer省直医保的参保范围是什么?中央直属、省直属在哈尔滨的机关、事业单位、社会团体及其职工和退休人员。参加省直医保的单位缴费基数如何确定和缴纳?在职职工(以下简称职工)个人月缴费基数按本人上年度月平均工资确定，由单位代扣代缴，用人单位月缴费基数按本单位参保职工个人月缴费基数之和确定。缴费费率：用人单位8%(含生育0.5%)、职工个人2%。缴费方式：用人单位、职工按月
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

实体对齐 算法_知识图谱中的实体对齐方法及装置与流程

你可能感兴趣的:(实体对齐,算法)

实体对齐算法_知识图谱中的实体对齐方法及装置与流程