人工智能技术与咨询

知识图谱的最新进展、关键技术和挑战

人工智能技术与咨询

本文来自《工程科学学报》，作者马忠贵等

随着知识的不断积累和科学的飞速发展，人类社会进行了多次改变社会结构的重大生产力革命。最近的生产力革命正是由Web技术发展引发的信息革命。伴随着Web技术不断地演进与发展，人类即将迈向基于知识互联的崭新“Web3.0”时代[1]。受语义网络（Semantic network）和语义网（Semantic web）的启发，Google公司提出了知识图谱（Knowledge graph）[2]，目的是为了提高搜索引擎的智能能力，增强用户的搜索质量和体验。随后，这一概念被传播开来，并广泛应用于医疗、教育、金融、电商等行业中，推动人工智能从感知智能向认知智能跨越。目前，已经涌现出一大批知识图谱，其中国外具有代表性的有YAGO[3]、DBpedia[4]、Freebase[5]、NELL[6]、Probase[7]等；国内出现了开放知识图谱项目OpenKG[8]，中文知识图谱CN-DBpedia[9]、zhishi.me[10]等。知识图谱的本质是连接实体间关系的图，即揭示实体之间关系的语义网络[11]，普遍采用资源描述框架（Resource description framework，RDF）来描述知识。知识图谱全生命周期主要包括3种关键技术：（1）从样本源中获取数据，并将其表示为结构化知识的知识抽取与表示技术；（2）融合异源知识的知识融合技术；（3）根据知识图谱中已有的知识进行知识推理和质量评估。

近几年，越来越多的学者将目光聚焦在了认知智能上，知识图谱受到越来越广泛的关注。除了知识图谱的技术文章爆发式增长之外，综述文章也越来越多。文献[11]针对知识图谱的相关技术进行了全面解析，文献[12-13]综述了知识图谱核心技术的研究进展以及典型应用，文献[14]总结了面向知识图谱的推理方法并展望了未来的研究方向，文献[15]定义知识图谱与本体的关系并简述了已开发的国内外知识图谱。2019年年末和2020年年初，国内有3本知识图谱的专著问世[16-18]，我们有了写作本论文的动机。与已有的综述文献相比，本文的主要贡献如下：梳理了知识图谱全生命周期技术，从知识抽取与表示、知识融合、知识推理、知识应用4个层面展开综述，建立方法论思维。限于篇幅，针对知识图谱的4个关键技术进行了取舍，重点介绍了知识融合与知识推理技术的最新进展。同时，简要介绍了知识图谱目前的挑战并展望了未来的发展方向。

1. 知识抽取与表示

对于知识图谱而言，首要的问题是：如何从海量的数据提取有用信息并将得到的信息有效表示并储存，就是所谓的知识抽取与表示技术。知识抽取与表示，也可以称为信息抽取，其目标主要是从样本源中抽取特定种类的信息，例如实体、关系和属性，并将这些信息通过一定形式表达并储存。对于知识图谱，一般而言采用RDF描述知识，形式上将有效信息表示为（主语，谓语，宾语）三元组的结构，某些文献中也表示为（头实体，关系，尾实体）的结构。针对信息抽取种类的不同，知识抽取又可分为实体抽取、关系抽取以及属性抽取。图1展示了知识图谱的技术架构。

图 1 知识图谱的技术架构

Figure 1. Architecture of the Knowledge Graph

下载: 全尺寸图片幻灯片

实体抽取也称为命名实体识别，主要目标是从样本源中识别出命名实体。实体是知识图谱最基本的元素，实体抽取的完整性、准确率、召回率将直接影响知识图谱的质量[12]。文献[19]将实体抽取的方法归纳为3种：（1）基于规则与词典的方法。通常需要为目标实体编写相应的规则，然后在原始语料中进行匹配，Quimbaya等[20]提出了一个基于词典的实体抽取方法，并应用于电子健康记录。（2）基于统计机器学习的方法。主要利用数据来对模型进行训练，然后再利用训练好的模型去识别实体，Liu等[21]将K近邻（K-nearest neighbors，KNN）算法和线性条件随机场（Conditional random fields，CRF）模型结合来识别实体。（3）面向开放域的抽取方法。主要是针对海量网络数据，Jain与Pennacchiotti[22]提出通过已知实体的语义特征来识别命名实体，并提出实体聚类的无监督开放域聚类算法。Zhang与Elhadad[23]提出一个无监督的实体抽取方法，利用术语、语料库统计信息以及浅层语法知识从生物医学中抽取实体。

通过实体抽取获取的实体之间往往是离散且无关联的。通过关系抽取，可以建立起实体间的语义链接。关系抽取技术主要分为3种：（1）基于模板的关系抽取。使用模板通过人工或者机器学习的方法抽取实体关系，虽然准确率高且针对性强，但是其也具有不适用于大规模数据集、低召回率、难以维护等缺点。（2）基于监督学习的关系抽取。将大量人工标注的数据送入模型中训练，刘克彬等[24]根据本体知识库训练模型，在开放数据集中对关系进行抽取，取得了极高的准确率。Sun与Han[25]提出了名为FTK（Feature-enriched tree kernel）的模型，利用设计好的有效特征训练，计算关系实例相似度并通过支持向量机对关系进行分类。（3）基于半监督或无监督学习的关系抽取。基于少量人工标注数据或者无标注数据，使用最大期望（Expectation maximization）等算法的半监督关系抽取方法进行关系抽取。Sun与Grishman[26]提出名为LGCo-Testing的主动学习系统，Fu与Grishman[27]则进一步优化了这个系统。Ji等[28]提出基于句子级注意力和实体描述的神经网络关系抽取模型APCNNS。该模型实际采用了多示例学习的策略，将同一关系的样例句子组成样例包，关系分类是基于样例包的特征进行的。实验结果表明，该模型可以有效地提高远程监督关系抽取的准确率。在采用多示例学习策略时，有可能出现整个样例包都包含大量噪声的情况。针对这一问题，Feng等[29]提出了基于强化学习的关系分类模型CNN-RL（Convolutional neural networks and reinforcement learning），该模型包括2个重要模块：样例选择器和关系分类器。实验结果表明：该模型获得了比句子级卷积神经网络和样例包级关系分类模型更好的结果。最近的工作通过强化学习来处理句子级的去噪，这种学习将来自远程监督的标签视为事实。然而，很少有工作专注于直接校正噪声标签的标签级降噪。Sun等[30]提出了一种基于强化学习的标签去噪方法，用于远程监督关系提取。该模型由两个模块组成：抽取网络和策略网络。标签去噪的核心是在策略网络中设计一个策略来获取潜在标签，可以在其中选择使用远距离监督标签或从抽取网络预测标签的操作。实验结果表明，强化学习对于噪声标签的校正是有效的，并且所提出的方法可以胜过最新的关系抽取系统。

属性抽取的目标是补全实体信息，通过从样本源中获取实体属性信息或属性值。实体属性可以看作是属性值与实体间的一种关系，因而可以通过关系抽取的解决思路来获得。Wu与Weld[31]利用百科类网站的半结构化数据，训练抽取模型，之后将抽取模型应用在非结构化数据中抽取属性。Chang等[32]提出了基于张量分解的关系抽取方法，这一方法也可以应用在属性抽取中，通过利用关于实体种类相应的领域知识来更好地获得实体所缺少的属性值。

2. 知识融合

通过知识抽取与表示，初步获得了数量可观的形式化知识。由于知识来源的不同，导致知识的质量参差不齐，知识之间存在着冲突或者重叠。此时初步建立的知识图谱，知识的数量和质量都有待提高。应用知识融合技术对多源知识进行处理，一方面提升知识图谱的质量，另一方面丰富知识的存量。Zhao等[33]对最新的知识融合进行了综述。早期的知识融合是通过传统的数据融合方法完成，Dong等[34]比较了传统的数据融合方法，选择了几种方法改良，并应用到知识融合中。随着知识图谱的飞速发展，目前也出现了专门的知识融合方法。下面从实体消歧、实体对齐和知识合并3个方面进行综述。

2.1 实体消歧

对于知识图谱中的每一个实体都应有清晰的指向，即明确对应某个现实世界中存在的事物。初步构建的知识图谱中，因数据来源复杂，存在着同名异义的实体。例如，名称为“乔丹”的实体既可以指美国著名篮球运动员，也可以指葡萄牙足球运动员，还可以指某个运动品牌。为了确保每一个实体有明确的含义，采用实体消歧技术来使得同名实体得以区分。

利用已有的知识库和知识图谱中隐含的信息来帮助进行语义消歧，Han与Zhao[35]提出使用维基百科（Wikipedia）作为背景知识，通过利用Wikipedia的语义知识，例如社会关系来更精确地衡量实体间的相似性，从而提升实体消歧的效果。Sen[36]提出了主题模型，利用知识库中存在的文本信息，学习共有实体组来实现实体集体消歧。Guo与Barbosa[37]基于语义相似性的自然概念提出了两个针对集体消歧的方法。通过在知识库上知识子图中随机游走得到的概率分布来表示实体和文档的语义，之后基于迭代的贪婪逼近算法和学习排序的方法来进行实体消歧任务。Zhu与Iglesias[38]提出了基于语义上下文相似度的命名实体消歧方法，基于上下文和知识图谱中实体的信息词之间的语义相似度来进行实体消歧。另外还提出了Category2Vec模型，将目录也用嵌入向量的形式表示出来。主要思想是候选实体和上下文单词间应存在语义联系，利用该联系来帮助选出正确的实体。

在线百科全书由专家和网络用户编写，有着高覆盖率和结构信息丰富的特点。Shen等[39]提出LINDEN（A framework for Linking named entities with knowledge base via semantic knowledge）模型，同时利用Wikipedia和WordNet，基于文本相似性和主题一致性进行实体消歧。Ratinov等[40]提出名为GLOW（Global and local approaches of Wikipedia）的系统，GLOW组合捕捉实体指称与Wikipedia题目间的相关性的本地模型和选择准确歧义语境的方法。统计Wikipedia中实体的频率作为候选实体的排序依据。Alokaili与Menai[41]提出了基于支持向量机的集成学习来解决实体消歧问题，使用不同的支持向量机的核函数来学习不同的集成学习算法，例如bagging、boosing、voting等。具体流程是将命名实体作为输入，根据Wikipedia中的知识生成候选实体，构造特征向量，最后送入集成学习模块里完成实体消歧。

值得一提的是，Agarwal等[42]提出了利用时间的实体消歧思路，通过计算实体的时序特征来和输入的命名实体上下文的时序比较，即使命名实体的上下文提供的信息不充分也可以完成实体消歧任务。Dong[43]将基于相似度特征的随机森林模型和基于XGBoost、基于逻辑回归以及基于神经网络的方法进行比较，随机森林模型不仅拥有极高的准确率和召回率，且不像XGBoost和神经网络那样容易受到超参数的影响，在实体消歧任务中表现突出。

2.2 实体对齐

在现实生活中，一个事物对应着不止一个称呼，例如，“中华人民共和国”和“中国”都对应于同一个实体。在知识图谱中也同样存在着同义异名的实体，通过实体对齐，将这些实体指向同一客观事物。苏佳林等[44]提出基于决策树的自适应属性选择的实体对齐方法。通过联合学习将实体嵌入表示在一个向量空间后，由信息增益选出最优约束属性，训练实体对齐模型，计算最优约束属性相似度和实体语义相似度完成实体对齐。

Cheng等[45]提出了一个全自动的实体对齐框架，包括候选实体生成器、选择器和清理器，利用搜索引擎使用者的查询信息和查询后的点击记录，计算出实体间的相似度，完成实体对齐任务。Pantel等[46]提出了一个大规模相似性模型，在MapReduce框架下实施并且部署了超过2000亿从互联网上爬取得到的单词。通过计算5亿terms得到的相似度矩阵来进行实体对齐任务。Chakrabarti等[47]通过一个同义发现框架将实体相似性作为输入生成一个满足简单自然属性的同义词，提出了两种新的相似性度量法，并通过在bing系统上实际应用，发现可以有效识别同义词。Mudgal等[48]综述了基于深度学习的实体对齐方法，通过将这些方法分类，分别组合设计空间中属性嵌入、属性相似度表示、分类的各个方法，得到最具代表性的平滑倒词频（Smooth inverse frequency，SIF）、循环神经网络（Recurrent neural network，RNN）、Attention和Hybrid共4种解决方案。

针对基于嵌入表示的实体对齐，Sun等[49]提出自举的方法解决标记训练数据不足的问题。根据全局最优目标来标记可能的对齐，并在迭代中将其加入到训练数据中，不断训练嵌入表示模型。Guan等[50]发现基于监督学习的实体对齐方法，普遍在取得标签数据上需要花费大量时间，无监督学习方法的表现则很大程度地依赖于验证集上复杂的相似度衡量方式。Zhang等[51]从实体的多视角出发，利用实体的名称、实体间的关系、实体的属性的组合策略来学习实体的嵌入，并根据实体的表示来完成实体对齐任务。

2.3 知识合并

实体消歧和实体对齐更多的是关注知识图谱中的实体，从实体层面上通过各种方法来提升知识图谱的知识质量。知识合并则是从知识图谱整体层面上进行知识的融合，基于现存的知识库和知识图谱来扩大知识图谱的规模，丰富其中蕴含的知识。然而现存的知识库或者知识图谱都是各种机构或者组织根据自己的需求设计创建，其中的知识也存在着多样性和异构性，并且存在很多知识上的重复和错误，因而需要使用知识合并技术来解决这些问题[52]。知识图谱的合并需要解决2个层面的问题：数据层的合并和模式层的合并[53]。知识合并过程中可能出现的来自两个数据源的同一实体的属性值却不相同的现象，我们称这种知识合并过程中出现的现象为知识冲突。针对知识冲突问题，可以采用冲突检测与消解以及真值发现等技术进行消除，再将各个来源的知识关联合并为一个知识图谱。

冲突消解目前的研究方向是利用图谱自身存在的特征，Trisedya等[54]利用属性元组生成属性特征嵌入向量。使用成分函数来表示属性。将多个属性值都转化为单一向量，并将相似的属性映射为相似的向量表示。利用这些属性特征嵌入向量将两个图谱中的实体嵌入转化到同一个空间中，计算实体的相似性。Chen等[55]针对多语言知识图谱的合并，提出了利用实体描述的基于嵌入的半监督跨语言学习方法，在一个大规模数据集上通过迭代的方式联合训练一个多语言知识图谱嵌入模型和一个文字描述嵌入模型，训练模型完成图谱的合并。Cao等[56]提出多通道图神经网络模型，通过多个通道将两个知识图谱进行鲁棒编码。在每个通道中通过不同的关系加权方案来编码知识图谱，使用知识图谱补全和跨知识图谱注意力策略来分别修剪每个图谱中的独有实体，通过池化技术组合这些通道。

3. 知识推理与质量评估

知识推理技术可以提升知识图谱的完整性和准确性。传统的知识推理方法拥有极高的准确率，但无法适配大规模知识图谱。针对知识图谱数据量大、关系复杂的特点，提出了面向大规模知识图谱的知识推理方法，并归纳为以下4类[14, 57]：（1）基于图结构和统计规则挖掘的推理；（2）基于知识图谱表示学习的推理；（3）基于神经网络的推理；（4）混合推理。

3.1 基于图结构和统计规则挖掘的推理

受传统推理地启发，基于知识图谱的图结构以及挖掘蕴藏在知识图谱中的规则进行推理的方法得以提出，并在知识推理任务上取得一定效果。Lao与Cohen[58]提出了路径排序算法（Path ranking algorithm，PRA），将实体间的路径作为特征，通过随机行走算法来计算实体间是否存在潜在的关系。Wang等[59]设计了耦合路径排序算法（Coupled path ranking algorithm，CPRA），并提出一种全新的逐次聚合的策略，通过这一策略使得具有强相关度的关系聚合在一起。使用多任务学习策略预测聚合后的关系。Xiong等[60]针对多跳关系路径的学习提出使用强化学习的框架，设计了一个具有连续基于知识图谱嵌入状态的策略Agent，通过Agent在知识图谱的向量空间中寻找最有潜力的关系加入路径完成推理。

Cohen[61]针对如何将知识整合到梯度学习的系统的问题，描述了一个概率演绎的数据库Tensorlog，通过可微分的过程来进行推理。Yang等[62]研究了基于学习一阶概率逻辑规则进行知识库推理的问题。受到Tensorlog的启发，提出了名为神经逻辑规划的框架，将一阶逻辑规则的参数和结构整合到一个端到端的可微分模型中。设计了一个带Attention机制和存储功能的神经控制系统来学习组合那些用于完成推理的规则。Kampffmeyer等[63]提出深度图传播模型，在利用图结构的便利的同时解决知识过于稀疏的问题。

3.2 基于知识图谱表示学习的推理

表示模型将知识图谱中相应的实体和关系用向量、矩阵或者张量的形式表示，表示后进行运算完成知识推理任务。因其简单高效且适应于大规模知识图谱推理的特点而不断发展。

3.2.1 基于距离的推理模型

Bordes等[64]提出了TransE模型，将所有的实体和关系表示为同一个空间下的向量，假设事实元组中头实体向量和关系向量之和应该约等于尾实体的向量。通过随机替换事实元组中的某一项来构建负例。计算元组中头向量和关系向量的和向量与尾向量的距离作为候选实体的得分。尽管TransE模型简单且有效，但其仍然具有许多缺陷，因而衍生出很多基于该模型的方法。Wang等[65]提出TransH模型，每一个关系都有一个特定的超平面，头实体向量和尾实体向量投影至特定的关系超平面计算事实元组得分。Lin等[66]提出TransR模型，针对特定关系引入了空间。Xiao等[67]提出了ManifoldE模型，引入了特定关系参数。尾实体向量有效范围是以头实体向量和关系实体向量的和向量为中心，以特定关系参数为半径的一个超球面。Feng等[68]提出的TransF模型和ManifoldE模型有着相似的思路，放宽了TransE中对实体关系向量的要求，仅需要头实体向量位于尾实体向量和负的关系向量的和向量的方向上，同时尾实体向量也位于头实体向量和关系向量的和向量的方向上。

Kzaemi与Poole[69]提出SimplE模型，允许实体拥有两个独立学习的向量表示，而关系由一个向量表示。Ebisu与Ichise[70]提出了TorusE嵌入模型，将TransE的思想应用在李群（Lie group）理论中的圆环面上，即在圆环面上计算表示向量间的距离来取得元组得分。Xu与Li[71]提出DihEdral模型，针对性地增强了知识推理的可解释性，通过离散值将关系建模成组的元素，显著地缩小了解空间。Sun等[72]提出RotatE模型，将关系看作是从头实体向量向尾实体向量的旋转，元组得分通过计算旋转后的头实体向量和尾实体向量的距离得到Zhang等[73]引入超复数的概念，提出了QuatE模型，通过一个拥有三个虚部的超复数来表示知识图谱中的实体和关系。与RotatE想法类似，QuatE模型将关系看作超复数平面下头实体到尾实体的旋转。

3.2.2 基于语义匹配的推理模型

Nickel等[74]提出的RESCAL模型将实体和向量联系起来，从而捕捉其中隐含的语义，潜在因子间的相互作用建模后得到关系表示矩阵，计算实体向量与关系矩阵的乘积来得到元组得分。Yang等[75]提出DistMult模型，每一个关系都表示为向量，再将向量转化为对角矩阵，通过计算头尾实体向量与关系对角矩阵的乘积得到元组的得分。Trouillon等[76]提出Complex模型，引入复数嵌入针对不对称关系建模。在Complex模型中，实体和关系都由复平面中的向量表示，计算头实体向量和根据关系向量建立的对角矩阵以及尾实体向量的共轭这三者的乘积，结果的实部作为元组的得分。Liu等[77]提出ANALOGY模型，利用实体和关系的类比性质来建模，实体由嵌入空间中的向量表示，将关系矩阵处理得到一系列稀疏的对角矩阵，减少了关系矩阵的参数。将头尾实体向量与关系矩阵的积作为元组得分。

Balazevic等[78]提出了基于KKT（Karush Kuhn Tucker）分解的tuckER模型，将所有实体和关系分别表示为行向量嵌入矩阵，从这两个矩阵中取出头尾实体向量和关系向量，将这些向量和一个核心张量相乘得到元组的得分。针对大部分现存的基于知识图谱嵌入的模型，Kristiadi等[79]研究了如何将文字信息整合到现存的表示模型中去，提出了LiteralE模型，在实体的嵌入表示上加入文字信息，用实体表示和文字信息的联合表示取代原本模型的单独的实体表示。Zhang等[80]提出了CrossE模型，基于向量表示实体和关系，生成多个元组的特定嵌入即交互嵌入。由交互表示和尾实体的嵌入表示的匹配程度给出元组得分。

基于表示学习的知识推理模型的比较如表1所示。

表 1 部分基于表示学习的知识推理模型

Table 1. Some knowledge reasoning models based on representation learning

Method	Scoring function	The entity representations	The relation representation
TransE	−∥h+t−r∥1/2−‖h+t−r‖1/2	h,t∈Rdh,t∈Rd	r∈Rdr∈Rd
ManifoldE	−(∥h+t−r∥22−θ2r)2−(‖h+t−r‖22−θr2)2	h,t∈Rdh,t∈Rd	r∈Rdr∈Rd
SimplE	12(〈hei,vr,tej〉+〈hej,vr−1,tei〉)12(〈hei,vr,tej〉+〈hej,vr−1,tei〉)	he,te∈Rdhe,te∈Rd	vr∈Rdvr∈Rd
RotatE	∥h∘r−t∥‖h∘r−t‖	h,t∈Cdh,t∈Cd	r∈Cdr∈Cd
QuatE	h⊗r\|r\|⋅th⊗r\|r\|⋅t	h,t∈Hdh,t∈Hd	r∈Hdr∈Hd
RESCAL	hTMrthTMrt	h,t∈Rdh,t∈Rd	Mr∈Rd×dMr∈Rd×d
DistMult	hTdiag(r)thTdiag(r)t	h,t∈Rdh,t∈Rd	r∈Rdr∈Rd
ComplEx	Re(hTdiag(r)t¯)Re(hTdiag(r)t¯)	h,t∈Cdh,t∈Cd	r∈Cdr∈Cd
ANALOGY	hTMrthTMrt	h,t∈Rdh,t∈Rd	Mr∈Rd×dMr∈Rd×d
CrossE	σ(tanh(cr∘h+cr∘h∘r+b)tT)σ(tanh(cr∘h+cr∘h∘r+b)tT)	h,t∈Rdh,t∈Rd	r∈Rdr∈Rd

下载: 导出CSV

| 显示表格

3.3 基于神经网络的推理

基于神经网络的推理方法将知识图谱中事实元组表示为向量形式送入神经网络中，通过训练神经网络不断提高事实元组的得分，最终通过输出得分选择候选实体完成推理。Socher等[81]提出适应于实体间关系推理的神经张量网络（Neural tensor networks，NTN）模型，用双线性张量层取代神经网络层，实体通过连续的词向量平均表示进而提升模型的表现。Neelakantan等[82]使用循环神经网络来建模知识图谱中的分布式语义的多跳路径。Das等[83]主要是将符号逻辑推理中丰富的多步推理与神经网络的泛化能力相结合。通过学习实体、关系和实体的种类来联合推理，并使用神经注意力建模来整合多跳路径。在单层RNN中分享参数来表示所有关系的逻辑组成。Graves等[84]建立了可微神经计算机模型，将神经网络和记忆系统结合起来，将通过样本学习到的知识储存起来并进行快速知识推理。

Dettmers等[85]针对知识图谱中大规模与过拟合的问题，设计了参数简洁且计算高效的二维卷积神经网络（Convolutional 2D，ConvE）模型。Vashishth等[86]基于特征排列、新的特征变形以及循环卷积提出InteractE模型。InteractE模型通过使用多种排列输入，更简单的特征变形方法以及循环卷积来取得比ConvE更显著的效果。

3.4 混合推理

对于上面的几类知识推理的方法，各有其优势与缺点，于是考虑结合多种方法的优势来提升推理效果，进而提出了混合推理方法。Guo等[87]提出学习规则增强关系来补全知识图谱的方法，使用规则来进一步改善传统关系学习得到的推理结果，提升知识推理的准确性。Lu等[88]提出了基于强化学习建模的逻辑概率的知识表示和推理模型，同时在已知的知识和由强化学习整合的经验上进行推理来训练强化学习的Agent。Xie等[89]提出一种利用实体描述的知识表示学习的方法，使用了连续词袋模型和深度卷积模型来编码实体的描述语义。之后进一步学习通过三元组和三元组中实体的描述来学习表示知识。并利用学习到的知识来完成知识推理任务。Wang[90]提出规则嵌入神经网络（The rule-embedded neural network，ReNN）。ReNN基于局部的推理检测局部模式，由局部模式领域知识的规则来生成规则调制映射。针对规则引起的优化问题，采用两阶段优化策略。引入规则解决了传统神经网络必须受限于数据集的问题，从而提升了推理的准确率。

Zhang等[91]提出了一个名为IterE的迭代学习嵌入和规则的框架，目标是同时学习实体嵌入表示和规则，并利用它们各自的优势来弥补对方的不足。Nie与Sun[92]组合了隐形特征和图特征的优势提出了一个名为文本强化型知识图谱嵌入（Text-enhanced knowledge graph embedding，TKGE）的组合模型，通过实体、关系和文本来提升推理的表现。Guan等[93]基于一个常识图的常识概念信息提出了一个常识伴随的知识图谱嵌入（Knowledge graph embedding with concepts，KEC）模型，将来自于知识图谱的事实元组通过常识概念信息修正，从而使得模型不仅仅关注实体间的关联性还有实体存在的常识概念。因此这个模型具有明确的语义性。

4类知识推理方法对比如表2所示。

表 2 4类知识推理方法对比

Table 2. Comparisons of 4 kinds of knowledge reasoning methods

Reasoning methods	Advantage	Disadvantage	Typical model
Knowledge reasoning based on graph structure and statistical rule mining	The advantages of graph structure and rules can significantly improve the accuracy of knowledge reasoning	Large-scale knowledge graphs have complex graph structures and rules are not easy to obtain; noise rules can mislead knowledge reasoning	PRA AMIE TensoLog
Knowledge reasoning based on representation learning	Simple and efficient, suitable for large-scale knowledge graph	Does not consider the deeper information in the knowledge graph, which limits its accuracy of reasoning	RESCAL TransE
Knowledge reasoning based on the neural network	Outstanding learning ability and reasoning ability	High complexity, huge number of parameters, and poor interpretability	NTN
Knowledge reasoning based on hybrid methods	Combines the advantages of several inference methods, so its performance is excellent	Most methods are just shallow fusion, not taking full advantage of their respective methods	TKGE

下载: 导出CSV

| 显示表格

3.5 质量评估

通过质量评估技术来对新知识进行筛选，是构建知识图谱中必不可少的环节。Mendes等[94]提出了Sieve，用于简化生成高质量数据的任务，并整合进了链接数据整合框架（Linked data integration framework，LDIF）中，包括一个质量评估模型和一个数据融合模型。质量评估主要利用用户选择的质量因子，通过用户配置的得分函数生成质量得分。数据融合使用质量得分来处理用户设置的冲突消解任务。Fader等[95]基于来自网络或Wikipedia的1000个句子中人工标注的实例来训练ReVerb系统的置信函数，通过一个逻辑回归分类器来评估每一个通过ReVerb系统抽取得到的实例的置信度。Google的Knowledge vault项目[96]，通过统计全球网络中抽取数据的频率作为评估信息可信度的依据，并通过已有知识库中的知识来修正可信度，这一方法有效降低了评估数据结果的不确定性，从而提升了知识的质量水平。Tan等[97]提出了一个名为CQUAL（Contribution quality predictor）的方法来自动预测用户提交至知识库的知识的质量，主要依据提交用户的领域、提交历史、以及历史准确率等数据。实验表明这一方法拥有很高的准确率和召回率。

4. 知识图谱应用

知识图谱技术提出之后，因其具有的语义处理和开放互联的能力，以及其简洁灵活的表达方式等优势，受到了广泛关注。知识图谱技术的发展得益于自然语言处理、互联网等技术的发展，而不断完善的知识图谱技术也可以应用到自然语言处理、智能问答系统、智能推荐系统等技术中，进一步促进这些技术的发展，而这些技术以及知识图谱技术又可以进一步应用在诸如医疗、金融、电商等垂直行业或领域内，帮助促进行业发展[16-17]。

构建完备的知识图谱可以帮助自然语言理解技术发展。针对文本分类问题，Wang等[98]首先利用知识库中的知识将短文本概念化，获得短文本的嵌入表示后送入卷积神经网络中进行分类。Lagon等[99]提出了知识图谱语言模型，一种拥有从知识图谱中选择和复制知识的神经语言模型。

智能问答系统可以依靠知识图谱中的知识来回答查询。Bauer等[100]利用关系路径从常识网络中获取背景常识知识，之后利用多注意力机制完成多跳推理并通过一个指针生成译码器来合成问题的答案。朱宗奎等[101]针对中文知识图谱问答系统，将BERT（Bidirectional encoder representations from transformers）模型和双向长短期记忆网络结合，之后通过条件随机场模型来预测字符标签，从而识别出问题中的实体并链接到知识网络中，最后完成答案的搜索。

知识图谱可作为外部信息整合至推荐系统中，使得推荐系统获得推理能力。通过利用知识图谱中诸如实体、关系的信息，许多研究进一步基于嵌入正则化来提升推荐效果。Wang等[102]将图注意网络应用于实体–关系和用户–物品图的协作知识图谱上，提出了名为知识图谱注意力网络的模型，在端到端的模式下通过嵌入传播和基于注意的聚合对建模知识图谱中的高阶连通性建模。

在垂直行业或领域内，知识图谱已开始应用。在医疗领域，通过提供更加精确规范的行业数据以及更加丰富的表达，帮助非行业相关人员获取医疗知识的同时也帮助行业人员更直观快捷获取所需医疗知识。在金融领域，借助知识图谱检测数据的不一致性，来识别潜在的欺诈风险。同时，利用知识图谱技术分析招股书、年报、公司公告等金融报告，建立公司和人物的关系，在此基础上做更进一步的研究和更优的决策。在电商领域，阿里巴巴已经通过应用知识图谱，建立商品间的关联信息，为用户提供更全面的商品信息和更智能化的推荐，从而提升用户的购物服务与体验。同时，知识图谱也在教育、科研、军事等领域中广泛应用。

5. 知识图谱在知识融合、推理与应用中的挑战与展望

自谷歌提出知识图谱概念至今，这项技术一直受到广泛的关注。随着深度学习、自然语言处理等相关领域的发展，知识图谱的研究热度不断增加。不可忽略的是，知识图谱发展至今，知识融合、知识推理等知识图谱关键技术以及知识图谱的应用仍面临许多挑战。

知识融合技术是知识图谱的关键技术之一。知识融合主要任务是将新获得的知识融入知识图谱中。保证知识图谱知识准确率的前提下高效地引入新知识，是知识融合的关键。存在的挑战如下：（1）为了保证融合后知识图谱的质量，首先要提升知识评估的能力。现存的知识评估方法大都是针对静态知识进行评估，缺少动态知识评估手段是目前知识评估面临的一大挑战。（2）要解决由自然语言的特殊性引发的知识冗余和缺失问题。当知识图谱不能准确将具有同义异名的实体对齐或将同名异义的实体消歧就会导致知识图谱中出现知识冗余或缺失。（3）目前，因自然语言的复杂性，在单一语言的背景下实体对齐和实体消歧的准确率仍然有待提高，针对多语言实体对齐或消歧更是一大挑战。

知识推理技术也是知识图谱的关键技术之一，通过已知的知识推理获得新知识来完善知识图谱。存在的挑战如下：（1）知识推理的主要对象多是二元关系，通常处理多元关系的方法是将其拆分为二元关系进行推理，然而将多元关系拆分会损失结构信息，如何尽可能完整地利用多元关系中复杂的隐含信息推理是知识推理的一大挑战。（2）现有的知识推理往往都是基于大量高质量的数据集训练推理模型，在相应的测试集中测试优化模型来完成推理。除了数据集获取成本高的问题，通过数据集训练的模型的泛化能力也极为有限，而现实世界中人类通过少量样本学习即可完成推理。如何模仿人脑机制实现小样本或零样本学习知识推理也是一大挑战。（3）知识图谱中知识的有效性往往受到时间空间等动态因素约束，如何合理利用知识的动态约束信息完成动态推理也是知识推理的一大挑战。

知识的表达、存储与查询将是贯穿知识图谱应用始终的问题。存在的挑战如下：（1）目前，应用在行业领域的知识图谱因为很大程度上依赖人工的参与构建，成本高昂。大多数研究工作主要针对知识图谱的半自动构建[103]，如何自动构建高质量知识图谱是知识图谱应用所面临的一大挑战。（2）知识拥有指导功能，利用知识图谱中的知识引导机器学习中的数据学习，从而降低数据依赖打破数据红利损耗殆尽后的僵局，是知识图谱应用面临的一大挑战。（3）利用人类易懂的符号化知识图谱，解释各类机器学习特别是深度学习的过程，补足其在可解释性方面的短板，也是知识图谱应用面临的一大挑战。（4）未来，能否应用知识图谱中的知识，作为已知的经验，通过训练构建人工智能层面上的心智模型，同样是知识图谱应用的一大挑战。

知识图谱意在模仿人类的认知方式，构建属于机器的知识库，是实现机器认知智能的关键技术，也是网络大数据时代中利用大数据的关键技术。本文从知识图谱构建过程中的关键技术出发，简略研究了知识的抽取与表示，重点分析了知识融合和知识推理技术的研究成果。然而众多研究成果实用性不强，知识图谱虽然已经出现了诸如Magi[104]这样的理论实践者，但距离知识图谱成为机器大脑知识库、实现机器认知智能的终极目标还有不小的距离。未来的研究中，基于网络数据自动构建的知识图谱将成为主流。因而需要进一步提高知识抽取、知识融合和知识推理技术的准确性，确保获取知识的质量；同时提高这些技术的效率，从而保证面对大规模数据量级时的实用性。同时，知识图谱虽然已经在公安情报分析、反金融欺诈等实际问题中开始应用，但是其具有的巨大潜力仍有待挖掘，如何将知识图谱技术应用在生活中的各个方面，也将是未来的主要研究方向。除此之外，目前存在着的大量知识图谱，大多有着结构或者语言上的差异，这种差异增大了知识图谱应用的难度，制定行业规范、整合各个知识图谱、构建通用知识图谱，也是未来知识图谱研究的方向之一。

关注微信公众号：人工智能技术与咨询。了解更多咨询！

你可能感兴趣的:(图像处理)

集成AI离线免费，全平台毫秒级快速处理！纪元A梦资源分享人工智能科技电脑软件抠图
随着PS技术的发展，大家对图像的要求和处理更加的多样化，其中，抠图作为一种常见的图像处理操作，并不是每个小伙伴都完全掌握PS技能，对于那些复杂的抠图操作往往会显得捉襟见肘，近两年随着AI技术的进步，各类软件都和AI集合，希望通过AI快速、高效的实现某些操作；分享一款免费、离线并且内嵌AI模型的抠图工具：鲜艺AI抠图v3.1；获取方式：https://pan.baidu.com/s/1gej6HL4
推荐3D UNet实现：深度学习3D体素数据语义分割的利器！滑辰煦Marc
推荐3DUNet实现：深度学习3D体素数据语义分割的利器！去发现同类优质开源项目:https://gitcode.com/在这个快速发展的深度学习时代，3DUNet已经成为3D图像处理领域中不可或缺的工具，尤其在医疗影像分析和3D物体识别等任务上展现出强大的潜力。这个开源项目为我们提供了一个高效、灵活的3DUNet实现，支持Tensorflow、PyTorch和Chainer三种主流深度学习框架。
MATLAB语言的计算机基础疯狂小小小码农包罗万象 golang 开发语言后端
MATLAB语言的计算机基础引言在当今信息技术飞速发展的时代，编程能力已成为当代人士必备的一项基本技能。MATLAB（矩阵实验室）作为一种高级编程语言和环境，广泛应用于数据分析、算法开发、模型创建、数字图像处理和计算机视觉等多个领域。MATLAB以其强大的矩阵运算和可视化能力，成为了科研人员和工程师的重要工具，尤其在数学、物理、工程等学科中，它的应用不可或缺。本文将从MATLAB的基本概念、环境搭
2025年Photoshop详细教程：从新手到高手，手把手带你学PS Java徐师兄 photoshop Photoshop教程 Photoshop 视频教程 Photoshop 入门教程 Photoshop入门视频教程
2025年Photoshop详细教程：从新手到高手，手把手带你学PS大家好！今天给大家带来一份超实用的2025年Photoshop入门教程，让你从零开始，快速掌握PS的基础操作！如果你是图像处理小白，或者刚刚接触Photoshop的新手，那么这套课程就是专门为你量身定制的哦！这套课程叫做《PS教程-小白系统入门课》，包含了16节高质量的视频教程，搭配丰富的练手素材，跟着我一起，一步步深入了解Pho
【机器学习：二十九、K-means算法：原理与应用】 KeyPan 机器学习机器学习算法 kmeans 人工智能神经网络深度学习数据挖掘
1.K-means概述K-means是一种经典的无监督学习算法，广泛应用于数据聚类任务。其核心思想是将数据集划分为kkk个簇，使得每个簇内的样本尽可能相似，同时不同簇之间尽可能不同。K-means的简单性和高效性使其在模式识别、图像处理、市场分析等领域具有广泛应用。核心思想基于欧几里得距离度量数据点之间的相似性。不断优化簇中心位置，最小化簇内样本与其中心点之间的总距离（即误差平方和，SSE）。适用
学生福利！Edu邮箱助你免费畅用设计软件明庭 adobe idea intellij-idea intellij idea
作为一名学生，想要学习和使用专业的图像处理、设计软件，但高昂的软件费用往往让人望而却步。其实，有一个简单的方法可以让你免费享用这些强大的工具——那就是利用你的Edu教育邮箱。Edu邮箱是什么？Edu邮箱是教育机构颁发给在校学生和教职员工的邮箱，通常以“.edu”结尾。凭借这个邮箱，你可以验证自己的学生身份，从而申请免费使用许多知名的软件。哪些软件可以用Edu邮箱免费申请？Adobe系列软件：Pho
SpringBoot一键提取身份证与营业执照信息一名技术极客 #java相关工具类 spring boot 后端 java
SpringBoot一键提取身份证与营业执照信息使用的工具和库步骤和代码示例添加依赖图像预处理和文字识别信息提取使用OpenCV对图像进行预处理OpenCV图像预处理示例集成到OCR服务中在SpringBoot中实现图片中的身份证号、营业执照等信息的识别，可以分为以下几个步骤：图像预处理：为了提高识别的准确性，首先对图片进行预处理，如调整大小、对比度、亮度等。文字检测：使用图像处理算法或框架来定位
内核详细知识「已注销」基础知识
支持这个网站。捐。Search内核（操作系统）有关其他用途，请参阅内核（消歧）。“内核（计算）”重定向到这里。有关其他用途，请参阅内核（消歧）。“核心（计算机科学）”重定向到这里。不要与Compute内核，内核方法或内核（图像处理）混淆。该内核是一个计算机程序是计算机的核心操作系统，拥有系统的一切完全控制。[1]在大多数系统中，它是启动时加载的第一个程序之一（在引导加载程序之后）。它处理剩余的启动
卷积神经网络（CNN）：深度学习中的核心模型任义礼智信深度学习 cnn 人工智能
引言卷积神经网络（ConvolutionalNeuralNetworks,CNNs）是深度学习领域的一种重要模型，广泛应用于图像处理、计算机视觉、自然语言处理等多个领域。CNN凭借其卓越的特征提取能力和参数共享机制，已成为计算机视觉任务中最主流的算法之一。本文将深入探讨CNN的基本原理、结构组件、应用场景及其发展方向。CNN的基本原理CNN是一种特殊的前馈神经网络（FeedforwardNeura
深度学习图像算法中的网络架构：Backbone、Neck 和 Head 详解肥猪猪爸 #深度学习深度学习算法人工智能数据结构神经网络计算机视觉机器学习
深度学习已经成为图像识别领域的核心技术，特别是在目标检测、图像分割等任务中，深度神经网络的应用取得了显著进展。在这些任务的网络架构中，通常可以分为三个主要部分：Backbone、Neck和Head。这些部分在整个网络中扮演着至关重要的角色，它们各自处理不同的任务，从特征提取到最终的预测输出，形成了一个完整的图像处理流程。本文将详细介绍这三部分的作用以及它们在目标检测和图像分割中的应用，帮助大家更好
C++：实现聚类算法（附带源码） Katie。 c c++实现算法算法聚类支持向量机
项目介绍聚类是无监督学习中一种常用的算法，用于将数据集中的对象分组（称为簇），使得同一簇中的对象相似度较高，而不同簇之间的对象相似度较低。在许多领域，如数据挖掘、图像处理和模式识别等，聚类算法都有广泛应用。在本项目中，我们将实现最常见的聚类算法之一——K均值聚类（K-MeansClustering）。该算法的目标是通过迭代的方式将数据集划分为K个簇，每个簇由其中心（均值）表示。项目实现思路输入参数
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
Matlab2024a安装教程是阿宇呢信息可视化开发语言
MATLAB是一款商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分，可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.解压安装包：①鼠标右击【MATLABR2024a(64bit)
图像处理的作用（6幅图诗）静月园
静月园著2020年1月️4日1自然力出现的图形画面，即无序，又有形。奇妙令人联想无限。好象理石花纹，又类似草木树植。2为何要如此色彩？好奇怪哦！自然的物态鬼斧神工。3孩童们信手涂鸦，但是脑控制了手的动作，所绘画的物体形状代表了孩子们对环境人物的所看，所听，所理解的形状。脑的心理活动影像，被转换成手的动作输出到笔尖的移动动作上，于是我们看到了简单的结构形状图。而对于我们的写作者来说，我们的作家脑内有
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
opencv 之实战项目识别银行卡上的数字 SEVEN-YEARS opencv 计算机视觉人工智能
OpenCV之实战项目：识别银行卡上的数字引言在日常生活中，银行卡的识别是一个常见的需求，特别是在金融领域。本实战项目旨在使用OpenCV库来识别银行卡上的数字。我们将通过模板匹配的方法，结合图像处理技术，来准确识别银行卡上的数字序列。项目准备本项目需要安装Python和OpenCV库。确保已经安装了必要的库，并准备好银行卡图像和数字模板图像。实验素材定义函数importcv2defsort_co
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
MATLAB车牌定位和识别系统清风明月来几时图像算法处理 matlab 开发语言
有很多方法可以实现MATLAB车牌的定位和识别系统。以下是一种可能的实现步骤：车牌定位：使用图像处理技术（如边缘检测、区域生长或颜色分割）来检测图像中的车牌区域。使用形态学操作来排除不符合车牌形状的区域。对车牌区域进行裁剪或调整大小，以便后续的识别。车牌识别：将车牌图像转换为灰度图像。使用图像处理技术（如二值化、滤波或增强）来减少噪音并突出字符。使用字符分割算法将车牌中的字符分开。使用特征提取方法
MATLAB车牌识别系统清风明月来几时图像算法处理 matlab 开发语言
MATLAB车牌识别系统是一个基于MATLAB开发的用于识别和提取车牌信息的系统。该系统使用图像处理和机器学习算法来实现车牌的定位和字符识别。以下是一个基本的MATLAB车牌识别系统的工作流程：图像预处理：首先，将输入的图像进行预处理，包括灰度化、高斯平滑、边缘检测等操作，以提高后续的车牌定位和字符识别的准确性。车牌定位：在预处理后的图像中，使用形态学运算和边缘检测算法来寻找车牌的位置。这可以通过
直方图匹配（Histogram Matching）姜太公钓鲸233 计算机视觉人工智能机器学习
直方图匹配（HistogramMatching），也被称为直方图规定化（HistogramSpecification）或直方图修正（HistogramEqualization），是一种图像处理技术，用于调整图像的直方图，以使其与某个目标直方图相匹配。目标直方图通常是用户定义的或者是希望获得的期望分布。直方图匹配的目标是改变图像的像素值分布，从而使其在视觉上更接近目标直方图。这对于图像增强、风格迁移
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =