开放知识图谱

技术动态 | 不确定性知识图谱的表示和推理

本文转载自漆桂林知乎。

作者 | 张嘉韬、漆桂林、吴天星

文章链接 |

https://zhuanlan.zhihu.com/p/369068016

随着近年人工智能的兴起，各种大型的通用知识图谱和领域知识图谱被构建出来，这些图谱在智能问答、语义搜索、辅助决策等应用中起到了重要作用。但在知识图谱的构建的过程中，始终存在着难以去除的噪声与错误，即不确定性，如何在对不确定性的知识图谱进行表示与推理逐渐引起广泛的关注。

一、知识图谱中的不确定性

有关不确定知识表示与推理的研究在人工智能和知识工程领域并不是什么新话题，早在1994年出版的人工智能领域的经典著作《人工智能——一种现代方法》[1]里就有整整五章的内容对于不确定知识表示与推理进行深入地探讨，其重要性可见一斑。知识图谱的不确定性表示方法早年就有一些研究成果，比如说fuzzy OWL, Probabilistic OWL[2] [3] [4] [5]。然而对于不确定性知识图谱的表示学习与推理的工作是近几年才引起大家的关注。

知识图谱中的不确定性主要来源于两方面：

首先是图谱构造过程中产生的噪声。早期的知识图谱通常由领域专家或人工标注的方式构建，然而大规模图谱的构建难以通过人工方式完成，越来越多的自动化方法参与到了图谱构建过程中，如关系抽取、实体匹配等，这些方法采用机器学习技术，所以往往会产生噪声和错误，许多噪声数据会随着图谱构造过程被保留到最后的图谱当中，并且难以被识别去除。

另一方面，一些知识本身就难以通过确定性的方式被表达。对于很多如医药、法律、金融等领域，许多知识往往带有很强的经验性与概率性，忽视这些性质而直接采用传统图谱三元组的方式表示这些知识是十分不准确甚至是错误的。

二、什么是不确定知识图谱

一些具有不确定性信息的开放知识图谱，如NELL[6]、ConceptNet[7]等，他们为每个三元组添加一个置信度来描述三元组的不确定性。形式化的来说，就是将我们通常知识图谱中三元组(h, r, t)拓展为<(h, r, t), s>，其中h、t代表头实体尾实体、r代表头尾实体之间的关系，s代表置信度。关于不确定性知识图谱的语法和语义，可以参考[2]。图1.给出了这样的一个例子。

图1. 不确定性知识图谱是由带有表示置信度的三元组构成的

三元组的置信度是如何得到的呢？不同的知识库计算置信度的策略有所不同：ConceptNet中置信度是根据众包标注频率计算得到；而NELL则是通过EM算法计算得到的具有概率语义的置信度值；知识检索系统MAGI通过统计三元组的上下文数量计算置信度(如图2.所示)。对于图谱中三元组的置信度分数计算涉及到图谱质量评估方面的研究，比较有代表性的工作有CKRL[8]等。

图2. MAGI中的置信度及其评分依据

确定性的知识图谱构建通常通过设定一个阈值过滤掉低质量的三元组从而保证图谱质量，不确定知识图谱构建则放松了知识都要是准确的和正确的这一假设，允许更多可能具有价值，但置信度较低的三元组保留下来，这样很大程度上提高了图谱的覆盖率，置信度的保留也更加方便了图谱的演化与更新。

三、不确定知识图谱表示学习与推理

如图3.所示，知识图谱表示学习的目标是将图谱中的实体和关系映射成低维、稠密的实值向量。表示学习能很好解决图表示具有的稀疏性，通过更加高效的计算实体和关系的语义联系，从而显著的提升了知识获取、融合和推理能力[9]。

图3. 知识图谱表示学习

相较于确定性的知识图谱表示与推理，不确定知识图谱的表示与推理需要额外补全三元组的置信度。用通常的链接预测的形式来说，如果进行尾实体补全，传统知识图谱推理需要在给定头实体h和关系r的情况下预测尾实体t即(h, r, ?)，而不确定知识图谱推理则需要额外预测推理结果的置信度，即<(h, r, ?), ?>。

对于确定性知识图谱来说，当前比较具有代表性的方法有TransE[10]、DistMult[11]、RESCAL[12]等，这些方法虽然在确定性知识图谱中有不错的效果，然而其并不适合直接应用于不确定知识图谱当中，面临的困难和挑战可分为三个方面：

首先是噪声问题，不确定知识图谱中通常具有较高比例的噪声数据，在该场景下传统的表示推理方法会学习到不准确的图谱表示，从而给出错误的推理结果；
其次是置信度或概率的嵌入及推理问题，传统表示推理方法既不能利用不确定三元组的置信度，也无法给出对于推理结果的置信度；
最后，是隐含信息的挖掘问题，在不确定知识图谱中，许多三元组所描述的事实可能是不够精确的，如何从大量的不精确的三元组中挖掘隐含的有效信息，需要模型具有较强的信息提取能力和归纳推理能力，这些点也是当前表示学习方法所缺少的。

为了解决以上方法存在的问题，当前一些研究从不同角度展开了不确定知识图谱的表示及推理的研究，这里介绍几个具有代表性的工作。

GTransE[14]的主要目标是提高表示模型在学习噪声数据上的鲁棒性，其主要思想是让模型更加专注于学习那些置信度更高的三元组，降低那些质量较差、置信度较低的三元组对实体及关系表示的贡献。具体来说，其基于TransE等表示方法所采用的Margin Loss，利用三元组的置信度动态的调整TransE中的Margin，让置信度更高的三元组的正负例间隔更大，而置信度较小的三元组正负例间隔更小，从而使得模型更加专注于置信度较高的三元组的学习，过程如图4.所示。采用类似思想的方法的还有CKRL[8]，不过CKRL中则是将置信度直接乘以对应三元组的损失函数上，使得置信度较高的三元组具有更高的优化权重。

图4. GTransE

虽然以上方法从一定程度上提高了模型在噪声环境下的鲁棒性，然而其并没有将置信度的具体数值保留在嵌入空间当中，不能较为准确的预测一个三元组的置信度。UKGE[13]首先提出了不确定知识图谱表示学习任务，即实体与关系的表示向量需要同时嵌入图谱的结构信息与置信度信息。具体来说，其基于DistMult[11]的实体与关系的表示方法及能量函数，将原本的Margin Loss更改为MSE Loss来拟合三元组的置信度(如图5.所示)，这样一方面将置信度信息嵌入到实体及关系的距离当中，另一方面只需要利用三元组的能量函数即可预测其置信度。

图5. UKGE Loss Function

此外，UKGE还引入规则作为先验知识，利用PSL概率软逻辑[15]的方式进行对unseen facts进行推理并将其也作为训练数据来训练embedding(如图6.所示)，从而将规则的约束保留到嵌入表示当中。

图6. UKGE中的PSL推理过程

四、我们的工作介绍

下面介绍两篇我们在这方面的工作

首先是被JIST 2019接收的一篇文章：Uncertain Ontology-aware Knowledge Graph Embeddings[16]，当前已经有很多方法尝试对不确定知识图谱进行表示推理，然而其都关注于事实层面，缺少对具有不确定性的本体进行建模的方法，本文希望对包含：Subclass, Domain, Range, Subproperty, Type五类本体关系和数据层的Data类型数据进行建模。

实体、关系、概念的表示上，我们参考TransC[17]及EmbedS[18]的方式：将实体建模成n维空间中的点；概念建模为n维空间中的超球体；关系建模为2n维空间中超球体(也可认为是n维空间中的两个球体)分别用于建模关系的domain和range。这种建模方式的优势是可以直观的反应出来实体与概念、概念与概念间的关系。

与UKGE类似，我们利用实体、概念、关系在嵌入空间中的距离来表征图谱本体的语义关系和不确定性。具体来说，对于Subclass, Domain, Range, Sub-property, Type, Data六类关系，我们定义了六种距离函数分别进行描述，如图7.所示。

图7. 距离函数定义

举一个例子，如图8.所示，对于一个不确定性的三元组来说，其描述了的类型是，并且这条三元组的置信度为，根据上面的距离函数定义，理想情况下其在嵌入空间中的表示应如下图所示，可以看出，我们利用实体和概念之间的距离表征了置信度。

图8. UOKGE示意图

最后，我们在CN15K数据集进行了置信度预测和三元组分类两项实验，根据实验结果可以看出(如图9.)，对比相关方法我们的方法在不确定本体推理方面的效果是最好的。

图9. 实验结果

另外一篇是近期被DASFAA 2021接收的一篇文章：Gaussian Metric Learning for Few-Shot Uncertain Knowledge Graph Completion[19]，本文主要希望解决以下问题：

不确定知识图谱中长尾关系的少样本问题：

由于知识图谱关系数量呈现长尾分布，即图谱中大部分的关系仅有少量三元组描述（如图10.）。当前的不确定知识图谱补全方法假设有充足的训练样本进行表示模型的训练，而对于这些长尾的关系来说，这些少量的样本显然不足以让模型上进行有效的训练，从而导致推理效果的下降。

图10. 知识图谱中关系呈现长尾分布

不确定知识图谱中实体及关系语义不确定性

在少样本设定情况下样本数量已经非常有限，然而更加困难的问题是，这些样本还存在很强的不确定性，这导致实体及关系的语义十分的模糊，使得模型无法学习到实体及关系准确的语义表示。举个例子，图11.是一些NELL中的真实数据，对于关系“synonymfor”(同义词)来说，根据常识我们知道，这个三元组比较准确的反映出了“synonymfor”的语义，而则是不准确的，而则是完全错误的，这些不准确或错误的数据都会让模型对于关系“synonymfor”进行不准确的表征，从而对于其本身的语义产生不确定性。

图11. 关系及实体的语义不确定性

针对以上两个问题，我们提出来一套基于高斯分布的度量学习方法，其主要思想是利用度量学习框架学习到的有效度量解决少样本的问题，利用Gaussian Embedding方式建模实体及关系的语义不确定性。

整体框架如图12.所示，对于关系“synonymfor”，模型仅有Support Set中的若干少样本的不确定三元组描述该关系，框架需要判定Query所描述的三元组是否属于该关系，并且给出置信度。框架首先通过一个Gaussian Encoder将Supports和Query都编码成Gaussian Embedding的形式，Gaussian Embedding由均值向量和方差向量构成，分别代表关系的语义信息和不确定信息。之后通过一个Gaussian Matching Function对两个Gaussian Embedding进行比较和度量。最后度量会给出Support 和Query的相似度及对该相似度的置信度，分别用来补全不确定知识图谱缺失的三元组及其置信度。

图12. 模型框架图

选择Gaussian Embedding的方式建模实体及关系的不确定性的主要动机是，相较于UKGE中同时在语义空间中嵌入语义信息和置信度信息，这种表示方法可以将语义表示和不确定性表示拆分到两个语义空间中，避免两种信息对彼此表示造成的混淆和干扰，也更加方便我们组合不同特征分别进行三元组的推理和置信度的推理。

如图13.所示，我们通过Gaussian Neighbor Encoder结构将Query和Support中的每个三元组编码成一个多维高斯分布，具体做法是利用两个Neighbor Encoder结构来分别编码高斯分布的均值和方差，对于Support来说，还需要对多个多维高斯分布进行聚合，聚合成为一个多维高斯分布。

图13. Gaussian Neighbor Encoder结构图

如图14.所示，Matching Function是Metric Learning方法的核心，需要对Support和Query的Gaussian Embedding进行度量比较，并给出相似度及置信度。这里我们将Metric也表示成为一个一维高斯分布，其均值代表匹配的相似度，方差表示对于该相似度的置信度。均值和方差分别通过一个基于LSTM的Matching Network进行计算，该模块可以将两个Embedding利用LSTM进行多次循环匹配，从而发现深层次的有效度量。最后，我们通过Metric这个一维高斯分布随机变量来计算Support和Query的similarity和confidence。

图14. Gaussian Matching Function结构图

为了测试模型在少样本以及不确定知识图谱中的表现，我们基于NL27K数据集构建了四个少样本的数据集：NL27K-N0/N1/N2/N3，分别加入0%、10%、20%、40%比例的噪声数据模拟真实的不确定性环境，设定Support Set的size为3，即对于每种关系仅可以观测到三个样本，数据集统计如图15.所示。最后利用CKRL[8]方法赋予每个三元组置信度。

图15. 数据集统计

部分实验结果如图16.所示，可以看到没有针对少样本情况进行优化的UKGE在样本数量较少情况下表现不佳，而其他少样本的方法如FSRL[20]和GMatching[21]在没有噪声情况下具有较好的表现，而随着噪声比例越来越高，这些方法性能也随之下降，而我们的方法在所有数据集中都可以取得最好效果，不过对于高比例的噪声数据，如N3，效果依然有很大的提升空间。

图16. 链接预测实验结果

这里提供数据集及代码地址：https://github.com/zhangjiatao/GMUC

五、思考及总结

本篇文章我们介绍了不确定知识图谱的表示与推理，具体包括：知识图谱中的不确定性及其来源、不确定知识图谱定义、不确定知识图谱表示推理方法与挑战、一个少样本不确定性知识图谱推理方法等内容。

可以看出，不确定知识图谱的表示推理的中蕴含的假设更加接近真实场景，所以可以在许多方面进行应用：首先，在一些风险敏感性应用(如自动驾驶、投资决策等)中，模型错误的决策往往会造成非常大的风险或损失，这时不确定的表示及推理方法给出的置信度可以作为重要的决策依据，降低模型造成的风险及损失；其也可以应用于机器人当中，尤其当机器人处于陌生场景下，其对周围环境认知存在很大不确定性，可以利用不确定性表示及推理方法来支持其在认知受限场景下进行推理及行动，此外还可以基于置信度触发机器人和人类的交互，让人类帮助机器人进行学习，也让机器人认知过程更加接近人类。

参考文献

[1] Stuart J. Russell, Peter Norvig: Artificial intelligence: a modern approach[J]. 1994.

[2] Chang Liu, Guilin Qi, Haofen Wang, Yong Yu: Reasoning with Large Scale Ontologies in Fuzzy pD* Using MapReduce. IEEE Comput. Intell. Mag. 7(2): 54-66 (2012)

[3] Zhangquan Zhou, Guilin Qi, Chang Liu, Pascal Hitzler, Raghava Mutharaju: Reasoning with Fuzzy-EL+ Ontologies Using MapReduce. ECAI 2012: 933-934

[4] Raghav Ramachandran, Guilin Qi, Kewen Wang, Junhu Wang, John Thornton: Probabilistic Reasoning in DL-Lite. PRICAI 2012: 480-491

[5] Chang Liu, Guilin Qi: Toward Scalable Reasoning over Annotated RDF Data Using MapReduce. RR 2012: 238-241

[6] Tom M. Mitchell, William W. Cohen, Estevam R. Hruschka Jr. , et al. Never-ending learning[J]. Communications of the ACM, 2018, 61(5): 103-115.

[7] Robyn Speer, Catherine Havasi: ConceptNet 5: A Large Semantic Network for Relational Knowledge. The People's Web Meets NLP 2013: 161-176

[8] Ruobing Xie, Zhiyuan Liu, Fen Lin, Leyu Lin: Does William Shakespeare REALLY Write Hamlet? Knowledge Representation Learning With Confidence. AAAI 2018: 4954-4961

[9] 刘知远, 孙茂松, 林衍凯, 等. 知识表示学习研究进展[J]. 计算机研究与发展, 2016, 53(2): 247-261.

[10] Antoine Bordes, Nicolas Usunier, Alberto García-Durán, Jason Weston, Oksana Yakhnenko: Translating Embeddings for Modeling Multi-relational Data. NIPS 2013: 2787-2795

[11] Bishan Yang, Wen-tau Yih, Xiaodong He, Jianfeng Gao, Li Deng: Embedding Entities and Relations for Learning and Inference in Knowledge Bases. ICLR (Poster) 2015

[12] Maximilian Nickel, Volker Tresp, Hans-Peter Kriegel: A Three-Way Model for Collective Learning on Multi-Relational Data. ICML 2011: 809-816

[13] Xuelu Chen, Muhao Chen, Weijia Shi, Yizhou Sun, Carlo Zaniolo: Embedding Uncertain Knowledge Graphs. AAAI 2019: 3363-3370

[14] Natthawut Kertkeidkachorn, Xin Liu, Ryutaro Ichise: GTransE: Generalizing Translation-Based Model on Uncertain Knowledge Graph Embedding. JSAI 2019: 170-178

[15] Kimmig A, Bach S, Broecheler M, et al. A short introduction to probabilistic soft logic[C]//Proceedings of the NIPS Workshop on Probabilistic Programming: Foundations and Applications. 2012: 1-4.

[16] Khaoula Boutouhami, Jiatao Zhang, Guilin Qi, Huan Gao: Uncertain Ontology-Aware Knowledge Graph Embeddings. JIST (2) 2019: 129-136

[17] Xin Lv, Lei Hou, Juanzi Li, Zhiyuan Liu: Differentiating Concepts and Instances for Knowledge Graph Embedding. EMNLP 2018: 1971-1979

[18] Gonzalo I. Diaz, Achille Fokoue, Mohammad Sadoghi: EmbedS: Scalable, Ontology-aware Graph Embeddings. EDBT 2018: 433-436

[19] Jiatao Zhang, Tianxing Wu, Guilin Qi: Gaussian Metric Learning for Few-Shot Uncertain Knowledge Graph Completion. DASFAA (1) 2021: 256-271

[20] Chuxu Zhang, Huaxiu Yao, Chao Huang, Meng Jiang, Zhenhui Li, Nitesh V. Chawla: Few-Shot Knowledge Graph Completion. AAAI 2020: 3041-3048

[21] Wenhan Xiong, Mo Yu, Shiyu Chang, Xiaoxiao Guo, William Yang Wang: One-Shot Relational Learning for Knowledge Graphs. EMNLP 2018: 1980-1990

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 网站。

mac 安装 python2 梦魇梦狸º macos python
官网下载2.7：PythonReleasePython2.7.18|Python.org查找地址：whichpython2#/usr/local/bin/python2设置npm使用Python2（新建窗口）：npmconfigsetpython/usr/local/bin/python2验证Python版本npmconfiggetpython#应返回你设置的Python2路径python2--v
使用ChatLlamaCpp和Llama CPP Python进行聊天模型集成 AWsggdrg llama python 开发语言
在这篇文章中，我们将探讨如何使用ChatLlamaCpp和LlamaCPPPython库来搭建一个强大的聊天模型。我们将详细讲解如何进行模型集成，并提供完整的代码示例以帮助您快速上手。技术背景介绍随着自然语言处理技术的不断发展，越来越多的应用需要集成复杂的聊天模型以提高交互能力。ChatLlamaCpp是一个基于LlamaCPPPython库构建的聊天模型，支持多种功能调用和结构化输出，非常适合用
Django网站搭建流程补三补四 #Django框架后端开发 sqlite 数据库 django 后端 python
使用Django搭建网站是一个系统的过程，涉及从环境搭建到部署上线的多个步骤。以下是详细的流程：1.环境搭建（1）安装PythonDjango是基于Python的Web框架，因此需要先安装Python。建议安装Python3.8及以上版本。下载地址：Python官网。（2）安装Django使用pip安装Django：pipinstalldjango检查Django是否安装成功：django-adm
七.网络模型 Kylin524 运筹学 python
最小(支撑)树问题最小部分树求解：破圈法：任取一圈，去掉圈中最长边，直到无圈；加边法：取图G的n个孤立点｛v1，v2，…，vn}作为一个支撑图，从最短边开始往支撑图中添加，见圈回避，直到连通（有n－1条边）最短路问题求最短路有两种算法：求从某一点至其它各点之间最短离的狄克斯屈拉(Dijkstra)算法求网络图上任意两点之间最短路的Floyd(弗洛伊德)矩阵算法最短路问题的数学模型最大流问题：最大流
Java 学习路线全解析：从基础到实战，全面掌握 Java 编程 ZIM学编程知识分享 java 学习开发语言
在当今数字化时代，Java作为一种广泛应用且极具影响力的编程语言，为众多开发者开启了通往技术世界的大门。无论是大型企业级应用开发，还是互联网后端服务构建，Java都展现出了强大的适应性和稳定性。以下是一条系统全面的Java学习路线，帮助你逐步攀登Java编程的高峰。一、JavaSE基础（20天）JavaSE是整个Java编程的基石，扎实掌握这部分内容至关重要。通过学习诸如变量、数据类型、控制语句、
C# 与 Python 代码互相调用的实践一只小灿灿 net Python c#python
一、引言在当今的软件开发领域，不同的编程语言都有其独特的优势和适用场景。C#是一种功能强大、面向对象的编程语言，主要应用于Windows平台开发、企业级应用开发以及游戏开发（借助Unity引擎等）等领域；而Python则以其简洁的语法、丰富的库以及在数据科学、机器学习、自动化脚本等众多方面的出色表现备受青睐。在实际的项目开发中，有时候我们希望能够结合这两种语言的优势，实现C#与Python代码的互
重生之我在异世界学编程之算法与数据结构：深入堆篇就爱学编程数据结构与算法算法数据结构 c语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录正文一、堆的基本概念二、堆的存储表示三、堆的基本操作1.插入元素（Insert）2.删除最大/最小值（ExtractMax/Min）3.构建堆（BuildHeap）四、源码（1）heap.h（2）heap.c（3）Test.c五、堆的应用1.优先队列2
python和PLC通信（以太网modbustcp） weixin_51506576 python 开发语言自动化
要在Python中与PLC建立通信，通常需要进行以下步骤流程：1.确定PLC的通信协议：不同的PLC厂商和型号可能采用不同的通信协议，例如Modbus、OPCUA、Profinet等。请先确定您的PLC使用的是哪种通信协议（本文为modbustcp）。2.安装相应的Python库：根据您所选择的PLC通信协议，在Python中安装相应的库。例如，如果使用Modbus协议，可以安装`pymodbus
plc编程和python的联系_通过Python与西门子PLC通信 weixin_39788960 plc编程和python的联系
供大家想要与西门子PLC通信的朋友使用1、该程序是通过pythonsnap7连接西门子1200、1500系列PLC并按照I、Q、M区采集打印信息；2、用户打开应用程序之前，要将目录下的snap7.dll、snap7.lib拷贝到C盘system32或syswow64目录下，具体根据系统版本而定；3、填写config配置文件和csv文件，其中config文件每行代表意思分别是：——》plc_ip=1
python snap7 plc_Python-Snap7获取西门子PLC 300数值 weixin_39541767 python snap7 plc
说明在一次数采项目中，对现场PLC300进行取数。本人小白，在网上搜罗了大量信息，终于找到解决方法。准备事项1.操作系统2.Python环境（本次使用Python3.6.6）3.Snap7connectconnect('192.168.0.1',rack=0,slot=1)三个参数分别为：IP地址，机架，插槽read_area及write_area函数read_area(self，area，dbn
Python文件封装成EXE（可执行文件）苏学能 python 开发语言后端
Section1-创建纯python环境创建一个python环境，最好32位的，这样执行生成的exe可以在32位系统和64位系统上运行，此外，打包编译的exe也不至于过于庞大，以及出现总是打包不成功的问题。Section2-执行pipinstallpyinstaller在纯python环境中pip命令下执行。Section3-修改配置文件：#-*-mode:python-*-block_ciphe
大模型的部署方法三：使用Xinference部署大模型微调部署人工智能 AI大模型大模型 AI 深度学习大模型部署
Xinference是一个分布式推理框架，它支持一键部署各种模型，包括大型语言模型（LLMs）。使用Xinference部署AI大模型的步骤：一、安装Xinference1）环境准备：确保您的系统上安装了Python3.9或以上版本。安装Docker（如果选择使用Docker部署）。2）安装Xinference：通过Python的包管理工具pip安装Xinference：pipinstall"xi
Django学习笔记 Atmanlee python SQL Django
Django跟着“自强学堂”学习django。。。。。感谢学堂！！！https://code.ziqiangxuetang.com/django/django-tutorial.html（自强学堂）Django使用python开发的免费开源的web框架，用于快速搭建网站。特点之一就是拥有强大的数据库操作接口(QuerySetAPI),如果需要也可以执行原生SQLDjango概览urls.py网址入
FastAPI教程：快速构建高性能API 迪小莫学AI fastapi python
FastAPI教程：快速构建高性能API介绍FastAPI是一个现代的、快速的（高性能）Web框架，用于构建APIs，基于标准的Python类型提示。它非常适合用于构建高效、易于维护的API服务。FastAPI支持自动生成文档，输入数据验证和异步编程，且性能接近Go和Node.js。本教程目标本教程将带领你构建一个简单的FastAPI应用，包括：1.创建FastAPI项目2.定义和处理API端点3
基于大数据的商品推荐系统的设计与实现 JAVA编码选手个人作品案例展示分享大数据 spring boot maven vue.js 后端 javascript
摘要在当今互联网时代，随着电子商务的快速发展，各行各业都面临着海量数据的挑战和机遇，电子商务极大地改变了商业运作的方式，为消费者和企业带来了前所未有的便利和机会。该毕业设计以京东商品数据为来源，设计与实现基于大数据的电商商品推荐系统。通过对电商商品数据进行深度挖掘，可以发现消费趋势、产品热门度、价格以及地区差异等信息，为市场营销和产品策略提供重要参考。利用Java语言及SpringBoot框架、M
Python 打包成 EXE 的方法详解小黄编程快乐屋 1024程序员节
#1024程序员节｜征文#日常开发中，python由于其便捷性成为了很多人的首选语言，但是python的环境配置也是有点麻烦的，那么我们如何让其变得更加友好呢？没错，就是打包成exe可执行文件。一、PyInstaller简介PyInstaller是一个非常流行的Python工具，可以将Python脚本打包为独立的可执行文件。它支持Windows、macOS和Linux系统，特别适合需要跨平台打包的
【Python】如何将列表中的所有字符串转换为整数 civilpy python windows 开发语言
基本原理在Python编程中，我们经常需要处理数据类型的转换。例如，你可能从数据库、文件或用户输入中获取数据，这些数据通常以字符串的形式存在。但是，如果你需要进行数学运算，就必须将这些字符串转换为整数或其他数值类型。本篇文章将为你介绍如何使用Python将列表中的所有字符串元素转换为整数。代码示例在Python中，有几种方法可以实现这一转换。以下是一些常见的方法：示例1：使用循环和内置函数int(
python PLC_IP协议 Modbus应用(一） Kamach_83 tcp/ip 网络 python 模块测试
在Python中与PLC建立通信，通常需要进行以下步骤：1.确定PLC的通信协议：不同的PLC厂商和型号可能采用不同的通信协议，例如Modbus、OPCUA、Profinet等。需要确定您的PLC使用的是哪种通信协议（本文为modbustcp）。2.安装相应的Python库：根据您所选择的PLC通信协议，在Python中安装相应的库。本文使用Modbus协议，故安装`pymodbus`库3.连接到
Python基础—用python读取xml文件！小尤笔记 python xml 开发语言
读取XML文件在Python中是一个常见的任务，通常可以使用内置的xml.etree.ElementTree模块来完成。这个模块提供了简单而高效的XML解析和生成功能。下面是一个详细的代码示例和讲解，展示了如何使用xml.etree.ElementTree来读取XML文件。代码示例假设我们有一个名为example.xml的XML文件，内容如下：120081411004201159900我们的目标是
深入探秘 Java 网络编程：从基础到多线程服务器的全方位指南 2的n次方_ java 网络服务器
我的主页：2的n次方_Java作为一门功能强大的编程语言，不仅在桌面应用、移动开发、后端开发等领域表现出色，还在网络编程中拥有广泛的应用。网络编程涉及在两个或多个设备之间通过网络进行通信，这对于构建分布式系统、客户端-服务器应用程序、以及互联网服务至关重要。在这篇博客中，我们将详细探讨Java网络编程的基础知识，并通过代码示例展示如何在Java中实现网络通信。1.Java网络编程基础Java网络编
Python OpenAI 库开发指南：从入门到实战精通 senger_lcc python 开发语言
在人工智能（AI）领域，OpenAI无疑是全球最受瞩目的机构之一。它推出的GPT系列模型、DALL·E等创新技术，正在深刻改变各行各业。作为Python开发者，我们该如何快速上手并高效利用OpenAI的API，成为了提升个人竞争力的关键。本文将带你从零开始，深入解析Python语言中的openAI库，助你掌握AI开发的核心工具，成为AI领域的专家。一、什么是openAI库？它能为开发者带来什么？1
Python入门：4.Python中的运算符平凡程序猿~ Python python
引言Python是一间强大而且便捷的编程语言，支持多种类型的运算符。在Python中，运算符被分为算术运算符、赋值运算符、复合赋值运算符、比较运算符和逻辑运算符等。本文将从基础到进阶进行分析，并通过一个综合案例展示其实际应用。1.算术运算符算术运算符用于执行基本的数学操作。常见的算术运算符以下是Python常见算术运算符的表格：运算符描述示例结果+加法3+25-减法3-21*乘法3*26/除法（浮
计算机创造的奇迹——C语言 UnwaterBreathing C c语言开发语言
一.简介C语言是一种较早的程序设计语言，诞生于1972年的贝尔实验室。1972年，DennisRitchie设计了C语言，它继承了B语言的许多思想，并加入了数据类型的概念及其他特性。尽管C语言是与UNIX操作系统一起被开发出来的，但它不只支持UNIX。C是一种通用（广泛可用）的编程语言。程序设计语言实与编译器是一体的，C编译器有著名的GCC（GNUCompilerCollection）等。广泛应用
Python 中 PIL 构建图片裁剪工具 winfredzhang python crop
概述这篇博客将为您展示如何使用wxPython和PIL库开发一个图片裁剪工具。本工具能够加载图片，允许用户通过拖拽选择框裁剪图片，并保存裁剪后的结果。以下是完整代码和实现步骤。C:\pythoncode\new\cropimageandsave.py功能特性图片加载：支持加载JPG和PNG格式的图片。动态裁剪：通过鼠标绘制矩形选择框进行裁剪。缩放适配：图片会根据面板大小自动缩放显示。保存裁剪结果：
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
python读取路径只能是双左斜杠、双右斜杠、左斜杠，不能是右斜杠吗？神笔馬良人工智能
问题描述：python读取路径只能是双左斜杠、双右斜杠、左斜杠，不能是右斜杠吗？问题解答：在Python中，读取文件路径时，可以使用双左斜杠（\），也可以使用双右斜杠（//），或者使用单左斜杠（/）。事实上，Python中的路径处理函数通常会接受和处理这三种形式的路径分隔符。但是，在Windows操作系统中，路径中的分隔符通常是反斜杠（\），而在Linux和Unix系统中通常是正斜杠（/）。因此，
Python 操作 Elasticsearch 全指南：从连接到数据查询与处理 XMYX-0 python elasticsearch jenkins
文章目录Python操作Elasticsearch全指南：从连接到数据查询与处理引言安装`elasticsearch-py`连接到Elasticsearch创建索引插入数据查询数据1.简单查询2.布尔查询更新文档删除文档和索引删除文档删除索引批量插入数据处理分页结果总结Python操作Elasticsearch全指南：从连接到数据查询与处理引言在大数据分析与搜索应用中，Elasticsearch是
Python（四）——SVG 图坐标轴数字和其他文本设置总结八年。。 python 开发语言笔记
在学术论文中，图像的质量和规范性直接影响文章的专业性和表达效果。尤其是在使用Python绘制SVG图时，图像的字体选择、大小设置、以及整体样式需要符合期刊或会议的要求。这不仅能提升视觉呈现的清晰度，还能增强论文内容的可读性和说服力。因此，合理设置坐标轴字体（如数字使用“TimesNewRoman”、文字使用“宋体”）和调整图像细节是学术制图中不可忽视的重要环节。1.设置全局字体frommatplo
《零基础Go语言算法实战》【题目 7-4】删除数组重复项，使每个元素只出现一次并返回新的长度廖显东-ShirDon 讲编程算法算法数据结构 go语言 go web web编程程序员 golang
《零基础Go语言算法实战》【题目7-4】删除数组重复项，使每个元素只出现一次并返回新的长度给定一个排序数组array，就地删除重复项，使每个元素只出现一次并返回新的长度。不要为另一个数组分配额外的空间，开发者必须通过使用空间复杂度为O(1)的额外内存就地修改输入数组来做到这一点。示例如下。输入：array=[5,5,6]输出：2【解答】①思路。本题可以通过希尔排序算法实现。注意本题中数组的删除并不
【Es】python es操作小毛驴吃梨子 elasticsearch python 大数据
表因为es是集群所以es_hosts是列表fromelasticsearchimportElasticsearchES_HOSTS=["127.0.0.1:9200"]ES_HTTP_AUTH="******************"#连接Eses=Elasticsearch(hosts=ES_HOSTS,http_auth=ES_HTTP_AUTH,maxsize=60,timeout=30,m
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

技术动态 | 不确定性知识图谱的表示和推理

你可能感兴趣的:(大数据,算法,编程语言,python,计算机视觉)