zenRRan

【知识图谱】知识图谱嵌入模型简介

来自：MIRA Lab

知识图谱 (Knowledge Graphs) 是大规模语义网络知识库，采取符号化的知识表示方式，利用三元组来描述具体的知识，并以有向图的形式对其进行表示和存储，具有语义丰富、结构友好、易于理解等优点。由于在表达人类先验知识上具有优良的特性，知识图谱近年来在自然语言处理、问答系统、推荐系统等诸多领域取得了广泛且成功的应用。

图1：知识图谱示意图

然而，知识图谱通常存在链接缺失问题，这限制了知识图谱在相关下游任务中的应用。为解决该问题，知识图谱补全任务应运而生。知识图谱补全旨在根据知识图谱中已有事实推断出新的事实，从而使得知识图谱更完整。

知识图谱嵌入 (Knowledge Graph Embedding) 是解决知识图谱补全问题的重要方法之一，它通过将知识图谱中的实体 (Entity) 和关系 (Relation) 嵌入到连续向量空间，从而在方便计算的同时保留知识图谱中的结构信息。知识图谱嵌入模型大致可以分为三类：

基于距离的模型 (Distance-based Models)
双线性模型 (Bilinear Models)
神经网络模型 (Neural Network Models)

本文将首先简要介绍知识图谱补全任务，然后回顾总结各类知识图谱嵌入模型，最后就模型的统一评测进行补充说明。

知识图谱补全任务

符号定义

知识图谱通常以三元组 (Triple) 来表示知识，三元组的一般格式为 (头实体，关系，尾实体)，如“金庸的表兄是徐志摩”表示成三元组为 (金庸，表兄，徐志摩)，其中金庸为头实体，徐志摩为尾实体，表兄是这两个实体之间的关系。我们使用小写的字母来分别表示头实体、关系和尾实体，表示知识图谱中的一个三元组。相应地，小写加粗字母分别表示头实体、关系和尾实体对应的嵌入向量。向量的第个元素记作。表示嵌入向量的维度。表示两个向量间的 Hadamard (element-wise) product。另外，我们使用来分别表示和范数。

补全任务与性能指标

知识图谱补全 (Knowledge Graph Completion)，是根据知识图谱中已有的三元组去对未知三元组进行预测。我们使用表示已知头实体和关系来预测尾实体，表示已知关系和尾实体来预测头实体，其中和被称为查询 (Query)。实际上，知识图谱补全任务，本质上给定查询下的排序问题。比如，对于图2所示的查询 (陆小曼，丈夫，？)，返回的是预测答案的排序列表，正确答案排名越高，预测的效果就越好。

图2：查询示意图

对于知识图谱补全任务，常用的性能评测指标有：MR (Mean Rank)，MRR (Mean Reciprocal Rank), 和 Hits@N。

MR 是针对一系列查询返回排名的平均值：
MRR 是针对一系列查询返回排名取倒数之后的平均值：
Hits@N 是排名在前名所占的比例：

其中，如果，，否则。

在一些实际应用中，MRR 能够比 MR 更好地反映排名的综合情况。例如，在一次测试中共有4次查询，模型A返回的排名结果序列为 [1,1,1,40001]，模型B返回的排名结果序列为 [10000,10000,10000,10000]，从 MR 的角度，模型A效果略差于模型B，但从 MRR 的角度，模型A的效果远好于模型B。在实际应用中，可能的场景是模型给出若干个最可能的结果供人选择，我们可以发现排名10000的结果和排名40001的结果由于排名非常靠后，很难出现在供人选择的若干结果中，这两个结果虽然排名值相差30001，但是他们对实际应用的贡献都接近0。从这个角度讲，使用 MRR 来评价这两个模型更为合适。

知识图谱补全数据集

知识图谱补全任务上，目前常用的数据集有 WN18RR, FB15k-237 和 YAGO3-10 等，它们分别是 WN18，FB15k 和 YAGO3 的子集。WN18 和 FB15k 数据集早期被用于知识图谱补全任务，但是后来有研究者发现这两个数据集存在一定的测试集泄漏问题，在这两个数据集上，简单的基于规则的方法就能够达到先进模型的效果，所以 WN18 和 FB15k 渐渐不被研究者使用。表1显示了知识图谱补全数据集的具体统计信息，其中数据集大小指的是三元组的数量。

表1：知识图谱补全数据集

知识图谱嵌入模型

知识图谱嵌入模型的设计通常需要三步：1）定义实体和关系的表示形式；2）定义衡量三元组合理性的打分函数；3）训练学习实体和关系的嵌入表示 [13]。打分函数值越高，代表三元组的合理性越高，即正确的可能性越大。在训练学习实体和关系的嵌入表示时，优化目标是使得知识图谱中已有三元组得分尽可能比未出现的三元组得分要高。根据打分函数的定义形式，可以将知识图谱嵌入模型大致分为基于距离的模型、双线性模型和神经网络模型。部分知识图谱嵌入模型的打分函数对比见表2。

表2：知识图谱嵌入模型打分函数对比。其中表示 Hadamard product，表示激活函数，表示循环相关运算 (Circular Correlation Operation)，表示 2D 卷积操作，表示卷积层的滤波器 (Filter)，表示 ComplEx 模型中的复向量取共轭和 ConvE 模型中的实向量的 2D reshaping。

基于距离的模型

基于距离的模型将关系建模成从头实体到尾实体的距离变换，并通过变换后的距离差来定义打分函数。

TransE [2] 假设实体和关系满足，其中，表示向量维度，定义打分函数为：

其中，我们使用来代表在该打分函数中使用范数或者范数皆可。

然而，TransE 模型难以处理多对一、一对多、多对多问题。以一对多问题为例，如存在两个三元组，在 TransE 模型下，我们有，由此可得。这可能是不合理的，例如，我们有两个三元组为 (金庸，作品，倚天屠龙记) 和 (金庸，作品，天龙八部)，从TransE模型的角度，要求倚天屠龙记 和 天龙八部这两个实体的嵌入向量非常相近，然而倚天屠龙记和天龙八部显然是不同的作品。

通过让实体在不同关系下拥有不同的嵌入向量，可以一定程度解决这个问题。TransR [3] 提出针对每个关系设计一个投影矩阵，实体在不同关系下的表示为：

通过这种方式，实体在不同关系下可以有不同的表示，最后的打分函数定义为：

其中，。

另一方面，为了能够更好地建模知识图谱中的关系模式，RotatE [4] 把关系定义成复空间中头实体到尾实体的旋转变换 (Rotation)，并假设实体和关系满足，其中，表示向量维度，RotatE 的打分函数为：

最近，HAKE [1] 模型使用极坐标系建模知识图谱中普遍存在的语义分层现象，利用模长部分建模分属不同层级的实体，利用角度部分建模属于同一层级的实体，在主流数据集上的性能超越了现有基于距离的模型。感兴趣的读者可以参考我们之前的分享了解详细情况：HAKE。

图3：HAKE 模型示意图 [1]

双线性模型

双线性模型采用乘积形式的打分函数来衡量实体和关系的语义相关性。

RESCAL [5] 定义打分函数为：

可以看作是的双线性函数，其中矩阵。为了降低计算量，DistMult [6] 将矩阵设计成对角矩阵，HolE [7] 则使用循环相关运算 (Circular Correlation Operation) 来代替中间的关系矩阵乘积。这些方法计算方式的示意图见图5。

图4：双线性模型计算方式示意图 [13]

ComplEx [8] 模型将 DistMult 模型扩展到复数空间，从而更好地建模反对称和可逆关系，它的打分函数为：

其中，，代表对向量取共轭，代表取实部。

神经网络模型

神经网络模型将同时输入神经网络，来判断三元组的打分。早期的工作如 MLP [9] 使用全连接神经网络来对给定的三元组进行打分。近年来，ConvE [10] 等工作使用卷积神经网络 (Convolutional Neural Network) 来定义打分函数。由于知识图谱是一种图结构的数据，近期也有一些工作将图神经网络 (Graph Neural Network) 应用于知识图谱嵌入。

图5：MLP 模型计算示意图 [13]

模型统一评测

近年来，大量的知识图谱嵌入模型被提出，各种方法层出不穷，模型效果的实际对比有待研究。近期，有两篇工作对现有的知识图谱嵌入模型进行了一些总结和重新评测，揭示了各个模型性能在统一评测下的效果，也为我们提供了对这些模型更为清晰的认识。

Zhiqing Sun 等人 [11] 指出，使用不恰当的评测方式，可能会造成实验结果虚高。在进行效果评测时，可能会有一些三元组得分和正确答案的得分相同，这时候针对这些相同得分的结果集合可以有不同的排序策略：

TOP：将正确答案排在的最前面
BOTTOM：将正确答案排在的最后面
RANDOM：给正确答案在中随机分配一个位置

值得注意的是，TOP 的排序策略在某些情况下是不恰当的，会导致结果虚高。一个直观的例子是，让一个模型对所有的候选三元组打分都输出0，这时正确答案和所有候选三元组得分相同，在 TOP 排序策略下，该模型所有正确答案都排名第一，评测性能达到顶峰。但实际上，由于候选三元组得分相同，该模型在预测时无法判别哪个为正确答案。由此可见，TOP 的排序策略会导致结果虚高。文章指出，RANDOM 的排序策略是最为合理的 [11]，这和我们实际的认知也是相符合的，即给定多个相同得分的候选者，我们通常采用随机的方式来挑选。采用统一的 RANDOM 策略进行评测之后，可以发现有些模型尤其是部分神经网络模型的性能显著下降，这表明有些模型由于不恰当的评测方式，导致了结果的虚高，这是我们需要注意甄别的。

另外，Daniel Ruffinelli 等人 [12] 对各种知识图谱嵌入模型中使用到的训练方式进行了系统的实验和研究，发现一些早期的模型如 RESCAL 在调整训练方式和进行更大的超参搜索之后，也能够达到或者超过现有先进模型的效果。这也显示了模型性能的提升未必是方法具有很大的优势，训练技巧也可能在其中起到不小的作用，我们需要通过统一评测去认知各个方法中真正有价值的思路和想法。

总结

本文首先简要介绍了知识图谱补全任务，包括评测方式、评测指标和评测数据集。知识图谱嵌入是处理知识图谱补全任务的重要方法之一。本文按照基于距离的模型、双线性模型和神经网络模型的分类方式，对知识图谱嵌入模型进行简要介绍。最后，本文结合两篇最新工作，指出模型统一评测的重要性。限于篇幅原因，本文只进行了简要的总结，更多细节请参考相应的原论文，以下给出文中参考文献的详细列表。

参考文献：

[1] Zhanqiu Zhang, Jianyu Cai, Yongdong Zhang, and Jie Wang. 2020. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction. In AAAI.

[2] Antoine Bordes, Nicolas Usunier, Alberto Garcia-Durán, Jason Weston, and Oksana Yakhnenko. 2013. Translating Embeddings for Modeling Multi-relational Data. In NIPS.

[3] Yankai Lin, Zhiyuan Liu, Maosong Sun, Yang Liu, and Xuan Zhu. 2015. Learning Entity and Relation Embeddings for Knowledge Graph Completion. In AAAI.

[4] Zhiqing Sun, Zhi-Hong Deng, Jian-Yun Nie, and Jian Tang. 2019. RotatE: Knowledge Graph Embedding by Relational Rotation in Complex Space. In ICLR.

[5] Maximilian Nickel, Volker Tresp, and Hans-Peter Kriegel. 2011. A threeway model for collective learning on multi-relational data. In ICML.

[6] Bishan Yang, Scott Wen-tau Yih, Xiaodong He, Jianfeng Gao, and Li Deng. 2015. Embedding Entities and Relations for Learning and Inference in Knowledge Bases. In ICLR.

[7] Maximilian Nickel, Lorenzo Rosasco, and Tomaso Poggio. 2016. Holographic Embeddings of Knowledge Graphs. In AAAI.

[8] Théo Trouillon, Johannes Welbl, Sebastian Riedel, Éric Gaussier, and Guillaume Bouchard. 2016. Complex Embeddings for Simple Link Prediction. In ICML.

[9] Xin Luna Dong, Evgeniy Gabrilovich, Geremy Heitz, Wilko Horn, Ni Lao, Kevin Murphy, Thomas Strohmann, Shaohua Sun, and Wei Zhang. 2014. Knowledge vault: A webscale approach to probabilistic knowledge fusion. In SIGKDD.

[10] Tim Dettmers, Pasquale Minervini, Pontus Stenetorp, and Sebastian Riedel. 2018. Convolutional 2d knowledge graph embeddings. In AAAI.

[11] Daniel Ruffinelli, Samuel Broscheit, and Rainer Gemulla. 2020. You CAN Teach an Old Dog New Tricks! On Training Knowledge Graph Embeddings. In ICLR.

[12] Zhiqing Sun, Shikhar Vashishth, Soumya Sanyal, Partha Pratim Talukdar, and Yiming Yang. 2020. A Re-evaluation of Knowledge Graph Completion Methods. In ACL.

[13] Quan Wang, Zhendong Mao, Bin Wang, and Li Guo. 2017. Knowledge Graph Embedding: A Survey of Approaches and Applications. In TKDE.

作者简介：陈佳俊，2019年毕业于厦门大学自动化系，获得工学学士学位。现于中国科学技术大学电子工程与信息科学系的 MIRA Lab 实验室攻读研究生，师从王杰教授。研究兴趣包括知识表示与知识推理。

下载一：中文版！学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套！

后台回复【五件套】
下载二：南大模式识别PPT

后台回复【南大模式识别】

说个正事哈

由于微信平台算法改版，公号内容将不再以时间排序展示，如果大家想第一时间看到我们的推送，强烈建议星标我们和给我们多点点【在看】。星标具体步骤为：

（1）点击页面最上方“深度学习自然语言处理”，进入公众号主页。

（2）点击右上角的小点点，在弹出页面点击“设为星标”，就可以啦。

感谢支持，比心。

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家：

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

专辑 | 情感分析


整理不易，还望给个在看！

AI未来趋势：AIGC浪潮下看AI训练师如何塑造智能未来（技术变革）用心去追梦前端 html css
在AIGC（AIGeneratedContent，人工智能生成内容）浪潮下，AI训练师扮演着至关重要的角色，他们不仅推动了技术的发展，还在确保这些技术能够安全、高效地服务于社会方面发挥了重要作用。以下是AI训练师如何塑造智能未来的几个关键方面：1.技术变革与创新算法与模型训练预训练：通过大规模无标注数据的学习，构建具备基础语言理解和生成能力的基座模型。这一过程为后续更精细的任务打下了坚实的基础。指
【1000个GDB技巧之】GDB中使用python脚本的方法以及4个注意事项（define、python、end、gdb.execute、to_string=True）北冥的备忘录 Linux调试方法 python 调试 gdb
要点使用define定义函数在define中使用python…end包围python使用的代码（python代码也可以不在包围中）在python中使用gdb命令用gdb.execute，并且需要指定to_stringsgdb可以单独写成文件然后source进来坑：坑1：python和gdb的end都不值直接注释，需要另起一行坑2：gdb.execute执行后的输出结果包括$xxx获取需要做转换坑3
深入理解AIGC背后的核心算法：GAN、Transformer与Diffusion Models 忘梓. 杂文 AIGC 算法生成对抗网络
深入理解AIGC背后的核心算法：GAN、Transformer与DiffusionModels前言随着人工智能技术的发展，AIGC（AIGeneratedContent，人工智能生成内容）已经不再是科幻电影中的幻想，而成为了现实生活中的一种新兴力量。无论是自动生成文章、绘制图像、生成音乐还是创作视频，AIGC都在各个内容创作领域崭露头角。然而，这些“智能创作”的背后究竟依赖于哪些算法？今天，我们将
华为OD机试E卷 - 补种未成活胡杨（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 java 华为od python c语言 c++javascript 华为OD机试E卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述近些年来，我国防沙治沙取得显著成果。某沙漠新种植N棵胡杨（编号1-N），排成一排。一个月后，有M棵胡杨未能成活。现可补种胡杨K棵，请问如何补种（只能补种，不能新种），可以得到最多的连续胡杨树？输入描述N总种植数量，1<=N<=100000M未成活胡杨数量，M个空格分隔的数，按编号从小到大排列，1<=M<=NK最多可以补
华为OD机试 - 树状结构查询（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od c++java javascript 华为od机试华为OD机试E卷 python
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述通常使用多行的节点、父节点表示一棵树，比如西安陕西陕西中国江西中国中国亚洲泰国亚洲输入一个节点之后，请打印出来树中他的所有下层节点输入描述第一行输入行数，下面是多行数据，每行以空格区分节点和父节点接着是查询节点输出描述输出查询节点的所有下层节点。以字典序排序示例1输入5bacadcecfdc输出def说明
【Python八股文系列】100个Python的面试/笔试高频考点程序员鑫港 python python 面试开发语言 python面试题 python入门 python笔试题 python入门教程
Python的100个面试/笔试高频考点本文主要整理了关于Python的面试/笔试的一些考点，可用于查漏补缺。前排提示：文末有独家福利！文章目录Python的100个面试/笔试高频考点1\.解释型和编译型语言的区别2\.简述下Python中的字符串、列表、元组和字典3\.简述上述数据类型的常用方法4\.简述Python中的字符串编码5\.一行代码实现数值交换6\.is和==的区别7\.Python
【华为OD-E卷 - 第k个排列 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 python 华为od java c++javascript
【华为OD-E卷-第k个排列100分（python、java、c++、js、c）】题目给定参数n，从1到n会有n个整数：1,2,3,…,n,这n个数字共有n!种排列。按大小顺序升序列出所有排列的情况，并一一标记，当n=3时,所有排列如下:“123”“132”“213”“231”“312”“321”给定n和k，返回第k个排列输入描述输入两行，第一行为n，第二行为k，给定n的范围是[1,9],给定k的
哈希算法篇——散落的秘密与精准的归宿，混沌中的秩序之美（上）诚丞成常用算法讲解哈希算法算法
文章目录引言：混沌中的秩序之美第一章：哈希的本质——化繁为简的魔法第二章：经典哈希函数——一座算法的博物馆第三章：哈希表的奇迹——从无序到有序的转变3.1哈希函数的基本实现3.2基本的哈希表实现3.3哈希算法的实际应用小结引言：混沌中的秩序之美在信息科学的星空下，有一种算法宛如一位洞悉混沌的智者，能够以其独特的规则，在无限的可能性中找到秩序。这便是哈希算法（HashingAlgorithm），一个
Kali Linux最新版本下无法直接pip安装？教你四招完美解决‘externally-managed-environment’报错！ vortex5 教程 Kali笔记 pip Kali 渗透经验分享
内容预览≧∀≦ゞKaliLinux中解决externally-managed-environment错误的四种方法引言解决方案1：从系统存储库安装Python包解决方案2：使用虚拟环境解决方案3：使用pipx安装（推荐）解决方案4：强制安装（不推荐）总结KaliLinux中解决externally-managed-environment错误的四种方法引言在KaliLinux的最新版本中，很多用户尝
Python基于OpenCV和PyQt5的人脸识别上课签到系统【附源码】 Java老徐 Python 毕业设计 python opencv 人脸识别上课签到系统人脸识别上课签到上课签到系统 PyQt5
博主介绍：✌Java老徐、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2024-2025年Java毕业设计选题推荐Python基于Django的微博热搜、微博舆论可视化系统，附源码基于PythonDjango的北极星招聘数据可视化系统感兴趣的可以先收藏起
如何使用python下载B站视频并使用ffmpeg进行合流操作 Zombie_man python 音视频开发语言 ffmpeg
需要了解的工具：先看看我发的第一期专栏，里面有关开发者模式的介绍，一些相关的请求库与解析库。本期专栏将不再赘诉。下载ffmpeg。下载官网链接：https://ffmpeg.org/download.html。注意：如果想要在cmd中使用，需要先配置环境变量有关于此的介绍与使用详细可以看此链接：https://zhuanlan.zhihu.com/p/356411237本期将导入subproces
Python FileNotFoundError: [WinError 2] 系统找不到指定的文件。 zhangda0000001 python python
用Idle运行Python脚本的时候发现如下错误：Traceback(mostrecentcalllast):File"D:\Python\Python36-32\lib\site-packages\selenium-3.4.3-py3.6.egg\selenium\webdriver\common\service.py",line74,instartstdout=self.log_file,st
自动化办公|使用Python重命名并移动文件到对应文件夹游客520 自动化 python全栈学习实用代码 python 自动化
在日常的文件管理和处理过程中，我们可能会遇到需要将文件整理到不同文件夹中的需求。例如，我们有一个包含多个文件的目录，文件名的首字符表示文件应该存放在哪个文件夹中。我们可以使用Python脚本来自动完成这个任务，实现文件的分类整理。本文将介绍如何通过Python编写一个脚本来实现以下功能：检查并删除空文件夹；将文件按照文件名的首字符分类，移动到对应的文件夹中。1.基本需求假设我们有一个文件夹save
python分段线性插值_计算方法（3）——分段插值法（附Python程序） weixin_39900206 python分段线性插值
在上一节计算方法(2)——插值法(附Python程序)当中，主要讲了插值法，介绍了龙格现象，并给出了插值法的代码。这一讲主要分段插值中的分段线性插值和分段Hermite插值，并给出分段插值的Python程序。在此之前需要注意一下，n为区间数，n+1为插值节点的个数。分段线性插值分段线性插值，需要两个列表，一个用于存放各点的x坐标，一个用于存放各点的y坐标。因为分段插值的算法需要x坐标按顺序增长，而
Erlang语言研究综述 weixin_34233856 java shell 数据结构与算法
2019独角兽企业重金招聘Python工程师标准>>>摘要:本文前半部分主要是关于Erlang编程语言相关的内容；着重就一般学习编程语言的一般的关注点来阐述了Erlang编程语言的基本语法点，主要包括：Erlang的变量、Erlang的数据类型、Erlang的语句和Erlang编程语言的函数与模块四个方面；本文的后半部分主要就Erlang语言的并行化编程的实践：Erlang的并行化编程与Erlan
利用Pygame实现Python塔防游戏开发阿卞是宝藏啊
本文还有配套的精品资源，点击获取简介：本项目介绍如何使用Python的pygame库制作塔防游戏，强调游戏开发的各个基本流程和技巧。包括初始化pygame、游戏结构设计、游戏逻辑实现、图像与声音处理，以及游戏优化和调试过程。项目旨在提升开发者在Python编程和游戏开发方面的技能。1.Python与pygame库基础简介Python是一种广泛应用于各个领域的高级编程语言，以其简洁明了的语法和强大的
FileNotFoundError: [WinError 2] 系统找不到指定的文件解决方案诗和远方ya 软件相关问题 python
在windows终端运行python程序时，报错FileNotFoundError:[WinError2]系统找不到指定的文件，但是检查完文件路径后发现并没有错，考虑到是不是需要加环境变量，以及通过sys.path.append在python文件中加上引用的其他文件的绝对路径。还是不管用。解决方案是：找到python源代码中的subprocess.py文件，将shell=False改为shell=
[使用Claude API构建回文检查应用的指南] qwe54165a4wd easyui 前端 javascript python
技术背景介绍AnthropicAPI提供了对Claude的访问功能，Claude是一个强大的语言模型，能够回答各种文本相关的问题。通过该API，我们可以开发应用程序，比如让Claude帮助我们实现一个检查字符串是否为回文的Python函数。核心原理解析回文是指正读和反读都相同的字符串。通过ClaudeAPI，我们可以让Claude生成用于检查回文的Python代码。AnthropicAPI的最大优
计算机系统原理：一些断言梅见十柒计算机系统原理经验分享笔记
0虚拟机和解释器在Java中，JVM既充当了一个虚拟机的角色，也包含了用于执行字节码的解释器。同样地，Python的CPython实现也是先将源代码编译成字节码，然后由Python虚拟机执行。1从源代码中提取token的过程就是词法分析词法分析是编译过程的第一个阶段，它的主要职责是从源代码中读取字符序列，并根据语言的词法规则将它们组合成具有独立意义的最小语法单元——Token。词法分析器会去除无关
AIGC - 深度洞察如何对大模型进行微调以满足特定需求网罗开发 AI 大模型人工智能 AIGC
网罗开发（视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：COC上海社区主理
【填坑】ESP-IDF 环境安装常见报错信息和解决方案清凉简装 ESP32 ESP-IDF 物联网 ESP32S2
文章目录Windows平台ESP-IDF环境安装常见报错信息和解决方案一、install时报错**Q1：错误信息：Downloadfailed操作超时或者installationhasfailedwithexitcode-2****Q2：错误信息：Downloadfailed:anerroroccurredinthesecurechannelsupport****Q3：错误信息：'python'：
如何使用 Python 实现简单的算法与数据结构全栈探索者chen python python 算法数据结构开发语言 javascript 数据分析性能优化
如何使用Python实现简单的算法与数据结构算法和数据结构是计算机科学的基础，理解它们不仅有助于解决复杂问题，还能提高编程效率和代码质量。在Python中，由于其简洁和高效的语法，学习和实现算法与数据结构更加轻松。本文将从以下几个方面探讨如何用Python实现常见的数据结构和基本算法，帮助你从基础开始掌握核心概念。一、数据结构1.数组（Array）数组是一种线性数据结构，存储一组相同类型的元素。P
如何使用LangChain内置工具和工具包 jkgSFS langchain microsoft python
在当今快速发展的人工智能应用开发中，利用现有的工具和工具包能大幅加快开发进程，提高应用的效率和功能性。本文将带您深入了解LangChain中的内置工具和工具包的使用方法，并通过示例代码进行演示。技术背景介绍LangChain是一个旨在简化应用程序创建的框架，其拥有丰富的第三方工具集成。这些工具可以帮助开发者轻松访问和操作如Wikipedia等大型数据集。核心原理解析LangChain工具通过API
AIGC视频生成国产之光：ByteDance的PixelDance模型好评笔记 AIGC-视频补档 AIGC 计算机视觉人工智能深度学习机器学习论文阅读面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
使用Amazon Bedrock API调用Anthropic的Claude模型 dwa46a56w4d easyui 前端 javascript python
在AI模型应用领域，亚马逊的BedrockAPI提供了便捷的方式来访问诸如Anthropic的Claude这样强大的模型。通过AmazonBedrock，开发者可以在云端直接调用Claude进行各种自然语言处理任务。本指南将引导您如何在Python中通过Bedrock来使用Claude模型。技术背景介绍Claude是由Anthropic开发的AI模型，提供强大的自然语言处理能力。通过AmazonB
【锂电池寿命】基于BP锂电池寿命预测（matlab) 大橘科研工作室毕设锂电池方向（MATLAB版）matlab
【锂电池寿命】基于BP锂电池寿命预测（matlab)文章目录【锂电池寿命】基于BP锂电池寿命预测（matlab)一、引言1.1、研究背景1.2、研究意义二、文献综述2.1、锂电池寿命预测研究现状2.2、常见预测方法对比2.3、BP神经网络在寿命预测中的应用三、研究方法与数据准备3.1、BP神经网络模型设计3.2、数据来源与预处理3.3、特征提取与选择四、模型训练与验证4.1、训练过程4.2、模型验
STLG_05_04_Python - 函数魔都天健开发语言前端笔记 python
Python函数是一种可重用的代码块，用于执行特定任务。它通过def关键字定义，可以接受参数作为输入，并通过return语句返回值。函数能够提高代码的模块化和可读性，方便维护和调试。无论是内置函数还是自定义函数，它们都是Python编程中实现功能和逻辑的重要工具。1.函数的定义和调用1.1函数的定义在Python中，函数是一段可重复使用的代码块，用于执行特定的任务。函数可以帮助我们将代码模块化，提
Python_线性插值胡小记 python
1、语法解释线性插值主要用到的是numpy中的interp函数interp(x,xp,fp,left=None,right=None,period=None)其中x为要插值点的横坐标，xp为x的坐标值（必须是递增），fp为y的坐标值left是可选择参数，如果x小于xp，则会默认返回xp[0]对应的fp值，right同理。period可设定横坐标的周期，该选项打开时，则忽略left和right。具体
亮相AICon，火山引擎边缘云揭秘边缘AI Agent探索与实践边缘计算智能硬件ai开发
12月13-14日，AICon全球人工智能开发与应用大会在北京成功举办。火山引擎边缘智能技术负责人谢皓受邀出席大会，以《AIAgent在边缘云的探索与实践》为主题，与全球AI领域的资深专家，共同深入探讨大模型落地、具身智能、多模态大模型、AIAgent等前沿技术如何推动行业变革、引领未来发展。火山引擎边缘智能技术负责人谢皓指出，随着AI时代的到来，边缘智能由传统的物联网、智慧物联，逐渐演变成智能体
如何用selenium来链接并打开比特浏览器进行自动化操作（1）写python的鑫哥爬虫实战进阶 selenium pyppeteer puppeteer 比特浏览器比特指纹浏览器链接打开
前言本文是该专栏的第76篇，后面会持续分享python爬虫干货知识，记得关注。本文，笔者将基于“比特浏览器”，通过selenium来实现链接并打开比特浏览器，进行相关的“自动化”操作。值得一提的是，在本专栏之前，笔者有详细介绍过“使用selenium或者pyppeteer（puppeteer）来链接并打开指纹浏览器AdsPower”的方法和详细教程。笔者将相关文章的链接，整理如下（对此领域，感兴趣
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l