PaperWeekly

如何使用知识图谱增强信息检索模型？

©PaperWeekly 原创 · 作者｜刘布楼

学校｜清华大学博士生

研究方向｜表示学习

传统的信息检索模型中，文本通常使用词袋模型表示。该方法有两个较为明显的缺陷：1）只能通过 TF-IDF 等相关信号判断查询-文本相关性；2）模型没有深入理解查询和文本的语义信息，而是更多地依赖于特征工程的方法。

近年来流行的方法主要可以分为两大类：1）通过知识图谱引入背景信息和先验知识；2）通过深度学习技术从大规模的数据中学到信息的隐性表示。

本文主要针对第一种思路进行探讨：通过引入知识图谱中的实体以及实体的描述信息丰富语义，从而优化信息检索模型。知识图谱中的实体可以是一些概念、人名地名等等，这些实体排除介词的干扰，赋予查询和文本更简洁的表示，并引入知识图谱中的语义信息，增强信息检索模型的语义理解能力。

本文内容将介绍五篇通过知识图谱优化信息检索模型的论文，分别是：1）基于知识图谱的学术检索模型；2）词袋和实体的结合表示优化排序；3）结合查询实体链接特征优化排序；4）基于核方法的实体重要性建模和排序优化；5）基于实体的神经信息检索模型。

基于知识图谱的学术检索模型

论文链接：http://www.cs.cmu.edu/~cx/papers/Explicit_Semantic_Ranking.pdf

论文概述

当前学术检索系统面临的主要挑战是检索系统无法理解学术概念而限制了学术检索的效果。例如“Softmax Categorization”和“Softmax Classification”表达的含义相同，但是词袋模型无法将其归为一类；而“Dynamic programming segmentation”在图像处理领域中表示语义分割，在自然语言处理领域中表示分词，但是词袋模型无法区分这两种概念。

本提出的方法是借助知识图谱，在实体空间中对查询和文本进行表示，然后通过他们的知识图谱嵌入表示建立语义连接，从而优化查询的效果。

算法详解

该算法主要分为两个部分，第一部分是建立知识图谱，第二部分是根据查询对学术论文进行语义排序。

建立知识图谱（Knowledge Graph Construction）：

建立知识图谱首先需要获取实体，论文给出两种途径：从 S2's corpus 中抽取关键词和从 freebase 里面获得；然后将论文中出现的 surface form 链接到实体；再后对每个实体建立四种边，分别是作者 (author), 上下文 (context), 描述 (desc)，发表刊物 (venue)；最后根据这四种边所连接的对象分别用 skip-gram 的方法得到实体嵌入表示。

语义排序（Explicit Semantic Ranking）：

该部分首先将查询和文本链接的实体两两计算语义相似度：

然后在查询词维度上做 max-pooling 操作（相当于针对每个文本实体仅考虑和它语义相关性最大的查询实体）：

再后在文本维度上做 bin-pooling 操作（将不同范围内的语义匹配信号各自相加，从而概括查询实体和文本实体之间的匹配情况）：

最后以此为特征输入全连接层计算得到最后的分数：

具体的算法流程如图所示：

创新和发现

建立辅助学术检索的知识图谱，包括两个重要发现：使用的 edge2vec 的方法是一种效率高且效果好的知识图谱嵌入表示方法；使用 freebase 获得的实体相比于直接从 S2's corpus 中抽取关键词效果更好。

使用 bin-pooling 操作抽取聚合相关性信号：该方法结合了直接匹配 (exact matching) 信号和软匹配 (soft matching) 信号，并将不同范围内的语义匹配信号各自相加，更有效的发掘查询和文本之间的语义相关信息。

词袋和实体的结合表示优化排序

论文链接：https://arxiv.org/abs/1706.06636

论文概述

在 ESR 论文中，查询和文本的表示仅考虑了链接实体而忽略了原有的词，导致了一定的信息损失。

本文提出了一种将词袋和知识图谱链接到的实体相结合，从而优化信息检索的框架。采用的方法是首先通过基于词袋的表示和基于实体的表示对查询和文本建模，然后利用词袋空间交互信息、实体空间交互信息和跨空间交互信息生成排序特征，最后使用注意力机制消除实体注释过程中产生的噪音信息，生成最终的相关性分数。

算法详解

该算法的主要流程分为三个部分，即第一部分是生成基于词袋和实体的表示，第二部分是词袋-实体表示结合的相关性抽取，第三部分是注意力机制聚合相关性信息。

生成基于词袋和实体的表示 (word and entity based representations)：

该部分将查询和文本表示为词袋和实体两种形式（即每次词/实体及其出现的频率）。其中实体的筛选过程包括两个步骤：获取 surface form (spotting) 和选取最有可能的候选实体 (disambiguation)。

词袋-实体表示结合的相关性抽取 (matching with word-entity duet)：

该部分首先基于四种交互方式（查询词-文本词、查询实体-文本词、查询词-文本实体、查询实体-文本实体）生成特征，前三者主要基于统计特征，实体-实体交互特征基于 ESR 模型生成的排序特征。

查询词-文本词具体构造方法：

查询实体-文本词具体构造方法：

查询词-文本实体具体构造方法：

查询实体-文本实体具体构造方法：

注意力机制聚合相关性信息 (attention features)：

针对于查询实体可能不准确的问题，该方法针对交互特征使用注意力机制生成注意力特征（即各个特征的权重），该注意力特征主要从歧义特征和查询重要性两个方面生成，具体表示如下：

因此对查询词交互特征和查询实体相关特征进行区分，查询词注意力分数设置为 1，查询实体注意力分数根据注意力特征获得，具体表示如下：

然后使用一维 CNN 聚合交互特征和注意力特征，并将二者相乘得到最后的相关性分数：

具体算法流程图如图所示：

创新和发现

将词袋表示和实体表示相结合，克服了仅适用词袋表示时语义信息不丰富和仅适用实体表示时造成信息损失的缺点，优化了知识图谱增强信息检索模型的结构。

针对查询实体引入了注意力特征，为生成的排序信号赋予权重，从而解决了引入的查询实体不准确的问题，特别在查询实体较多的情况下体现出较好的效果。

结合查询实体链接特征优化排序

论文链接：http://www.cs.cmu.edu/~cx/papers/JointSem.pdf

论文概述

在原有的方法构建排序特征的过程中，实体链接往往只是一个预处理的步骤，而没有将链接的信息作为特征加入到排序模型里。

本文提出了一种将查询实体链接和基于实体的文本排序模型结合起来构造语义相似度排序模型的办法。采用的方法是利用获取 surface form (spotting) 的信息和链接 (linking) 信息表示候选实体的重要性，从而通过链接实体的过程优化文本排序的特征。

算法详解

该算法的流程相对较为简单，主要是分为两个步骤，第一步生成三种特征（surface form 特征，链接特征和基于实体的文本排序特征），第二步根据这些特征计算排序分数。特征生成（surface form 特征，链接特征和基于实体的文本排序特征）：

Surface form 特征：首先将查询划分为能在 surface form 字典里面查找到的最大的 ngrams，然后根据每个 surface form 和候选实体之间的关系构造特征。例如和语料库中的每个实体分别连接的概率、连接概率最大的实体和第二大的实体之间概率的差值、自身的长度等等。

链接特征：将每个实体对齐到第一步所得到的 surface form 的过程中获取。例如和每个 surface form 之间连接的概率，和查询词之间通过嵌入表示计算的相似度以及和每个查询词的最匹配实体之间通过嵌入表示计算的相似度等。

基于实体的文本排序特征：通过普通的检索模型得到的文本排序特征，例如 BM25, TF-IDF 等等。

具体三种特征的表示如下：

相关性分数计算：

Surface form 的重要性表示如下：

对齐实体的重要性表示如下：

文本排序特征表示如下：

最终的相关性分数计算方法如下：

创新和发现

本文通过抽取实体链接过程中的特征，赋予链接实体不同的权重，从而优化基于实体的文本排序模型。

针对 surface form 选取链接性靠前的几个实体，相比于只选取一个实体，排序的效果可以得到提升。

基于核方法的实体重要性建模和排序优化

论文链接：https://arxiv.org/abs/1805.01334

论文概述

在原来的工作中，实体重要性建模主要停留在查询实体的层面上，而文本实体重要性主要通过出现频率确定。

本文提出的方法更好地估计文本中的实体重要性。具体来说，首先使用知识图谱中的描述信息丰富实体表示，再利用核方法对目标实体和文本中的词、实体进行交互式建模，最后将交互式特征聚合估计实体重要性。

在该方法的基础上可以优化信息检索模型的效果。具体来说，可以将查询实体和目标文本中的词和实体以核方法进行交互式建模得到特征作为排序特征，从而计算相关性分数。

算法详解

该模型获取交互式特征的过程可以分为两个步骤：加入知识的实体表示 (Knowledge Enriched Embedding) 和基于核方法的交互式建模 (KerneI Interaction Model)。随后将该特征输入全连接网络可以用于实体重要性估计任务和信息检索任务。

加入知识的实体表示 (Knowledge Enriched Embedding)：

该步骤首先使用 CNN 对实体描述信息建模得到新的实体描述表示：

然后将实体表示和实体描述表示拼接并聚合得到加入知识的实体表示：

完整的加入知识的实体表示生成流程如下图所示：

基于核方法的交互式建模 (Kernel Interaction Model)：

该步骤首先将目标实体和文本词使用核方法进行交互式建模：

然后将目标实体和文本实体使用核方法进行交互式建模：

最后将二者拼接获得交互式特征：

完整基于核方法的交互式建模流程如下：

实体重要性打分：计算实体相对于文本的重要性程度只需将交互式特征输入全连接层即可：

检索模型应用：计算查询实体和文本的匹配程度只需将查询实体输入该模型建模得到交互式特征，并在交互式特征的每个维度上计算 log sum 得到统一的交互式特征，并输入全连接层得到最终的相关分数：

完整的检索模型应用流程图如下：

创新和发现

在频繁使用的实体和较少使用的实体之间具有较好的平衡型，这是对实体频率模型最重要的改进。

该方法在短文中的效果相比于原来方法有较大的提高。

在信息检索的过程中，可以辅助判断查询实体的重要性（提及还是强调），有利于增强模型对查询的理解。

基于实体的神经信息检索模型

论文链接：https://www.aclweb.org/anthology/P18-1223

源码链接：https://github.com/thunlp/EntityDuetNeuralRanking

论文概述

在以上介绍的方法中，均是通过知识图谱提取人工特征，而没有利用神经网络自动提取知识图谱的语义信息。

本文将知识图谱中的实体信息作为先验知识加入神经信息检索已有的较好模型（KNRM [6], Conv-KNRM [7]）中，提出 EDRM 模型，从而达到提升信息检索泛化能力的效果。

算法详解

该方法分为两个部分，第一部分是生成四个相关信号矩阵：查询词-文本词矩阵、查询实体-文本词矩阵、查询词-文本实体矩阵、查询实体-文本实体矩阵，第二部分是结合 KNRM 和 Conv-KNRM 等神经信息检索模型聚合相关信号矩阵得到相关分数。

相关信号矩阵生成：

该步骤需要根据词向量和实体语义向量分别计算相似度矩阵。其中查询词嵌入和文本词嵌入的方法和神经信息检索的方法是完全一样的，如果使用 K-NRM 则直接使用原本的词向量，如果使用 Conv-KNRM 则根据卷积核的大小变化得到 unigrams, bigrams, trigrams 的向量。实体语义向量需要计算三个向量并聚合得到，分别是实体向量，描述向量和类型向量。

实体向量直接使用实体本身的向量即可：

描述向量需要将实体描述的词向量通过卷积神经网络的计算得到：

类型向量需要将实体的类型向量通过注意力机制计算得到：

将三种向量聚合得到实体语义向量：

最后计算四个相关信号矩阵：查询词-文本词矩阵、查询实体-文本词矩阵、查询词-文本实体矩阵、查询实体-文本实体矩阵，并拼接得到排序特征：

神经信息检索模型聚合相关信号：
神经信息检索模型 K-NRM 通过核池化函数抽取不同范围内的相关信号，将每个相似度矩阵输入可以得到排序特征：

对于 Conv-KNRM 模型，需要构造基于 n-grams 的相似度矩阵：

最后将核池化函数提取的相关性特征作为全连接层的输入得到相关性分数：

创新和发现
EDRM 模型具有较好的泛化能力，相较于原来的神经信息检索模型有更好的排序效果。
在信息较难提取的情况（如查询文本长度较短）下：EDRM 相较于原来的神经信息检索模型有较大突破，这说明该模型可以在信息较少的情况下结合知识图谱中的信息提高查询的效果。

总结

通过知识图谱引入背景信息和先验知识已经在信息检索模型中取得了较好的效果，证明实体语义对于理解查询意图、优化排序结果有很大的帮助，未来的研究可以从引入知识图谱的关系入手，建立更丰富、更智能化的知识指导式信息检索模型，而不仅仅局限于知识图谱中的实体语义信息。

参考文献

[1] Chenyan Xiong, Russell Power, Jamie Callan. Explicit Semantic Ranking for Academic Search via Knowledge Graph Embedding. WWW (2017)

[2] Chenyan Xiong, Jamie Callan, and Tie-Yan Liu. Word-entity duet representations for document ranking. SIGIR (2017)

[3] Chenyan Xiong, Zhengzhong Liu, Jamie Callan, Eduard Hovy. JointSem: Combining Query Entity Linking and Entity based Document Ranking. CIKM (2017)

[4] Chenyan Xiong, Zhengzhong Liu, Jamie Callan, Tie-Yan Liu. Towards Better Text Understanding and Retrieval through Kernel Entity Salience Modeling. SIGIR (2018)

[5] Zhenghao Liu, Chenyan Xiong, Maosong Sun, Zhiyuan Liu. Entity-Duet Neural Ranking: Understanding the Role of Knowledge Graph Semantics in Neural Information Retrieval. ACL (2018)

[6] Chenyan Xiong, Zhuyun Dai, Jamie Callan, Zhiyuan Liu, and Russell Power. End-to-end neural ad-hoc ranking with kernel pooling. SIGIR (2017)

[7] Zhuyun Dai, Chenyan Xiong, Jamie Callan, and Zhiyuan Liu. Convolutional neural networks for softmatching n-grams in ad-hoc search. WSDM (2018)

点击以下标题查看更多往期内容：

知识图谱实体链接：一份“由浅入深”的综述
BERT+知识图谱：知识赋能的K-BERT模型
从 Word2Vec 到 BERT
后 BERT 时代的那些 NLP 预训练模型
从三大顶会论文看百变Self-Attention
从 EMNLP 2019 看知识图谱领域最新进展

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

???? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

???? 投稿邮箱：

• 投稿邮箱：[email protected]

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
Maya自定义右键菜单样例教程 holy-pills
本文还有配套的精品资源，点击获取简介：本文详细指导如何在Maya中通过脚本节点自定义右键菜单，增强工作效率和个性化工作环境。自定义右键菜单允许用户根据个人习惯调整菜单项，使之更加便捷。文章介绍了创建脚本节点、编写菜单脚本、关联菜单到视图以及保存和加载自定义菜单的具体步骤。同时提供了实际操作样例，帮助用户更好地理解和应用这一技巧。1.Maya自定义右键菜单的重要性Maya，作为三维动画制作的行业标准
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 计算机视觉人工智能机器学习算法深度学习
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的有个假设：就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。具体来说，这是通过对比诚实和不诚实场景下的模型隐藏状态实现的。importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizer,AutoConfigimportnum
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
Spring WebFlux 响应式编程原理与实战指南
SpringWebFlux响应式编程原理与实战指南一、技术背景与应用场景随着微服务与高并发的迅速发展，传统的阻塞式编程模型在处理大量并发请求时容易导致线程资源耗尽、响应延迟增高。SpringWebFlux基于ReactiveStreams规范，通过非阻塞、背压机制，实现高吞吐、低延迟的Web服务。典型应用场景包括：实时数据推送：WebSocket或Server-SentEvents场景。高并发AP
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
基于Python的智能公示信息监控爬虫系统开发实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言音视频搜索引擎 scrapy
摘要本文详细介绍了如何使用Python构建一个高效的公示信息监控爬虫系统。系统采用最新技术栈，包括异步爬取、智能解析、反反爬策略等，能够自动监控各类政府网站、企业公示平台的更新信息。文章从系统设计到具体实现，提供了完整的代码示例和详细的技术解析，帮助读者掌握大规模公示信息采集的核心技术。关键词：Python爬虫、公示监控、信息采集、异步爬取、智能解析1.引言在数字化时代，各类公示信息（如政府采购、
基于Python的Google Scholar学术论文爬虫实战：最新技术与完整代码解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言学习 scrapy
摘要本文详细介绍如何使用Python构建一个高效的GoogleScholar爬虫系统，包括代理设置、反反爬策略、数据解析与存储等核心技术。文章涵盖最新Python爬虫技术栈（如Playwright、异步IO等），提供完整可运行的代码示例，并讨论学术爬虫的伦理与法律问题。通过本教程，读者将掌握从GoogleScholar批量获取学术论文信息的高级爬虫技术。关键词：Python爬虫、GoogleSch
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

如何使用知识图谱增强信息检索模型？

描述向量需要将实体描述的词向量通过卷积神经网络的计算得到：

最后计算四个相关信号矩阵：查询词-文本词矩阵、查询实体-文本词矩阵、查询词-文本实体矩阵、查询实体-文本实体矩阵，并拼接得到排序特征：

神经信息检索模型聚合相关信号： 神经信息检索模型 K-NRM 通过核池化函数抽取不同范围内的相关信号，将每个相似度矩阵输入可以得到排序特征：

你可能感兴趣的:(如何使用知识图谱增强信息检索模型？)

神经信息检索模型聚合相关信号：
神经信息检索模型 K-NRM 通过核池化函数抽取不同范围内的相关信号，将每个相似度矩阵输入可以得到排序特征：