不一样的雅兰酱

CIKM-2016-DRMM-A Deep Relevance Matching Model for Ad-hoc Retrieval

A Deep Relevance Matching Model for Ad-hoc Retrieval

DRMM by Jiafeng Guo, Yixing Fan, Qingyao Ai and W.Bruce Croft for CIKM2016

文章目录

A Deep Relevance Matching Model for Ad-hoc Retrieval

摘要(Abstract)
1.概述(Introduction)

Machine learning for IR
Deep learning for IR

deep models for ad-hoc retrieval

2.Ad-hoc检索作为一个匹配问题

Ad-hoc retrieval ——(formalize)—— > text matching problem
两类深度匹配模型

以表示为中心的模型（representation-focused model）
以交互为中心的模型（representation-focused model）
存在的问题
提出的问题

3.语义匹配 VS. 相关性匹配
4.本文的模型架构DRMM

模型架构
形式化描述
本文采用的词嵌入
三个组成部分
实验效果
主要贡献

5.总结

摘要(Abstract)

关键词：相关性匹配，语义匹配，神经模型，Ad-hoc检索，排序模型
背景：DNN在语音识别、计算机视觉和NLP任务中取得了极大的突破，但是在ad-hoc检索任务并没有取得多少积极的结果。
关键：在ad-hoc检索任务和NLP匹配任务中有根本上的不同，在于ad-hoc检索任务主要是关于相关性匹配(relevance matching),而NLP匹配任务更多地是考虑语义匹配(semantic matching)。

一个好的相关性匹配需要正确处理精确匹配信号，查询项重要性和多种多样的匹配需求。
本文研究工作：
- 提出深度相关匹配模型（Deep Relevance Matching Model, DRMM）
- 主要组成部分：匹配直方图映射(matching histogram mapping), 前馈匹配网络(feed forward matching network)以及词项门控网络( term gating network)，以解决以上上个问题。
数据集及表现：

TREC——Robust04 和ClueWeb-09-Cat-B，与传统的检索模型和state-of-the-art深度匹配模型相比，很有竞争力。

1.概述(Introduction)

应用于信息检索的方法：Machine learning methods -> Deep learning models

Machine learning for IR

近年来，机器学习方法已成功应用于信息检索(IR)。通常排序函数(ranking function)可以基于一系列人为定义的特征，对于一个给定的查询和文档对给出相关性分数。然而手工设置的特征存在有以下几个缺点：

耗时（time-consuming）
不完整（incomplete）
过于精确（over-specified）

Deep learning for IR

而另一方面，深度神经网络，作为一个表示学习(representation learning)工具,有能力从训练数据的隐藏结构和抽象的不同层级的特征中发现对任务有用的特征。深度学习目前已经被成功应用于语音设别(speech recognition,2011),计算机视觉(computer vision，2013)以及自然语言处理(Natural Language Processing,NLP,2015)，并且已经产生了显着的性能改进。鉴于这些领域深度学习的成功，深度学习似乎应该对IR产生重大影响。然而，到目前为止，关于IR任务的深度模型，特别是ad-hoc 检索任务的积极结果很少。

deep models for ad-hoc retrieval

当将深度模型应用于ad-hoc检索时，检索任务一般会被形式化为两段文本(也就是查询query和文档document)的匹配问题。这种匹配问题通常被认为是通用的，因为它既可以涵盖ad-hoc检索任务，也可以涵盖许多NLP任务，如释义识别(paraphrase identification),问答(question answering,QA)和自动对话(automatic conversation)。

2.Ad-hoc检索作为一个匹配问题

Ad-hoc retrieval ——(formalize)—— > text matching problem

Ad-hoc检索的核心问题是对于一个给定的查询，计算文档的相关性，因此可以被形式化为一个文本匹配问题如下。给定两个文本 $T_{1}$ 和 $T_{2}$ ，衡量它们的相似度得分可以由一个打评分函数(scoring function)基于每个文本的表示计算得分：

$match(T_{1},T_{2})=F(\phi(T_{1},\phi(T_{2})))$

其中， $\phi$ 是一个函数，用于将每一个文本映射至一个表示向量；

$F$ 是一个评分函数，基于两个文本之间的交互

这样一个文本匹配问题通常会被当作NLP任务的描述来考虑，大量深度匹配模型的提出要么是针对具体的ad-hoc检索任务或者是为了通用匹配问题。

两类深度匹配模型

已经有多种多样的深度匹配模型被提出，用于解决这个匹配问题，根据它们的模型结构(也就是对以上两种函数的选择)，现由的深度匹配模型可以分为以下两类：

以表示为中心的模型（representation-focused model）

用深度神经网络为单个文本建立一个好的表示，然后在文本的组合和抽象文本表示之间进行匹配。如：DSSM, C-DSSM 和 ARC-I。

两种函数的选择

在该方法中， $\phi$ 是一个复杂表示的映射函数，而 $F$ 是一个相对简单的匹配函数。

具体模型案例

model	$\phi$	$F$
DSSM	前馈神经网络	余弦相似度函数
C-DSSM	卷积神经网络(CNN)	余弦相似度函数
ARC-I	卷积神经网络(CNN)	多层感知机(MLP)

以交互为中心的模型（representation-focused model）

首先在两段文本之间建立本地交互(local interactions),也就是本地匹配信号(local matching signals)。然后用深度神经网络去学习匹配的分层交互模式(hierarchical interaction patterns) .如DeepMatch, ARC-II 和 MatchPyramid。

两种函数的选择

在该方法中， $\phi$ 是一个简单的映射函数，而 $F$ 是一个复杂的深度模型。

具体模型案例

model	$\phi$	$F$
DeepMatch	将文本映射为词序列的简单映射函数	前馈神经网络
ARC-II	简单映射函数	卷积神经网络(CNN)
MatchPyramid	简单映射函数	卷积神经网络(CNN)

存在的问题

尽管在这样的一般匹配问题形式化下已经提出了各种深度匹配模型，但是大多数模型仅被证明对一系列NLP任务有效，在ad-hoc检索方面有积极作用的很少。甚至是专门为Web搜索设计的深度模型（如DSSM和C-DSSM），也仅仅能够在<查询，文档标题>对上进行评估，这些不是典型的ad-hoc检索设置。如果我们直接将这些深度匹配模型应用于某些基准检索集合，如TREC语料库集合中，我们会发现性能不如传统的排序模型如语言模型和BM25。

提出的问题

基于以上观察，我们可以提出一些问题如下：

在ad-hoc中的匹配事都真的和NLP任务中的匹配完全一样？
现存的深度匹配模型是否适合于ad-hoc检索任务？

3.语义匹配 VS. 相关性匹配

很多NLP任务和ad-hoc检索任务的匹配问题从根本上是不同的！

Matching in NLP tasks

大多数NLP任务关注于语义匹配，即识别语义和推断两段文本之间的语义关系

Matching in ad-hoc retrieval tasks

而ad-hoc检索任务主要是关于相关性匹配，即识别文档是否与给定查询相关。

语义匹配(Semantic Matching)

在这些语义匹配任务中，两个文本通常是同质的并且有很少的自然语言句子组成，如问答句子或对话。为了推断自然语言句子之间的语义关系，语义匹配强调以下3个因素：
- Similarity matching signals：不同的项表达着相似的意思或者具有推断关系等相关的意思。
- Compositional meanings：更关注语法结构而非词的集合/词的序列，同时明确的语法结构对该NLP任务至关重要。
- Global matching requirement：考虑文本的整体信息。
相关性匹配(Relevance Matching)

在相关性匹配任务中，查询文本通常很短并且基于关键词，而文档的长度是变化的，从几十个词到上千上万个词。为了检验查询和文档之间的相关性，相关性匹配主要关注于以下三个：
- Exact matching sigals：尽管词项的错误匹配在ad-hoc检索中是一个重要问题，并且已经用不同的语义相似度信号来处理。但由于现代搜索引擎中的索引和搜索范例，文档和查询中的精确匹配项仍然是最重要的信号。先前的研究表明原始查询项匹配的相关性得分总是不低于多次对语义相关的项进行匹配。这也解释了为什么一些传统的检索模型，例如BM25，可以完全基于精确匹配信号很好地工作。
- Query term importance：在Ad-hoc检索中，通常比较短的query没有复杂的语法结构，主要包括一些关键词。所以query的term的重要性值得考虑。
- Diverse matching requirement：Verbosity Hypothesis认为长文档和短文档类似，也包括一个相似的范围；Scope Hypothesis认为长文档是不相关的短文档的集合，所以文章不一定要整个与query相关。

4.本文的模型架构DRMM

模型架构

本文提出一种深度相关匹配模型(deep relevance matching model,DRMM),它是一个以交互为中心的模型，为了实现相关性匹配在查询项级别部署了一个联结深度架构(joint deep architecture)。

具体来说，我们首先在查询和基于词项嵌入的文档中的每一对词项之间构建本地交互。对于每一个查询项，我们将可变长度的本地交互(variable-length local interactions)映射至固定长度的匹配直方图(fixed-length matching histogram)。基于这个固定长度的匹配直方图，我们部署一个前馈匹配网络来学习分层匹配模式并产生一个匹配分数。最后，整体匹配分数由每一个查询项和词项门控网络计算得到总权重进行聚合得到。模型架构如下图所示：

形式化描述

假设查询和文档都被表示成一系列词项向量的集合，标注如下：

查询项向量的集合 $q=\{w_{1}^{(q)},…,w_{M}^{(q)}\}$ ，每一个查询项向量 $w_{i}^{(q)},i=1,…,M$

文档项向量的集合 $d=\{w_{1}^{(d)},…,w_{N}^{(d)}\}$ ，每一个文档项向量 $w_{j}^{(d)},j=1,…,N$

我们用 $s$ 表示最终的相关性得分，有：

其中， $\bigotimes$ 表示一个查询项和文档项之间的交互操作

$h$ 表示从本地交互到匹配直方图的映射函数

$z_{i}^{(l)},l=0,…,L$ 表示对于第 $i$ 个查询项中间的隐藏层

$g_{i},i=1,…,M$ 表示由词项门控网络产生的聚合权重

$W^{(l)}$ 表示第 $l$ 个权重矩阵，而 $b^{(l)}$ 表示第 $l$ 个偏置项

它们在不同的额查询项之间交叉共享。注意，我们采用余弦相似度作为查询和文档中每对术语向量之间的交互操作符。

本文采用的词嵌入

本文假设术语向量是使用现有的神经嵌入模型（如Word2Vec）先验学习的。本文在深度相关性匹配模型中没有学习词向量，原因如下：1）可以从大规模的未标记文本集合中获取可靠的词项表示，而不是从有限的真实数据中进行ad-hoc检索; 2）通过使用先验学习的词项向量，我们可以将模型的学习集中在相关性匹配模式上，并且可以大大降低模型的复杂性。

三个组成部分

本文的主要模型设计包括：
- 匹配直方图映射(matching histogram mapping)
- 一个前馈匹配网络(a feed forward matching network)
- 一个词项门控网络(a term gating network)
解决了ad-hoc检索中相关性匹配的三个关键问题。

实验效果

我们基于两个代表性的ad-hoc检索基准集合(benchmark collections)来评估所提出的DRMM的有效性。为了进行比较，我们考虑了一些众所周知的传统检索模型，以及几种最先进的深度匹配模型，这些模型是为一般匹配问题而设计的，或者是专门为特殊检索任务而提出的。实证结果表明，现有的深度匹配模型无法与这些基准集合中的传统检索模型竞争，而我们的模型在所有评估指标方面可以显着优于所有基线模型。

主要贡献

指出了语义匹配和相关性匹配之间的三个主要不同，导致了深度匹配模型的架构设计显著不同。
本文通过明确解决相关性匹配的三个关键因素，提出了一种用于临ad-hoc检索的新的深度相关匹配模型。
本文对基准集合中最先进的检索模型进行了严格的比较，并分析了现有深度匹配模型的缺陷和DRMM的优势。

5.总结

该论文是在Interaction-focused模型基础之上进行修改，得到一个新的网络模型DRMM。之前基于Interaction-focused的模型保留了位置信息，比如ARC-II中生成的交互矩阵，然后在此之上构建前向网络。但是在实际情况中，query中的词和文档中的词不具有位置上的对应关系。基于此，该文提出的DRMM是基于值的大小对matrix中的单元重新分类（即该文中所提到的直方图）。
该文首先用query中的每个单词和文档的每个单词构建成为一个词对（word pair），再基于词向量，将一个词对映射到一个局部交互空间（local interactions，该文用了余弦相似度）。然后将每一个局部交互空间映射到长度固定的匹配直方图中。引用文中的例子，将相似度[-1, 1]分为五个区间{[-1,-0.5), [-0.5,-0), [0,0.5), [0.5,1), [1,1]} 。给定query中的一个词“car”以及一篇文档（car, rent, truck, bump, injunction, runway）, 得到对应的局部交互空间为(1, 0.2, 0.7, 0.3, -0.1, 0.1)，最后我们用基于计数的直方图方法得到的直方图为[0,1, 3, 1, 1]。对于每一个query的词得到一个直方图分布后，在此之上构建一个前向匹配网络并且产生query和文档的匹配分值，最后在将query中所有词合并的时候加入gating参数（比较类似于attention机制）。

使用 C++/Faiss 加速海量 MFCC 特征的相似性搜索 whoarethenext c++faiss 开发语言
使用C++/Faiss加速海量MFCC特征的相似性搜索引言在现代音频处理应用中，例如大规模声纹识别(SpeakerRecognition)、音乐信息检索(MusicInformationRetrieval)或音频事件检测(AudioEventDetection)，我们通常需要从海量的音频库中快速找到与给定查询音频最相似的样本。这个过程的核心技术是对音频内容进行特征提取和高效的相似性搜索。MFCC(
LangChain核心组件全解析北辰alk AI langchain
文章目录一、核心架构组件1.模型I/O(ModelI/O)2.检索(Retrieval)3.记忆(Memory)4.链(Chains)5.代理(Agents)二、关键支持组件1.回调系统(Callbacks)2.文档加载器(DocumentLoaders)3.文本分割器(TextSplitters)4.向量存储(VectorStores)三、高级架构组件1.工具集成(Tools)2.工作流(Wor
undo tablespace的恢复， database能不关闭最好不要关闭 jnrjian oracle 数据库
Appliesto:EnterpriseManagerforOracleDatabase-Version9.2.0.1to11.2.0.4Informationinthisdocumentappliestoanyplatform.PurposeProblemDescription:====================Thisisarecoveryscenarioinwhichadatafile
未来数据库硬件-网络篇数据库云计算架构
本文在绿泡泡“狗哥琐话”首发于2025.2.17<-关注不走丢。最近看到一篇不错的文章，叫做“ModernHardwareforFutureDatabases”，里面从几个方向讲了下现在数据库的硬件发展趋势，今天先来说说网络篇。内容中，一位大佬对（获过图灵奖的大佬）OLTP系统进行了一些基准测试，发现TCP-IP协议栈对于总体CPU使用率是占在47～68%。如果使用的网络带宽增加，这个开销还会提升
爆改RAG！用强化学习让你的检索增强生成系统“开挂”——从小白到王者的实战指南许泽宇的技术分享人工智能
“RAG不准？RL来救场！”——一位被RAG气哭的AI工程师前言：RAG的烦恼与AI炼丹师的自我修养在AI圈混久了，大家都知道RAG（Retrieval-AugmentedGeneration，检索增强生成）是大模型落地的“万金油”方案。无论是企业知识库、智能问答，还是搜索引擎升级，RAG都能插上一脚。但你用过RAG就知道，理想很丰满，现实很骨感。明明知识库里啥都有，问个“量子比特的数学表达式”，
OL9.4安装19.27RAC记录李曰福 Oracle oracle
更新-2025-06-09在上一次安装时，文档OracleDatabase19cProactivePatchInformation(DocID2521164.1)未给出GI_MRP的链接。安装DB_MRP失败。在PrimaryNoteforDatabaseQuarterlyReleaseUpdates(DocID888.1)找到了GI_MRP.上传到/stage目录后，并修改setup.ini,加
交互式模式下启用 SAI（SoC 架构信息）的操作解析
一、交互式模式启用SAI的核心逻辑与流程在交互式模式下启用SAI（SoCArchitectureInformation）是通过命令行逐行输入指令，动态构建芯片架构模型并实时查看反馈的操作方式。其核心优势在于灵活性高，适合设计早期的单场景探索与命令调试，具体流程如下：二、关键操作步骤与命令详解启动SAI功能（read_sai）作用：启动物理设计环境并进入SAI交互模式。命令格式：tclread_sa
利用 SoC 架构信息 (SAI) 创建自动网表的解析 weixin_45371279 innovus
基于SAI（SoCArchitectureInformation）创建网表是在无完整电路网表时启动物理设计的关键技术，通过解析架构描述并生成等效网表，使Innovus能够执行布局规划与分析。以下是核心功能与实现逻辑的详细说明：一、SAI自动网表生成的技术背景与目标当设计早期缺乏RTL或门级网表时，SAI自动网表生成通过抽象模型具体化的方式，将架构描述转换为物理设计工具可识别的网表结构，实现：提前启
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
从维基百科到知识图谱：用 DSPy、OpenAI 和 TiDB 构建 GraphRAG 的奇妙旅程步子哥 AGI通用人工智能知识图谱 tidb 人工智能
在信息爆炸的时代，如何快速从海量数据中提取有用信息，成为了技术发展的重要方向。传统的RAG（Retrieval-AugmentedGeneration）方法虽然在信息检索领域表现出色，但随着需求复杂度的提升，GraphRAG（基于知识图谱的RAG）逐渐成为更优的解决方案。本文将带您一步步了解如何利用DSPy、OpenAI和TiDBVectorDatabase，从维基百科数据构建一个GraphRAG
greenplum查询超时_Greenplum常用SQL查询
抽空网上收罗Greenplum常用SQL查询语句整理备忘。欢迎各位留言补充。都是SQL命令以及数据字典的使用。熟悉数据字典非常重要。三个重要的schema:pg_catalog,pg_toolkit,information_schema,其中information_schema中的数据字典都在视图中目录一、查看表某模式所有分布键信息二、数据库运行状态查询管理1.greenplum查询正在运行的sq
LangChain4j如何自定义文档转换器实现数据清洗？古斯塔夫歼星炮
LangChain4j提供了3种RAG（Retrieval-AugmentedGeneration，检索增强生成）实现，我们通常在原生或高级的RAG实现中，要对数据进行清洗，也就是将外接知识库中的原数据进行噪音去除，留下有价值的信息。例如在带有HTML标签的文本中，HTML标签就是噪音，他对于搜索结果是没有任何帮助，甚至会影响查询结果的，因此我们就需要将HTML标签进行清除。那问题来了，怎么进行数
探秘QuickFIX/J：高效金融交易的FIX协议引擎谢忻含Norma
探秘QuickFIX/J：高效金融交易的FIX协议引擎项目地址:https://gitcode.com/gh_mirrors/qu/quickfixj在金融交易领域，FIX（FinancialInformationeXchange）协议是不可或缺的标准，用于实时电子交换证券交易信息。而QuickFIX/J，作为这一协议的100%纯Java开源实现，为开发者提供了一个强大且全面的消息引擎。本文将带你
QuickFIX/Go：高效实现FIX协议的Go语言开源库裘珑鹏Island
QuickFIX/Go：高效实现FIX协议的Go语言开源库quickfixTheGoFIXProtocolLibrary:rocket:项目地址:https://gitcode.com/gh_mirrors/qui/quickfix项目介绍QuickFIX/Go是一个基于Go语言的开源FIX协议实现库。FIX（FinancialInformationeXchange）协议是金融行业中广泛使用的通信
金融系统中常用的FIX协议 William一直在路上职业重启计划工作心得金融
一、FIX协议的产生背景与行业驱动力FIX（FinancialInformationeXchange）协议诞生于20世纪90年代初，是金融市场电子化转型的直接产物。1987年美股崩盘后，行业迫切需要减少人工交易错误，提高处理效率。1992年，由摩根士丹利、高盛等13家金融机构联合发起，旨在通过标准化电子通信协议替代传统电话和纸质单据。其核心目标包括：降低交易成本：消除人工录入和电话确认的时间与错误
数据库锁等待时间过长问题的深度解析与大数据解决方案百态老人数据库大数据
一、锁等待问题的核心原因与日志特征锁等待超时是数据库高并发场景下的典型瓶颈问题，其根本原因与日志特征可归纳为以下维度：事务管理缺陷原因：未提交的长事务（如代码分支遗漏提交）、隐式事务（自动提交关闭）导致锁持有时间过长。日志特征：information_schema.innodb_trx表中存在trx_started时间早于当前时间数分钟的事务。错误日志中频繁出现Lockwaittimeoutexc
浙大版PTA Python程序设计题目与知识点整理（综合版）
目录第一章一、高级语言程序的执行方式二、变量赋值与内存地址三、字符编码3.1Unicode3.2ASCII（AmericanStandardCodeforInformationInterchange）四、编程语言分类按照编程范式分类4.1面向过程语言4.2面向对象语言五、原码、反码和补码5.1原码5.2反码5.3补码六、基本的计算机概念6.1二进制和数据表示6.2内存和存储6.3变量和常量6.4运
ASCII 码表 IMPYLH 笔记
ASCII（AmericanStandardCodeforInformationInterchange，美国信息交换标准代码）是一种字符编码标准，用于表示一组特定的95个（英语）可打印字符和33个控制字符（共128个代码点）。二进制八进制十进制十六进制字符01000000403220space(novisibleglyph)01000010413321!01000100423422"0100011
MySQL 报错Lock wait timeout exceeded； try restarting transaction A486525173 mysql 数据库
处理MySQL报错Lockwaittimeoutexceeded;tryrestartingtransaction1.使用SELECT*FROMinformation_schema.INNODB_TRX;定位未结束的事务，在查询出来的数据找到要删除的事务取出trx_mysql_thread_id的ID使用KILLtrx_mysql_thread_id结束事务
【架构基础】什么是系统架构？
系统架构（信息系统架构，InformationSystemArchitecture，ISA）是信息系统整体结构的高层抽象描述，它定义了系统的核心组件、组件间的交互方式、数据流动路径、技术选择以及设计原则，以支持业务目标的实现。系统架构不仅关注技术实现，还涉及业务、组织、流程等多个维度，是连接业务需求与技术实现的桥梁。核心要素：业务组件：支持业务流程的模块或服务（如用户管理、订单处理）。技术组件：实
RAG技术全面对比研究：探索最优检索增强生成策略
检索增强生成（RAG）技术全景解析：从基础到前沿在当今信息爆炸的时代，如何从海量数据中快速准确地获取所需信息，是人工智能领域的一大挑战。Retrieval-AugmentedGeneration（RAG，检索增强生成）技术应运而生，它结合了检索和生成的优势，通过从大量文档中检索相关信息，再利用这些信息生成高质量的回答。本文将系统性地介绍18种RAG技术，通过概念解析、代码示例和实际应用场景分析，帮
Advanced RAG：下一代检索增强生成技术详解北辰alk AI 人工智能
文章目录一、核心演进维度二、关键技术组件1.智能检索子系统2.动态知识管理3.生成控制器三、核心增强技术1.递归检索(RecursiveRetrieval)2.假设性检索(HypotheticalDocumentEmbedding)3.自适应分块(AdaptiveChunking)四、生产级架构设计完整系统架构关键优化点五、典型应用场景1.专业领域问答系统2.企业知识中枢3.实时决策支持六、评估指
深入探索 Vanna：让数据库交互更智能从零开始学习人工智能数据库交互
深入探索Vanna：让数据库交互更智能在数字化时代，与数据库进行高效交互是许多开发者、数据分析师和企业面临的挑战。传统的SQL查询编写不仅需要对数据库结构有深入的了解，还需要花费大量的时间和精力来调试和优化。Vanna，一个基于Python的开源工具，通过结合检索增强（RetrievalAugmentation）和大型语言模型（LLM），为这一问题提供了一个创新的解决方案。本文将深入探讨Vanna
RAG技术栈详解：构建智能问答系统的核心组件认知超载 AI 人工智能
本文深度剖析RAG（Retrieval-AugmentedGeneration）技术栈的核心构成，助你快速搭建企业级知识增强系统一、RAG技术架构全景图二、核心组件技术选型1.检索模块（Retriever）向量数据库主流选择：Pinecone、Milvus、Qdrant、Weaviate新兴势力：ChromaDB（开源轻量级）、腾讯云向量数据库嵌入模型（Embedding）OpenAItext-e
【Linux内核及内核编程】Linux 内核的发展与演变：从 UNIX 到开源帝国的崛起 byte轻骑兵 #嵌入式Linux驱动开发实战 linux unix 运维
1969年，贝尔实验室的肯·汤普森和丹尼斯·里奇在报废的DECPDP-7小型机上开发了一个“太空旅行”游戏。为简化开发，他们用汇编语言编写了一个轻量级操作系统——UNICS（UniplexedInformationandComputingService），后缩写为UNIX。这个“游戏外挂”意外开启了操作系统的新纪元目录一、UNIX：现代操作系统的基石1.1起源与早期发展1.2分支与商业化二、Min
由浅入深：Python异步函数调用的艺术 - 从脚本到API架构设计 Ven% python python 网络开发语言
文章目录引言：异步编程的新范式一、基础篇：事件循环中的直接调用1.1理解异步执行模型1.2简单调用示例1.3关键注意事项二、进阶篇：API接口中的异步调用2.1为什么需要API封装？2.2FastAPI实现示例2.3调用对比分析三、架构篇：分层设计的最佳实践3.1问题：紧耦合的陷阱3.2解决方案：三层架构设计3.2.1核心业务层(core/retrieval.py)3.2.2API接口层(api/
【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Retrieval组件）Text Splitters详解？
【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Retrieval组件）TextSplitters详解？【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Retrieval组件）TextSplitters详解？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Re
MYSQL的基础信息如何存放月堂 oracle 数据库
一、存储位置与版本差异1、MySQL8.0+（事务化存储）系统表存储：所有元数据（表结构、索引、权限等）统一存储在mysql系统库的InnoDB事务表中（如mysql.tables、mysql.columns），物理文件为mysql.ibd。优势：性能优化：INFORMATION_SCHEMA改为内存视图，查询效率提升（无需解析文件）。原子DDL：DDL操作（如建表、删表）完全事务化，失败自动回滚
RAG和KAG的区别 testresultstomorrow 人工智能 python java 知识图谱
RAG（Retrieval-AugmentedGeneration，检索增强生成）和KAG（Knowledge-AugmentedGeneration，知识增强生成）都是用于增强生成模型能力的框架，但它们在多个方面存在区别，以下是具体介绍：原理与知识处理方式RAG：基于检索和生成的结合，用户查询经检索系统处理后，从外部知识源检索相关文档或段落，再将这些作为上下文输入生成模型，生成相关回复。KAG：
RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？许泽宇的技术分享人工智能
大家好，我是你们的AI技术侃侃而谈小能手。今天我们来聊聊RAG（Retrieval-AugmentedGeneration，检索增强生成）系统的进化之路——如何让它像喝了聪明药一样，越用越聪明，越聊越懂你。你是不是也有这样的体验？用ChatGPT、文档问答机器人，刚开始觉得还行，但用久了发现它总是“死脑筋”，问同样的问题，答得千篇一律，甚至一错再错。你想：“要是它能记住我的吐槽和建议，下次别再犯同
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str