E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
信息检索
搜广推校招面经九十三
字节懂车帝一面一、NDCG(NormalizedDiscountedCumulativeGain)的计算NDCG是
信息检索
和排序任务中常用的评价指标,用于衡量模型预测的排序质量与真实相关性排序的一致程度
Y1nhl
·
2025-07-12 10:40
搜广推面经
机器学习
人工智能
python
算法
推荐算法
pytorch
搜索算法
MySQL 中如何优化 DISTINCT 查询:基于 Java 的实践与应用
限制选择字段3.使用`GROUPBY`替代`DISTINCT`核心源码解读Java代码示例:优化`DISTINCT`查询代码说明案例分析案例一:数据去重优化应用场景演示场景一:日志数据去重场景二:用户
信息检索
优缺点分析优点缺点类代码方法介绍及演示
喵手
·
2025-07-11 20:34
数据库
mysql
java
数据库
技术类岗位面试中经典问题总结分享
1.谈淡你的最成功/失败的经历,你现在回去(时光倒流)怎么做2.你做过的一个项目/事例,说说过程(观是否谈结果)过程中,怎么进行
信息检索
的3.请你对我进行一个评价(观察是否谈到缺点)4.请用一句话介绍自己
·
2025-07-11 19:54
【RAG实战指南 Day 13】嵌入模型选择与性能对比
在
信息检索
过程中,嵌入模型将文本转换为向量表示,其质量决定了语义搜索的准确性和召回率。本文将深入分析主流嵌入模型的技术特点、性能表现和适用场景,帮助您在项目中做出最优选择。通过本文,您将
在未来等你
·
2025-07-11 08:12
Java场景面试宝典
RAG
嵌入模型
语义搜索
信息检索
向量数据库
Spring AI:Tool Calling
工具主要用于:
信息检索
。此类工具可用于从外部源(如数据库、web服务、文件系统或web搜索引擎)检索信息。目标是增强模型的知识,使其能够回答否则无法回答的问题。
虾条_花吹雪
·
2025-07-09 21:25
Spring
AI
ai
java
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力
信息检索
与整合:基于用户意图精准搜索并生成答案多场景应用:技术文档撰写、数据分析、代码生成等交互优化
·
2025-07-08 22:20
LSA主题模型:基于奇异值分解的主题模型
主题模型在文本挖掘、
信息检索
、推荐系统等领域有着广泛的应用。
AI天才研究院
·
2025-07-08 09:23
AI人工智能与大数据
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用 C++/Faiss 加速海量 MFCC 特征的相似性搜索
使用C++/Faiss加速海量MFCC特征的相似性搜索引言在现代音频处理应用中,例如大规模声纹识别(SpeakerRecognition)、音乐
信息检索
(MusicInformationRetrieval
whoarethenext
·
2025-07-08 04:17
c++
faiss
开发语言
从维基百科到知识图谱:用 DSPy、OpenAI 和 TiDB 构建 GraphRAG 的奇妙旅程
传统的RAG(Retrieval-AugmentedGeneration)方法虽然在
信息检索
领域表现出色,但随着需求复杂度的提升,GraphRAG(基于知识图谱的RAG)逐渐成为更优的解决方案。
步子哥
·
2025-07-06 20:34
AGI通用人工智能
知识图谱
tidb
人工智能
Python爬虫实战:研究httplib2库相关技术
网络爬虫作为一种自动获取互联网信息的程序,能够按照一定的规则,自动地抓取网页内容并提取和整理信息,为
信息检索
、数据分析、机器学习等领域提供了丰富的数据来源。
ylfhpy
·
2025-07-03 21:11
爬虫项目实战
python
爬虫
php
httplib2
Python爬虫实战:研究stdlib库相关技术
网络爬虫作为一种自动获取网页内容的工具,在
信息检索
、数据挖掘、舆情分析等领域发挥着重要作用。Python由于其简洁的语法和丰富的库支持,成为开发网络爬虫的首选语言。
ylfhpy
·
2025-07-03 21:11
爬虫项目实战
python
爬虫
前端
开发语言
stdlib
标准库
ES 和 lucene 的区别是什么?
Elasticsearch(ES)和Lucene都是用于全文搜索和分析的工具,但它们在功能和使用场景上有一些重要的区别:基础与角色:Lucene是一个开源的
信息检索
软件库,提供了一个高性能、全功能的文本搜索引擎
晚夜微雨问海棠呀
·
2025-07-03 03:31
elasticsearch
lucene
大数据
Lucence 和 Elasticsearch 的区别?
Lucene和Elasticsearch都是在
信息检索
和文本处理领域中广泛使用的工具,它们的主要区别如下:概念和定位Lucene:是一个基于Java的全文检索库,它提供了一套强大的底层索引和搜索功能的API
码出财富
·
2025-07-03 03:30
elasticsearch
大数据
搜索引擎
30、法律案例的关联检索:提升法律实践的信息处理能力
大量的法律案例、法规和判例使得
信息检索
变得复杂而耗时。为了提高工作效率和决策质量,法律从业者迫切需要一种高效的工具来发现和检索相互关联的法律案例。
android
·
2025-07-02 13:43
法律案例
关联检索
信息处理
RAG系列:提升RAG检索力:三大Query变形术,助你玩转AI知识检索!
在AI时代,
信息检索
的效率和质量,80%取决于你“怎么问”。RAG系统的本质,就是“你问得好,我答得妙”。但现实往往是——用户提问:“AI会抢我饭碗吗?”
数智前沿
·
2025-07-01 08:22
数字化转型
人工智能
RAG
Python爬虫实战:研究MarkupSafe库相关技术
1.引言1.1研究背景与意义随着互联网数据量的爆炸式增长,网页内容自动提取与分析技术在
信息检索
、舆情监控、数据挖掘等领域的需求日益凸显。网络爬虫作为获取网页内容的核心工具,能够自动化采集互联网信息。
ylfhpy
·
2025-06-30 12:37
爬虫项目实战
python
爬虫
开发语言
MarkupSafe
企业级RAG系统架构设计与实现指南(Java技术栈)
RAG系统通过结合
信息检索
与自然语言生成(NLG),能够有效提升模型对特定领域数据的适应能力,避免传统大模型在训练数据不足或数据更
在未来等你
·
2025-06-30 12:32
大模型应用开发
AI
技术
编程
Java
Spring
信息检索
简介——文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等
作者:禅与计算机程序设计艺术1.简介2005年8月17日至9月3日在美国加利福尼亚州伯克莱纳举行了SIGIR国际会议(中文全称“计算机信息retrieval国际会议”),这是
信息检索
领域的顶级会议之一。
AI天才研究院
·
2025-06-29 21:32
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
爆改RAG检索力:三大Query变形术,助你玩转AI知识检索!
在AI时代,
信息检索
的效率和质量,80%取决于你“怎么问”。RAG系统的本质,就是“你问得好,我答得妙”。但现实往往是——
许泽宇的技术分享
·
2025-06-29 00:30
大模型
AIGC
搜索引擎
人工智能
RAG
智能查询工具如何重塑
信息检索
的未来?
从客户行为数据到供应链信息,从市场趋势到内部运营指标,这些数据蕴含着巨大的商业价值。然而,数据量的激增也带来了前所未有的检索挑战:如何在海量信息中快速定位所需数据?如何确保查询结果的准确性和时效性?据统计,75%的企业正受困于低效的查询工具,这已成为阻碍企业数字化转型的关键痛点。传统的数据查询方式主要依赖SQL语句或特定的查询语言,这要求用户具备专业的编程知识和对数据结构的深入理解。即使对于数据分
镜舟科技
·
2025-06-28 16:29
StarRocks
QueryGPT
数据查询
数据分析
多模态交互
RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG(检索增强生成)RAG(RetrievalAugmentedGeneration,检索增强生成)是一种结合
信息检索
和文本生成的技术范式
ApacheDubbo
·
2025-06-28 14:40
spring
人工智能
架构
Spring
AI
RAG
Python爬虫实战:研究jieba相关技术
文本分析技术通过对文本内容的结构化处理和语义挖掘,能够揭示隐藏在文本中的主题、情感和趋势,为舆情监测、
信息检索
、内容推荐等应用提供技术支持。1.2研究目标与方法本研究旨在构建一个完整的新闻文本分析
ylfhpy
·
2025-06-27 17:53
爬虫项目实战
python
爬虫
开发语言
html
jieba
分词
多模态查询技术:让搜索更智能、更精准
多模态查询技术:让搜索更智能、更精准关键词:多模态查询、跨模态搜索、语义理解、向量检索、深度学习、
信息检索
、人工智能摘要:本文深入探讨多模态查询技术如何通过整合文本、图像、音频等多种数据形式,实现更智能
搜索引擎技术
·
2025-06-24 07:24
ai
搜索领域个性化排序:如何利用生成式AI提升效果?
从理论框架出发,结合
信息检索
第一性原理与生成式模型的核心优势,构建"用户-查询-文档"三元组的深度关联模型;通过层次化架构设计,覆盖用户建模、查询理解、文档表示到排序决策的全流程;
搜索引擎技术
·
2025-06-24 07:23
人工智能
ai
Spring Boot + LangChain 构建 RAG 应用
•通常使用
信息检索
技术,如向量搜索或关键词匹配。生成:•在检索到
程序员丸子
·
2025-06-22 16:05
langchain
AI大模型
语言模型
自然语言处理
人工智能
大语言模型
RAG
【Elasticsearch】TF-IDF 和 BM25相似性算法
以下是对这两种算法的对比以及在Elasticsearch中的使用情况:TF-IDF-定义与原理:TF-IDF是一种经典的
信息检索
算法,用于评估一个词语对于一个文件集或语料库中某份文件的重要程度。
risc123456
·
2025-06-20 10:41
Elasticsearch
elasticsearch
LangChain、RAG、Agent是什么
RAG技术将
信息检索
与生成模型结合,能缓解“幻觉”,而Agent智能体和LangChain框架可满足复杂业务需求。本地
ZhangJiQun&MXP
·
2025-06-20 00:33
2021
AI
python
2024大模型以及算力
教学
langchain
语言模型
人工智能
算法
自然语言处理
Coggle数据科学 | Kaggle赛题解析:识别数据引用与分类
原文链接:Kaggle赛题解析:识别数据引用与分类赛题名称:MakeDataCount-FindingDataReferences赛题类型:自然语言处理、
信息检索
赛题任务:从科学论文的全文中提取所有被引用的研究数据
双木的木
·
2025-06-20 00:02
深度学习拓展阅读
分类
数据挖掘
人工智能
计算机视觉
prompt
python
算法
大模型RAG高阶面试指南:第一章:RAG绪论
第一章:RAG绪论1.1RAG的定义、背景与核心思想检索增强生成(RetrievalAugmentedGeneration,简称RAG)是一种结合了
信息检索
和文本生成的人工智能技术。
强化学习曾小健3
·
2025-06-18 15:38
大模型RAG高阶面试指南
人工智能
深度学习
实现RAG融合以提升
信息检索
精准度
在
信息检索
领域,如何从浩如烟海的信息中精准地获得答案是一个巨大的挑战。RAG(Retrieval-AugmentedGeneration)融合就是一种创新的解决方案。
zbb258
·
2025-06-18 10:02
javascript
python
langchain
自然语言处理分类
包括词性标注,分词,语法解析,语言模型,
信息检索
,信息抽取,语义表示,文本分类。这些任务发展较为成熟,各种相关工作的主要目的是提高当前模型的性能。第二类是人工智障NLP。
要奋斗呀
·
2025-06-18 10:58
自然语言处理
Qwen3-Embedding-Reranker本地部署教程:8B 参数登顶 MTEB 多语言榜首,100 + 语言跨模态检索无压力!
基于Qwen3基础模型构建,二者通过协同工作显著提升语义理解与
信息检索
效率,在多语言场景和工业部署中表现卓越。
算家计算
·
2025-06-17 23:14
模型构建
embedding
Qwen3
Qwen3-Reranker
模型部署教程
智能检索
算家云
镜像社区
如何使用EnsembleRetriever结合多个检索器的结果
在
信息检索
领域,融合不同检索器的结果可以提升搜索结果的质量。EnsembleRetriever是一个支持将多个检索器的结果组合起来的工具。
weixin_43212959
·
2025-06-17 11:54
windows
人工智能
microsoft
《阿里新神器MaskSearch问世:为何我们需要打破传统搜索代理训练的枷锁?》
在今天这个信息爆炸的数字世界,我们需要的不是更多的信息,而是更精准、更智能、更懂人心的
信息检索
方式。
来自于狂人
·
2025-06-16 22:00
语言模型
人工智能
python
使用 LangChain 实现多用户文档检索
在构建
信息检索
应用时,通常需要支持多个用户,并确保每个用户只能访问自己的数据。这篇文章将展示如何配置检索链的运行时属性,以限制可用文档,并提供一个使用Pinecone向量存储实现的示例。
yunwu12777
·
2025-06-16 16:46
langchain
服务器
数据库
使用Weaviate和LangChain实现RAG (检索增强生成)
在现代的AI应用中,RAG(检索增强生成)技术通过将生成模型与外部知识库结合,提供了一个强大的
信息检索
和处理方法。
·
2025-06-16 15:46
LLM OS 中的自然语言搜索引擎
LLMOS中的自然语言搜索引擎关键词:大语言模型、操作系统、自然语言搜索、语义理解、
信息检索
、人工智能、用户交互文章目录LLMOS中的自然语言搜索引擎1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤
·
2025-06-15 23:23
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
RAG:2025年检索增强生成前沿技术完全指南
这项诞生于2020年的创新技术,通过将
信息检索
(Retrieval)与文本生成(Generation)解耦又融合的设计,突破了传统语言模型“幻觉”问题的桎梏,为构建可信、可控、可扩展的AI系统奠
大模型之路
·
2025-06-13 11:18
RAG
rag
检索增强生产
llm
Python爬虫实战:研究Bleach库相关技术
网络爬虫作为一种自动获取网页内容的技术,能够高效地从互联网上收集所需信息,为数据分析、
信息检索
、舆情监测等应用提供基础。
ylfhpy
·
2025-06-13 10:07
爬虫项目实战
python
爬虫
php
开发语言
html
javascript
基于bert预训练模型transformer架构的中文文本多标签分类的双向语义理解。
该系统利用BERT模型的强大能力,能够精确地对中文文本进行多维度的标签分类,广泛应用于内容管理、
信息检索
、情感分析等领域。主要特性
·
2025-06-12 14:14
GET和POST请求的区别
常见用例:
信息检索
与数据查询(关键词搜索,商品筛选)静态资源加载与缓存(加载网页图片)公开数据接口调用等(地理位置解析)P
Qiuluo_ovo
·
2025-06-10 21:24
java
深入解析 Qwen3-Embedding 和 Qwen3-Reranker:原理、应用与代码示例
深入解析Qwen3-Embedding和Qwen3-Reranker:原理、应用与代码示例在当今数字化信息爆炸的时代,高效的
信息检索
与处理技术成为了众多领域的关键需求。
从零开始学习人工智能
·
2025-06-09 06:16
embedding
BM25检索与向量检索
BM25检索与向量检索是
信息检索
领域的两种核心技术,二者在技术原理、适用场景、优缺点等方面存在显著差异。
·
2025-06-09 01:10
如何评估学术搜索结果的相关性
如何评估学术搜索结果的相关性关键词:学术搜索、相关性评估、
信息检索
、排序算法、文献计量、用户反馈、机器学习摘要:本文深入探讨了评估学术搜索结果相关性的多种方法和技术。
搜索引擎技术
·
2025-06-08 12:08
服务器
运维
ai
利用 DeepSeek 构建本地RAG系统
可以帮助用户快速从PDF文档中获取所需信息,提高
信息检索
和获取的效率。二、科普知识1.大语言模型(LLM)大语言模型是基于大量文本数据进行训练的人工智能模型,能够理解和生成自然语言。
·
2025-06-07 18:35
深度学习中的负采样
它常用于:词向量训练(如Word2Vec)推荐系统(从大量候选项中学正例与负例)语言模型、对比学习、
信息检索
等场景本质概念在许多任务中,我们的模型要从上万个候选中预测正确类别。
洪小帅
·
2025-06-05 10:47
深度学习
人工智能
基于本体的自动问答系统
自然语言处理的一个分支–自动问答系统本体(Ontology)的应用:(1)
信息检索
(2)自动问答分词停用此词处理相似度计算词语相似度计算句子相似度计算改进(1)分词算法(2)词语相似度计算的算法(3)句子相似度计算的算法提高
奇文王语
·
2025-06-03 22:46
自然语言处理
语言
自动
信息检索
微调embedding模型_jhgan-ko-sroberta-multitask
目录数据准备阶段特殊韩语处理技巧模型加载与配置损失函数选择指南进阶训练配置评估与优化策略数据准备阶段推荐数据格式:#句子对格式(语义相似度任务)samples=[("문장1","문장2",0.8),#相似度得分("한국어문장","다른한국어문장",0.3)]#三元组格式(
信息检索
任务
激进小猪1002
·
2025-06-03 19:51
embedding
bert
自然语言处理
搜索领域索引构建:技术创新与业务拓展新方向
搜索领域索引构建:技术创新与业务拓展新方向关键词:搜索领域、索引构建、技术创新、业务拓展、
信息检索
摘要:本文聚焦于搜索领域的索引构建,深入探讨了其在技术创新和业务拓展方面的新方向。
搜索引擎技术
·
2025-06-02 14:24
java
服务器
linux
ai
使用Redis和OpenAI进行RAG的完美指南:解析耐克10-K文件
而要高效地从这些文件中提取有用的信息,一个强大的
信息检索
系统必不可少。
dsndnwfk
·
2025-06-01 06:02
redis
数据库
缓存
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他