风儿吹花儿美

milvus安装及其使用教程

milvus 简介

milvus是干什么的？通俗的讲，milvus可以让你在海量向量库中快速检索到和目标向量最相似的若干个向量，这里相似度量标准可以是内积或者欧式距离等。借用官方的话说就是：

Milvus 是一款开源的、针对海量特征向量的相似性搜索引擎。基于异构众核计算框架设计，成本更低，性能更好。在有限的计算资源下，十亿向量搜索仅毫秒响应。

说白了就是速度快，先不说十亿向量，自己写代码去完成对100万300维向量的余弦相似度计算并排序就需要不小的响应时间吧，就本人测试而言，即便使用scipy库计算速度依然要比milvus慢很多。

milvus和Faiss的对比

其实在milvus开源之前，也存在高性能向量相似性搜索引擎(库)，这个引擎就是Facebook的Faiss，它的功能和milvus是一样的，所以就不再做过多介绍，具体可以参考官网

就我个人而言，我是推荐使用milvus的，主要是在我个人看来，milvus有如下几个好处:

多平台通用，mac，windows和linux都是支持的，因为milvus可以通过docker部署，因此平台通用性好了不少。
支持编程语言多，Java，c，c++和python都支持，要知道Faiss是不支持java的，这一点简直让人抓狂，github上好几个项目就是关于把Faiss转成java的，因为我Java和python都是要使用的，我把github上关于faiss转java的项目都试了个遍，结论就是非常难安装，只要Faiss版本更新了，必须要重来一遍，即便最后java可以用了，也不敢保证其稳定性。所以想在Java上用Faiss还是放弃吧。
在速度方面，就我自己测试而言，milvus不输Faiss，但是我没有使用GPU测试，有兴趣的小伙伴可以试一下。

当然milvus也有难用的地方，我自己发现了两点，如果是我自己使用不当造成的，还请各位朋友在评论指出：

milvus的向量格式不支持numpy，要用列表的形式存储向量，而列表占用内存要远远大于ndarray的，这对于小内存主机简直是个天灾，我16GB内存情况下，把500000*768的矩阵转成list，电脑直接卡死。
milvus在第一次search时速度会慢，之后机会快起来了，这应该是个小bug，有人在github提出了，应该很快就可以修复，所以你们在测试milvus的速度时千万别算第一次的时间。

milvus 安装及常见问题

milvus 一共有两种安装方式：自己编译安装和使用docker安装。这里推荐大家使用docker安装，docker安装方便快捷，可在Windows上使用。自己编译安装，由于每个人环境不同，很容易出问题。本文只介绍基于docker的安装，另外因为我比较穷，所以只介绍cpu版本的安装，不过gpu安装也是大同小异。

基于docker安装milvus CPU版本

简言之安装比较简单，毕竟大佬们已经把milvus部署在了docker里，我们只要启动起来就行了
。

安装docker

首先就是要安装docker，还不了解docker可以了解一波，非常好用的虚拟机工具，直接去官网下载对应平台的安装文件即可。

下载相应版本镜像

安装好docker后，要去pull对应的镜像(image)，首先进到dockerhub官网中，然后搜索milvus，第一个结果就是。因为我们安装的是CPU版本，所以在tags里找cpu-latest，然后pull下来就可以了，即在你的命令行窗口输入
docker pull milvusdb/milvus:cpu-latest。注意：随着版本迭代更新，这一条命令在未来可能会失效，建议先去dockerhub搜索一下，去看一下应该用什么tag。

设置工作目录和配置文件

在创建启动容器之前，我们要先设置好工作目录和配置文件。

一共要设置三个目录，分别是数据库存储目录，日志存储目录和配置文件目录。其中配置文件目录就存放着我说的配置文件。配置文件一共有两个，分别是服务器设置文件和日志设置文件。

所以我们要想好这三个文件夹放在哪里，比如我们可以在当前用户目录下建立一个milvus文件夹，然后在这里面存储上述三个目录。下面我们需要设置两个配置文件，记得要把服务器配置文件名改为server_config.yaml，把日志配置文件改为log_config.conf。
两个配置文件的内容：服务器配置文件日志配置文件。配置文件也可以到官网下载。

下面是我的文件目录结构，共大家参考：

  milvus
    │
    ├─conf //配置文件目录
    │      log_config.conf  //服务器配置文件
    │      server_config.yaml  //日志配置文件
    │
    ├─db //数据库存储目录
    │
    └─logs //日志存储目录
    │

启动docker服务

设置好工作目录后，就可以使用镜像创建容器了，我的工作目录是C:\Users\Zhdun\milvus，所以我的创建命令是：

docker run -td --name mymilvus -e "TZ=Asia/Shanghai" -p 19530:19530 -p 8080:8080 -v C:\Users\Zhdun\milvus\db:/var/lib/milvus/db -v C:\Users\Zhdun\milvus\conf:/var/lib/milvus/conf -v C:\Users\Zhdun\milvus\logs:/var/lib/milvus/logs milvusdb/milvus:cpu-latest

命令看起来有点长，我稍微解释下，-td是后台运行，--name是给自己的容器起个名字，-p是端口映射，不想用默认的话，可以去服务器配置文件里改，-v就是为了映射三个工作目录。具体可以参考docker的run命令。

执行完命令后，运行docker ps -a，如果发现自己创建的容器excited的了，那就docker logs一下，看出了什么问题。如果发现容器在运行了，就代表基本没问题了。

接下来我会说一下常见的安装问题，以及如何去使用milvus。

安装时的常见问题及解决

Config check fail: Invalid config version: . Expected config version: 0.1 遇到这种问题就在服务器的配置文件第一行加上version: 0.1。

Config check fail: Invalid cpu cache capacity: 1. Possible reason: sum of cache_config.cpu_cache_capacity and db_config.insert_buffer_size exceeds system memory.
这种问题就说明内存超出了限制，首先检查服务器配置里的 cpu_cache_capacity 和 insert_buffer_size 是不是过大了。

然后再检查给定docker设定的内存是多少，可以通过docker info来检查。

milvus 基本使用

安装完成后，终于可以开始使用milvus了，milvus支持python，java和c++。在这里我只介绍python的使用。
首先安装 pymilvus库：pip install pymilvus，然后就可以使用这个库来写代码了，接下来我会直接把自己写的范例代码贴上去，其中每一步的具体含义以及可能的扩展我会直接在注释里告诉大家，如有错误还请各位指出。

# -*- coding: utf-8 -*-

#导入相应的包
import numpy as np
from milvus import Milvus, IndexType, MetricType

# 初始化一个Milvus类，以后所有的操作都是通过milvus来的
milvus = Milvus()

# 连接到服务器，注意端口映射，要和启动docker时设置的端口一致
milvus.connect(host='localhost', port='19530')

# 向量个数
num_vec = 5000
# 向量维度
vec_dim = 768

# 创建表
# 参数含义
# table_name: 表名
# dimension: 向量维度
# metric_type: 向量相似度度量标准, MetricType.IP是向量内积; MetricType.L2是欧式距离
table_param = {'table_name': 'mytable', 'dimension':vec_dim, 'index_file_size':1024, 'metric_type':MetricType.IP}
milvus.create_table(table_param)

# 随机生成一批向量数据
vectors_array = np.random.rand(num_vec,vec_dim)
vectors_list = vectors_array.tolist()

# 官方建议在插入向量之前，建议先使用 milvus.create_index 以便系统自动增量创建索引
# 索引类型有：FLAT / IVFLAT / IVF_SQ8 / IVF_SQ8H，其中FLAT是精确索引，速度慢，但是有100%的召回率
index_param = {'index_type': IndexType.FLAT, 'nlist': 128}
milvus.create_index('mytable', index_param)

# 把向量添加到刚才建立的表格中
# ids可以为None，使用自动生成的id
status, ids = milvus.add_vectors(table_name="mytable",records=vectors_list,ids=None) # 返回这一组向量的ID

# 官方建议 向量插入结束后，相同的索引需要手动再创建一次
milvus.create_index('mytable', index_param)

# 输出一些统计信息
status, tables = milvus.show_tables()
print("所有的表格：",tables)
print("表格的数据量(行):{}".format((milvus.count_table('mytable')[1])))
print("mytable表格是否存在:",milvus.has_table("mytable")[1])

# 加载表格到内存
milvus.preload_table('mytable')

# 创建查询向量
query_vec_array = np.random.rand(1,vec_dim)
query_vec_list = query_vec_array.tolist()
# 进行查询, 注意这里的参数nprobe和建立索引时的参数nlist 会因为索引类型不同而影响到查询性能和查询准确率
# 对于 FLAT类型索引，两个参数对结果和速度没有影响
status, results = milvus.search(table_name='mytable', query_records=query_vec_list, top_k=4, nprobe=16)
print(status)
print(results)



# 删除表格和索引, 不删除的话，下一次还可以继续使用
milvus.drop_index(table_name="mytable")
milvus.delete_table(table_name="mytable")

# 断开连接
milvus.disconnect()

milvus 多进程使用

写这一章的主要目的是为了进行并发测试,以及多进程能否节省时间，官方说明在使用多进程时需要满足下面两个条件：

程序执行时主进程中没有创建 client

每个子进程分别创建 client 进行操作

下面是我的测试代码：

# -*- coding: utf-8 -*-
import time
from multiprocessing import Pool
import numpy as np
import random
from milvus import Milvus, IndexType, MetricType

def create_data(host,port,num_vec,vec_dim):
    """ 创建一些表格和索引用来做多进程测试 """
    milvus = Milvus()
    milvus.connect(host=host, port=port)
    # 创建2个表
    table_param = {'table_name': 'table1', 'dimension':vec_dim, 'index_file_size':1024, 'metric_type':MetricType.IP}
    milvus.create_table(table_param)
    table_param = {'table_name': 'table2', 'dimension':vec_dim, 'index_file_size':1024, 'metric_type':MetricType.L2}
    milvus.create_table(table_param)
    # 随机生成一批向量数据
    vectors_array = np.random.rand(num_vec,vec_dim)
    vectors_list = vectors_array.tolist()
    # 创建索引
    index_param = {'index_type': IndexType.FLAT, 'nlist': 128}
    milvus.create_index('table1', index_param)
    milvus.create_index('table2', index_param)

    # 添加数据
    milvus.add_vectors(table_name="table1",records=vectors_list,ids=None)
    milvus.add_vectors(table_name="table2",records=vectors_list,ids=None)

    # 创建索引
    milvus.create_index('table1', index_param)
    milvus.create_index('table2', index_param)
    print(milvus.show_tables())
    # 断开连接
    milvus.disconnect()
def clear_table(host,port):
    """ 清空表格和索引 """
    milvus = Milvus()
    milvus.connect(host=host, port=port)
    for table_name in milvus.show_tables()[1]:
        milvus.drop_index(table_name=table_name)
        milvus.delete_table(table_name=table_name)
    milvus.disconnect()
def milvus_search(host,port,table_name,query_vec,search_time=10):
    """ 测试查询, 返回查询的秒数"""
    milvus = Milvus()
    milvus.connect(host=host, port=port)
    # 因为bug的原因，要先搜索一次
    milvus.search(table_name,4,8,query_vec)
    # 开始测试
    for _ in range(search_time):
        query_vec[0][0] = random.random() # 稍微随机化一下
        milvus.search(table_name, 4, 8, query_vec)


if __name__  == "__main__":
    host = "localhost"
    port = "19530"
    num_vec = 100000
    vec_dim = 768
    num_proc = 3 # 进程数
    search_time = 2000 # 搜索次数
    ####### Step1 先创建用于测试的数据 运行一次就行了
    # create_data(host=host,port=port,num_vec=num_vec,vec_dim=vec_dim)
    # clear_table(host,port)
    # exit(0)

    ####### Step2 测试依次执行的时间
    start_time = time.time()
    for _ in range(num_proc):
        query_vec = np.random.rand(1,vec_dim).tolist()
        milvus_search(host,port,"table1",query_vec,search_time)
    end_time = time.time()
    print("顺序执行milvus_search的时间总和是：",end_time-start_time)

    ####### Step3 测试多进程时间
    pool = Pool(num_proc)
    start_time = time.time()
    for _ in range(num_proc):
        query_vec = np.random.rand(1,vec_dim).tolist()
        pool.apply_async(milvus_search,args=(host,port,"table1",query_vec,search_time))
    pool.close()
    pool.join()
    end_time = time.time()
    print("并行执行milvus_search的时间总和是：",end_time-start_time)

结论就是对于search操作，依次search100次，和10个进程同时开，每个进程search10次，开多进程速度是会变快的。

感谢阅读，如有问题，烦请指出。

文章可以随意转载，但请务必注明出处：

https://www.cnblogs.com/SuperDun/

事实是什么? 这些事实所证实的真理是什么? 永远不要让自己被自己所更愿意相信所影响, 只是单单地去审视, 什么才是事实.

Milvus 中常见相似度度量方法 Sirius Wu milvus 机器学习算法
在Milvus中，相似度度量方法用于衡量向量之间的相似程度，不同的度量方法有不同的特点、优缺点和适用场景。以下是对Milvus中常见相似度度量方法的详细介绍以及对应的search参数示例。1.欧氏距离（L2Distance，L2）特点欧氏距离是最常用的距离度量方法之一，它计算的是两个向量在欧几里得空间中的直线距离。对于两个nnn维向量x⃗=(x1,x2,⋯ ,xn)\vec{x}=(x_1,x_2
利用docker部署单节点milvus并实现图像化管理听说唐僧不吃肉 Linux docker milvus
Docker部署单机版milvus使用DockerCompose安装Milvusstandalone（即单机版），进行一个快速milvus的体验。1.前提条件系统可以使用centos或者ubuntu系统已经安装docker和docker-composemilvus版本这里选择2.3.12.启动etcd、minio、milvus由于milvus依赖etcd和minio，因此需要先启动这2个组件。同样
新手如何使用 Milvus 巴依老爷coder 数据库 milvus 向量数据库数据库
一文带你入门Milvus：详细指南新手如何使用Milvus：详细指南一、Milvus简介主要特点应用领域二、安装Milvus安装DockerCompose基于DockerCompose安装Milvus服务端安装attu-可视化界面工具三、快速入门安装PythonSDK连接数据库方式1方式2（方式1的封装）数据库操作核心概念集合操作数据操作插入数据精准查询数据-get条件查询数据-query查询数据
Milvus学习整理 louisliao_1981 milvus 学习
Milvus学习整理一、度量类型(metric_type)二、向量字段和适用场景介绍三、索引字段介绍（一）、概述总结（二）、详细说明四、简单代码示例（一）、建立集合和索引示例（二）、搜索示例（三）、参考文档五、数据搜索(一)、基础搜索参数说明(二)、范围搜索1.概述总结2.详细说明(三)、全文搜索(BM25)1.概述2.使用全文搜索步骤(四)、其他搜索一、度量类型(metric_type)相似度量
LLM之向量数据库Chroma milvus FAISS maxmaxma 数据库 milvus faiss
以下是Chroma、Milvus和FAISS的核心区别，从功能定位、架构设计、性能及应用场景等维度进行对比：一、功能定位Chroma轻量级向量数据库：专注于快速构建中小型语义搜索原型，提供简单易用的API，适合快速集成到现有应用中。特点：支持近似最近邻搜索（ANN）、实时性能优化，但对大规模数据处理能力有限。Milvus分布式向量数据库：专为超大规模向量数据设计，支持云原生架构和高可用性，适合企业
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
个人AI助手的未来：Yi AI开源系统助力快速搭建耶耶Norsea 网络杂烩人工智能开源
摘要YiAI推出了一站式个人AI助手平台解决方案，助力用户快速搭建专属AI助手。该平台采用全套开源系统，涵盖前端应用、后台管理及小程序功能，并基于MIT协议开放使用。同时，平台集成了本地RAG方案，利用Milvus与Weaviate向量数据库支持本地部署，为用户提供高效、灵活的数据处理能力。关键词个人AI助手,快速搭建,开源系统,本地RAG,向量数据库一、YiAI开源系统概述1.1个人AI助手的发
基于ViT+milvus的以图搜图服务国防科技苏东坡分类算法 pytorch milvus
以图搜图服务简介服务流程介绍：将图片特征经过vit模型提取特征，保存到milvus库中，并存入对应的唯一id和身份标签，用于相似图片搜索；使用相似图片进行搜索，返回搜索到图片的身份标签和置信度。服务包括图片数据插入和图片相似搜索两部分。ViT(VisionTransformer)模型使用huggingface的ViT模型权重。https://huggingface.co/tttarun/visio
向量库集成指南三月七꧁ ꧂ langchain+llm 集成学习自然语言处理语言模型机器学习人工智能 gpt llama
文章目录向量库集成指南Chroma集成Pinecone集成MiLvus集成向量库集成指南向量库是一种索引和存储向量嵌入以实现高效管理和快速检索的数据库。与单独的向量索引不同，像Pinecone这样的向量数据库提供了额外的功能，例如，索引管理、数据管理、元数据存储和过滤，以及水平扩展。特别是在处理大数据和复杂查询时，向量库在多种应用场景中发挥着关键作用。其中，语义文本搜索是一个典型的应用，用
Milvus 本地Ollama向量化markdown文件慌雨 milvus 数据库
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言代码测试注意前言提示：这里可以添加本文要记录的大概内容：我在局域网内安装了milvus服务，现在需要把一个文件夹里所有的markdown文档都向量化到milvus数据库中。所用的切分方法是langchain中自带的markdown按照标题切分，且带有标题的metadata，非常清晰。但是用langchain提供的milvu
轻松掌握：Milvus向量数据库部署与RAG使用技巧威研威语人工智能数据库 milvus 数据库人工智能 RAG
Milvus简介Milvus是一款开源的向量数据库，由Zilliz开发并维护，适合用于机器学习和人工智能领域。是一款专为处理向量查询而设计的数据库，Milvus能够对万亿级向量进行索引。Milvus官网：https://milvus.io/Milvus中文文档：https://www.milvus-io.com/Milvus部署环境准备Linux操作系统Docker19.03或更高版本Docker
开源向量数据库介绍说明 ❀͜͡傀儡师开源数据库
开源向量数据库Milvus特点：分布式、高性能，支持亿级向量检索。支持的数据类型：文本、图像、音频、视频等。使用场景：推荐系统、语义搜索、图像搜索。数据存储后端：支持多种后端，如SQLite、MySQL、PostgreSQL。Qdrant特点：高可用性、易用性，支持实时更新和过滤。编程接口：支持REST和gRPC。使用场景：个性化推荐、自然语言搜索、商品搜索。Weaviate特点：基于GraphQ
打造RAG系统：四大向量数据库Milvus、Faiss、Elasticsearch、Chroma 全面对比与选型指南橙子小哥的代码世界数据库数据库 milvus faiss 人工智能深度学习神经网络 elasticsearch
在当今信息爆炸的时代，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）系统已成为自然语言处理（NLP）领域的重要工具。RAG系统通过结合生成模型和信息检索技术，能够在大规模数据中高效地获取相关信息，生成更为精准和有针对性的内容。而在构建RAG系统时，选择合适的向量数据库是确保系统性能和可扩展性的关键一步。本文将深入对比四大主流向量数据库——Milvus、Fai
【微服务】SpringBoot 整合Redis Stack 构建本地向量数据库相似性查询小码农叔叔 AI大模型实战与应用 springboot 入门到精通向量数据库 redis stack java使用向量数据库
目录一、前言二、向量数据库介绍2.1什么是向量数据库2.2向量数据库特点2.3向量数据库使用场景三、常用的向量数据库解决方案3.1Milvus3.1.1Milvus是什么3.1.2Milvus主要特点3.2Faiss3.2.1Faiss是什么3.2.2Faiss主要特点3.3Pinecone3.3.1Pinecone是什么3.3.2Pinecone主要特点3.4Weaviate3.4.1Weavi
Milvus 数据批量导入实战：Python代码解析修破立生 Milvus milvus python 人工智能
1引言在处理大规模数据的存储和检索时，向量数据库逐渐成为一种热门的解决方案。Milvus作为一款高性能的向量数据库，在人工智能、机器学习等领域有着广泛的应用。本文将介绍如何使用Python代码将数据批量导入到Milvus数据库中，通过实际的代码示例来帮助大家理解导入过程和相关的技术要点。2代码功能概述我们的代码主要实现了从本地文件读取数据，并将其批量导入到Milvus数据库的功能。代码涉及到命令行
使用milvus-sdk-go的迭代器导出数据 shulu milvus向量数据库 milvus golang 开发语言
使用milvus-sdk-go的迭代器导出数据迭代器是一种功能强大的工具，可帮助您使用主键值和布尔表达式迭代集合中的大量数据或所有数据。这可以显著改善您检索数据的方式。与传统的offset和limit参数用法不同，后者可能会随着时间的推移而变得效率低下，而迭代器提供了更具可扩展性的解决方案。当表数据很大，需要全量导出，我们可以使用迭代器，例如每次只查询1000行数据，直到所有数据查询完成，同时也可
RAG组件：向量数据库（Milvus） CITY_OF_MO_GY milvus 人工智能
在当前大模型盛行的时代，大模型的垂类微调、优化成为产业落地、行业应用的关键；RAG技术应运而生，主要解决大模型对专业知识、实效性知识欠缺的问题；RAG的核心工作逻辑是将专业知识、实效知识等大模型欠缺的知识进行收集、打包、保存为一个知识库，在用到该部分知识的时候，可以通过检索关键信息，将知识库內对应知识片段进行返回，再整合为一个结构化的prompt（提示词）输入给大模型，这样以来，大模型就可以结合这
Milvus 数据批量导出实战：Python 代码解析修破立生 Milvus milvus python 人工智能
1引言由于Milvus在单次查询中所能返回的数据量存在固有约束，当处理数据量庞大的Collection时，需考虑采用多次查询的策略。本文详细阐述了如何运用多次查询的方式，将Milvus中的数据进行分批导出，以有效应对数据量过大带来的挑战。2代码整体概述我们的目标是从Milvus中导出指定集合的数据，并将其保存为JSON文件。代码主要分为以下几个部分：连接到Milvus服务。定义数据导出函数，包括数
langchain4j+milvus实战 llm
序本文主要研究一下如何使用langchain4j来对接向量数据库milvus步骤docker运行milvusdockerrun-d\--namemilvus-standalone\--security-optseccomp:unconfined\-eETCD_USE_EMBED=true\-eETCD_DATA_DIR=/var/lib/milvus/etcd\-eETCD_CONFIG_PATH
BERT 和 Milvus 构建智能问答系统的全面技术解析，涵盖从原理到实践的完整流程
结合BERT和Milvus构建智能问答系统的全面技术解析，涵盖从原理到实践的完整流程。下面Python代码示例和优化策略：一、技术栈协作原理BERT的语义编码能力BERT作为预训练语言模型，通过双向Transformer结构将文本转换为高维向量（如768维），捕捉上下文语义信息。例如，句子"Milvus是向量数据库"会被编码为类似[0.2,-1.3,0.5,...]的向量19。Milvus的向量检
开源的向量数据库Milvus 研创通之逍遥峰数据库数据库 milvus
Milvus是一款开源的向量数据库，专为处理向量搜索任务而设计，尤其擅长处理大规模向量数据的相似度检索。官网地址：https://milvus.io/以下是关于Milvus的详细介绍：一、基本概念向量数据库：Milvus是一款云原生向量数据库，它支持多种类型的向量，如浮点向量、二进制向量等，并且可以处理大规模的向量数据。向量在Milvus中作为基本数据单元，用于表示高维空间中的点，可以是图像、音频
BERT 模型和 Milvus 向量数据库分步骤讲解如何实现「文本相似度搜索」
结合BERT模型和Milvus向量数据库，通过一个Python示例分步骤讲解如何实现「文本相似度搜索」。整个过程分为：文本向量化→存储到Milvus→相似度搜索。1️⃣环境准备安装必要的库：pipinstallpymilvustransformerstorch2️⃣流程图解BERT模型↓将文本转为向量Milvus数据库（存储所有向量）↓输入问题文本Milvus搜索相似向量→返回最相似的答案3️⃣完
Milvus「非结构化数据」的超级搜索引擎后端机器学习深度学习
Milvus可以简单理解为一个专门处理「非结构化数据」的超级搜索引擎。它的核心价值是：帮你快速从海量数据（比如图片、音频、视频、文本）中找到最相似的内容。举个例子秒懂：假设你有100万张图片，你想找其中和「某张猫咪图片」最相似的10张。如果用传统方法（比如人工比对或普通数据库），可能需要几小时甚至更久。而Milvus可以在毫秒级完成搜索，就像用百度搜文字一样快。核心作用：向量相似度搜索非结构化数据
RagFlow专题三、RagFlow 关键技术（向量数据库、文档分块、Prompt 设计与召回排序优化）伯牙碎琴大模型 prompt 大模型 AI Rag RagFlow
深入解析RagFlow关键技术：向量数据库、文档分块、Prompt设计与召回排序优化在前一篇文章中，我们详细探讨了RagFlow的核心架构，包括数据检索、语义搜索（BM25&向量搜索）以及知识融合，并了解了如何通过RagFlow机制优化信息检索和生成质量。本篇文章将深入解析RagFlow的关键技术，包括：向量数据库（FAISS、Milvus、Elasticsearch）——负责高效的语义检索与存储
阿里云Milvus 2.5：支持全文检索，1次查询实现文本+向量双精度匹配人工智能大数据milvus
随着大模型时代带来的各种新型应用探索，结合传统基于文本匹配的精确检索与语义检索所带来的增益日益显著，尤其在一些深度依赖关键字词匹配的场景中，这种需求变得尤为关键。目前，阿里云向量检索服务Milvus版（简称阿里云Milvus）集成开源Milvus2.5版本内核，在支持向量检索的基础上，新增支持原生全文检索、基于特定词汇的精准文本匹配等功能，在RAG、多模态搜索等场景下搜索精度明显提升，使用体验大幅
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[6]-实现Milvus向量检索+实现自定义关键词调整Embedding模型汀、人工智能 LLM工业级落地实践 langchain milvus embedding 人工智能自然语言处理语言模型大模型
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[6]-实现Milvus向量检索+实现自定义关键词调整Embedding模型0.Milvus与Faiss对比Milvus相对于Faiss的优势主要体现在以下几个方面：在线数据更新与实时搜索：Milvus支持在线的数据更新和实时的向量搜索，这意味着在数据频繁变动的场景下，用户无需重新构建整个索引，从而大大减少了维护成本。相比之
使用 LangChain 和 Milvus 构建测试知识库 Python测试之道测试提效 python python DeepSeek
LangChain是一个强大的框架，可以与向量数据库（如Milvus）无缝集成，用于构建基于检索的增强生成（RAG）系统。在测试工程师的场景中，可以将测试资产（如需求文档、测试用例、缺陷报告等）存储在Milvus中，然后通过LangChain提供的检索功能快速查询和生成相关内容。功能目标存储测试资产：将需求文档、测试用例和缺陷记录等内容转换为向量表示并存储到Milvus。检索测试资产：根据用户输入
基于 Elasticsearch 和 Milvus 的 RAG 运维知识库的架构设计和部署落地实现指南 ViniJack AI milvus 运维 rag 落地方案知识库
最近在整理一些业务场景的架构设计和部署落地实现指南先放一个【基于RAG的运维知识库(ElasticSearch+Milvus)的详细实现指南】，其中包含了详尽的技术实现细节、可运行的示例代码、原理分析、优缺点分析和应用场景分析。架构描述：基于RAG的运维知识库(ElasticSearch+Milvus)部署指南1.极其详细的部署步骤(包含详尽的技术实现细节和分步骤、可运行的示例代码-也只能给示例代
Milvus高性能向量数据库与大模型结合山塘小鱼儿数据库阿里云向量数据库
Milvus|高性能向量数据库，为规模而构建Milvus是一个为GenAI应用构建的开源向量数据库。使用pip安装，执行高速搜索，并扩展到数十亿个向量。https://milvus.io/zhMilvus是什么？Milvus是一种高性能、高扩展性的向量数据库，可在从笔记本电脑到大规模分布式系统等各种环境中高效运行。它既可以开源软件的形式提供，也可以云服务的形式提供。Milvus是LFAI&Data
镜像解决，向量数据库Milvus报错 zwzscnds docker milvus
MilvusMilvus是一款开源的向量数据库，具有高度的灵活性、稳定可靠性以及高速查询等特点。它支持针对TB级向量的增删改操作和近实时查询，适用于大规模向量数据的存储和检索。Milvus的官网：https://milvus.ioGithub上Milvus的链接：https://github.com/milvus-ioDockerDocker是一种容器化技术，它允许开发者将应用程序及其依赖项打包到
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_