ZILLIZ RDS

Milvus 开发者专栏｜以图搜图系统工程实践

Milvus 小编：

此篇文章是来自瞧好货app 的工程师-凌虚的投稿，团队用 Milvus 实现了以图搜图的功能，提升了业务的效率。希望此文能帮助到需要的小伙伴，也欢迎更多的开发者来与我们分享你的故事喔！凌虚也时常在公众号Node Python Go全栈开发分享一些干货，请大家多多关注！

| 应用场景

我们的系统主要是各级代理商家之间会传递大量以图片为载体的商品信息，有时候下级商家看中了某一款商品他就会直接截图，去找上级代理拿货，因为图片数量比较多，所以上级代理找起来也很麻烦，搜图就根据图片内容快速定位到商品的具体的信息。

|以图搜图系统工程实践

之前写过一篇概述: 以图搜图系统概述。

以图搜图系统需要解决的主要问题是：

• 提取图像特征向量（用特征向量去表示一幅图像）

• 特征向量的相似度计算（寻找内容相似的图像）

对应的工程实践，具体为：

• 卷积神经网络 CNN 提取图像特征

• 向量搜索引擎 Milvus

|CNN + VGG16

使用卷积神经网路 CNN 去提取图像特征是一种主流的方案，具体的模型则可以使用 VGG16 ，技术实现上则使用 Keras + TensorFlow ，参考 Keras 官方示例：

from keras.applications.vgg16 import VGG16
from keras.preprocessing import image
from keras.applications.vgg16 import preprocess_input
import numpy as np

model = VGG16(weights='imagenet', include_top=False)

img_path = 'elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)

features = model.predict(x)

这里提取出来的 feature 就是特性向量。

1、归一化

为了方便后续操作，我们常常会将 feature 进行归一化的处理：

from numpy import linalg as LA

norm_feat = feat[0]/LA.norm(feat[0])

后续实际使用的也是归一化后的 norm_feat 。

2、Image 说明

这里加载图像使用的是 keras.preprocessing 的 image.load_img 方法即：

from keras.preprocessing import image

img_path = 'elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))

实际上是 Keras 调用的 TensorFlow 的方法，详情见 TensorFlow 官方文档，而最后得到的 image 对象其实是一个 PIL Image 实例（ TensorFlow 使用的 PIL ）。

3、Bytes 转换

实际工程中图像内容常常是通过网络进行传输的，因此相比于从 path 路径加载图片，我们更希望直接将 bytes 数据转换为 image 对象即 PIL Image ：

import io
from PIL import Image

# img_bytes: 图片内容 bytes
img = Image.open(io.BytesIO(img_bytes))
img = img.convert('RGB')

img = img.resize((224, 224), Image.NEAREST)

以上 img 与前文中的 image.load_img 得到的结果相同，这里需要注意的是：

• 必须进行 RGB 转换

• 必须进行 resize （ load_img 方法的第二个参数也就是 resize ）

4、黑边处理

有时候图像会有比较多的黑边部分（例如截屏），而这些黑边的部分即没有实际价值，又会产生比较大的干扰，因此去除黑边也是一项常见的操作。

所谓黑边，本质上就是一行或一列的像素点全部都是 (0, 0, 0) ( RGB 图像)，去除黑边就是找到这些行或列，然后删除，实际是一个 numpy 的 3-D Matrix 操作。

移除横向黑边示例：

# -*- coding: utf-8 -*-

import numpy as np
from keras.preprocessing import image


def RemoveBlackEdge(img):
"""移除图片横向黑边

Args:
 img: PIL image 实例

Returns:
 PIL image 实例
"""
 width = img.width
 img = image.img_to_array(img)
 img_without_black = img[~np.all(img == np.zeros((1, width, 3), np.uint8), axis=(1, 2))]
 img = image.array_to_img(img_without_black)
return img

CNN 提取图像特征以及图像的其它相关处理先写这么多，我们再看向量搜索引擎。

|向量搜索引擎 Milvus

只有图像的特征向量是远远不够的，我们还需要对这些特征向量进行动态的管理（增删改），以及计算向量的相似度并返回最邻近范围内的向量数据，而开源的向量搜索引擎 Milvus 则很好的完成这些工作。

下文将会讲述具体的实践，以及要注意的地方。

1、对 CPU 有要求

想要使用 Milvus ，首先必须要求你的 CPU 支持 avx2 指令集，如何查看你的 CPU 支持哪些指令集呢？对于 Linux 系统，输入指令

cat /proc/cpuinfo | grep flags

你将会看到形如以下的内容：

flags  : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand lahf_lm abm cpuid_fault epb invpcid_single pti intel_ppin tpr_shadow vnmi flexpriority ept vpid ept_ad fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid cqm xsaveopt cqm_llc cqm_occup_llc dtherm ida arat pln pts

flags 后面的这一大堆就是你的 CPU 支持的全部指令集，当然内容太多了，我只想看是否支持具体的某个指令集，比如 avx2 ，再加一个 grep 过滤一下即可：

cat /proc/cpuinfo | grep flags | grep avx2

如果执行结果没有内容输出，就是不支持这个指令集，你只能换一台满足要求的机器。

2、容量规划

系统设计时，容量规划是需要首先考虑的地方，我们需要存储多少数据，这些数据需要多少内存以及多大的磁盘空间？

速算，上文中特征向量的每一个维度都是 float32 的数据类型，一个 float32 需要占用 4 byte，那么一个 512 维的向量就需要 2 KB ，依次类推：

• 一千个 512 维向量需要 2 MB

• 一百万 512 维向量需要 2 GB

• 一千万 512 维向量需要 20 GB

• 一个亿 512 维向量需要 200 GB

• 十个亿 512 维向量需要 2 TB

如果我们希望能将数据全部存在内存中，那么系统就至少需要对应大小的内存容量。

这里推荐你使用官方的大小计算工具: milvus tools

实际上我们的内存可能并没有那么大（内存不够没关系，milvus 会将数据自动刷写到磁盘上），另外除了这些原始的向量数据之外，还会有一些其他的数据例如日志等的存储也是我们需要考虑的地方。

3、系统配置

关于系统配置，官方文档有比较详细的说明：

• Milvus 服务端配置

• 如何设置系统配置项

• 配置 Milvus 用于生产环境

4、数据库设计

collection & partition

在 Milvus 中，数据会按照 collection 和 partition 进行划分：

•collection 就是我们理解的表。•partition 则是 collection 的分区，也就是某个表内部的分区。

partition 分区在底层实现上其实与 collection 集合是一致的，只是前者从属于后者，但是有了分区之后，数据的组织方式变得更加灵活，我们也可以指定集合中某个特定分区进行查询，从而达到一个更高的查询性能，更多内容参考分区表详细说明。

我们可以使用多少个 collection 和 partition ？由于 collection 和 partition 的基本信息都属于元数据，而 milvus 内部进行元数据管理需要使用 SQLite（ milvus 内部集成）或者 MySQL (需要外部连接) 其中之一，如果你使用默认的 SQLite 去管理元数据的话，当集合和分区的数量过多时，性能损耗会很严重，因此集合和分区总数不要超过 50000（0.8.0 版本将会限制为 4096），需要设置更多的数量则建议使用外接 MySQL 的方式。

Milvus 的 collection 和 partition 内部支持的数据结构非常简单，只支持 ID + vector ，换句话说，表只有两列，一列是 ID ，一列是向量数据。

注意：

• ID 目前只支持整数类型•我们需要保证 ID 在 collection 的层面是唯一的，而不是 partition 。

条件过滤

我们使用一些传统的数据库时，往往可以指定字段进行条件过滤，但是 Milvus 并不能直接支持这项功能，然而我们是可以通过集合和分区的设计去实现简单的条件过滤，例如，我们有很多图片数据，但是这些图片数据都明确的属于具体的用户，那么我们就可以按照用户去划分 partition ，这样查询的时候以用户作为过滤条件其实就是指定 partition 即可。

结构化数据与向量的映射

由于 milvus 只支持 ID + vector 的数据结构，而实际业务上我们最终需要的往往是具有业务意义的结构化数据，也就是说，我们需要通过 vector 向量最终找到结构化数据，因此我们需要通过 ID 去维护结构化数据与向量之间的映射关系:

结构化数据 ID <--> 映射表 <--> Milvus ID

索引类型选择

请参考以下文档:

• 索引类型

• 如何选择索引类型

5、搜索结果处理

Milvus 的搜索结果是 ID + distance 的集合:

•ID : collection 中的 ID 。•distance : 0 ~ 1 的距离值，表示相似性程度，越小越相似。

过滤 ID 为 -1 的数据

当数据集过少的时候，搜索结果可能会包含 ID 为 -1 的数据，我们需要自己去过滤掉。

翻页

向量的搜索比较特别，查询的结果是按照相似性顺序，从最相似开始往后选取 topK 个数据（ topK 需要搜索时由用户指定）。

Milvus 的搜索不支持翻页，如果我们希望在业务上实现这个功能，那么只能由我们自己去处理，比如，我想要每页 10 条数据，只显示第 3 页的数据，那么我们需要去取 topK = 30 的数据，然后只返回最后 10 条。

业务上的相似性阈值

两张图片的特征向量的距离 distance 范围是 0 ~ 1 ，有些时候我们需要在业务上去判定两张图片是否相似，这时就需要我们自己去设置一个距离的阈值，当 distance 小于阈值时就可以判定为相似，大于阈值时判定为不相似，这个也是需要根据具体的业务自己去处理。

| 结语

本文讲述了以图搜图系统进行工程实践时比较常见的内容，最后强烈推荐一下 Milvus 。

**Milvus 小编：

也想来与我们分享你和 Milvus 的故事吗？或是加入社区一起搞事情，下面的文章告诉你如何加入我们噢！

-> @ 所有人，你也能成为Milvus贡献者！

|欢迎加入 Milvus 社区

http://github.com/milvus-io/milvus | 源码

http://milvus.io | 官网

http://milvusio.slack.com | Slack 社区

http://zhihu.com/org/zilliz-11/columns | 知乎

http://zilliz.blog.csdn.net | CSDN 博客

Milvus向量数据库集合操作初尝试麦克阿建 milvus
目录1.集合（Collection)2.字段（Field）3.索引（Index）4.分区（Partition）5.实体（Entity）6.代码示例6.1集合创建6.2向量插入6.3向量查询6.4向量删除1.集合（Collection)集合是Milvus中存储数据的最基本单元。它类似于数据库中的一个表（table）。集合定义了数据的整体结构，包括数据类型、字段、索引等。作用：集合是你数据的容器，用来
高阶知识库搭建实战五、（向量数据库Milvus安装）伯牙碎琴大模型数据库 milvus 大模型 AI
以下是关于在Windows环境下直接搭建Milvus向量数据库的教程：本教程分两部分，第一部分是基于docker安装，在Windows环境下直接安装Milvus向量数据库，目前官方推荐的方式是通过Docker进行部署，因为Milvus的运行环境依赖于Linux系统。如果你希望在Windows上直接运行Milvus，可以考虑使用MilvusLite版本，这是一个轻量级的Python库，适用于快速原型
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
大模型——TRAE+Milvus MCP 自然语言就能搞定向量数据库不二人生大模型 milvus 数据库 trae 大模型
大模型——TRAE+MilvusMCP自然语言就能搞定向量数据库不久前，继Cursor和ClaudeDesktop在海外市场掀起智能编程浪潮后，字节跳动TRAE海外版也进入了付费模式。相较前两款海外产品，TRAE集成了代码补全、智能问答和Agent模式之外，还可以为中文开发者带来本土化的智能编程体验。恰逢其时，MilvusMCP服务器新增了SSE（Server-SentEvents）支持。相比传统
推荐开源项目：Milvus Lite —— 轻量级向量数据库，助力AI应用快速起飞穆希静
推荐开源项目：MilvusLite——轻量级向量数据库，助力AI应用快速起飞项目介绍MilvusLite是知名开源向量数据库Milvus的轻量级版本，专为需要在小型环境中进行向量嵌入和相似性搜索的AI应用设计。通过将MilvusLite导入您的Python应用，您可以直接使用Milvus的核心向量搜索功能。MilvusLite已集成在PythonSDKofMilvus中，只需通过pipinstal
Linux部署Milvus数据库及Attu UI工具完全指南
一、准备工作1.1环境要求操作系统：Ubuntu20.04/Debian11/CentOS7+硬件配置：至少8GB内存，4核CPU，50GB磁盘空间网络要求：可访问互联网（用于拉取Docker镜像）1.2安装Docker和DockerCompose1.2.1安装Dockersudoapt-getupdatesudoapt-getinstall-ydocker.iosudosystemctlstar
windows配置内网穿透 AI算法网奇 win/ubuntu 运维服务器
目录dify访问：在Windows上配置frpcdify访问：VECTOR_STORE=milvusMILVUS_URL=http://host.docker.internal:19530#取决于Milvus启动位置在Windows上配置frpc下载地址：https://github.com/fatedier/frp/releases解压后，编辑frpc.ini：下载版本：frp_0.62.1_w
医疗AI与融合数据库的整合：挑战、架构与未来展望（下） Allen_Lyb 数智化教程（第二期）人工智能数据库架构
解决方案：引入融合数据库（Multi-modalDataFusionDB）医院引入一款支持图、向量、表、流的融合数据库（如OracleADW、Milvus+PostgreSQL、或某国产平台），完成了以下集成：数据类型来源系统格式/模型示例内容基因组数据NGS平台VCF/JSON/图EGFR突变、ALK融合等医学影像特征CT影像AI平台向量肿瘤体积、位置、边界清晰度等临床病历HIS/EMR结构化表
国产（以麒麟为例）环境，离线安装docker、docker-compose、milvus 般若-波罗蜜 1024程序员节 docker python 深度学习 pytorch
文章目录一、专有名词解释1.主流cpu2.操作系统二、安装docker2.读入数据总结docker错误解决方法一、专有名词解释1.主流cpu架构（指令集）x86（早期intel开发的32位指令集）x64（CISC）1）AMD64--------AMD首先开发出64位指令集，向下兼容32位2）x86_64--------intel使用AMD的64位指令集，换了个名字而已ARMAArch64为ARMv
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
RAG技术栈详解：构建智能问答系统的核心组件认知超载 AI 人工智能
本文深度剖析RAG（Retrieval-AugmentedGeneration）技术栈的核心构成，助你快速搭建企业级知识增强系统一、RAG技术架构全景图二、核心组件技术选型1.检索模块（Retriever）向量数据库主流选择：Pinecone、Milvus、Qdrant、Weaviate新兴势力：ChromaDB（开源轻量级）、腾讯云向量数据库嵌入模型（Embedding）OpenAItext-e
安装milvus数据库 weixin_44080967 milvus 数据库
#创建保存目录mkdir-pdocker_images_backupcddocker_images_backup#1.保存Milvus镜像dockersave-omilvus_latest.tarmilvusdb/milvus:latest#2.保存MinIO镜像dockersave-ominio_latest.tarminio/minio:latest#3.保存ETCD镜像dockersave-
Milvus向量数据库入门指南 longfei.li milvus 数据库人工智能
一、Milvus简介Milvus是一个开源的向量数据库，专为AI应用和向量相似度搜索而设计，以加速非结构化数据的检索。自2019年创建以来，Milvus专注于存储、索引和管理由深度神经网络和其他机器学习模型生成的海量嵌入向量。其能够处理万亿级别的向量索引任务。Milvus的核心优势在于其高效的索引机制，它支持多种索引类型，包括FLAT、IVF_FLAT、IVF_SQ8、IVF_PQ和HNSW等。这
新手如何本地构建Milvus向量数据库 BeMiracle~ milvus 数据库
简单构建一个Milvus数据库一、前言：什么是Milvus数据库二、安装Docker官方下载地址：配置Docker三、安装Milvus四、Milvus关键概念介绍1、首先创建数据库2、然后创建逻辑定义3、添加字段4、创建集合collection5、建立索引（有索引才能查询数据）6、插入更新删除数据7、查询数据(查询limit个相似向量)一、前言：什么是Milvus数据库Milvus是一款‌开源向量
Milvus数据库创建 cts618 Milvus分布式向量数据库数据库 milvus oracle
URL：https://milvus.io/docs/zh/manage_databases.mdfrompymilvusimportMilvusClient"""URL：https://milvus.io/docs/zh/manage_databases.md"""#创建数据库client=MilvusClient(uri="",token="")client.create_database(d
Milvus知识库创建
importconfigparserimporttimeimportrandomfrompymilvusimportMilvusClientfrompymilvusimportDataTypecfp=configparser.RawConfigParser()cfp.read('config.ini')milvus_uri=cfp.get('example','uri')token=cfp.get
Milvus中 Collections 级多租户和分区级多租户的区别背太阳的牧羊人人工智能 RAG优化方法 milvus 向量数据库
原文链接图片内容中。1，所有租户共用一个Collection：所有租户共享一个Collection，租户特定字段用于过滤。2，每个租户一个分区：租户共享一个Collections，但他们的数据存储在不同的分区中。我们可以通过为每个租户分配一个专用分区来隔离数据。3，基于PartitionKey的多租户：这是一种可扩展性更强的方案，其中单个Collections使用分区Key来区分租户。它们看起来相
Milvus 资源调度系统的核心部分：「查询节点」「资源组」「数据库」背太阳的牧羊人 milvus数据库 milvus 数据库
Milvus的资源管理分为三层：查询节点、资源组和数据库。查询节点：处理查询任务的组件。它在物理机或容器（如Kubernetes中的pod）上运行。资源组：查询节点的集合，充当逻辑组件（数据库和Collections）与物理资源之间的桥梁。您可以将一个或多个数据库或集合分配给一个资源组。下面我将详细解释这三个概念。总体图（打个比方）你可以把整个Milvus系统想象成一个「大型图书馆系统」，里头有：
向量数据库milvus中文全文检索取不到数据的处理办法 --勇数据库 milvus 全文检索
检查中文分词配置Milvus2.5+支持原生中文全文检索，但需显式配置中文分词器：创建集合时指定分词器类型为chinesepythonschema.add_field(field_name="text",datatype=DataType.VARCHAR,max_length=65535,enable_analyzer=True,analyzer_params={"type":"chinese"}
pymilvus.exceptions.MilvusException: ＜MilvusException: (code=0, message=attempt #0: channel=by-dev-r
Langchain连接AI大模型连接milvus数据库，向milvus同步数据时报错如下：ERROR:ExceptioninASGIapplicationTraceback(mostrecentcalllast):File"/home/devops/.local/lib/python3.10/site-packages/uvicorn/protocols/http/httptools_impl.p
Milvus向量数据库：处理和分析大规模向量数据 concisedistinct 人工智能 milvus 数据库向量人工智能机器学习高可用容灾
目录一Milvus概述性能可扩展性易用性二Milvus的核心技术1向量索引HNSWIVFPQ2GPU加速3分布式架构分布式三深入了解Milvus的技术细节1存储机制持久化存储内存存储2数据导入与导出批量导入实时导入3高可用性与容灾机制数据副本自动故障恢复数据备份与恢复四实践中的Milvus1电商平台的图像搜索系统架构性能优化2金融行业的风险控制系统架构成果与展望五结语在当今数据驱动的世界中，处理和
局域网访问WSL服务——问题排查笔记迟三登 linux windows
给团队做了一个RAG项目，由于使用的向量数据库是milvus（不支持Windows），以及方便后面项目迁移到服务器，遂开发调试过程中使用的是WSL2。项目在本机上开发调试结束后，由于是给团队使用的，需要局域网内其它设备能够访问这个运行在WSL2上的服务。这次的排查经历相对比较完整，可以作为以后参考的排查清单。目标:允许局域网内的其他设备访问运行在WSL内部的服务。初始环境:Windows主机IP(
docker 安装 milvus standalone 版本 + attu Jiangnan_Cai Linux docker milvus 数据库
首先，milvus向量数据库和sql类似，有lite版本和standalone版本，就是功能有些阉割：milvuslite的话python直接安装pymilvus就可以用了standalone版本则需要通过docker来进行部署1.安装docker与docker-compose这个在这里就不赘述了，但是需要将docker的源换成国内可用的，经过我测试，针对milvus镜像的下载，国内的下面两个源是
Milvus 向量数据库详解与实践指南 JJJ@666 基础知识(人工智能AI)milvus 向量数据库图像检索推荐系统
一、Milvus核心介绍1.什么是Milvus？Milvus是一款开源、高性能、可扩展的向量数据库，专门为海量向量数据的存储、索引和检索而设计。它支持近似最近邻搜索（ANN），适用于图像检索、自然语言处理（NLP）、推荐系统、语义搜索、智能问答、多模态数据处理等AI应用场景。它能够高效处理：嵌入向量（Embeddings）特征向量（FeatureVectors）任何高维数值向量2.核心特性特性说明
CentOS使用docker-compose在线部署milvus服务（超详细）男孩一泽 milvus CentOS 人脸搜索 docker centos milvus
部署milvus服务（在线部署docker、docker-compose、milvus服务）注意事项:若所有操作在root用户下进行，则无需执行第2步、第4步的第1条、第6步的第1条离线部署适用于内网服务器，比较麻烦，若服务器可以访问外网，参考milvus在线部署版部署步骤在root账户下创建milvus账户执行如下命令useradd-mmilvuspasswdmilvus输入两次密码密码设置成功
ModaHub魔搭社区：基于 Amazon EKS 搭建开源向量数据库 Milvus 大禹智库《向量数据库指南》《实战AI智能体》开源数据库 milvus 向量数据库 ModaHub AI模型魔搭社区
目录01前言02架构说明03先决条件04创建EKS集群05部署Milvus数据库06优化Milvus配置07测试Milvus集群08总结01前言生成式AI（GenerativeAI）的火爆引发了广泛的关注，也彻底点燃了向量数据库（VectorDatabase）市场，众多的向量数据库产品开始真正出圈，走进大众的视野。根据IDC的预测，到2025年，超过80%的业务数据将是非结构化的，以文本、图像、音
Linux CentOS安装Docker和docker-compose和milvus 数据叨叨叨 linux centos docker
一、LinuxCentOS安装Docker在CentOS上安装Docker与在Ubuntu上类似，但有一些微小的差异。以下是在CentOS上安装Docker的步骤：更新系统：确保系统处于最新状态。使用以下命令更新软件包列表：sudoyumupdate安装依赖包：安装一些必要的软件包，以便能够通过HTTPS使用存储库：sudoyuminstall-yyum-utilsdevice-mapper-pe
Docker【部署 04】Docker Compose下载安装及实例Milvus Docker compose(CPU)使用说明分享_docker compose 下载 2401_84301352 docker milvus eureka
1.Compose说明DockerCompose是一个用于定义和管理多个Docker容器的工具，旨在简化容器化应用程序的开发、部署和管理过程。通过DockerCompose，您可以使用一个单独的配置文件（通常是docker-compose.yml文件）来描述应用程序中涉及的多个容器、网络设置、存储卷等。DockerCompose官网安装说明文档。1.1OverviewofinstallingDoc
使用 Docker Compose 安装 Milvus（单机版） openlabx.org.cn docker milvus 向量数据库人工智能
1.创建专用目录并进入mkdirmilvus-standalone&&cdmilvus-standalone2.下载docker-compose.yml文件使用官方提供的配置文件（以Milvusv2.3.3为例）：wgethttps://github.com/milvus-io/milvus/releases/download/v2.3.3/milvus-standalone-docker-com
Milvus/ES 插入方案对比风筝超冷 milvus python 开发语言
在Python中加载它并打印一个示例嵌入的维度。python-c"fromsentence_transformersimportSentenceTransformer;model=SentenceTransformer('/root/.cache/modelscope/hub/models/Qwen/Qwen3-Embedding-0.6B');example_embedding=model.en
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &