彬彬侠

【Milvus】pymilvus 中的 API 分类例举和说明

pymilvus 是 Milvus 向量数据库的 Python SDK，为用户提供了与 Milvus 服务交互的接口，用于管理集合、插入向量、构建索引、执行搜索等操作。在版本 2.5.0 中，pymilvus 提供了灵活的 MilvusClient 模块和传统的 ORM（对象关系映射）模块，支持同步和异步操作，并新增了模型集成（如嵌入生成）。以下是对 pymilvus 2.5.0 中 API 的全面分类、示例和详细说明，旨在帮助理解其功能和使用场景。

1. 概述

pymilvus 2.5.0 提供了两种主要接口：

MilvusClient：推荐的新接口，简单直观，适合大多数用户，集成了集合管理、数据操作、搜索和模型功能。
ORM 模块：传统的接口，提供更细粒度的控制，适合需要复杂操作的场景。
AsyncMilvusClient：异步版本的 MilvusClient，支持异步编程，提高并发性能。

此外，pymilvus 新增了 model 模块，集成了嵌入生成和重排序功能，简化了从文本、图像等数据生成向量的过程。本教程将重点介绍 MilvusClient 的 API 分类，并提及 AsyncMilvusClient 和 model 模块的相关功能。

API 可以分为以下几大类：

连接管理
集合管理
数据操作
索引管理
搜索与查询
分区管理
模型集成
异步操作

以下逐一介绍每个分类的功能、示例和说明。

2. 连接管理

连接管理 API 用于初始化与 Milvus 服务的连接，配置服务器地址、认证信息和数据库。

主要功能：

初始化客户端，连接到 Milvus 服务。
支持无认证、根用户认证和非根用户认证。
支持本地文件（如 Milvus Lite）或远程服务器连接。

示例：

from pymilvus import MilvusClient

# 无认证连接（本地服务器）
client = MilvusClient(uri="http://localhost:19530")

# 根用户认证
client = MilvusClient(
    uri="http://localhost:19530",
    token="root:Milvus",
    db_name="default"
)

# 非根用户认证
client = MilvusClient(
    uri="http://localhost:19530",
    token="user:password",
    db_name="default"
)

# 本地 Milvus Lite
client = MilvusClient(uri="./milvus_demo.db")

说明：

uri：指定 Milvus 服务器地址（远程）或本地文件路径（Milvus Lite）。
token：用于认证，格式为 username:password。
db_name：指定数据库名称，默认为 default。
本地 Milvus Lite 模式适合快速原型开发，数据存储在指定文件中。
连接成功后，客户端可用于后续操作，如创建集合或插入数据。

3. 集合管理

集合（Collection）是 Milvus 中存储向量的基本单位，类似于数据库中的表。集合管理 API 用于创建、删除、描述和列出集合。

主要功能：

创建集合，指定向量维度和距离度量。
删除集合，释放资源。
描述集合，查看 schema 和属性。
列出所有集合。
修改集合属性（如别名）。

示例：

# 创建集合
client.create_collection(
    collection_name="example_collection",
    dimension=128,  # 向量维度
    metric_type="L2"  # 欧几里得距离
)

# 查看集合信息
schema = client.describe_collection(collection_name="example_collection")
print("Collection schema:", schema)

# 列出所有集合
collections = client.list_collections()
print("Collections:", collections)

# 删除集合
client.drop_collection(collection_name="example_collection")

说明：

create_collection：需要指定集合名称、向量维度和距离度量（如 L2、COSINE、IP）。
metric_type：影响相似性计算，常见选项包括：
- L2：欧几里得距离，适合计算机视觉。
- COSINE：余弦相似度，适合自然语言处理。
- IP：内积，适合某些 NLP 任务。
describe_collection：返回集合的 schema，包括字段定义和属性。
list_collections：返回当前数据库中的所有集合名称。
drop_collection：永久删除集合及其数据，谨慎使用。

4. 数据操作

数据操作 API 用于向集合中插入、删除、查询和更新向量数据。

主要功能：

插入向量及其元数据。
删除向量（基于 ID 或过滤条件）。
查询向量（基于 ID 或表达式）。
更新向量数据（部分字段）。

示例：

import random

# 插入数据
data = [
    {
        "id": i,
        "vector": [random.random() for _ in range(128)],
        "metadata": {"category": f"cat_{i % 3}"}
    }
    for i in range(1000)
]
client.insert(collection_name="example_collection", data=data)

# 查询数据（基于 ID）
results = client.query(
    collection_name="example_collection",
    ids=[0, 1, 2],
    output_fields=["id", "metadata"]
)
print("Query results:", results)

# 删除数据（基于过滤条件）
client.delete(
    collection_name="example_collection",
    filter="category == 'cat_0'"
)

# 更新数据
client.upsert(
    collection_name="example_collection",
    data=[
        {"id": 0, "metadata": {"category": "updated_cat"}}
    ]
)

说明：

insert：批量插入向量数据，每个实体包含 id（主键）、vector（向量）和元数据（如 metadata）。
query：根据 ID 或过滤表达式检索数据，返回指定字段。
delete：支持基于主键 ID 或过滤表达式（如 category == 'cat_0'）删除数据。
upsert：插入或更新数据，如果 ID 已存在则更新，否则插入。
过滤表达式支持简单的逻辑运算，如 ==、>、< 和 in。

5. 索引管理

索引管理 API 用于创建、删除和描述索引，以加速向量搜索。

主要功能：

创建索引，指定索引类型和参数。
删除索引，恢复到无索引状态。
查看索引信息。

示例：

# 创建 HNSW 索引
client.create_index(
    collection_name="example_collection",
    field_name="vector",
    index_params={
        "index_type": "HNSW",
        "metric_type": "L2",
        "params": {"M": 16, "efConstruction": 200}
    }
)

# 查看索引信息
index_info = client.describe_index(collection_name="example_collection", field_name="vector")
print("Index info:", index_info)

# 删除索引
client.drop_index(collection_name="example_collection", field_name="vector")

说明：

create_index：支持多种索引类型：
- HNSW：高精度、低延迟，适合中小规模数据。
- IVF_FLAT：适合大规模数据，平衡精度和速度。
- FLAT：无索引，精确搜索，适合小数据集。
index_params：根据索引类型设置参数，例如：
- HNSW：M（邻居数量）、efConstruction（构建时的搜索范围）。
- IVF_FLAT：nlist（簇数量）。
describe_index：返回索引类型和参数。
索引构建是异步的，大数据集可能需要时间完成。

6. 搜索与查询

搜索与查询 API 是 Milvus 的核心功能，用于执行向量相似性搜索和混合查询。

主要功能：

向量相似性搜索（Top-K 最近邻）。
混合查询（结合元数据过滤）。
支持批量搜索和分页。

示例：

# 单向量搜索
query_vector = [random.random() for _ in range(128)]
results = client.search(
    collection_name="example_collection",
    data=[query_vector],
    limit=5,
    output_fields=["id", "metadata"],
    filter="category == 'cat_1'"
)
print("Search results:", results)

# 批量搜索
query_vectors = [[random.random() for _ in range(128)] for _ in range(2)]
results = client.search(
    collection_name="example_collection",
    data=query_vectors,
    limit=3,
    output_fields=["id"]
)
print("Batch search results:", results)

说明：

search：返回与查询向量最相似的 Top-K 结果。
data：支持单向量或多向量搜索。
limit：指定返回结果数量。
filter：元数据过滤表达式，如 category == 'cat_1' 或 id > 100。
output_fields：指定返回的字段，如 id 或元数据。
搜索性能依赖于索引类型和参数，HNSW 通常提供低延迟。

7. 分区管理

分区（Partition）用于将集合分割成逻辑子集，提高搜索效率。分区管理 API 用于创建、删除和操作分区。

主要功能：

创建和删除分区。
加载和释放分区到内存。
列出分区。

示例：

# 创建分区
client.create_partition(
    collection_name="example_collection",
    partition_name="part1"
)

# 加载分区到内存
client.load_partition(
    collection_name="example_collection",
    partition_name="part1"
)

# 列出分区
partitions = client.list_partitions(collection_name="example_collection")
print("Partitions:", partitions)

# 删除分区
client.drop_partition(
    collection_name="example_collection",
    partition_name="part1"
)

说明：

create_partition：创建一个逻辑分区，默认分区为 _default。
load_partition：将分区加载到内存以加速搜索。
release_partition：释放分区，节省内存。
分区适合按类别或时间分隔数据，例如按年份存储日志向量。

8. 模型集成

pymilvus 2.5.0 的 model 模块集成了嵌入生成和重排序功能，简化了从原始数据（如文本）生成向量的过程。

主要功能：

密集嵌入（Dense Embedding）：使用预训练模型生成固定维度的向量。
稀疏嵌入（Sparse Embedding）：使用 BM25 等算法生成稀疏向量。
重排序（Reranking）：优化搜索结果的排序。

示例：

from pymilvus import model

# 密集嵌入
ef = model.DefaultEmbeddingFunction()  # 使用 all-MiniLM-L6-v2 模型
docs = [
    "Artificial intelligence was founded in 1956.",
    "Alan Turing contributed to AI."
]
embeddings = ef.encode_documents(docs)
print("Dense embeddings dimension:", ef.dim)  # 384

# 稀疏嵌入（BM25）
bm25_ef = model.sparse.BM25EmbeddingFunction()
bm25_ef.fit(docs)
docs_embeddings = bm25_ef.encode_documents(docs)
query = "AI history"
query_embedding = bm25_ef.encode_queries([query])
print("Sparse embeddings dimension:", bm25_ef.dim)

# 保存 BM25 参数
bm25_ef.save("bm25_params.json")

说明：

DefaultEmbeddingFunction：默认使用 all-MiniLM-L6-v2 模型，生成 384 维密集向量，适合语义搜索。
BM25EmbeddingFunction：生成稀疏向量，适合关键词搜索，需先 fit 数据。
重排序功能（未在示例中展示）可通过 model.rerank 模块优化搜索结果。
模型集成简化了嵌入生成，减少对外部库（如 sentence-transformers）的依赖。

9. 异步操作

AsyncMilvusClient 是 pymilvus 2.5.0 新增的异步客户端，支持异步编程，适合高并发场景。

主要功能：

异步创建、删除集合。
异步插入、搜索和查询。
异步关闭客户端。

示例：

import asyncio
from pymilvus import AsyncMilvusClient

async def main():
    async_client = AsyncMilvusClient(uri="http://localhost:19530")
    await async_client.create_collection("async_collection", dimension=128)
    await async_client.insert(
        collection_name="async_collection",
        data=[{"id": 0, "vector": [0.1] * 128}]
    )
    results = await async_client.search(
        collection_name="async_collection",
        data=[[0.1] * 128],
        limit=1
    )
    print("Async search results:", results)
    await async_client.drop_collection("async_collection")
    await async_client.close()

asyncio.run(main())

说明：

AsyncMilvusClient：功能与 MilvusClient 类似，但使用 await 关键字。
适合高并发应用，如 Web 服务或实时推荐系统。
当前支持的 API 是 MilvusClient 的子集，未来版本可能扩展。

10. 其他功能

pymilvus 2.5.0 还提供了一些辅助功能：

数据库管理：
- 创建数据库：client.create_database(db_name="new_db")
- 删除数据库：client.drop_database(db_name="new_db")
别名管理：
- 创建别名：client.create_alias(collection_name="example_collection", alias="alias1")
- 删除别名：client.drop_alias(alias="alias1")
RBAC（角色权限控制）：
- 授予权限：client.grant_privilege(...)
- 撤销权限：client.revoke_privilege(...)

示例（数据库管理）：

# 创建数据库
client.create_database(db_name="test_db")

# 切换数据库
client.using_database(db_name="test_db")

# 删除数据库
client.drop_database(db_name="test_db")

说明：

数据库管理支持多租户场景，允许在同一 Milvus 实例中隔离数据。
别名便于动态切换集合引用。
RBAC 功能适合生产环境，控制用户访问权限。

11. 实际应用示例：语义搜索

以下是一个完整的语义搜索示例，结合 model 模块和 MilvusClient，展示 pymilvus 的综合应用。

from pymilvus import MilvusClient, model

# 初始化客户端和嵌入模型
client = MilvusClient(uri="http://localhost:19530")
ef = model.DefaultEmbeddingFunction()

# 准备数据
docs = [
    "Artificial intelligence was founded in 1956.",
    "Alan Turing contributed to AI.",
    "Deep learning is a subset of AI."
]
embeddings = ef.encode_documents(docs)

# 创建集合
client.create_collection(
    collection_name="semantic_search",
    dimension=384,  # all-MiniLM-L6-v2 输出 384 维
    metric_type="COSINE"
)

# 插入数据
data = [
    {"id": i, "vector": embeddings[i], "text": docs[i]}
    for i in range(len(docs))
]
client.insert(collection_name="semantic_search", data=data)

# 构建索引
client.create_index(
    collection_name="semantic_search",
    field_name="vector",
    index_params={"index_type": "HNSW", "metric_type": "COSINE", "params": {"M": 16, "efConstruction": 200}}
)

# 搜索
query = "History of AI"
query_embedding = ef.encode_queries([query])[0]
results = client.search(
    collection_name="semantic_search",
    data=[query_embedding],
    limit=2,
    output_fields=["text"]
)
for result in results[0]:
    print(f"Text: {result['entity']['text']}, Distance: {result['distance']}")

# 清理
client.drop_collection("semantic_search")

输出示例：

Text: Artificial intelligence was founded in 1956., Distance: 0.92
Text: Alan Turing contributed to AI., Distance: 0.85

说明：

使用 model.DefaultEmbeddingFunction 生成文本嵌入。
配置 COSINE 距离进行语义搜索。
结合索引和过滤实现高效查询。

12. 注意事项

版本兼容性：确保 pymilvus 2.5.0 与 Milvus 服务器版本匹配（推荐 Milvus 2.4.x 或 2.5.x）。
性能优化：
- 选择合适的索引类型（HNSW 适合低延迟，IVF 适合大规模）。
- 调整索引参数（如 M、efConstruction）以平衡精度和速度。

错误处理：

使用 try-except 捕获异常：

try:
    client.create_collection("test", dimension=128)
except Exception as e:
    print(f"Error: {e}")

资源管理：
- 及时释放集合或分区（release_collection、release_partition）。
- 关闭客户端（client.close()）以释放连接。

13. 总结

pymilvus 2.5.0 提供了丰富的 API，涵盖连接管理、集合管理、数据操作、索引管理、搜索与查询、分区管理、模型集成和异步操作。MilvusClient 模块简单易用，适合快速开发；AsyncMilvusClient 支持高并发场景；model 模块简化了嵌入生成。结合这些功能，可以轻松构建语义搜索、推荐系统或图像检索等应用。

你可能感兴趣的:(Milvus,Chroma,pymilvus,API,milvus,python)

【Python 语法】Python 神经网络项目常用语法一杯水果茶！人生苦短我用 Python python
基础1.导入模块和包2.修改系统路径(sys.path.append)3.命令行参数解析(argparse模块)4.assert确保正确性5.main()脚本入口点6.辅助函数生成器函数`cycle(dl)`一、常用函数1.`.cuda()`/`.cpu()`和`torch.device`2.`torch.zeros`、`torch.randn`、`torch.arrange`、`torch.po
python中的字典类型_Python中字典数据类型石墨稀 python中的字典类型
一.创建字典方法①:>>>dict1={}>>>dict2={'name':'earth','port':80}>>>dict1,dict2({},{'port':80,'name':'earth'})方法②:从Python2.2版本起>>>fdict=dict((['x',1],['y',2]))>>>fdict{'y':2,'x':1}方法③:从Python2.3版本起,可以用一个很方便的内建
Linux驱动开发：掌握SPI通信机制夜星辰2025 Linux驱动开发 linux 驱动开发 SPI
目录标题1、SPI简介2、SPI通信机制3、Linux内核中的SPI支持4、SPI核心API5、SPI控制器驱动6、SPI设备驱动7、编写SPI设备驱动8、调试SPI驱动在Linux驱动开发中，串行外设接口(SPI)是一种常见的高速全双工通信协议，用于连接处理器和各种外设。本文将深入探讨SPI的工作原理，并演示如何在Linux环境下开发SPI驱动程序。1、SPI简介SPI（SerialPeriph
Python 中的列表（List）和元组（Tuple） shangjg3 Python python 开发语言
1.定义与语法差异1.列表的定义列表使用方括号`[]`定义，元素之间用逗号分隔。列表的元素可以是不同数据类型，甚至嵌套其他列表或元组。my_list=[1,"hello",True,[2,3]]2.元组的定义元组使用圆括号`()`定义，同样支持混合数据类型。需要注意的是，定义单元素元组时必须在元素后加逗号，以区别于数学表达式中的括号。my_tuple=(1,"world",False,(4,5))
如何让用户回到上次阅读的位置？玛卡巴卡半夜不睡觉状态模式
【前端实战】如何让用户回到上次阅读的位置？在阅读类、资讯类、博客类网站中，记忆用户上次阅读到的位置，并在下次访问时自动滚动回那个位置，可以大大提升用户体验感。今天我们就来详细讲一讲：前端如何实现用户回到上次阅读的位置，包括基础scroll方法+优化、IntersectionObserverAPI+探针追踪、锚点URLHASH定位跳转等策略实现一个流畅且高效的方案。一、总体思路1、核心目标在用户滚动
Python 列表
列表是由一系列按特定顺序排列的元素组成。在python中用方括号（[]）来表示列表并用逗号来分隔其中的元素。例如：bicycles=['trek','cannondale','redline']。访问列表元素时，只需将该元素的索引值或位置告诉Python即可。（索引值由0开始）>>>names=['zhao','qian','sun','li']>>>print(names[0])zhao创建的大
列表简单数据类型天池小晨 python
整型浮点型布尔型容器数据类型列表元组字典集合字符串1.列表的定义列表是有序集合，没有固定大小，能够保存任意数量任意类型的Python对象，语法为[元素1,元素2,...,元素n]。关键点是「中括号[]」和「逗号,」中括号把所有元素绑在一起逗号将每个元素一一分开2.列表的创建创建一个普通列表【例子】1x=['Monday','Tuesday','Wednesday','Thursday','Frid
Python-难点-获取项目根目录
1需求2接口3示例4参考资料在Python中，“设置根目录”通常指指定项目的基准路径，以便统一管理文件路径。以下是几种常见方法，结合不同场景和兼容性需求：一、基于路径拼接（最常用）通过手动拼接路径来定义根目录，适用于结构固定的项目。importos#方法1：根据当前文件位置向上递归定义（推荐）defset_project_root():current_file=os.path.abspath(__
JSON和JSONL、python操作 weixin_668 json python
JSONJSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，基于文本、易于读写，并支持多种数据结构。以下是常见的JSON格式及示例：1.简单对象（键值对）{"name":"Alice","age":25,"isStudent":true}2.嵌套对象{"person":{"name":"Bob","address":{"city":"NewYork","zipc
python 抓取小红书小五咔咔咔 python 开发语言
python相关学习资料：https://edu.51cto.com/video/3832.htmlhttps://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlPython抓取小红书数据的科普文章小红书是一个流行的社交电商平台，用户可以分享购物心得、生活点滴等。本文将介绍如何使用Python语言抓取小红书的数据
利用 Python 爬取小红书热门笔记并进行标签关键词分析程序员威哥最新爬虫实战项目 python 笔记开发语言
一、背景与目标小红书（RED）作为中国最活跃的内容社区之一，拥有大量关于美妆、穿搭、美食、旅游等领域的用户生成内容（UGC）。对于产品、品牌方或研究人员来说，提取热门笔记的标签关键词，可以有效捕捉用户关注点、消费趋势及内容热词。本项目目标：使用Python爬取小红书某个话题下的热门笔记；分析每篇笔记中的标题、正文、标签等字段；利用NLP技术提取高频关键词；对关键词进行可视化与聚类分析。二、技术难点
微信扫描登录详解 introverter 微信扫描 java后台接口微信扫描登录
微信扫描登录第一步：准备工作在application.properties添加相关配置信息微信开放平台appidwx.open.app_id=你的appid微信开放平台appsecretwx.open.app_secret=你的appsecret微信开放平台重定向urlwx.open.redirect_url=http://你的服务器名称/api/ucenter/wx/callback创建util
python JSON Lines (JSONL)的保存和读取；jsonl的数据保存和读取，大模型prompt文件保存常用格式医学小达人常用算法 NLP prompt JSON Lines JSONL jsonl jsonl文件保存读取
1.JSONLines(JSONL)文件保存将一个包含多个字典的列表保存为JSONLines(JSONL)格式的文件，每个字典对应一个JSONL文件中的一行。以下是如何实现这一操作的Python代码importjson#定义包含字典的列表data=[{"id":1,"name":"Alice","age":30,"email":"[email protected]"},{"id":2,"name"
四十行Python代码，带你爬取热门音乐评论，制作评论词云图！
请求页面数据driver.get(‘https://music.163.com/#/song?id=569213220’)#selenium无法直接获取到嵌套页面里面的数据switch_to.frame()切换到嵌套网页driver.switch_to.frame(0)让浏览器加载的时候,等待渲染页面driver.implicitly_wait(10)driver.page_source获取请求页
Python 处理图像并生成 JSONL 元数据文件 - 固定text版本
Python处理图像并生成JSONL元数据文件-固定text版本flyfishJSONL（JSONLines）简介JSONL（JSONLines，也称为newline-delimitedJSON）是一种轻量级的数据序列化格式，由一系列独立的JSON对象组成，每行一个有效的JSON对象，行与行之间通过换行符（\n）分隔。JSONL是传统JSON的“轻量化”变体，通过“每行一个JSON对象”的设计，解
Spring Cloud Gateway远程代码执行CVE-2022-22947漏洞分析及复现长白山攻防实验室
0x01漏洞描述SpringCloudGateway是基于SpringFramework和SpringBoot构建的API网关，它旨在为微服务架构提供一种简单、有效、统一的API路由管理方式。据公布的漏洞描述称，当SpringCloudGateway执行器端点启用、公开且不安全时，使用SpringCloudGateway的应用程序容易受到代码注入攻击。远程攻击者可以发出含有恶意代码的请求，从而允许
jxORM--编程指南 jxandrew jxWebUI 数据库 python jxWebUI jxORM ORM
jxORM是jxWebUI配套的数据库操作库，可以简化python程序员操作数据库。声明数据类定义数据类之前，先导入ORM修饰符：fromjxORMimportORM,DBDataType,ColType然后就可以用ORM修饰符来修饰一个类，从而定义一个数据类：@ORMclassUser:ID:DBDataType.Long=ColType.PrimaryKeyCreateTime:DBDataT
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
Python中的enumerate()函数冉成未来 Service python 开发语言
文章目录基本用法参数说明特点实际应用与zip()的比较注意事项enumerate()是Python内置的一个非常有用的函数，它用于在遍历可迭代对象（如列表、元组、字符串等）时，同时获取元素的索引和值。基本用法fruits=['apple','banana','cherry']forindex,fruitinenumerate(fruits):print(index,fruit)输出：0apple1
空间曲线正交投影及其距离计算的理论与实践老歌老听老掉牙 python 正交投影
引言：正交投影的几何本质在三维空间中，正交投影是一种基础而重要的几何变换，它将空间中的点沿特定方向映射到一个平面上。当我们考虑将空间曲线投影到由给定法向量n\mathbf{n}n定义的平面时，这一问题在计算机图形学、CAD/CAM系统和科学计算中具有广泛应用。本文将从数学原理、Python实现到距离计算的等价性问题，全面探讨这一几何操作的深层内涵。设空间曲线由参数方程r(t)=(x(t),y(t)
pip是如何卸载你安装的第三方库的酷python python python
使用pipuninstall命令可以卸载掉你所安装的第三方库，所有与其相关的文件都将被pip整理出来展示并询问是否真的要删除，类似下面的提示pipuninstallnoxFoundexistinginstallation:nox2020.8.22Uninstallingnox-2020.8.22:Wouldremove:d:\python\lib\site-packages\nox-2020.8.
云原生安全工具：数字基础设施的免疫长城花海如潮淹云原生安全经验分享笔记
⚡运维团队的三重核灾难1.容器漏洞的连锁爆炸某金融平台因基础镜像包含未修复的Log4j漏洞，黑客横向穿透182个Pod，导致2.3亿用户数据泄露（CNCF2024安全报告）。更致命的是，53%的漏洞存在于第三方镜像（Sysdig研究），传统扫描器漏检率超35%。2.微服务边界的信任崩塌某电商因未限制服务账户权限，攻击者通过促销API入侵支付系统，45分钟盗取$4300万（FBI加密犯罪档案）。Ku
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
Nginx IP授权页面实现步骤
目标：一、创建白名单文件sudomkdir-p/usr/local/nginx/conf/whitelistsudotouch/usr/local/nginx/conf/whitelist/temporary.conf二、创建Python认证服务文件路径：/opt/script/auth_server.pyimportosimporttimefromflaskimportFlask,request
Milvus向量数据库集合操作初尝试麦克阿建 milvus
目录1.集合（Collection)2.字段（Field）3.索引（Index）4.分区（Partition）5.实体（Entity）6.代码示例6.1集合创建6.2向量插入6.3向量查询6.4向量删除1.集合（Collection)集合是Milvus中存储数据的最基本单元。它类似于数据库中的一个表（table）。集合定义了数据的整体结构，包括数据类型、字段、索引等。作用：集合是你数据的容器，用来
高阶知识库搭建实战五、（向量数据库Milvus安装）伯牙碎琴大模型数据库 milvus 大模型 AI
以下是关于在Windows环境下直接搭建Milvus向量数据库的教程：本教程分两部分，第一部分是基于docker安装，在Windows环境下直接安装Milvus向量数据库，目前官方推荐的方式是通过Docker进行部署，因为Milvus的运行环境依赖于Linux系统。如果你希望在Windows上直接运行Milvus，可以考虑使用MilvusLite版本，这是一个轻量级的Python库，适用于快速原型
python分布式事务_分布式事务系列（2.1）分布式事务的概念
#1系列目录#2X/OpenDTPDTP全称是DistributedTransactionProcess，即分布式事务模型。之前我们接触的事务都是针对单个数据库的操作，如果涉及多个数据库的操作，还想保证原子性，这就需要使用分布式事务了。而X/OpenDTP就是一种分布式事务处理模型。##2.1X/OpenDTP模型X/Open是一个组织，维基百科上这样说明：X/Open是1984年由多个公司联合创
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
[微信域名检测]基于微信域名检测api的PHP随机跳转阿乐LeoChen
用户名和KEY请到www.xxweixin.com获取
LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。