wgcn我的金斧头呢

Milvus QueryCoordV2学习笔记

前言

年前看了些Milvus QueryCoordV2的代码整理了一些笔记(算是半成品),省去了很多细节。一直为做最终的整理, 直到准备去社区做分享才开始临时抱佛脚翻笔记, 之前看的东西也快忘了。本着输出倒逼输入的原则,还是把他发出来提供给大家指正。最少也是给大家提供个索引

以下是内容目录

从一个Load Collection 大概的流程串起来
分别看下这几个组件的实现
- 元数据
- Checker
- TaskScheduler & disHandler
- Observer
NodeUp/NodeDown

LoadCollection流程

概括

QueryCoordV2负责将Segment,Channel分配到QueryNode，更新QueryNode中的LeaderView信息。相较QueryCoordV1，QueryCoordV2在分配数据过程都是异步的操作。在分配的逻辑上也会每个QueryNode粒度分别去分配。

元数据组件

1.Meta

在ETCD中维护集合和副本的信息，包含了两个Manager

CollectionManager:维护集群的集合和分区基础信息和Load进度

type CollectionManager struct {
	rwmutex sync.RWMutex
	collections map[UniqueID]*Collection
	partitions  map[UniqueID]*Partition
	store       Store
}

type Collection struct {
	*querypb.CollectionLoadInfo 
	LoadPercentage int32 //Load进度
	CreatedAt      time.Time
	UpdatedAt      time.Time
}

ReplicaManager:维护副本和分配给这个副本的QueryNode节点ID

type ReplicaManager struct {
	rwmutex sync.RWMutex

	idAllocator func() (int64, error)
	replicas    map[UniqueID]*Replica
	store       Store
}

type Replica struct {
	ID                   int64  
	CollectionID         int64   
	Nodes                []int64  //分配给这个副本的QueryNode节点ID
}

2.DistributionManager

在内存中维护Segment/Channel/LeaderView在QueryNode实际的分配快照。包含了三个Manager

SegmentDisManager: 记录Segment的分配情况

type SegmentDistManager struct {
	rwmutex sync.RWMutex

	// nodeID -> []*Segment
	segments map[UniqueID][]*Segment
}

type Segment struct {
	*datapb.SegmentInfo
	Node    int64 // Node the segment is in
	Version int64 // Version is the timestamp of loading segment
}

ChannelDistManager:记录Channel分配的情况

type ChannelDistManager struct {
	rwmutex sync.RWMutex

	// NodeID -> Channels
	channels map[UniqueID][]*DmChannel
}

type DmChannel struct {
	*datapb.VchannelInfo
	Node    int64
	Version int64
}

LeaderViewManager: 记录每个节点Leader与Segment/Channel的之间的关系

type LeaderViewManager struct {
	rwmutex sync.RWMutex
	views   map[int64]channelViews // 节点ID -> Views (one per shard)
}

type channelViews map[string]*LeaderView  //channel -> View

type LeaderView struct {
	ID              int64
	CollectionID    int64
	Channel         string
	Segments        map[int64]*querypb.SegmentDist
	GrowingSegments typeutil.UniqueSet
}

3.TargetManager

记录需要分配给QueryNode的Segment/Channel

type TargetManager struct {
	rwmutex sync.RWMutex
	segments   map[int64]*datapb.SegmentInfo
	dmChannels map[string]*DmChannel
}

后面handoff/load等在QueryNode的操作，会修改TargetManager。通过TargetManager和DistManager，Checker会比对每个replica的差异情况，生成LoadTask/ReduceTask。接下来我们看下Checker的逻辑

Checker

刚才我们提到Checker比对TargetManager和DistManager之间的差异，生成LoadTask/ReduceTask的逻辑。简单说下

实现入口

CheckerController会有个协程定时去check，生成Task加入到TaskScheduler，现在已有的Checker :

SegmentChecker: 生成Segment相关的Task
ChannelChecker: 生成Channel相关的Task
RebalanceChecker: 根据Rebalance策略，生成Loaded Collection的Segment/Channel Task

// check is the real implementation of Check
func (controller *CheckerController) check(ctx context.Context) {
	tasks := make([]task.Task, 0)
	for _, checker := range controller.checkers {
		tasks = append(tasks, checker.Check(ctx)...)
	}

	for _, task := range tasks {
		err := controller.scheduler.Add(task)
		if err != nil {
			task.Cancel()
			continue
		}
	}
}

Check逻辑

用SegmentChecker举例:

对比TargetManager和每个replica的Segment集合

如图，针对lacks情况生成LoadTask,针对redundancies情况生成ReduceTask

  lacks, redundancies := diffSegments(targets, dists)
	tasks := c.createSegmentLoadTasks(ctx, lacks, replica)
	ret = append(ret, tasks...)

	tasks = c.createSegmentReduceTasks(ctx, redundancies, replica.GetID(), querypb.DataScope_All)
	ret = append(ret, tasks...)

根据数据行数均衡分配Segment

sort.Slice(segments, func(i, j int) bool {
   return segments[i].GetNumOfRows() > segments[j].GetNumOfRows()
})

plans := make([]SegmentAssignPlan, 0, len(segments))
for _, s := range segments {
   // pick the node with the least row count and allocate to it.
   ni := queue.pop().(*nodeItem)
   plan := SegmentAssignPlan{
      From:    -1,
      To:      ni.nodeID,
      Segment: s,
   }
   plans = append(plans, plan)
   // change node's priority and push back
   p := ni.getPriority()
   ni.setPriority(p + int(s.GetNumOfRows()))
   queue.push(ni)
}

此外针对其他情况，如released的collection；重复的Segment；Growing Segment对应的Sealed Segment已经load等情况都会生成相应的Task

TaskScheduler&DistHandler

TaskScheduler和其他组件里的Sheduler不一样，没有队列，不会主动去执行任务，更像是一个保存Task的容器。为每个在线的node维护一个Executor。

func (scheduler *taskScheduler) AddExecutor(nodeID int64) {
	scheduler.rwmutex.Lock()
	defer scheduler.rwmutex.Unlock()

	if _, exist := scheduler.executors[nodeID]; exist {
		return
	}

	executor := NewExecutor(scheduler.meta,
		scheduler.distMgr,
		scheduler.broker,
		scheduler.targetMgr,
		scheduler.cluster,
		scheduler.nodeMgr)

	scheduler.executors[nodeID] = executor
	executor.Start(scheduler.ctx)
	log.Info("add executor for new QueryNode", zap.Int64("nodeID", nodeID))
}

QueryCoord会为每个node启动一个DistHandler,DistHandler会维护一个协程

定时获取Segment,Channel的分配信息更新DIstManager
通过TaskScheduler的Executor执行对应node的任务

func (dh *distHandler) handleDistResp(resp *querypb.GetDataDistributionResponse) {
	node := dh.nodeManager.Get(resp.GetNodeID())
	if node != nil {
		node.UpdateStats(
			session.WithSegmentCnt(len(resp.GetSegments())),
			session.WithChannelCnt(len(resp.GetChannels())),
		)
	}

	dh.updateSegmentsDistribution(resp)
	dh.updateChannelsDistribution(resp)
	dh.updateLeaderView(resp)

	dh.scheduler.Dispatch(dh.nodeID)
}

Observer

前面提到Checker通过全量比对元数据生成Task存放在TaskScheduler,然后每个DisHandler都会有一个对应的协程定时分发TaskScheduler的任务到对应的QueryNode，还会同步QueryNode中Segment,Channel的分配情况到QueryCoord中的DistManager。大致的流程已经清晰了，还有一些细节如

Collection啥时候算Loaded状态，在哪里控制load超时
订阅到合并的Segment或者新Sealed Segment,QueryCoord怎么处理的
新的loaded或者 handoff 成功后，如何让 QueryNode上的shadeLeader知道

这三个Observer分别解决这三个问题

CollectionObserver

loaded状态的集合是否晖被(nodeup影响)

1.定时更新Collection/Partition的Load状态

2.如果Load超时，放弃Load

实现

从TargetManager, LeaderViewManager ,ReplicaManager获取查看load 进度

分子：LeaderViewManager中: Segment的副本数 +Channel副本数

分母： (TargetManager :(Segment个数+Channel个数))*(ReplicaManager:副本数)

HandoffObserver

从ETCD订阅到Handoff事件：

通过修改TargetManager, 将新Segment分配到QueryNode
通过反查 LeaderViewManager确认是否handof后的segment是否部署完成，如果完成，TargetManager删掉过期的Segement

实现

从ETCD读取需要Handoff的segment
从TargetManager 读取这个Segment的CompactionFrom(由哪些Segment合并来的)
向TargetManager 添加这个新的Segment
去LeaderViewManager查询，如果Handoff Segment已经部署好。去TargetManager 删掉CompactionFrom Segment

LeaderObserver

从在LeaderViewManager 和SegmentDistManager 获取Segment元数据做对比更新QueryNode中ShardLeader的快照

在LeaderViewManager 获取 leader 的快照
在SegmentDistManager 获取 Segment的快照

Remove/Load的条件

Load : dist的segment信息的版本高于 leaderview

ret := make([]*querypb.SyncAction, 0)
	dists = utils.FindMaxVersionSegments(dists)
	for _, s := range dists {
		version, ok := leaderView.Segments[s.GetID()]
		if ok && version.GetVersion() >= s.Version ||
			!o.target.ContainSegment(s.GetID()) {
			continue
		}
		ret = append(ret, &querypb.SyncAction{
			Type:        querypb.SyncType_Set,
			PartitionID: s.GetPartitionID(),
			SegmentID:   s.GetID(),
			NodeID:      s.Node,
			Version:     s.Version,
		})
	}

Remove :Segment在 TargetManager和DistManaager 都不存在

ret = append(ret, &querypb.SyncAction{
   Type:      querypb.SyncType_Remove,
   SegmentID: sid,
})

LoadCollection/NodeUp/NodeDown

1.LoadCollection

将副本均摊到不同节点，用`ReplicaManager`维护起来。

replicas, err := utils.SpawnReplicas(job.meta.ReplicaManager,
		job.nodeMgr,
		req.GetCollectionID(),
		req.GetReplicaNumber())

集合注册给HandOffObserver

	job.handoffObserver.Register(job.CollectionID())
	err = utils.RegisterTargets(job.ctx,
		job.targetMgr,
		job.broker,
		req.GetCollectionID(),
		partitions)

注册给TargetManager

err = utils.RegisterTargets(job.ctx,
   job.targetMgr,
   job.broker,
   req.GetCollectionID(),
   partitions)

2.NodeUp

TaskScheduler 添加新Executor
```
s.taskScheduler.AddExecutor(node)
```

为新节点添加新的DistHandler

s.distController.StartDistInstance(s.ctx, node)

摊平一些replica到新节点

for _, collection := range s.meta.CollectionManager.GetAll() {
		log := log.With(zap.Int64("collectionID", collection))
		replica := s.meta.ReplicaManager.GetByCollectionAndNode(collection, node)
		if replica == nil {
			replicas := s.meta.ReplicaManager.GetByCollection(collection)
			sort.Slice(replicas, func(i, j int) bool {
				return replicas[i].Nodes.Len() < replicas[j].Nodes.Len()
			})
			replica := replicas[0]
			// TODO(yah01): this may fail, need a component to check whether a node is assigned
			err := s.meta.ReplicaManager.AddNode(replica.GetID(), node) //3. pour replica to new Node
			if err != nil {
				log.Warn("failed to assign node to replicas",
					zap.Int64("replicaID", replica.GetID()),
					zap.Error(err),
				)
			}
			log.Info("assign node to replica",
				zap.Int64("replicaID", replica.GetID()))
		}
	}

func (s *Server) handleNodeUp(node int64) {
	log := log.With(zap.Int64("nodeID", node))
	s.taskScheduler.AddExecutor(node)               //1. addExecutor
	s.distController.StartDistInstance(s.ctx, node) //2.new DistHandler

	for _, collection := range s.meta.CollectionManager.GetAll() {
		log := log.With(zap.Int64("collectionID", collection))
		replica := s.meta.ReplicaManager.GetByCollectionAndNode(collection, node)
		if replica == nil {
			replicas := s.meta.ReplicaManager.GetByCollection(collection)
			sort.Slice(replicas, func(i, j int) bool {
				return replicas[i].Nodes.Len() < replicas[j].Nodes.Len()
			})
			replica := replicas[0]
			// TODO(yah01): this may fail, need a component to check whether a node is assigned
			err := s.meta.ReplicaManager.AddNode(replica.GetID(), node) //3. pour replica to new Node
			if err != nil {
				log.Warn("failed to assign node to replicas",
					zap.Int64("replicaID", replica.GetID()),
					zap.Error(err),
				)
			}
			log.Info("assign node to replica",
				zap.Int64("replicaID", replica.GetID()))
		}
	}
}

3.NodeDown

func (s *Server) handleNodeDown(node int64) {
	log := log.With(zap.Int64("nodeID", node))
	s.taskScheduler.RemoveExecutor(node)
	s.distController.Remove(node)

	// Refresh the targets, to avoid consuming messages too early from channel
	// FIXME(yah01): the leads to miss data, the segments flushed between the two check points
	// are missed, it will recover for a while.
	channels := s.dist.ChannelDistManager.GetByNode(node)
	for _, channel := range channels {
		partitions, err := utils.GetPartitions(s.meta.CollectionManager,
			s.broker,
			channel.GetCollectionID())
		if err != nil {
			log.Warn("failed to refresh targets of collection",
				zap.Int64("collectionID", channel.GetCollectionID()),
				zap.Error(err))
		}
		err = utils.RegisterTargets(s.ctx,
			s.targetMgr,
			s.broker,
			channel.GetCollectionID(),
			partitions)
		if err != nil {
			log.Warn("failed to refresh targets of collection",
				zap.Int64("collectionID", channel.GetCollectionID()),
				zap.Error(err))
		}
	}

	// Clear dist
	s.dist.LeaderViewManager.Update(node)
	s.dist.ChannelDistManager.Update(node)
	s.dist.SegmentDistManager.Update(node)

	// Clear meta
	for _, collection := range s.meta.CollectionManager.GetAll() {
		log := log.With(zap.Int64("collectionID", collection))
		replica := s.meta.ReplicaManager.GetByCollectionAndNode(collection, node)
		if replica == nil {
			continue
		}
		err := s.meta.ReplicaManager.RemoveNode(replica.GetID(), node)
		if err != nil {
			log.Warn("failed to remove node from collection's replicas",
				zap.Int64("replicaID", replica.GetID()),
				zap.Error(err),
			)
		}
		log.Info("remove node from replica",
			zap.Int64("replicaID", replica.GetID()))
	}

	// Clear tasks
	s.taskScheduler.RemoveByNode(node)
}

从TaskExecutor删掉Executor
删掉对应节点的DIstHandler
清空TargetManger中的数据
清空DistManager中的数据
清空meta中的数据
清空TaskScheduler中的数据

搭建个人AI知识库：RAG与本地模型实践指南 ai开发知识库
引言你是否想过拥有一个私人订制的AI助手，能够随时为你提供最个性化的信息？本文将带你一步步搭建一个基于本地模型和RAG技术的个人知识库。搭建本地模型环境os:archlinux内存:32gcpu:6核12线程python:3.12.7docker27.3.1+docker-compose向量库:milvus2.4.13+attu2.4(客户端)ollamapacman-Sollamasystemc
搭建个人AI知识库：RAG与本地模型实践指南 ai开发知识库
引言你是否想过拥有一个私人订制的AI助手，能够随时为你提供最个性化的信息？本文将带你一步步搭建一个基于本地模型和RAG技术的个人知识库。搭建本地模型环境os:archlinux内存:32gcpu:6核12线程python:3.12.7docker27.3.1+docker-compose向量库:milvus2.4.13+attu2.4(客户端)ollamapacman-Sollamasystemc
避免 PyCharm 将该 Python 脚本作为测试运行 MonkeyKing.sun python pycharm ide
为了避免PyCharm将该Python脚本作为测试运行（即pytest自动捕获），你可以做以下几步来确保该脚本作为普通的Python程序执行，而不是作为pytest运行。解决方案：1.确保文件名不以test_开头：Pytest会自动检测以test_开头的文件，并尝试将其作为测试运行。如果你的文件名是test_milvus.py，pytest会尝试收集并运行它。可以重命名文件为不包含test_的前缀
go向量数据库 leijmdas golang
在Go语言中，有几个开源的向量数据库项目可供选择。以下是一些受欢迎的选项：1.Milvus：Milvus是一个开源的向量数据库，专为AI应用设计，支持大规模的向量相似性搜索。Milvus2.0版本采用云原生架构，具有存储和计算分离的特点，支持水平扩展以处理数十亿的向量数据。Milvus提供了Go语言的SDK，可以轻松集成到Go应用程序中。Milvus支持多种索引类型，如倒排索引、HNSW、IVF等
实现从 Milvus 中获取数据，并基于嵌入向量重新排序的功能 MonkeyKing.sun milvus numpy
为了实现从Milvus中获取数据，并基于嵌入向量重新排序的功能，你可以参考以下步骤对原代码进行完善和修改。关键问题和修改：Milvus数据获取：确保query()能获取插入的数据，尤其是向量。确保Collection正确连接，并且output_fields中字段名匹配Milvus中的定义。加载数据：插入数据后，需要通过load()加载数据，确保数据在Milvus中可见。优化向量查询逻辑：可以考虑使
从Milvus迁移DashVector DashVector milvus 数据库阿里云人工智能数据结构向量检索
本文档演示如何从Milvus将Collection数据全量导出，并适配迁移至DashVector。方案的主要流程包括：首先，升级Milvus版本，目前Milvus只有在最新版本(v.2.3.x)中支持全量导出其次，将MilvusCollection的Schema信息和数据信息导出到具体的文件中最后，以导出的文件作为输入来构建DashVectorCollection并数据导入下面，将详细阐述迁移方案
Milvus 核心设计（4） ---- metric及index原理详解与示例(2) PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus python 机器学习 vector db 人工智能
目录背景BinaryEmbedding定义与特点常见算法应用场景距离丈量的方式JaccardHamming代码实现IndexBIN_FLATBIN_IVF_FLATSparseembeddings定义应用场景优点实现方式距离丈量方式IPIndexSPARSE_INVERTED_INDEX应用场景优势SPARSE_WAND工作原理性能特点应用场景小结背景接着上面的Milvusmetric及index
向量数据库对比分析报告大霸王龙行业+领域+业务场景=定制人工智能深度学习 python
FAISS、Milvus、Weaviate和OpenAIAPI四个工具的对比分析，主要针对是否支持离线、开发难度、debug支持、生态系统以及Python接口等方面。1.FAISS(FacebookAISimilaritySearch)是否支持离线:支持。FAISS是一个离线库，可以部署在本地或服务器上，不需要网络连接。开发难度:中等。FAISS是一个低级别的工具，需要开发者对近似最近邻搜索算法和
Docker & Ubuntu & Milvus 2.4 windows 详细安装攻略 PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus vector db ubuntu 人工智能 docker
目录背景安装DockerDestop下载docker破解之法启动dockerdestopOS镜像前置条件
Milvus核心组件（2）---- etcd 详解 PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus
目录背景etcd简介1.基本概念2.数据存储特性3.KVS的操作4.租约（Lease）机制5.实际应用场景Milvus下的etcd服务及存储结构etcd服务端口存储位置安全连接信息嵌入式方式运行etcd文件存储结构解析etcd文件连接etcdserver注意事项key部分value部分数据的物理存储背景前面的概述比较笼统，只是给出了milvus的基本设计理念。下面将细致的讲解每部分组件的功能及设计
Milvus实践(4) ---- attu2.4x及以下版本可视化工具搭建(不stop milvus服务) PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus python vector db 人工智能 attu 可视化
目录背景下载规范镜像format运行attuUI前置条件运行attucommand启动webLog输出问题描述根因分析描述图解解决方案不完美解决方案不完美的原因设计模式与维护理念完美解决方案运行截图下一个坑再次分析再次修改运行效果背景可能你用习惯了mysqlclient的navigate或其他可视化连接数据库的工具。作为Milvus来说，其实配套还是比较完善的，Chroma相对来说，目前就我所知，
向量数据库 Milvus：智能检索新时代三余知行「数智通识」「机器学习」数据库 milvus 智能检索高维数据检索 AIGC 维护
文章目录Milvus核心技术Milvus基本特点索引策略相似度计算图像检索演示Milvus基础维护环境搭建建立向量索引数据导入数据更新数据删除用户权限管理Milvus评估与调优性能评估调优技巧Milvus数据安全安全策略数据备份与恢复Milvus扩展性案例演示电影推荐在线广告投放结语随着人工智能和大数据技术的不断进步，向量数据库的应用场景愈发广泛。Milvus作为一款优秀的开源向量数据库，凭借其强
Zilliz Cloud 再发新版本：性能提升超 10 倍，AI 应用开发流程再简化！人工智能
ZillizCloud再发新版本！本次新版本的主要内容包括：大幅提升的向量搜索性能（性能提升10倍以上）、企业级数据安全和无缝数据集成。新版本发布后，用户无需自定义代码，便可快速顺畅地完成非结构化数据处理和索引。此外，ZillizCloud将有效帮助用户节省成本，简化支付和采购流程。以下为本次发布的新特性一览：Cardinal搜索引擎正式上线了与Milvus2.3相同的功能基于角色的访问控制和权限
HuggingFists-低代码玩转LLM-腾讯云RAG(1) colorknight HuggingFists 低代码腾讯云人工智能大语言模型 RAG 向量库提示工程
前序在之前的系列文章里，笔者介绍了如何使用阿里的千问LLM、阿里的文本嵌入模型以及Milvus向量库来搭建一个RAG(检索增强生成)的实验。可通过以下的文章链接回顾一下之前介绍的内容：《HuggingFists-低代码玩转LLMRAG-准备篇》《HuggingFists-低代码玩转LLMRAG(1)Embedding》《HuggingFists-低代码玩转LLMRAG(2)--Query》在之前的
使用GPT3.5,LangChain，Milvus和python构建一个本地知识库 juhanishen gpt-3 langchain milvus
本篇文章获得同事刘工的授权刊登。原文发表于2023年7月13日。引言介绍本地知识库的概念和用途在现代信息时代，我们面临着海量的数据和信息，如何有效地管理和利用这些信息成为一项重要的任务。本地知识库是一种基于本地存储的知识管理系统，旨在帮助用户收集、组织和检索大量的知识和信息。它允许用户在本地环境中构建和管理自己的知识资源，以便更高效地进行信息处理和决策。本地知识库通常采用数据库、索引和搜索技术，以
Milvus Cloud「文档」：80% 的答案就在官网文档里 LCHub低代码社区 milvus 向量数据库 Milvus Cloud Milvus ModaHub LChub
引言：在探索向量数据库的海洋中，Milvus如同一艘航船，而它的文档则是指引我们航行的灯塔。社区里有句流传甚广的箴言：“80%的答案就在官网文档里”。这不仅是对文档价值的肯定，也是对那些渴望掌握Milvus精髓者的启示。今天，就让我们一同揭开MilvusCloud文档的神秘面纱，看看如何在这海量信息中找到我们需要的宝藏。一、使用文档——你的第一站1.初识MilvusCloud想要驾驭MilvusC
《向量数据库指南》——Milvus Cloud 「部署」：简化部署一直在路上 LCHub低代码社区《向量数据库指南》数据库 milvus 向量数据库 Milvus Cloud Milvus ModaHub
“docker-compose能部署分布式吗？”"单机部署为什么还依赖这么多组件？"“大家MilvusCloud集群部署有没有实践过比较好的方案？”作为一个开源数据库，是否能够进行快速部署，是所有工作的前提。在简化部署的道路上，社区从来没有停止过脚步。2023年，社区推出了MilvusCloud-lite这样的轻量化版本，没有k8s、没有docker、依旧能玩MilvusCloud。之前有用户反映
《向量数据库指南》——Milvus Cloud集群」生产环境永远推荐使用集群模式 LCHub低代码社区数据库 milvus 向量数据库 Milvus Cloud Milvus ModaHub
「集群」生产环境永远推荐使用集群模式“MilvusCloud单集群，能到百亿向量吗？还是到十亿级？”“MilvusCloudstandalone中的数据如何迁移到MilvusCloud集群中？”“coordinator能做集群么？”“MilvusCloud集群版依赖太多了，资源很缺，部署单机版支持主从或者多副本么？”MilvusCloud是一个分布式的向量数据库，“分布式”是它的一个核心特点。目前
《向量数据库指南》——Milvus Cloud「日志」问题定位的指南针 LCHub低代码社区《向量数据库指南》milvus Milvus Cloud 向量数据库人工智能 AIGC LChub 低代码
“2.X集群的日志在哪里导啊”“现在没有对MilvusCloud进行任何读写操作，但是日志还是不断增加，这正常吗？”“请教下k8s部署的MilvusCloud日志如果持久化，只能使用共享存储吗？如果只想放在本地盘可以如何配置？”社区讨论问题的时候基本都离不开日志，因为日志是问题分析的第一抓手，也是问题定位的指南针。大家在社区中发的日志非常多，不同日志背后的原因各不相同，我们不可能在这里讨论清楚所有
向量数据库Milvas hzhj 人工智能
Milvus是在2019年创建的，其唯一目标是存储、索引和管理由深度神经网络和其他机器学习（ML）模型生成的大规模嵌入向量。Milvus的概述–Milvus向量库中文文档(milvus-io.com)Milvus2.0概述-《Milvus帮助手册-教程-V2版本》-极客文档(geekdaxue.co)核心概念详见这里，其中常见的如下：实体(Entity)，代表现实世界对象的一组字段。在Milvus
《向量数据库指南》——Milvus Cloud半数使用问题是配置问题 LCHub低代码社区《向量数据库指南》数据库 milvus 向量数据库 Milvus Cloud Milvus 低代码
“MilvusCloud配置用户名密码进行校验，需要怎么开启呢？”“这个服务通过k8s已经起来的，我在不想关闭他的情况下应该怎么修改配置文件呢？”“etcd如果独立部署的话，这块儿的配置有推荐的参考值吗？”MilvusCloud作为一个分布式向量数据库，除了自身有较多的功能模块，同时还依赖对象存储、消息队列、etcd等第三方组件。为了保证MilvusCloud集群在不同应用场景中均能发挥出最佳性能
《向量数据库指南》——Milvus Cloud始于向量，不止于向量 LCHub低代码社区《向量数据库指南》milvus 向量数据库 Milvus Cloud ModaHub
始于向量，不止于向量MilvusCloud作为一个向量数据库，查询是用户使用频率最高的操作。最早的时候，MilvusCloud只支持纯向量的Top-K近似查询，随着社区的壮大，用户对于查询能力的需求也逐渐增多。目前，MilvusCloud最新版本（v2.3.4）已经支持了非常丰富的查询能力，Top-K近似查询、表达式过滤近似查询、RANGE近似查询。在火热的RAG应用浪潮中，不少开发者还提出让Mi
《向量数据库指南》——Milvus Cloud 内存省一点，再省一点 LCHub低代码社区《向量数据库指南》milvus 向量数据库 Milvus Cloud Milvus ModaHub
“partitionkey也是很多人在一个集合里吗？可不可以一个人一个人的释放占用的内存”“因为我在插入数据到时候报错内存不足，所以我想算一下需要多少。”“标量是不是不建议load内存中，感觉几十G的内存几下就用完了。”“数据如果一直都有写入，那load后的集合会越来越占内存，不知道其他人有没有什么好的方案能在内存和查询速度上做出平衡？”以上是关于“内存”关键词的相关讨论。向量作为一种新的数据类型
《向量数据库指南》——Milvus Cloud丝滑入库是影响开发体验的第一步 LCHub低代码社区《向量数据库指南》数据库 milvus oracle 向量数据库 Milvus Cloud Milvus
除了查询之外，“插入”应该是使用最多的一个数据库操作，所有后续的工作也是建立在数据成功插入的基础上。丝滑的入库体验，是影响开发体验的第一步，也是至关重要的一步。MilvusCloud社区对于“插入”的讨论，主要集中在数据插入的实践经验上：“插入的速度怎么优化啊？”“分批插入数据，是每一批collection.flush()，还是最后再collection.flush()？”“这个设置成主键之后，为
《向量数据库指南》——AIGC 需求的快速变化，催生了Milvus Cloud向量数据库的超高速迭代 LCHub低代码社区《向量数据库指南》AIGC milvus Milvus Cloud 向量数据库人工智能 ModaHub
对于“版本”成为热度排名第一的关键词，我开始是有点意外的，仔细一想似乎也在情理之中。2023年，是AIGC大爆发的一年，LLM展现出了强大的分析、推理、归纳、总结能力。但是，由于缺乏最新的和特定领域的训练数据，大模型“幻觉”成为困扰AIGC开发者的一大难题。随着RAG技术的发展，LLM和向量数据库这对黄金搭档开始走到一起，成为幻觉问题的通用处理范式。MilvusCloud作为全球最流行的开源向量数
Windows 和 Anolis 通过 Docker 安装 Milvus 2.3.4 猪悟道数据结构 windows docker milvus anolis attu
Windows10通过Docker安装Milvus2.3.4一.Windows安装Docker二.Milvus下载1.下载2.安装1.Windows下安装（指定好Docker文件目录）2.Anolis下安装三.数据库访问1.ATTU客户端下载一.Windows安装DockerDocker下载双击安装即可，安装完成后打开客户端需要正好登陆查看版本docker-v二.Milvus下载1.下载下载Mil
《向量数据库指南》——Milvus Cloud向量数据库的新认知 LCHub低代码社区《向量数据库指南》数据库 milvus Milvus Cloud 向量数据库人工智能 Milvus 低代码
除了数字上的里程碑，2023年业务模式的改变也带来了很多定性的认知。这些认知帮助我们深化了对向量这种数据类型的理解，也引导了我们思考向量数据库未来的发展方向。大模型应用仍处于初期阶段：避免重蹈智能手机时代“手电筒应用”的覆辙回顾移动互联网早期，许多开发者创建了如手电筒或天气预报等简单应用，这些应用最终被整合到智能手机操作系统中。如今，大多数AI原生应用，例如迅速在GitHub上获得100,000星
《向量数据库指南》——AI 热潮中的非典型Milvus Cloud向量数据库 LCHub低代码社区《向量数据库指南》人工智能数据库向量数据库 Milvus Cloud Milvus 低代码
2023年是AI应用开发领域的一个重要转折点。在这一年里，大语言模型（LLMs）因其卓越的自然语言处理能力而广受赞誉，极大地拓宽了机器学习应用的场景。开发者们逐渐意识到，有了LLMs，他们可以设计出更智能、更容易互动的应用程序。与此同时，“向量数据库”已成为业界的热门话题，其作为大型模型长期记忆的角色得到了认可。像RAG（检索增强生成）模型、智能代理和多模态检索等应用的兴起生动地展示了向量数据库在
《向量数据库指南》——Milvus Cloud支持上万个 Collection、新增 Accesslog 功能…… LCHub低代码社区《向量数据库指南》milvus 数据库 Milvus Cloud 向量数据库人工智能 Milvus 低代码
2024年开年，MilvusCloud好消息不断。除了收获Github25,000颗星的成就，MilvusCloud也发布了新年的第一个版本——2.3.4。此次发版的主要目的是为用户提供一个高扩展性且更易用的MilvusCloud版本。为此，MilvusCloud新增了许多易用性功能，比如：可追踪外部接口调用的accesslog；对parquet数据格式的导入做了支持；引入了更清晰的错误消息；更快
安装向量数据库milvus可视化工具attu MonkeyKing.sun milvus
使用docker安装的命令和简单就一个命令：dockerrun-p8000:3000-eMILVUS_URL={milvusserverIP}:19530zilliz/attu:v2.3.5sunyuhua@sunyuhua-HKF-WXX:~/dockercom/milvus$dockerrun-p8000:3000-eMILVUS_URL=127.0.0.1:19530zilliz/attu:
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul