ZILLIZ RDS

使用预训练Embedding，finetune DSSM模型

Milvus 小编：本文转载自公众号 Python 科技园，作者王多鱼。

1. 前言

DSSM模型是点击预估领域的经典召回模型，是由 “用户”端和 “商品”端两个塔式结构组成。“用户”端和 “商品”端两个子塔分别生成最终的 “用户” Embedding 和 “商品” Embedding。在线上应用时，实时生成 “用户” 端的 Embedding（因为用户的行为是动态的），在线从数据库中（例如：HBase, Redis）获取 “商品” 端的 Embedding（商品的Embedding生成后直接存储到数据库中，不需要实时生成）。然后通过NN的方式，检索出用户感兴趣的top-N商品候选集。

在训练模型时，如果某一场景的数据量较少，训练出的模型效果大概率不理想，容易造成模型不收敛的情况。最佳的解决方案：即采用预训练的方式，通过微调该场景下所构建的模型。例如：支付宝APP上的某个商品推荐位置，用户产生的点击或购买行为较少；但是在淘宝APP上用户的行为是海量的。可以通过淘宝APP上的数据训练出 “用户ID” 的 Embedding 和 “商品ID” 的 Embedding，然后使用该 Embedding 在支付宝APP上的商品推荐场景下对模型进行微调。

2. 构建DSSM模型

（1）加载模块

import sys
import time
import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Lambda, Activation, Multiply, Dot
from tensorflow.keras.models import Model
from tensorflow.keras.callbacks import EarlyStopping, TensorBoard

from keras.utils import plot_model

（2）构建DSSM模型

def build_model():
    n_pin_vec = 128
    n_sku_vec = 128

    pin_vec = Input(shape=(n_pin_vec, ), dtype = 'float32')
    sku_vec = Input(shape=(n_sku_vec, ), dtype = 'float32')

    pin_part = Dense(64, activation='relu')(pin_vec)
    sku_part = Dense(64, activation='relu')(sku_vec)

    
    prod = Multiply()([pin_part, sku_part])
    prob = Dense(1, activation='sigmoid')(prod)

    model = Model(inputs = [pin_vec, sku_vec], outputs = prob)

    model.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])
    
    model.__setattr__("user_input", pin_vec)
    model.__setattr__("item_input", sku_vec)
    model.__setattr__("user_embedding", pin_part)
    model.__setattr__("item_embedding", sku_part)

    return model

其中：“用户”端的 Embedding 和 “商品”端的 Embedding 向量维度均为128维。（输入的Embedding向量是已经预训练完毕的Embedding。例如通过word2vec模型对用户行为建模，即可得到“商品”端的 Embedding；然后通过 avg(用户产生行为的商品的Embedding)，即可得到“用户”端的 Embedding）

查看一下模型的summary信息。

model = build_model()
print(model.summary())

所构造的DSSM模型结构如下所示。由于未对用户和商品的ID进行Embedding操作，所以该模型的参数较少。

打印一下模型的结构。

plot_model(model, to_file='finetune_dssm_model.png')

（3）加载数据

考虑到数据量较大，所以采用 generator 模式对数据进行处理，防止加载全部数据，撑爆内存。

def file_generator(input_path, batch_size = None):

    while True:
        with open(input_path, 'r') as f:

            pin_vec_array, sku_vec_array, y_array = [], [], []

            cnt = 0 
            for line in f:
                buf = line[:-1].split(',')

                pin_vec = np.array(buf[1:129], dtype=np.float32)
                sku_vec = np.array(buf[129:], dtype=np.float32)
                y = int(buf[0])

                pin_vec_array.append(pin_vec)
                sku_vec_array.append(sku_vec)
                y_array.append(y)
    
                cnt += 1

                if cnt % batch_size == 0:
                    pin_vec_array = np.array(pin_vec_array)
                    sku_vec_array = np.array(sku_vec_array)
                    y_array = np.array(y_array)
                    
                    yield [pin_vec_array, sku_vec_array], y_array

                    cnt = 0
                    pin_vec_array, sku_vec_array, y_array = [], [], []

本文使用小数据量进行试验，数据格式如下：

1,0.111400,0.298000,0.520000,-2.107100,-0.658500,-0.060500,-0.755700,-0.317100,0.786800,-0.051100,-0.514300,-0.772700,0.947900,0.045500,-0.146600,0.670900,0.739700,0.715800,0.519000,1.733300,-0.567100,0.475800,0.392100,0.386000,0.038900,-0.267600,-0.597700,0.365000,-1.514600,0.362100,-0.316900,0.873700,-0.208400,-0.079500,-0.401500,-0.040200,-0.545500,0.001900,0.018300,0.836700,-0.154500,-0.114000,0.648800,-0.949100,-0.074600,0.075200,0.846000,-0.234500,0.590100,-1.521400,0.374400,-0.194700,-0.309800,1.297600,0.329300,-1.250700,0.958500,-0.247100,0.083100,-1.150500,-0.535000,0.112800,-1.356800,0.879200,-0.353400,0.034500,0.241300,-0.205700,0.670600,0.633200,-0.368100,-0.754100,-0.153500,-0.475300,0.347100,0.370000,-0.380000,-0.739700,0.471700,-0.177900,0.308500,-0.058100,1.279900,0.776900,-0.088300,-1.248500,-0.973700,-0.211500,-0.210300,0.631500,-0.652400,0.866200,0.464500,-0.682000,-0.627600,-0.598000,-0.119200,0.473700,0.381500,0.567900,0.003600,-0.514900,0.536100,-0.803500,-0.619500,-0.141500,0.010400,1.268600,0.406200,-0.632000,0.250500,-0.218300,-0.168800,0.015000,-1.186700,-0.683500,1.632600,0.430000,-0.098000,0.436500,-0.068900,0.601700,0.006100,0.540800,-0.227800,-1.126100,1.165200,-0.220900,-0.202962,-3.636311,-0.504060,-2.546363,-1.235034,-0.883959,-0.348022,-0.219954,0.907031,-1.482731,0.669218,-0.477431,4.881980,3.885695,0.578319,1.427294,2.173270,-2.765083,0.004624,1.796896,1.087227,0.389897,0.604141,-1.155123,1.274209,-2.239976,-1.858146,3.090227,-0.206842,2.549677,2.601414,-0.692583,0.388238,-0.117103,-2.207036,-3.230492,-3.375904,-1.553133,2.262967,-2.091266,-0.825930,-2.791187,2.190521,-0.433236,-0.217687,-2.277860,-0.432154,-1.141102,-0.850199,-3.686642,2.615366,0.076896,-1.115686,1.734991,-1.578039,1.183485,0.641641,-2.347620,1.625458,-1.123846,1.017014,2.852135,-0.979481,0.912863,0.727238,-0.418464,-0.958715,-0.861919,0.282138,1.843323,0.175354,-1.792245,-1.370620,1.089480,0.778957,-2.377766,0.829453,-2.713742,-3.567303,-1.208078,1.233118,1.125459,4.193498,-2.459454,0.897581,1.001604,0.674028,-1.428830,-0.025545,1.150639,-3.673055,-0.666604,0.064266,0.285329,-1.370663,-0.463825,-0.842921,0.618591,1.990929,0.457696,-2.935576,0.301109,3.309814,-2.633363,-1.209220,-0.564443,-0.663638,1.399326,1.430363,-1.934421,-2.455737,-1.447479,0.263726,-0.861657,0.584651,-2.341039,3.445074,1.608032,0.724370,-0.370727,-2.025292,-0.842234,0.977376,3.447604,2.289111,2.478286,0.241298,-1.674832
0,-0.804500,0.572300,-0.357900,0.472200,1.037200,0.266700,-0.023200,0.858800,-0.484500,-0.782800,0.480700,0.119000,-0.293300,-0.504600,0.374600,-0.039300,0.935600,-1.255600,-0.258700,-0.582000,-1.719200,0.307800,0.052900,0.381800,0.577100,-0.998900,0.060600,0.373900,-0.281600,0.024100,-0.332200,0.038900,0.136100,-0.002500,0.724800,0.038700,-0.148800,1.535200,-0.059800,0.322100,-0.811600,0.363400,-1.402800,0.158200,-0.507700,-0.108200,-0.051600,-0.286800,-0.345700,-0.152300,-0.201400,-0.494600,-0.716300,0.541900,-1.629700,-0.287000,-1.277400,1.244700,0.011400,0.549900,0.883000,-1.100400,-0.700300,-0.079900,-1.227600,0.047900,-0.769000,0.821900,0.783400,0.173500,0.697400,0.499200,0.602800,0.548200,-0.256100,-0.751800,1.143400,0.295100,-0.123700,-0.503200,-0.160300,-0.908800,-0.056600,0.107600,0.436000,0.679800,0.313100,-0.249200,0.779700,0.801200,-1.650800,0.089900,0.026200,-0.338600,-0.115900,0.495700,0.088600,0.526900,0.595000,0.156700,-0.736900,0.558100,-0.095900,0.072100,-0.209400,-0.999600,-0.567300,-0.017400,-0.232500,-0.538800,-0.041200,1.247400,-0.610300,0.085700,0.321900,0.478900,-0.274800,0.074000,-0.387400,-0.306000,0.204200,0.978300,-0.738800,0.267800,0.299300,0.989500,-0.597800,-0.211500,0.302525,0.926751,0.444355,2.095530,0.641599,0.585963,-0.007165,-0.225599,1.195284,0.743535,-0.283189,0.421811,-0.900632,-1.775821,0.194162,-0.131157,2.221316,-0.871263,0.611026,1.586028,0.208971,1.728807,-1.214678,-0.006417,-0.487578,-1.347446,1.257976,-1.105078,-0.641283,2.040870,-1.064334,1.848631,0.021456,1.044769,1.046561,-0.382474,0.511813,1.991464,1.541210,1.197348,-0.132546,-1.227524,-1.825696,0.637844,0.266854,0.627479,-1.939037,1.784560,-1.572687,1.319858,-0.297955,-0.648528,1.552862,-0.390313,-1.862317,-1.434988,1.003443,2.372627,0.048504,-1.178071,0.345171,-0.493632,0.708266,0.439852,1.367206,0.587270,-1.676261,1.519096,2.178505,0.398875,-0.987587,-1.099164,2.224100,-0.032785,-1.974257,-2.476301,1.279583,0.368386,0.118637,-0.390930,0.206159,-1.526931,-0.706359,-0.666684,1.660718,2.577286,2.185187,-0.082288,1.171966,-0.962591,-1.345657,3.024471,0.326179,-1.740565,0.338833,2.163889,-1.306316,0.962814,2.811996,0.795088,0.042636,-1.563679,0.169866,-0.691936,0.281116,-0.114342,-0.654810,-0.018624,-1.712857,-1.027673,0.120613,1.324406,-0.825408,0.978356,-0.286835,1.155605,-0.480432,-0.661304,0.434739,0.736817,-1.921379,1.111957,0.592577,-0.935139,-0.926583,2.585314,-0.798262,-0.515275

解释：第一个数据为label，1表示正样本，0表示负样本；第2列到第129列表示用户的Embedding数据；第130列到第257列表示商品的Embedding数据；

3. 训练DSSM模型

接下来开始训练DSSM模型。

def train_finetune_dssm(train_path, val_path, model_path, \
    n_train = None, \
    n_val = None):

    model = build_model()

    print("train samples numbers: %s" % n_train)
    print("val samples numbers: %s" % n_val)
    batch_size = 128
    epochs = 2
    
    train_steps_per_epoch = int(n_train / batch_size)
    val_steps_per_epoch = int(n_val / batch_size)
    
    train_generator = file_generator(train_path, batch_size = batch_size)
    val_generator = file_generator(val_path, batch_size = batch_size)

    early_stopping_cb = EarlyStopping(monitor = 'val_loss', patience = 10, restore_best_weights = True) 
    tensorboard_cb = TensorBoard(\
        log_dir = './logs', \
        histogram_freq = 0, \
        write_graph = True, \
        write_grads = True, \
        write_images = True)
        
    
    callbacks = [early_stopping_cb, tensorboard_cb]
    start = time.time()

    history = model.fit_generator(\
        train_generator, \
        steps_per_epoch = train_steps_per_epoch, \
        epochs = epochs, \
        verbose = 1, \
        callbacks = callbacks, \
        validation_data = val_generator, \
        validation_steps = val_steps_per_epoch, \
        max_queue_size = 10, \
        workers = 1, \
        use_multiprocessing = False, \
        shuffle = True, \
        initial_epoch = 0)

    model.save_weights(model_path)

    last = time.time() - start
    print("Train model to %s done! Lasts %.2fs" % (model_path, last))

if __name__ == "__main__":
    train_path = "data/train_data"
    val_path = "data/val_data"
    model_path = "data/finetune_dssm.model"
    train_val_summary_path = "data/train_val_summary"

    n_train = 0
    n_val = 0
    fr = open(train_val_summary_path, 'r')
    for line in fr:
        buf = line[:-1].split(',')
        n_train = int(buf[0].split('=')[1])
        n_val = int(buf[1].split('=')[1])
        break
    fr.close()

    train_finetune_dssm(train_path, val_path, model_path, \
        n_train = n_train, \
        n_val = n_val)

其中：data/train_data 为训练集数据；data/val_data 为验证集数据；data/finetune_dssm.model 为最后训练完成后的模型；data/train_val_summary 为训练集和验证集数据信息；

模型训练过程如下图所示：

4. 生成最终的用户Embedding和商品Embedding

该模型产生的最终用户Embedding和商品Embedding分别对应 “模型结构图” 中的 dense_3 和 dense_4。

test_user_vec_embedding = np.array([0.1114, 0.298, 0.52, -2.1071, -0.6585, -0.0605, -0.7557, -0.3171, 0.7868, -0.0511, -0.5143, -0.7727, 0.9479, 0.0455, -0.1466, 0.6709, 0.7397, 0.7158, 0.519, 1.7333, -0.5671, 0.4758, 0.3921, 0.386, 0.0389, -0.2676, -0.5977, 0.365, -1.5146, 0.3621, -0.3169, 0.8737, -0.2084, -0.0795, -0.4015, -0.0402, -0.5455, 0.0019, 0.0183, 0.8367, -0.1545, -0.114, 0.6488, -0.9491, -0.0746, 0.0752, 0.846, -0.2345, 0.5901, -1.5214, 0.3744, -0.1947, -0.3098, 1.2976, 0.3293, -1.2507, 0.9585, -0.2471, 0.0831, -1.1505, -0.535, 0.1128, -1.3568, 0.8792, -0.3534, 0.0345, 0.2413, -0.2057, 0.6706, 0.6332, -0.3681, -0.7541, -0.1535, -0.4753, 0.3471, 0.37, -0.38, -0.7397, 0.4717, -0.1779, 0.3085, -0.0581, 1.2799, 0.7769, -0.0883, -1.2485, -0.9737, -0.2115, -0.2103, 0.6315, -0.6524, 0.8662, 0.4645, -0.682, -0.6276, -0.598, -0.1192, 0.4737, 0.3815, 0.5679, 0.0036, -0.5149, 0.5361, -0.8035, -0.6195, -0.1415, 0.0104, 1.2686, 0.4062, -0.632, 0.2505, -0.2183, -0.1688, 0.015, -1.1867, -0.6835, 1.6326, 0.43, -0.098, 0.4365, -0.0689, 0.6017, 0.0061, 0.5408, -0.2278, -1.1261, 1.1652, -0.2209]).reshape(1, -1)
test_item_vec_embedding = np.array([-0.202962, -3.636311, -0.50406, -2.546363, -1.235034, -0.883959, -0.348022, -0.219954, 0.907031, -1.482731, 0.669218, -0.477431, 4.88198, 3.885695, 0.578319, 1.427294, 2.17327, -2.765083, 0.004624, 1.796896, 1.087227, 0.389897, 0.604141, -1.155123, 1.274209, -2.239976, -1.858146, 3.090227, -0.206842, 2.549677, 2.601414, -0.692583, 0.388238, -0.117103, -2.207036, -3.230492, -3.375904, -1.553133, 2.262967, -2.091266, -0.82593, -2.791187, 2.190521, -0.433236, -0.217687, -2.27786, -0.432154, -1.141102, -0.850199, -3.686642, 2.615366, 0.076896, -1.115686, 1.734991, -1.578039, 1.183485, 0.641641, -2.34762, 1.625458, -1.123846, 1.017014, 2.852135, -0.979481, 0.912863, 0.727238, -0.418464, -0.958715, -0.861919, 0.282138, 1.843323, 0.175354, -1.792245, -1.37062, 1.08948, 0.778957, -2.377766, 0.829453, -2.713742, -3.567303, -1.208078, 1.233118, 1.125459, 4.193498, -2.459454, 0.897581, 1.001604, 0.674028, -1.42883, -0.025545, 1.150639, -3.673055, -0.666604, 0.064266, 0.285329, -1.370663, -0.463825, -0.842921, 0.618591, 1.990929, 0.457696, -2.935576, 0.301109, 3.309814, -2.633363, -1.20922, -0.564443, -0.663638, 1.399326, 1.430363, -1.934421, -2.455737, -1.447479, 0.263726, -0.861657, 0.584651, -2.341039, 3.445074, 1.608032, 0.72437, -0.370727, -2.025292, -0.842234, 0.977376, 3.447604, 2.289111, 2.478286, 0.241298, -1.674832]).reshape(1, -1)

user_embedding_model = Model(inputs=model.user_input, outputs=model.user_embedding)
item_embedding_model = Model(inputs=model.item_input, outputs=model.item_embedding)

user_emb = user_embedding_model.predict(test_user_vec_embedding, batch_size=1)
item_emb = item_embedding_model.predict(test_item_vec_embedding, batch_size=1)

print(user_emb)
print(item_emb)

可以看到新生成的用户Embedding和商品Embedding，均为64维。

根据某一用户的Embedding和商品集合的Embedding数据，使用NN方式检索用户感兴趣的商品集。可参考：https://github.com/milvus-iohttps://github.com/spotify/annoyhttps://github.com/facebookresearch/faiss

5. 结语

这里强烈推荐 Milvus， Milvus 基于高度优化的 Approximate Nearest Neighbor Search (ANNS) 索引库构建，包括 faiss、annoy、和 hnswlib 等。可以针对不同使用场景选择不同的索引类型。还提供了 Python、Java、Go 和 C++ SDK 与 Restful API，简单易用，欢迎有需要的小伙伴请到 Milvus 官网与 GitHub 了解更多技术细节！

Milvus 官网：https://www.milvus.io/cn/

Milvus GitHub：https://github.com/milvus-io

避免 PyCharm 将该 Python 脚本作为测试运行 MonkeyKing.sun python pycharm ide
为了避免PyCharm将该Python脚本作为测试运行（即pytest自动捕获），你可以做以下几步来确保该脚本作为普通的Python程序执行，而不是作为pytest运行。解决方案：1.确保文件名不以test_开头：Pytest会自动检测以test_开头的文件，并尝试将其作为测试运行。如果你的文件名是test_milvus.py，pytest会尝试收集并运行它。可以重命名文件为不包含test_的前缀
go向量数据库 leijmdas golang
在Go语言中，有几个开源的向量数据库项目可供选择。以下是一些受欢迎的选项：1.Milvus：Milvus是一个开源的向量数据库，专为AI应用设计，支持大规模的向量相似性搜索。Milvus2.0版本采用云原生架构，具有存储和计算分离的特点，支持水平扩展以处理数十亿的向量数据。Milvus提供了Go语言的SDK，可以轻松集成到Go应用程序中。Milvus支持多种索引类型，如倒排索引、HNSW、IVF等
实现从 Milvus 中获取数据，并基于嵌入向量重新排序的功能 MonkeyKing.sun milvus numpy
为了实现从Milvus中获取数据，并基于嵌入向量重新排序的功能，你可以参考以下步骤对原代码进行完善和修改。关键问题和修改：Milvus数据获取：确保query()能获取插入的数据，尤其是向量。确保Collection正确连接，并且output_fields中字段名匹配Milvus中的定义。加载数据：插入数据后，需要通过load()加载数据，确保数据在Milvus中可见。优化向量查询逻辑：可以考虑使
从Milvus迁移DashVector DashVector milvus 数据库阿里云人工智能数据结构向量检索
本文档演示如何从Milvus将Collection数据全量导出，并适配迁移至DashVector。方案的主要流程包括：首先，升级Milvus版本，目前Milvus只有在最新版本(v.2.3.x)中支持全量导出其次，将MilvusCollection的Schema信息和数据信息导出到具体的文件中最后，以导出的文件作为输入来构建DashVectorCollection并数据导入下面，将详细阐述迁移方案
Milvus 核心设计（4） ---- metric及index原理详解与示例(2) PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus python 机器学习 vector db 人工智能
目录背景BinaryEmbedding定义与特点常见算法应用场景距离丈量的方式JaccardHamming代码实现IndexBIN_FLATBIN_IVF_FLATSparseembeddings定义应用场景优点实现方式距离丈量方式IPIndexSPARSE_INVERTED_INDEX应用场景优势SPARSE_WAND工作原理性能特点应用场景小结背景接着上面的Milvusmetric及index
向量数据库对比分析报告大霸王龙行业+领域+业务场景=定制人工智能深度学习 python
FAISS、Milvus、Weaviate和OpenAIAPI四个工具的对比分析，主要针对是否支持离线、开发难度、debug支持、生态系统以及Python接口等方面。1.FAISS(FacebookAISimilaritySearch)是否支持离线:支持。FAISS是一个离线库，可以部署在本地或服务器上，不需要网络连接。开发难度:中等。FAISS是一个低级别的工具，需要开发者对近似最近邻搜索算法和
Docker & Ubuntu & Milvus 2.4 windows 详细安装攻略 PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus vector db ubuntu 人工智能 docker
目录背景安装DockerDestop下载docker破解之法启动dockerdestopOS镜像前置条件
Milvus核心组件（2）---- etcd 详解 PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus
目录背景etcd简介1.基本概念2.数据存储特性3.KVS的操作4.租约（Lease）机制5.实际应用场景Milvus下的etcd服务及存储结构etcd服务端口存储位置安全连接信息嵌入式方式运行etcd文件存储结构解析etcd文件连接etcdserver注意事项key部分value部分数据的物理存储背景前面的概述比较笼统，只是给出了milvus的基本设计理念。下面将细致的讲解每部分组件的功能及设计
Milvus实践(4) ---- attu2.4x及以下版本可视化工具搭建(不stop milvus服务) PhoenixAI8 RAG Milvus Chroma 源码及实践 milvus python vector db 人工智能 attu 可视化
目录背景下载规范镜像format运行attuUI前置条件运行attucommand启动webLog输出问题描述根因分析描述图解解决方案不完美解决方案不完美的原因设计模式与维护理念完美解决方案运行截图下一个坑再次分析再次修改运行效果背景可能你用习惯了mysqlclient的navigate或其他可视化连接数据库的工具。作为Milvus来说，其实配套还是比较完善的，Chroma相对来说，目前就我所知，
向量数据库 Milvus：智能检索新时代三余知行「数智通识」「机器学习」数据库 milvus 智能检索高维数据检索 AIGC 维护
文章目录Milvus核心技术Milvus基本特点索引策略相似度计算图像检索演示Milvus基础维护环境搭建建立向量索引数据导入数据更新数据删除用户权限管理Milvus评估与调优性能评估调优技巧Milvus数据安全安全策略数据备份与恢复Milvus扩展性案例演示电影推荐在线广告投放结语随着人工智能和大数据技术的不断进步，向量数据库的应用场景愈发广泛。Milvus作为一款优秀的开源向量数据库，凭借其强
Zilliz Cloud 再发新版本：性能提升超 10 倍，AI 应用开发流程再简化！人工智能
ZillizCloud再发新版本！本次新版本的主要内容包括：大幅提升的向量搜索性能（性能提升10倍以上）、企业级数据安全和无缝数据集成。新版本发布后，用户无需自定义代码，便可快速顺畅地完成非结构化数据处理和索引。此外，ZillizCloud将有效帮助用户节省成本，简化支付和采购流程。以下为本次发布的新特性一览：Cardinal搜索引擎正式上线了与Milvus2.3相同的功能基于角色的访问控制和权限
HuggingFists-低代码玩转LLM-腾讯云RAG(1) colorknight HuggingFists 低代码腾讯云人工智能大语言模型 RAG 向量库提示工程
前序在之前的系列文章里，笔者介绍了如何使用阿里的千问LLM、阿里的文本嵌入模型以及Milvus向量库来搭建一个RAG(检索增强生成)的实验。可通过以下的文章链接回顾一下之前介绍的内容：《HuggingFists-低代码玩转LLMRAG-准备篇》《HuggingFists-低代码玩转LLMRAG(1)Embedding》《HuggingFists-低代码玩转LLMRAG(2)--Query》在之前的
使用GPT3.5,LangChain，Milvus和python构建一个本地知识库 juhanishen gpt-3 langchain milvus
本篇文章获得同事刘工的授权刊登。原文发表于2023年7月13日。引言介绍本地知识库的概念和用途在现代信息时代，我们面临着海量的数据和信息，如何有效地管理和利用这些信息成为一项重要的任务。本地知识库是一种基于本地存储的知识管理系统，旨在帮助用户收集、组织和检索大量的知识和信息。它允许用户在本地环境中构建和管理自己的知识资源，以便更高效地进行信息处理和决策。本地知识库通常采用数据库、索引和搜索技术，以
Milvus Cloud「文档」：80% 的答案就在官网文档里 LCHub低代码社区 milvus 向量数据库 Milvus Cloud Milvus ModaHub LChub
引言：在探索向量数据库的海洋中，Milvus如同一艘航船，而它的文档则是指引我们航行的灯塔。社区里有句流传甚广的箴言：“80%的答案就在官网文档里”。这不仅是对文档价值的肯定，也是对那些渴望掌握Milvus精髓者的启示。今天，就让我们一同揭开MilvusCloud文档的神秘面纱，看看如何在这海量信息中找到我们需要的宝藏。一、使用文档——你的第一站1.初识MilvusCloud想要驾驭MilvusC
《向量数据库指南》——Milvus Cloud 「部署」：简化部署一直在路上 LCHub低代码社区《向量数据库指南》数据库 milvus 向量数据库 Milvus Cloud Milvus ModaHub
“docker-compose能部署分布式吗？”"单机部署为什么还依赖这么多组件？"“大家MilvusCloud集群部署有没有实践过比较好的方案？”作为一个开源数据库，是否能够进行快速部署，是所有工作的前提。在简化部署的道路上，社区从来没有停止过脚步。2023年，社区推出了MilvusCloud-lite这样的轻量化版本，没有k8s、没有docker、依旧能玩MilvusCloud。之前有用户反映
《向量数据库指南》——Milvus Cloud集群」生产环境永远推荐使用集群模式 LCHub低代码社区数据库 milvus 向量数据库 Milvus Cloud Milvus ModaHub
「集群」生产环境永远推荐使用集群模式“MilvusCloud单集群，能到百亿向量吗？还是到十亿级？”“MilvusCloudstandalone中的数据如何迁移到MilvusCloud集群中？”“coordinator能做集群么？”“MilvusCloud集群版依赖太多了，资源很缺，部署单机版支持主从或者多副本么？”MilvusCloud是一个分布式的向量数据库，“分布式”是它的一个核心特点。目前
《向量数据库指南》——Milvus Cloud「日志」问题定位的指南针 LCHub低代码社区《向量数据库指南》milvus Milvus Cloud 向量数据库人工智能 AIGC LChub 低代码
“2.X集群的日志在哪里导啊”“现在没有对MilvusCloud进行任何读写操作，但是日志还是不断增加，这正常吗？”“请教下k8s部署的MilvusCloud日志如果持久化，只能使用共享存储吗？如果只想放在本地盘可以如何配置？”社区讨论问题的时候基本都离不开日志，因为日志是问题分析的第一抓手，也是问题定位的指南针。大家在社区中发的日志非常多，不同日志背后的原因各不相同，我们不可能在这里讨论清楚所有
向量数据库Milvas hzhj 人工智能
Milvus是在2019年创建的，其唯一目标是存储、索引和管理由深度神经网络和其他机器学习（ML）模型生成的大规模嵌入向量。Milvus的概述–Milvus向量库中文文档(milvus-io.com)Milvus2.0概述-《Milvus帮助手册-教程-V2版本》-极客文档(geekdaxue.co)核心概念详见这里，其中常见的如下：实体(Entity)，代表现实世界对象的一组字段。在Milvus
《向量数据库指南》——Milvus Cloud半数使用问题是配置问题 LCHub低代码社区《向量数据库指南》数据库 milvus 向量数据库 Milvus Cloud Milvus 低代码
“MilvusCloud配置用户名密码进行校验，需要怎么开启呢？”“这个服务通过k8s已经起来的，我在不想关闭他的情况下应该怎么修改配置文件呢？”“etcd如果独立部署的话，这块儿的配置有推荐的参考值吗？”MilvusCloud作为一个分布式向量数据库，除了自身有较多的功能模块，同时还依赖对象存储、消息队列、etcd等第三方组件。为了保证MilvusCloud集群在不同应用场景中均能发挥出最佳性能
《向量数据库指南》——Milvus Cloud始于向量，不止于向量 LCHub低代码社区《向量数据库指南》milvus 向量数据库 Milvus Cloud ModaHub
始于向量，不止于向量MilvusCloud作为一个向量数据库，查询是用户使用频率最高的操作。最早的时候，MilvusCloud只支持纯向量的Top-K近似查询，随着社区的壮大，用户对于查询能力的需求也逐渐增多。目前，MilvusCloud最新版本（v2.3.4）已经支持了非常丰富的查询能力，Top-K近似查询、表达式过滤近似查询、RANGE近似查询。在火热的RAG应用浪潮中，不少开发者还提出让Mi
《向量数据库指南》——Milvus Cloud 内存省一点，再省一点 LCHub低代码社区《向量数据库指南》milvus 向量数据库 Milvus Cloud Milvus ModaHub
“partitionkey也是很多人在一个集合里吗？可不可以一个人一个人的释放占用的内存”“因为我在插入数据到时候报错内存不足，所以我想算一下需要多少。”“标量是不是不建议load内存中，感觉几十G的内存几下就用完了。”“数据如果一直都有写入，那load后的集合会越来越占内存，不知道其他人有没有什么好的方案能在内存和查询速度上做出平衡？”以上是关于“内存”关键词的相关讨论。向量作为一种新的数据类型
《向量数据库指南》——Milvus Cloud丝滑入库是影响开发体验的第一步 LCHub低代码社区《向量数据库指南》数据库 milvus oracle 向量数据库 Milvus Cloud Milvus
除了查询之外，“插入”应该是使用最多的一个数据库操作，所有后续的工作也是建立在数据成功插入的基础上。丝滑的入库体验，是影响开发体验的第一步，也是至关重要的一步。MilvusCloud社区对于“插入”的讨论，主要集中在数据插入的实践经验上：“插入的速度怎么优化啊？”“分批插入数据，是每一批collection.flush()，还是最后再collection.flush()？”“这个设置成主键之后，为
《向量数据库指南》——AIGC 需求的快速变化，催生了Milvus Cloud向量数据库的超高速迭代 LCHub低代码社区《向量数据库指南》AIGC milvus Milvus Cloud 向量数据库人工智能 ModaHub
对于“版本”成为热度排名第一的关键词，我开始是有点意外的，仔细一想似乎也在情理之中。2023年，是AIGC大爆发的一年，LLM展现出了强大的分析、推理、归纳、总结能力。但是，由于缺乏最新的和特定领域的训练数据，大模型“幻觉”成为困扰AIGC开发者的一大难题。随着RAG技术的发展，LLM和向量数据库这对黄金搭档开始走到一起，成为幻觉问题的通用处理范式。MilvusCloud作为全球最流行的开源向量数
Windows 和 Anolis 通过 Docker 安装 Milvus 2.3.4 猪悟道数据结构 windows docker milvus anolis attu
Windows10通过Docker安装Milvus2.3.4一.Windows安装Docker二.Milvus下载1.下载2.安装1.Windows下安装（指定好Docker文件目录）2.Anolis下安装三.数据库访问1.ATTU客户端下载一.Windows安装DockerDocker下载双击安装即可，安装完成后打开客户端需要正好登陆查看版本docker-v二.Milvus下载1.下载下载Mil
《向量数据库指南》——Milvus Cloud向量数据库的新认知 LCHub低代码社区《向量数据库指南》数据库 milvus Milvus Cloud 向量数据库人工智能 Milvus 低代码
除了数字上的里程碑，2023年业务模式的改变也带来了很多定性的认知。这些认知帮助我们深化了对向量这种数据类型的理解，也引导了我们思考向量数据库未来的发展方向。大模型应用仍处于初期阶段：避免重蹈智能手机时代“手电筒应用”的覆辙回顾移动互联网早期，许多开发者创建了如手电筒或天气预报等简单应用，这些应用最终被整合到智能手机操作系统中。如今，大多数AI原生应用，例如迅速在GitHub上获得100,000星
《向量数据库指南》——AI 热潮中的非典型Milvus Cloud向量数据库 LCHub低代码社区《向量数据库指南》人工智能数据库向量数据库 Milvus Cloud Milvus 低代码
2023年是AI应用开发领域的一个重要转折点。在这一年里，大语言模型（LLMs）因其卓越的自然语言处理能力而广受赞誉，极大地拓宽了机器学习应用的场景。开发者们逐渐意识到，有了LLMs，他们可以设计出更智能、更容易互动的应用程序。与此同时，“向量数据库”已成为业界的热门话题，其作为大型模型长期记忆的角色得到了认可。像RAG（检索增强生成）模型、智能代理和多模态检索等应用的兴起生动地展示了向量数据库在
《向量数据库指南》——Milvus Cloud支持上万个 Collection、新增 Accesslog 功能…… LCHub低代码社区《向量数据库指南》milvus 数据库 Milvus Cloud 向量数据库人工智能 Milvus 低代码
2024年开年，MilvusCloud好消息不断。除了收获Github25,000颗星的成就，MilvusCloud也发布了新年的第一个版本——2.3.4。此次发版的主要目的是为用户提供一个高扩展性且更易用的MilvusCloud版本。为此，MilvusCloud新增了许多易用性功能，比如：可追踪外部接口调用的accesslog；对parquet数据格式的导入做了支持；引入了更清晰的错误消息；更快
安装向量数据库milvus可视化工具attu MonkeyKing.sun milvus
使用docker安装的命令和简单就一个命令：dockerrun-p8000:3000-eMILVUS_URL={milvusserverIP}:19530zilliz/attu:v2.3.5sunyuhua@sunyuhua-HKF-WXX:~/dockercom/milvus$dockerrun-p8000:3000-eMILVUS_URL=127.0.0.1:19530zilliz/attu:
docker compose安装milvus MonkeyKing.sun docker milvus java
下载对应版本的milvus-standalone-docker-compose.ymlwgethttps://github.com/milvus-io/milvus/releases/download/v2.3.5/milvus-standalone-docker-compose.yml重新命令为docker-compose.ymlmvmilvus-standalone-docker-compos
Milvus 上新：支持上万个 Collection、新增 Accesslog 功能…… Zilliz Planet 程序人生
2024年开年，Milvus好消息不断。除了收获Github25,000颗星的成就，Milvus也发布了新年的第一个版本——2.3.4。此次发版的主要目的是为用户提供一个高扩展性且更易用的Milvus版本。为此，Milvus新增了许多易用性功能，比如：可追踪外部接口调用的accesslog；对parquet数据格式的导入做了支持；引入了更清晰的错误消息；更快的加载速度以及更好的查询分片平衡能力。在
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

使用预训练Embedding，finetune DSSM模型

你可能感兴趣的:(Milvus)