bug菌¹

【腾讯云云上实验室-向量数据库】腾讯云开创新时代，发布全新向量数据库Tencent Cloud VectorDB

前言

随着人工智能、数据挖掘等技术的飞速发展，海量数据的存储和分析越来越成为重要的研究方向。在海量数据中找到具有相似性或相关性的数据对于实现精准推荐、搜索等应用至关重要。传统关系型数据库存在一些缺陷，例如存储效率低、查询耗时长等问题，因此，新型向量数据库应运而生。

腾讯云向量数据库(Tencent Cloud VectorDB)是腾讯云推出的一款向量数据库，是一种可高效存储和查询向量数据的数据库系统，可广泛应用于计算机视觉、自然语言处理、推荐系统等领域。本文将以Java开发语言为例，介绍如何使用腾讯云向量数据库，并分析其优缺点和适用场景。

摘要

本文主要介绍了如何使用腾讯云向量数据库(Tencent Cloud VectorDB)，包括源代码解析、应用场景案例、优缺点分析和测试用例。通过本文的介绍，读者可以了解如何利用腾讯云向量数据库存储和查询向量数据，并了解其在实际应用中的优势和适用场景。

向量数据库

概念

何为向量数据库？腾讯云向量数据库(Tencent Cloud VectorDB)是一种基于向量相似度计算的云数据库。它通过支持高效的向量检索，能够快速地查询出与指定向量相似的数据。 VectorDB主要应用于图像、音频、视频、自然语言处理(NLP)等领域。

VectorDB提供了高性能的向量索引服务，支持多种向量相似度计算方式和索引策略，包括精确查找、L2距离、余弦相似度、汉明距离、Jaccard相似度和Edit距离等。VectorDB还提供了多种检索方式和可视化工具，方便用户进行数据检索和数据分析。

除此之外，VectorDB还支持数据的持久化和备份，以及自动化扩展和负载均衡等功能。同时，VectorDB还提供了多种API和SDK，方便用户进行二次开发和集成。

总之，腾讯云向量数据库是一款高效、稳定、灵活和全面的向量数据库，适用于各种大规模向量相似度计算应用和场景。

当然了，有需要的小伙伴也可以亲自前往主页，免费领取向量数据库免费实例 + Baichuan2 400万免费Tokens等资源，免费体验下腾讯云VectorDB以向量存储的魅力吧。

然后点击【免费领取】后会跳转到如下页面，只需要填写你领取的手机号即可。

接着如下我就不一一给大家做演示啦，如下我就针对已经领取好了数据库资源后给大家做实践演示。

技术特点

腾讯云向量数据库采用了分布式存储和计算技术，支持水平扩展和在线扩容，能够轻松应对海量数据的检索需求。它基于GPU加速的深度神经网络和向量量化技术，能够实现快速、准确、高效的向量搜索和相似度匹配。

具体来说，腾讯云向量数据库具有以下几个技术特点：

高性能

腾讯云向量数据库采用了GPU加速的深度神经网络，能够实现高速的向量计算和相似度匹配。据官方测试，单卡速度可达到4000QPS，多卡并行速度更是可以达到数万QPS。此外，向量搜索的结果可以通过缓存等方式进行优化，进一步提高检索性能。

可扩展

腾讯云向量数据库采用了分布式存储和计算技术，支持水平扩展和在线扩容。用户可以根据自己的需求选择多种部署模式，包括单机部署、多机部署和混合部署等，能够满足不同规模的用户和数据量。

多种数据类型支持

腾讯云向量数据库不仅支持向量数据的检索，还支持图像、文本、音频等多种数据类型的向量化处理。用户可以根据自己的数据类型选择合适的向量化模型，实现数据的高效存储和检索。

易于使用

腾讯云向量数据库提供了丰富的API和SDK，支持多种编程语言，如Java、Python、C++等，可以让用户快速进行应用开发和集成。此外，腾讯云向量数据库还提供了可视化的管理界面和监控报警功能，方便用户进行系统管理和性能监控。

应用场景和案例研究

腾讯云向量数据库可以应用于很多领域，如图像搜索、推荐系统、广告投放等。下面我将以推荐系统为例，探讨腾讯云向量数据库的应用场景和案例研究。

应用场景

推荐系统是指通过对用户历史行为和偏好进行分析和挖掘，给用户推荐感兴趣的商品、新闻、视频等内容，是电商、社交、媒体等互联网企业的核心技术。传统的推荐系统通常是基于协同过滤算法和内容过滤算法，效果有限，容易出现过度推荐或欠推荐的问题。

腾讯云向量数据库则提供了一种新的解决方案，即基于向量相似度的推荐。具体来说，将用户和商品的特征向量存储在数据库中，当用户需要进行推荐时，将用户的特征向量输入到向量数据库中，获取距离最近的商品向量，即为推荐结果。这种方法不仅能够避免过度或欠推荐的问题，还能够更加准确地捕捉用户和商品之间的关系，提高推荐效果。

以下是一些具体的应用场景案例：

图像搜索。将图像数据转换为向量数据，并将其存储在腾讯云向量数据库中。之后，可以使用向量检索来搜索与指定图像相似的图像。
文本分类。将文本数据转换为向量数据，并将其存储在腾讯云向量数据库中。之后，可以使用空间聚类来将文本数据分组，并进行文本分类。
推荐系统。将用户数据和商品数据转换为向量数据，并将其存储在腾讯云向量数据库中。之后，可以使用向量检索来查找与用户兴趣相似的商品。

例如：

1.企业化能力：千亿级数据规模、500万QPS、99.99%可用性。

2.智能化能力：内容召回率提升20%，推理速度大幅提升。

还有很多应用场景，等待开拓，我们也可以发挥下脑洞，把数据库的应用面扩大拓宽。

案例研究

我曾经使用腾讯云向量数据库在一个电商推荐系统中进行了实际应用。具体的流程如下：

获取商品数据：从电商网站爬取商品数据，包括商品名称、价格、描述等信息。
特征工程：将商品数据进行处理，提取商品的特征向量，可以使用图像、文本等多种方式进行向量化。
数据导入：将处理后的商品数据导入腾讯云向量数据库中，支持在线导入和离线批量导入两种方式。
推荐服务：将用户的历史行为和偏好进行分析和挖掘，得到用户的特征向量，将其输入到腾讯云向量数据库中，获取距离最近的商品向量，即为推荐结果。
评估优化：根据用户反馈和推荐效果，不断优化推荐算法和向量模型。

经过实际测试，腾讯云向量数据库的性能表现出色，能够在海量商品数据中快速进行相似度匹配，提高了推荐系统的精确度和效率。

例如针对实践成果：集团内部 40+业务接入，1600亿次请求/天；1000+外部用户接入。具体数据可参考如下：

优缺点分析

腾讯云向量数据库(Tencent Cloud VectorDB)相比传统关系型数据库和其他新型数据库有以下优点：

高效。腾讯云向量数据库使用基于向量索引的存储引擎，可以快速存储和查询大量的向量数据。它还支持实时数据写入和查询，并能够通过水平扩展来支持更大的数据规模。
易于使用。腾讯云向量数据库提供了一个易于使用的RESTful API，方便开发人员与它集成。它还支持多种向量数据类型和高级功能，例如向量检索、空间聚类等。
可靠性高。腾讯云向量数据库使用了多种技术来优化性能，例如分片、负载均衡等。它还支持多重备份和数据恢复机制，保证数据的可靠性和安全性。

但也有一些缺点需要注意：

学习曲线陡峭。腾讯云向量数据库的使用需要一定的技术知识和经验。对于一些初学者来说，可能需要花费一些时间来学习和理解其内部机制和使用方式。
成本较高。腾讯云向量数据库是一款商业软件，使用需要支付一定的费用。对于一些小型企业或个人开发者来说，可能承受不起这样的成本。

代码集成使用

为了方便大家更易理解，本文以Java开发语言为例，介绍如何使用腾讯云向量数据库。

首先我们需要引入腾讯云向量数据库的Java SDK，可以通过以下方式进行引入，在你的pom.xml配置文件中引入即可：

<dependency>
    <groupId>com.tencent.vectordbgroupId>
    <artifactId>vectordb-sdk-javaartifactId>
    <version>1.0.0version>
dependency>

在使用腾讯云向量数据库之前，需要先创建数据库实例和向量集合。可以通过以下代码进行创建：

// 初始化客户端
VectordbClientOptions options = new VectordbClientOptions();
options.setSecretId("your_secret_id");
options.setSecretKey("your_secret_key");
options.setEndpoint("vectordb.tencentcloudapi.com");

VectordbClient client = new VectordbClient(options);

// 创建实例
CreateInstanceRequest req = new CreateInstanceRequest();
req.setRegion("ap-guangzhou");
req.setZone("ap-guangzhou-3");
req.setNodeNum(3);
req.setNodeType("STANDARD");
req.setDiskSize(100);
req.setInstanceId("your_instance_id");
CreateInstanceResponse res = client.CreateInstance(req);

// 创建集合
CreateCollectionRequest req2 = new CreateCollectionRequest();
req2.setCollectionName("your_collection_name");
CreateCollectionResponse res2 = client.CreateCollection(req2);

创建完成后，可以向集合中添加向量数据，可以通过以下代码进行添加：

VectorBatch vectorBatch = new VectorBatch();
vectorBatch.setCollectionName("your_collection_name");
vectorBatch.setParallism(8);
vectorBatch.setDim(512);
vectorBatch.setBatchId("your_batch_id");

List<VectorObj> vectorObjs = new ArrayList<>();
VectorObj vectorObj = new VectorObj();
vectorObj.setVec(new String[]{"0.1,0.2,0.3,0.4,...,0.9,1.0"});
vectorObj.setId("your_vector_id");
vectorObjs.add(vectorObj);

vectorBatch.setVectorObjs(vectorObjs);

AddVectorsResponse resp = client.AddVectors(vectorBatch);

如上代码解析：

如上示例代码使用的是Java开发语言编写，其目的是将一组向量添加到指定的集合中。代码中使用了一个名为VectorBatch的类来表示向量批处理，其中包含了集合名称、并行度、向量维度和批处理ID等属性。利用VectorObj类来表示每个向量，其中包含了向量的ID和向量本身的字符串表示。代码中创建了一个向量批处理对象vectorBatch，然后将待添加的向量列表vectorObjs赋给了该对象。最后，调用client对象的AddVectors方法来将向量批处理添加到服务器端，返回一个AddVectorsResponse对象。

查询向量数据可以使用以下代码进行查询：

SearchVectorsRequest req3 = new SearchVectorsRequest();
req3.setCollectionName("your_collection_name");
req3.setTopK(10);
req3.setDim(512);
req3.setVec(new String[]{"0.1,0.2,0.3,0.4,...,0.9,1.0"});
req3.setSearchParams(new SearchParams());
SearchVectorsResponse res3 = client.SearchVectors(req3);

以上代码片段演示了如何使用腾讯云向量数据库进行向量数据的存储和查询。

如上代码解析：

如上代码中，用于向 Milvus 服务端发送请求以进行向量搜索。具体来说，代码中首先创建了一个 SearchVectorsRequest 对象，然后设置了该请求的参数，包括要搜索的集合名称、返回前 K 个相似向量、向量的维度、待搜索的向量等。最后还设置了用于搜索的参数 SearchParams 对象。随后，代码调用了 Milvus 客户端的 SearchVectors 方法，并将 SearchVectorsRequest 对象作为参数传入，执行搜索操作。执行成功后，将返回一个 SearchVectorsResponse 对象，其中包含了搜索的结果数据。

类代码方法介绍

本章节介绍腾讯云向量数据库(Tencent Cloud VectorDB) Java SDK中的一些常用类代码和方法。具体请看如下：

VectordbClient

VectordbClient是腾讯云向量数据库(Tencent Cloud VectorDB) Java SDK的主要客户端类，用于与向量数据库进行交互。主要方法如下：

public VectordbClient(VectordbClientOptions options)：构造函数，用于创建一个VectordbClient实例。
public CreateInstanceResponse CreateInstance(CreateInstanceRequest req)：创建实例。
public CreateCollectionResponse CreateCollection(CreateCollectionRequest req)：创建集合。
public AddVectorsResponse AddVectors(VectorBatch batch)：添加向量数据。
public SearchVectorsResponse SearchVectors(SearchVectorsRequest req)：查询向量数据。

如上代码解析：

如上代码是一个 Vectordb（向量数据库）的客户端库，提供了一些基本的操作接口。

VectordbClient 是该客户端库的主类，其构造函数需要传入 VectordbClientOptions 对象作为参数，用于创建一个 VectordbClient 的实例。

接下来是一些主要的操作函数：

CreateInstance：创建一个实例对象；
CreateCollection：创建一个集合；
AddVectors：添加向量数据，需要传入一个 VectorBatch 对象，用于批量添加向量数据；
SearchVectors：查询向量数据，根据 SearchVectorsRequest 对象中指定的条件进行查询，并返回一个 SearchVectorsResponse 对象，其中包含符合条件的向量数据。CreateInstanceRequestCreateInstanceRequest用于创建腾讯云向量数据库(Tencent Cloud VectorDB)实例。主要属性如下：
private String region：实例所在地域。
private String zone：实例所在可用区。
private String instanceId：实例ID。
private String nodeType：实例节点类型。
private Integer nodeNum：实例节点数量。
private Integer diskSize：实例磁盘大小。

如上代码解析：

如上代码定义了一个Java类，并声明了类的属性（instance variables）。

其中，属性（instance variables）的数据类型包括：

region：字符串（String）
zone：字符串（String）
instanceId：字符串（String）
nodeType：字符串（String）
nodeNum：整数（Integer）
diskSize：整数（Integer）

这些属性是私有的（private），意味着只有该类内部的方法可以直接访问和修改这些属性的值。其他的类无法直接访问和修改这些属性。

通过定义类属性，我们可以在类的方法中使用这些属性，对其进行操作和处理，从而实现类的具体功能。

CreateCollectionRequest

CreateCollectionRequest用于创建向量集合。主要属性如下：

private String collectionName：集合名称。

如上代码解析：

如上代码，CreateCollectionRequest是用于创建向量集合的请求类，其中包含一个主要属性collectionName表示集合名称。一般来说，在使用CreateCollectionRequest时，需要设置集合名称参数，以便正确地创建一个向量集合。

VectorObj

VectorObj用于表示一个向量对象。主要属性如下：

private String[] vec：向量数据。

如上代码解析：

如上代码定义了一个名为VectorObj的类，用于表示一个向量对象。该类包含一个私有属性vec（向量数据），它是一个字符串数组。

VectorBatch

VectorBatch用于表示向量数据的批量添加。主要属性如下：

private String collectionName：集合名称。
private Integer parallism：添加向量数据的并行度。
private Integer dim：向量数据的维度。
private String batchId：批次ID。
private List vectorObjs：向量数据列表。

如上代码解析：

如上代码定义了一个名为VectorBatch的类，用于表示向量数据的批量添加。其中包含了以下属性：

collectionName：表示集合名称，即向量数据所属的集合。
parallism：表示添加向量数据时的并行度，即同时处理向量数据的数量。
dim：表示向量数据的维度，即向量的长度。
batchId：表示批次ID，用于标识同一批次的向量数据。
vectorObjs：表示向量数据列表，即待添加的向量数据。该属性的类型为VectorObj的列表，VectorObj表示一个向量对象。SearchVectorsRequestSearchVectorsRequest用于查询向量数据。主要属性如下：
private String collectionName：集合名称。
private Integer topK：返回的最相似的向量数据数量。
private Integer dim：向量数据的维度。
private String[] vec：向量数据。
private SearchParams searchParams：查询参数。

如上代码解析：

如上代码定义了一个用于查询向量数据的类SearchVectorsRequest，其中包括以下主要属性：

collectionName：集合名称，表示需要查询的向量数据存储在哪个集合中。
topK：返回的最相似的向量数据数量，表示查询结果中需要返回多少个与查询向量最相似的向量数据。
dim：向量数据的维度，表示每个向量数据包含多少个维度。
vec：向量数据，即需要进行相似度查询的向量。
searchParams：查询参数，用于指定查询的相关设置。可以通过它设置查询的距离度量方式、是否返回向量ID等。

总之，该类是用于查询向量数据的，用户通过设置相应的属性来指定查询的条件，从而得到相应的查询结果。

SearchParams

SearchParams用于指定查询参数。主要属性如下：

private Integer nprobe：控制查询时候参与计算的向量数量。

如上代码解析：

如上代码定义了一个名为SearchParams的类，用于指定查询参数。该类具有一个属性nprobe，其数据类型为Integer，可以控制查询时参与计算的向量数量。

测试用例

为了验证腾讯云向量数据库(Tencent Cloud VectorDB)的存储和查询性能，可以进行以下测试用例进行测试分析：

添加一批大小为1000的512维度的随机向量，并记录添加时间。
查询与某个向量相似的前10个向量，并记录查询时间。
分别测试不同维度和并发数对添加和查询性能的影响。
对比腾讯云向量数据库和传统关系型数据库的存储和查询性能。

经过多轮测试验证，可以得出结论：腾讯云向量数据库(Tencent Cloud VectorDB)在存储和查询大规模向量数据时表现良好，具有高效、精确、扩展性好、兼容性好等优点，且适用于计算机视觉、自然语言处理、推荐系统等领域。但也需要注意其可承受的数据规模相对有限，对数据的修改和删除操作效率较低等缺点。具体的话你们可以去尝试验证一下，这里我就不过多赘述啦。

其次，你们也可以通过如下的main测试用例进行测试，实现起来就没有如上那么繁琐，测试连接腾讯云向量数据库(VectorDB)是否成功，具体代码如下：

import com.qcloud.vectordb.client.VectorDBClient;

public class Test {
    public static void main(String[] args) {
        // 连接数据库
        String endpoint = "xxxxxxxxxx.vectordb.tencentcloudapi.com";
        String secretId = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
        String secretKey = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
        String instanceId = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
        VectorDBClient client = new VectorDBClient(endpoint, secretId, secretKey, instanceId);

        // 测试连接是否成功
        boolean isConnected = client.testConnect();
        System.out.println("Connection status: " + isConnected);
    }
}

测试代码分析：

如上写的是一个 Java 代码测试示例，使用了腾讯云的 VectorDBClient 对象来连接 VectorDB 数据库。具体实现可以分成以下几个步骤，大家请看：

导入 Vectordb 的客户端库。
在 main 函数中创建一个 VectorDBClient 对象，并传入所需的参数：
endpoint：所使用的数据库服务地址。
secretId 和 secretKey：用于用户身份验证的密钥对。
instanceId：连接的数据库实例 ID。
实例化 VectorDBClient 后，使用 testConnect() 方法测试连接状态。最后，将连接状态输出到控制台。

&emsp大家需要额外注意的是，在使用 VectorDB 之前，还需要根据业务需求，在数据库中创建相应的表格和索引等数据结构，这点不是说随意捏造就可以了。

小结

根据如上内容梳理下来，验证得出腾讯云向量数据库(Tencent Cloud VectorDB)是一种高效、稳定、灵活和全面的向量数据库，其采用基于向量索引的查询方式，对于大规模的向量数据，查询速度非常快。通过使用高维度向量空间中的距离计算，可以精确匹配相似的向量数据。同时，它还支持数据的持久化和备份、自动化扩展和负载均衡等功能，并提供了多种API和SDK，方便用户进行二次开发和集成。腾讯云向量数据库可以广泛应用于计算机视觉、自然语言处理、推荐系统等领域，适用于各种大规模向量相似度计算应用和场景。

总结和建议

综合以上所述，腾讯云向量数据库具有高性能、可扩展、多种数据类型支持和易于使用等技术特点，可以应用于很多领域。在实际应用过程中，需要根据自己的需求选择合适的部署模式和向量化模型，保证系统的性能和准确度。

为了进一步提高腾讯云向量数据库的应用价值和效果，我建议从以下几个方面入手：

提高向量模型的精度和泛化能力，进一步提高推荐效果和搜索准确度。
支持更多的数据类型和特征工程方法，满足不同领域的需求。
提供更加丰富的API和SDK，方便用户进行应用开发和集成。
开发更加智能化的监控和管理工具，实现自动化运维和性能优化。

总而言之，腾讯云向量数据库是一款非常优秀的向量搜索服务，有着广泛的应用前景和市场前景。我相信在不久的将来，它一定会成为人工智能和大数据领域的重要组成部分。让我们一起期待着，为它加油，等待它那一天的到来。

—End—

你可能感兴趣的:(腾讯云,数据库,云计算,腾讯云VectorDB,向量数据库)

利用图数据库构建问答应用指南 scaFHIO 数据库 oracle python
在本指南中，我们将逐步介绍如何在图数据库上创建问答链。这些系统可以让我们针对图数据库中的数据提出问题，并返回自然语言的答案。⚠️安全提示⚠️构建基于图数据库的问答系统需要执行模型生成的图查询。这其中存在固有风险。确保数据库连接权限范围尽可能地缩小以满足链/代理的需求。这将减轻但不会消除构建模型驱动系统的风险。更多安全实践的信息，请查看这里。架构在高层次上，大多数图链的步骤为：将问题转换为图数据库查
鸿蒙开发API 12 完全解析：核心技术升级与开发实战北辰alk 鸿蒙 harmonyos 华为
文章目录一、API12架构全景图1.1系统架构层次1.2API12核心模块对比二、ArkUI3.0革命性升级2.13D图形能力2.1.13D组件基础结构2.1.2物理引擎集成2.2新增组件库三、分布式能力增强3.1超级终端协同框架3.2分布式数据管理3.2.1跨设备数据库3.2.2设备能力发现四、硬件服务扩展4.1外设统一管理框架4.2新硬件API概览五、安全体系强化5.1安全架构升级5.2关键安
MySQL时间溢出原理、实战影响与全面解决方案 dblens 数据库管理和开发工具 mysql mysql 数据库
一、问题背景与现象复现操作场景：本文将手把手带您了解mysql时间溢出原理、实战影响与全面解决方案，所有代码均通过dblensformysql数据库工具验证，推荐使用该工具进行可视化数据库管理和开发。在MySQL5.7环境中，若通过命令date-s"2038-04-0100:00:00"将系统时间设置为2038年4月1日，观察MySQL的行为。现象总结：timestamp字段溢出：写入2038年后
想成为一名数据分析师，SQL技能需要掌握到什么程度？爱开发V 数据库 mysql java python 编程语言
请问做一名数据分析人员，在sql方面需要掌握到什么程度呢？会增删改查就可以了吗？还是说关于开发的内容也要会？想要成为一名数据分析师，SQL需要掌握到什么程度？对于这个问题，有的初学者可能会被一些资料误导，以为SQL要掌握到数据库管理员的水平，而去学习SQL所有的知识点，最后在学习的过程中发现很难学，学不会，走了不少弯路，有的还因此放弃了。其实对于数据分析师，不同的职位对SQL的要求是完全不一样的。
mysql 存储过程和自定义函数详解 angen2018 mysql mysql 数据库
首先创建存储过程或者自定义函数时，都要使用usedatabase切换到目标数据库，因为存储过程和自定义函数都是属于某个数据库的。存储过程是一种预编译的SQL代码集合，封装在数据库对象中。以下是一些常见的存储过程的关键字：存储过程1.存储过程的定义CREATEPROCEDURE:用于创建一个新的存储过程。CREATEPROCEDUREprocedure_name(parameter_list)BEG
服务器虚拟化：技术原理、实践与未来趋势 encoding-console 服务器运维虚拟化
服务器虚拟化：技术原理、实践与未来趋势引言在云计算与数字化转型的浪潮下，服务器虚拟化技术已成为现代IT基础设施的核心支柱。通过将物理服务器资源抽象为多个独立虚拟环境，企业显著提升了资源利用率、灵活性和运维效率。本文将从技术原理、核心组件、实践场景及未来趋势展开分析。一、服务器虚拟化技术原理1.1基本架构服务器虚拟化的核心是通过Hypervisor（虚拟机监控器）实现硬件资源的抽象与隔离。其架构分为
Linux云计算SRE-第十八周晨曦启明711 linux 云计算运维
1.部署3节点mongodb复制集。1、编辑mongodb节点rocky(10.0.0.160)、rocky1(10.0.0.170)、rocky2(10.0.0.180)的安装脚本。viminstall_mongodb.sh#!/bin/bash#正确定义版本变量MONGODB_VERSION=rhel80-5.0.4MONGODB_FILE=mongodb-linux-x86_64-${MON
云计算：虚拟化、容器化与云存储技术详解 Evaporator Core #深度学习网络工程师网络规划设计师云计算
在上一篇中，我们深入探讨了网络安全的核心技术，包括加密、认证和防火墙，并通过实际案例和细节帮助读者全面理解这些技术的应用和重要性。今天，我们将转向一个近年来迅速发展的领域——云计算。云计算通过提供按需访问的计算资源，彻底改变了IT基础设施的构建和管理方式。本文将详细介绍云计算的核心技术，包括虚拟化、容器化和云存储，并通过实际案例和细节帮助读者全面理解这些技术的应用和优势。一、云计算概述1.1云计算
支持向量机 SVM 简要介绍 _夜空的繁星_ 机器学习 svm 支持向量机拉格朗日对偶机器学习
那些我从来没有理解过的概念（1）下面是我在学习过程中遇到的对我很难理解的概念和我抄下来的笔记主要资料来源：《统计学习方法》，维基百科拉格朗日对偶问题是什么假设f(x),ci(x),hj(x)是定义在Rn上的连续可微函数，考虑以下最优化问题：$$\min_{x\inR^n}{f(x)}\c_i(x)\leq0,i=1,2,\dots,k\h_j(x)=0,j=1,2,\dots,l$$是一个凸优化问
sklearn 支持向量机实践总结可爱的红薯 python sklearn 支持向量机 python sklearn 支持向量机
转自http://www.cnblogs.com/pinard/p/6117515.html之前通过一个系列对支持向量机(以下简称SVM)算法的原理做了一个总结，本文从实践的角度对scikit-learnSVM算法库的使用做一个小结。scikit-learnSVM算法库封装了libsvm和liblinear的实现，仅仅重写了算法了接口部分。1.scikit-learnSVM算法库使用概述sciki
支持向量机——SVM big_matster 周志华机器学习支持向量机算法
支持向量机支持向量机是一种经典的二分类模型，基本模型定义为特征空间中的最大间隔的线性分类器，其学习的优化目标便是间隔最大化，因此，支持向量机本身可以转换一个凸二次规划求解问题。函数间隔和几何间隔对于二分类学习，假设现在的数据是线性可分的，这时分类学习最基本的想法就是找到一个合理的超平面，该超平面能够将不同类别的样本分开，类似于二维平面使用ax+by+c=0ax+by+c=0ax+by+c=0来表示
MySQL SQL语句执行流程详解 AitTech Mysql mysql sql 数据库
一条SQL语句在MySQL中的执行过程是一个复杂而精细的过程，它涉及多个阶段和组件的协同工作。以下是这一过程的详细描述：一、客户端与服务器建立连接身份验证：用户通过客户端（如MySQL命令行工具、MySQLWorkbench、编程语言数据库接口等）向MySQL服务器发送连接请求，该请求包含数据库地址、用户名和密码。服务器端的连接器（Connector）接收请求，并通过用户模块验证用户名和密码的正确
如何高效使用LangChain实现复杂任务：全面功能指南 shuoac langchain 前端 python
LangChain是一个强大的工具集，它为开发基于大语言模型(LLM)的应用提供了丰富的组件和功能支持。无论你是初学者还是经验丰富的开发者，这篇指南将帮助你掌握LangChain的核心功能，并通过可运行的代码示例指导你完成各种任务。目录安装LangChain核心功能概览LangChain表达式语言(LCEL)组件详解及实现Prompt模板消息管理文档加载器向量存储应用场景分析问答系统(Q&A)信息
面试被问 SQL 注入一脸懵？一文读懂 SQL 注入攻防全攻略大模型大数据攻城狮数据库 sql C++面试 java面试后端面试 sql注入 sql优化
目录SQL注入概述定义与原理常见类型攻击技术指标注入点识别绕过防御机制数据提取方法防范措施参数化查询输入验证与过滤最小权限原则检测与监控漏洞扫描实时监控SQL注入概述定义与原理SQL注入是一种极具破坏力的网络攻击技术。想象一下，Web应用程序就像是一座大厦，而数据库则是大厦里存放重要文件的保险柜。正常情况下，用户通过Web应用程序向数据库发送请求，就如同员工拿着正确的钥匙去保险柜取文件。但攻击者利
VO DTO DO PO BusyMonkey Java Spring java spring
1、定义VO：ViewObject，视图对象，用于展示层DTO：DataTransferObject，展示层与服务层的数据传输对象DO：DomainObject，领域对象，抽象的业务实体PO：PersistentObject，持久化对象2、VO和DTO的区别数据本质是一样的，比对DTO是没有转义的，数据库字段0、1、2、A、B等。VO则是转以后的开始状态、结束状态，运行状态等
数据库二三事（13）一只鱼玉玉数据库
故障管理四大类故障：事务内部故障，系统故障，介质故障，计算机病毒故障事物内部：分为预期与非预期故障，需要强制回滚事物恢复状态，自动完成且透明系统故障：软故障，因为软件意外导致非正常终止，影响所有事物，导致易失性存储器内容丢失，需要回滚所有未完成事务结果介质故障：硬故障，因为物理意义意外导致数据库数据丢失，采用备份（有局限性）和双物理存储设备，双系统方式进行保存病毒：杀死程序或备份文件恢复重点：建立
什么时候需要做性能测试？海姐软件测试测试工具职场和发展
性能测试是确保系统在高负载、复杂场景下稳定运行的关键环节，通常在以下场景中需要执行性能测试：---###**1.新系统上线或核心功能发布前**-**验证系统容量**：确保系统能承载预期的用户量和业务量（如日活用户、峰值并发）。-**预防生产事故**：提前发现性能瓶颈（如数据库慢查询、内存泄漏），避免上线后崩溃。---###**2.系统架构重大变更时**-**技术升级**：如数据库迁移（MySQL→
构建基于ASP.NET的教务管理系统黃昱儒
本文还有配套的精品资源，点击获取简介：教务管理系统是一个Web应用程序，利用ASP.NET技术为高校和教育机构提供全面的教务管理功能。它包括学生信息管理、课程管理、考试安排和成绩录入等核心模块。系统支持权限控制和数据管理，以确保信息安全和操作便捷。ASP.NET框架使用C#或VB.NET编程，结合.NETFramework、SQLServer或MySQL数据库以及前端技术（HTML、CSS、Jav
2025年毕设ssm网上超市论文+源码 SSM毕设程序源码JAVA 课程设计
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于网上超市系统的研究，现有研究主要集中在电子商务平台的设计与开发、供应链管理、以及用户行为分析等领域。尽管这些研究已经取得了一定的成果，但专门针对基于SSM（Spring、SpringMVC、MyBatis）框架的网上超市系统的研究仍相对较少。随着电子商务的蓬勃发展，网上超市
linux网卡绑定和漂移,linux双网卡绑定和防漂移.doc Alysssssa linux网卡绑定和漂移
linux双网卡绑定和防漂移问题：四川Greenplum服务器双网卡绑定，重启后网卡组IP漂移到另一网卡组，掉包率严重，导致gp数据库无法正常使用。处理办法：在/etc/sysconfig/network-scripts/ifcfg-ethx中添加网卡mac地址，使其无论先后启动都不会发生IP漂移。结果：服务器正常工作。处理过程如下：[root@master~]#ifconfig-abond0Li
大模型与图数据库RAG通俗流程拆解 gallonyin 产品笔记 AI 知识图谱
图构建（略）neo4j、tugraph等均可，不影响GraphRAG核心框架模型向量化模型bce-embedding-base_v1重排序模型bce-reranker-base_v1大语言模型Qwen/Qwen2.5-32B-Instruct图数据库tugraph索引faiss核心流程这个调用链日志展示了一个完整的问答系统处理用户输入“百草园里有什么”的过程。本项目使用和参考了开源项目茴香豆。以下
Laravel如何实现MySQL分库分表的功能？使用场景是什么？底层原理是什么？快点好好学习吧 Laravel laravel mysql php
一、MySQL分库分表的定义1.核心定义分库（Sharding）：将数据分散到多个数据库中，以减轻单个数据库的压力。分表（Partitioning）：将一个大表拆分为多个小表，通常基于某种规则（如用户ID或时间戳）。目的：提高系统的扩展性、性能和可用性。二、使用场景1.常见使用场景高并发系统：数据量巨大且访问频率高的场景（如电商平台、社交网络）。大数据存储：单表数据量超过千万甚至亿级时，需要分表以
MySQL——用户管理 m0_74824002 面试学习路线阿里巴巴 mysql adb android
在使用MySQL时，初始都是只有一个root账号，跟Linux类似，拥有最高管理员权限。如果数据库将来要被多个人使用，如果所有人都通过root登录，那么就可以对所有的数据库信息进行操作，这显然是不安全的，因此MySQL也必须做用户管理。一.用户管理1.创建用户MySQL中的所有用户信息都存放在系统数据库mysql的user表中：host：表示这个用户可以从哪个主机登陆，如果是localhost，表
基于SpringBoot农产品智慧物流系统的设计与实现四金学长计算机毕业设计参考案例 spring boot 后端 java 农产品智慧物流系统
1.引言在当今的软件开发领域，企业级应用的开发和部署速度直接影响着业务的竞争力。SpringBoot以其轻量级、快速启动和强大的集成能力，成为构建现代企业级应用的首选框架。本文将带您深入了解SpringBoot框架的核心特性，并展示如何利用它构建一个高效、可扩展的系统。2.开发环境开发语言：Java框架：springbootJD版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定
语义检索-BAAI Embedding语义向量模型深度解析[1-详细版]：预训练至精通、微调至卓越、评估至精准、融合提升模型鲁棒性汀、人工智能 LLM工业级落地实践 embedding langchain 人工智能智能问答 RAG 检索增强生成大模型
语义检索-BAAIEmbedding语义向量模型深度解析[1-详细版]：预训练至精通、微调至卓越、评估至精准、融合提升模型鲁棒性语义向量模型（EmbeddingModel）已经被广泛应用于搜索、推荐、数据挖掘等重要领域。在大模型时代，它更是用于解决幻觉问题、知识时效问题、超长文本问题等各种大模型本身制约或不足的必要技术。然而，当前中文世界的高质量语义向量模型仍比较稀缺，且很少开源。为加快解决大模型
向量叉乘与向量点乘 commonbelive c++
向量点乘向量叉乘应用在C++中，判断某一点是否在三角形内有多种方法，以下是几种常见的实现方式：向量叉积法原理：对于三角形ABC和点P，计算向量\overrightarrow{PA}与\overrightarrow{PB}、\overrightarrow{PB}与\overrightarrow{PC}、\overrightarrow{PC}与\overrightarrow{PA}的叉积，若这三个叉积
Java进阶-在Ubuntu上部署SpringBoot应用 m0_74824534 面试学习路线阿里巴巴 java ubuntu spring boot
随着云计算和容器化技术的普及，Linux服务器已成为部署Web应用程序的主流平台之一。Java作为一种跨平台的编程语言，具有广泛的应用场景。本文将详细介绍如何在Ubuntu服务器上部署Java应用，包括环境准备、应用发布、配置反向代理（Nginx）、设置系统服务以及日志管理等步骤。一、部署准备在开始之前，请确保你具备以下条件：一台运行Ubuntu（如Ubuntu20.04或22.04）的服务器，具
数据库存储引擎中 InnoDB 和 MyISAM 的区别？ Code额 SQL 数据库存储引擎
InnoDB和MyISAM的区别？InnoDB和MyISAM是MySQL数据库中两种常用的存储引擎，它们各自具有不同的特点和适用场景。以下是它们之间的一些主要区别：InnoDB天生支持事务：提供了完整的提交、回滚和崩溃恢复能力；支持物理外键：有助于保持数据的参照完整性；天生支持行锁：允许更高的并发性，因为只有修改的特定行被锁定，其他行仍可以进行读写操作；手动支持表锁；使用聚簇（集）索引：索引跟数据
文档进行embedding，Faiss向量检索被编程为难的小娃娃 embedding faiss
这里采用Langchain的HuggingFaceEmbeddings参照博主，改了一些东西，因为Langchain0.3在0.2的基础上进行了一定的修改fromlangchain.text_splitterimportRecursiveCharacterTextSplitterfromlangchain_huggingfaceimportHuggingFaceEmbeddingsfromlang
你还在用裸指针？C++ 智能指针早就吊打它了！ c++
前言大家好，我是小康。在上一篇文章中，我们聊了聊RAII的魔力，如何通过简单的类设计解决了资源泄漏问题，比如自动管理数据库连接、网络连接等。RAII就像一个贴心的小助手，帮你在构造时搞定资源分配，在析构时自动清理资源，让你轻松避免手动管理资源的“坑”。不过，讲到这，有的朋友可能会问：“这些例子很好，但每次都得手写一个类，岂不是很麻烦？有没有一种现成的解决方案，可以更方便地管理像内存这样的资源？”这
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin