夕小瑶

2024年1月17日Arxiv热门NLP大模型论文：THE FAISS LIBRARY

Meta革新搜索技术！提出Faiss库引领向量数据库性能飞跃

引言：向量数据库的兴起与发展

随着人工智能应用的迅速增长，需要存储和索引的嵌入向量（embeddings）数量也在急剧增加。嵌入向量是由神经网络生成的向量表示，其主要目的是将输入媒体项映射（嵌入）到向量空间中，空间中的局部性编码了输入的语义。这些嵌入向量从各种媒体形式中提取，包括文字、图像、用户和推荐项目等。它们甚至可以编码对象关系，例如多模态文本-图像或文本-音频关系。

嵌入向量在工业环境中非常受欢迎，用于端到端学习成本效益不高的任务。例如，k最近邻分类器比深度神经网络分类更高效。在这种情况下，嵌入向量作为可以重复用于多个目的的紧凑中间表示特别有用。这解释了为什么提供向量存储和搜索功能的工业数据库管理系统（DBMS）在过去几年中获得了采用。这些DBMS位于传统数据库和近似最近邻搜索（ANNS）算法的交汇处。直到最近，后者主要被认为是特定用例或研究中的算法。

从实际角度来看，保持嵌入提取和向量搜索算法之间角色的清晰分离有多种优势。两者都受“嵌入合同”约束，该合同规定了嵌入距离：嵌入提取器（通常是现代系统中的神经网络）经过训练，使得嵌入之间的距离与要执行的任务对齐；向量索引旨在尽可能准确地执行嵌入向量之间的邻居搜索，以便在给定的距离度量下获得精确搜索结果。

Faiss是一个用于ANNS的工业级库。它旨在从简单脚本中使用，也可以作为DBMS的构建模块。与其他只关注单一索引方法的库不同，Faiss是一个工具箱，包含通常涉及一系列组件（预处理、压缩、非穷尽搜索等）的索引方法。这是必要的：根据使用约束，最有效的索引方法是不同的。

声明：本期论文解读非人类撰写，全文由赛博马良「AI论文解读达人」智能体自主完成，经人工审核后发布。
智能体传送门：赛博马良-AI论文解读达人

论文概览：Faiss库的核心功能与应用

Faiss库专门用于向量相似性搜索，是向量数据库的核心功能。Faiss是一套索引方法和相关原语的工具包，用于搜索、聚类、压缩和转换向量。本文首先描述了向量搜索的权衡空间，然后是Faiss的设计原则，包括结构、优化方法和接口。我们对库的关键特性进行了基准测试，并讨论了几个选定的应用案例，以突出其广泛的适用性。

Faiss是一个包含多种索引方法的工具箱，这些方法通常涉及一系列组件（如预处理、压缩、非穷尽搜索等）。这是必要的，因为根据使用约束，最有效的索引方法是不同的。Faiss不提取特征——它只索引由不同机制提取的嵌入；Faiss不是一个服务——它只提供在本地机器上作为调用过程的一部分运行的函数；Faiss也不是数据库——它不提供并发写访问、负载平衡、分片或一致性。库的范围有意限制，以专注于精心实现的算法。

Faiss的基本结构是索引。索引可以存储一定数量的数据库向量，这些向量逐渐添加到其中。在搜索时，提交一个查询向量到索引。索引返回与查询向量在欧几里得距离上最接近的数据库向量。有许多这种基本功能的变体：可以返回最近的邻居而不是仅仅一个；可以返回固定数量的邻居而不是一定范围内的向量；可以并行搜索多个向量，在批处理模式下；支持除欧几里得距离以外的其他度量；可以为速度或内存交换搜索的准确性。搜索可以使用CPU或GPU。

本文的目标是展示Faiss的设计原则。相似性搜索库必须在不同约束之间取得平衡，这在Faiss中通过两个主要工具解决：向量压缩和非穷尽搜索。Faiss被设计为灵活且可用的工具。我们还回顾了Faiss在万亿级索引、文本检索、数据挖掘和内容审核等几个应用中的应用。

论文标题：THE FAISS LIBRARY
机构：FAIR, Meta; Zilliz; Zhejiang University
论文链接：https://arxiv.org/pdf/2401.08281.pdf
项目地址：暂无提供

向量搜索的权衡空间：速度、准确性与资源消耗

在向量搜索的领域，我们面临速度、准确性和资源消耗之间的权衡。这些因素通常是相互制约的，优化其中一个往往会牺牲另一个。例如，为了提高搜索速度，我们可能会接受较低的准确性或更高的资源消耗。反之，为了提高准确性，我们可能需要更多的时间和资源来处理数据。

1. 速度
速度是衡量搜索算法性能的关键指标之一。在实际应用中，快速响应用户的查询请求是至关重要的。然而，提高速度往往需要牺牲准确性或增加资源消耗。

2. 准确性
准确性指的是搜索结果与理想结果的接近程度。在某些应用场景中，如内容推荐或医疗诊断，高准确性是必不可少的。然而，提高准确性可能会导致搜索速度降低，或需要更多的计算资源。

3. 资源消耗
资源消耗包括内存使用、计算能力和存储空间等。在资源有限的环境中，如移动设备或嵌入式系统，资源消耗成为一个重要的考虑因素。优化资源消耗可以降低成本并提高系统的可扩展性。

在设计搜索算法时，我们需要根据具体的应用场景和需求来平衡这三个因素，以达到最佳的性能。

Faiss设计原则：结构、优化方法和接口设计

Faiss是一个专注于向量相似性搜索的工具库，其设计遵循了一些核心原则，以确保其在不同的应用场景中都能提供高效且灵活的搜索能力。

1. 结构设计
Faiss的基本结构是索引（index），它可以存储数据库向量，并在查询时返回与查询向量最接近的数据库向量。Faiss支持多种索引变体，如返回k个最近邻、只返回一定范围内的向量等。索引的设计允许在CPU和GPU上使用，以适应不同的硬件环境。

2. 优化方法
Faiss通过向量压缩和非穷尽搜索来优化搜索过程。向量压缩可以减少内存使用，而非穷尽搜索则通过聚类或图探索等方法，减少需要计算距离的向量数量，从而提高搜索速度。

3. 接口设计
Faiss旨在提供灵活的接口，使其可以轻松地嵌入到其他工具或数据库管理系统中。所有的类成员都是公开的，以便用户可以访问和修改实现细节。此外，Faiss提供了Python绑定，使得它可以方便地在脚本中使用。

Faiss的关键特性：索引方法与基准测试

Faiss提供了多种索引方法，以支持不同的搜索需求和优化目标。

1. 索引方法
Faiss的索引方法包括基于量化的近似最近邻搜索（ANN），如乘积量化（Product Quantization，PQ）和残差量化（Residual Quantization，RQ）。这些方法通过将向量压缩成紧凑的代码，来减少存储和计算需求。

2. 基准测试
为了评估不同索引方法的性能，Faiss进行了基准测试。这些测试使用了不同规模的数据集，如百万级别的数据集和包含10亿向量的数据集。基准测试结果显示，Faiss在处理大规模数据集时能够提供快速且准确的搜索结果。

通过这些特性，Faiss能够在保持高准确性的同时，有效地处理大规模的向量搜索任务。

向量压缩与非穷尽搜索：Faiss的两大工具

在处理大规模嵌入向量集合的向量数据库中，向量压缩和非穷尽搜索是Faiss库的两大核心工具。Faiss专注于向量相似性搜索，这是向量数据库的核心功能。向量压缩旨在减少向量所需的存储空间，而非穷尽搜索则试图在不检查数据库中的每个向量的情况下找到与查询向量最相似的向量。

1. 向量压缩

向量压缩通过减少每个向量的表示大小来减少整体存储需求。Faiss支持多种向量编解码器，或称为量化器，这些量化器将连续的多维向量转换为整数或等效的固定大小比特串。量化器的解码器部分负责从整数重建向量的近似表示。由于整数的数量是有限的，解码器只能重建有限数量的不同向量。

2. 非穷尽搜索

非穷尽搜索方法旨在提高搜索效率，通过避免对数据库中的每个向量进行距离计算来加速查询。Faiss实现了多种非穷尽搜索方法，包括基于聚类的方法和基于图的方法。这些方法通常涉及在搜索时只访问数据库的一个子集，这个子集由与查询向量最近的一组向量组成。

非穷尽搜索方法：IVF与基于图的索引

1. IVF索引

倒排文件（IVF）索引是一种在索引时对数据库向量进行聚类的技术。这种聚类使用向量量化器（粗量化器）产生一定数量的不同索引，这些索引的重建值称为质心。在搜索时，只访问部分质心对应的聚类。这种方法的关键参数是聚类的数量，它直接影响搜索的准确性和速度。

2. 基于图的索引

基于图的索引通过构建一个有向图来实现，图的节点是要索引的向量。在搜索时，通过跟随指向查询向量最近的节点的边来探索图。Faiss实现了两种基于图的算法：HNSW和NSG，分别对应于 IndexHNSW和 IndexNSG类。

数据库操作：向量的动态添加、删除与过滤搜索

1. 动态操作

Faiss索引支持动态添加（add和 add_with_ids）和删除向量（remove_ids）。这些操作允许数据库随时间变化，向量可以根据需要添加或删除。Faiss不存储任何与向量相关的元数据，只使用63位整数作为标识符。

2. 过滤搜索

向量过滤是在搜索时基于某些标准返回数据库向量的过程。Faiss对向量过滤有基本的支持，用户可以提供一个谓词（IDSelector回调），如果谓词对向量标识符返回 False，则忽略该向量。这种方法适用于需要根据元数据过滤向量的情况。

通过这些工具和方法，Faiss提供了一种灵活且高效的方式来处理大规模向量搜索任务，无论是在内存中还是在磁盘上。它支持各种操作，包括向量的动态添加和删除，以及基于用户定义的标准过滤搜索结果。

Faiss的工程实践：代码结构与优化策略

3.1 Brute force search

在Faiss中，实现高效的暴力搜索并不是一件简单的事情。它需要（1）一种高效计算距离的方法，以及（2）对于k近邻搜索，一种高效追踪k个最小距离的方法。

距离计算在Faiss中要么通过直接距离计算完成，要么当查询向量以足够大的批量提供时，使用矩阵乘法分解。Faiss的函数在CPU和GPU上分别通过 knn和 knn_gpu暴露。在CPU上，最小距离的追踪使用二进制堆或GPU上的排序网络。对于较大的k值，使用一个大小为k’ > k的未排序的结果缓冲区（reservoir）更为高效，当它溢出时将其调整为k。

尽管暴力搜索可以给出准确结果，但对于大型、高维数据集来说，这种方法变得缓慢。在低维度中，存在精确搜索结果的分支限界方法，但在高维度中，它们并不比暴力搜索更快。

3.2 Metrics

在近似最近邻搜索（ANNS）中，用户接受不完美的结果，这为新的解决方案设计空间打开了大门。数据库可以预处理成索引结构，而不仅仅是存储为普通矩阵。

准确性指标。在ANNS中，准确性是与精确搜索结果的差异来衡量的。这是一个中间目标：端到端的准确性取决于（1）距离度量与项目匹配目标的相关性，以及（2）我们在此处测量的ANNS的质量。

资源指标。交易的其他轴与计算资源相关。在搜索期间，搜索时间和内存使用是主要约束。内存使用可以小于原始向量的内存，如果使用了压缩的话。

3.3 Tradeoffs

通常只有一部分指标是重要的。例如，当在固定索引上执行大量搜索时，索引构建时间并不重要。或者，当向量数量如此之小以至于原始数据库可以多次完全适合RAM时，内存使用就不重要了。我们称我们关心的指标为活跃约束。请注意，准确性始终是一个活跃的约束，因为它可以与每一个其他约束进行交易。

3.4 Exploring search-time settings

对于固定索引，通常有一个或多个搜索时超参数，可以在速度和准确性之间进行权衡。例如，对于 IndexIVF，请参见第5节。一般来说，我们将超参数定义为标量值，这样当值更高时，速度会降低，准确性会提高。然后，我们可以只保留Pareto最优设置，这些设置是对于给定准确性来说最快的，或者等效地，对于给定时间预算来说具有最高准确性。

3.5 Exploring the index space

Faiss包括一个基准测试框架，用于探索索引设计空间，以找到最佳地权衡准确性、内存使用和搜索时间的参数。基准测试生成候选索引配置进行评估，扫描构建时和搜索时的参数，并测量这些指标。准确性指标根据适用情况选择，例如k近邻搜索的n-recall@m，范围搜索的平均精度，以及向量编解码器的均方误差，可以进一步自定义。

实际应用案例：从文本检索到内容审核

8.2 Text retrieval

Faiss常用于自然语言处理任务。特别是，近似最近邻搜索（ANNS）对于信息检索很重要，应用包括事实核查、实体链接、槽填充或开放域问答：这些通常依赖于在大规模语料库中检索相关内容。为此，嵌入模型已针对文本检索进行了优化。

8.4 Content Moderation

Faiss的主要应用之一是大规模检测和补救有害内容。人工标记的违反政策的图像和视频示例使用模型（如SSCD）进行嵌入，并存储在Faiss索引中。为了决定新图像或视频是否会违反某些政策，多阶段分类管道首先嵌入内容并搜索Faiss索引以查找相似的标记示例，通常使用范围查询。结果聚合并通过额外的机器分类或人工验证进行处理。由于错误的影响很大，良好的表示应该区分感知上相似和不同的内容，即使在数十亿到万亿规模上，也需要准确的相似性搜索。

总结与展望：Faiss的未来发展方向

Faiss是一个专注于向量相似性搜索的工具库，它通过一系列方法实现了不同的权衡，包括训练时间、吞吐量、内存使用和准确性。本文提到的大多数用例和实验在Faiss的wiki页面中有更详细的介绍和相应的代码。Faiss的未来发展将继续关注优化和扩展其功能，以满足不断增长的工业和研究需求，特别是在处理大规模数据集和复杂查询方面。随着深度学习和人工智能应用的不断增长，Faiss将继续在高效、可扩展的相似性搜索领域发挥关键作用。

AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
Julia视频教程 Bounce_aaba
在网易云课堂上直接搜索：Julia教程，就可以找到，教程的全名是：Julia教程从入门到进阶这是国内第一个免费的完整的Julia视频教程，非常适合Julia的入门。有兴趣的朋友可以去学习一下。教程链接：https://study.163.com/course/courseMain.htm?share=2&shareId=480000001854445&courseId=1208959805&_tr
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
GEO + SEO+SMO：AI时代全域组合营销智***O 人工智能 GEO优化大数据 GEO AI搜索
在信息爆炸的时代，用户每一次搜索的背后，都是一次决策的起点。当AI工具逐渐成为人们获取答案的首选，如何让你的品牌在AI生成的回答中占据核心位置？如何让用户在不同平台搜索时，始终选择你？智火营销SEO+GEO+SMO组合营销策略，让品牌成为用户与“搜索”之间的桥梁。智火营销GEO服务一、SEO：巩固搜索生态的信任基石在AI工具与社交平台崛起的当下，传统搜索引擎仍是用户验证信息的重要场景。SEO（搜索
信息学奥赛-一本通-第二部分基础算法 --＞第五章搜索与回溯算法攻城丶狮 C++比赛信息算法深度优先图论 c++青少年编程
1317：【例5.2】组合的输出【题目描述】排列与组合是常用的数学方法，其中组合就是从n个元素中抽出r个元素(不分顺序且r≤n)，我们可以简单地将n个元素理解为自然数1，2，…，n，从中任取r个数。现要求你用递归的方法输出所有组合。例如n＝5，r＝3，所有组合为：123124125134135145234235245345【题目分析】1.搜索函数参数:上一次搜索的数字i(i(n)>=i(n-1))
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
IntelliJ IDEA 使用技巧与插件推荐：提升开发效率的终极指南海豹工匠 ide jetbrain JAVA 编程工具
在现代软件开发中，IntelliJIDEA作为一款功能强大的集成开发环境（IDE），深受开发者的喜爱。它不仅支持多种编程语言和框架，还提供了丰富的功能和插件，帮助开发者提高工作效率和代码质量。本文将深入探讨IntelliJIDEA的使用技巧和插件推荐，助您充分利用这款优秀的开发工具。目录IntelliJIDEA简介高效使用IntelliJIDEA的技巧快捷键大全代码导航与搜索高级重构实时错误检查与
网络爬虫：技术原理、应用场景与合法使用全攻略程序小武 python爬虫入门爬虫网络
爬虫是什么？网络爬虫（WebScraping或WebCrawling）是一种通过自动化方式从网站上抓取公开数据的程序。它通过模拟用户在浏览器中浏览网页的过程，访问网页、提取信息，并将数据保存到本地系统中。爬虫技术广泛应用于搜索引擎、数据收集、市场分析、信息聚合等多个领域。爬虫能做什么？数据收集爬虫可以高效地从互联网上的大量网站收集信息。比如，抓取新闻网站上的文章内容、商品电商平台的价格与库存数据、
POJ 156:LETTERS（dfs） Ctrl AC #POJ 深度优先算法
题目：忘题戳这题目大意：一个表格中每处有字母，从左上角开始走，不能经过重复的字母，看你最多能走多少个格子（包括左上角的起点格子）分析：一道非常典型的搜索题，寻路问题。深搜的同时，根据条件进入深搜（即没走过则进入，走过则跳过）用到的变量大概有，maxpos记录历史能走的最多的步数，nowpos记录当前走了多少格，visit[i]记录i点有没有走过，map[i][j]地图，还有行和列rc。小技巧：用字
流量深度链诺惜
自然流量：关键字搜索可比价款，趋势热销款，普通商品公司搜索，图片搜索，就是客户通过主页的推荐和搜索进入的就叫自然搜索流量，搜索流量：千人千面每个人搜索结果显示的商品不一样，结果是根据他本人定制的展示页面搜索流量：流量加权分为4个等级等级1新搜索上线之日起，商品在过去30天没有交易等级2新搜索上线之日起，商品在过去30天交易大于0，通过搜索指数，商品3级类目下排名在60%以外等级3，新搜索在线上之日
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
PostgreSQL 中的 pg_trgm 扩展详解 Yashar Qian 数据库(SQL)随笔 postgresql 数据库
PostgreSQL中的pg_trgm扩展详解pg_trgm是PostgreSQL提供的一个核心扩展，用于实现基于三元组(trigram)的文本相似度计算和高效搜索。它特别适合优化模糊匹配、部分匹配和相似度查询。核心功能三元组(trigram)概念：将字符串拆解为连续的3个字符组例如：“hello”→["h","he",“hel”,“ell”,“llo”,"lo"]主要用途：优化LIKE'%pat
LETTERS（dfs，搜索与回溯）ナナ色のブランク算法学习搜索与回溯算法 c++dfs
题目描述】给出一个roe×col的大写字母矩阵，一开始的位置为左上角，你可以向上下左右四个方向移动，并且不能移向曾经经过的字母。问最多可以经过几个字母。【输入】第一行，输入字母矩阵行数R和列数S，1≤R,S≤20。接着输出R行S列字母矩阵。【输出】最多能走过的不同字母的个数。【输入样例】36HFDFFBAJHGDHDGAGEH【输出样例】6题目分析：这属于dfs（深度优先搜索算法）。dfs带有三个
AI Agent从零到精通：深度解析Workflow、Prompt、Multi-Agent Systems和RL Training 爱看烟花的码农 AIGC NLP 人工智能 prompt
1.AI智能体简介：从概念到应用1.1什么是AI智能体？AI智能体是一种自主智能体，能够根据用户输入的目标，自主规划、执行和优化任务，最终生成结果。它不同于传统聊天模型（如ChatGPT）的单次回答能力，而是能处理多步骤、工具依赖、动态调整的复杂任务。例如：任务：用户要求“撰写一篇关于AI伦理的文章”。智能体行为：搜索资料、整理信息、撰写草稿、校对优化，全程无需用户干预。制造业场景（ManuS）：
2018-04-08 viper44
科技就是将复杂的事情简单化，所以智能手机的出现显著降低了我们学习的难度，只要善于使用搜索引擎，几乎能够获得所有的知识，而我们利用这些工具的姿势，会反过来决定我们未来的走向，所以一定不能做伸手党，能查到东西尽量自己去搜索，网上有很多现成的成功，我们要善于搜索，把节约的时间拿去干别的事生活中会面临很多突发状况，要如何才能从容面对呢，培养急智的最简单的方法就是列举出所有可能出现的问题，并对它们制定一些相
「DR」沉渊／柳瑱箫凌
站在黑暗的深处靠近光明的边缘刻铸最细腻的温情全世界只有不到3%的人微信搜索并且关注了箫凌你真是个特别的人策划：箫凌「fromOvertureStudio/角一文化」姓名：柳瑱生日：1993年12月4日星座：射手座Overture工作室/角一文化签约原创创作者作品：沉渊文案：柳瑱「fromOvertureStudio/角一文化」NOTE：其实我真不知道所谓创作构思要怎么写，那就罗列一些关于这个主题的
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
力扣 hot100 Day48 qq_51397044 Hot100 算法数据结构
35.搜索插入位置给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为O(logn)的算法。//自己写的classSolution{public:intsearchInsert(vector&nums,inttarget){intleft=0;intright=nums.size()-1;while(left
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name