翔底

Faiss(3)：基于IndexIVFPQ的demo程序

1. 说明

在研究Faiss库一段时间之后，做了一个简单的demo程序。这个程序在CPU环境下进行训练，GPU内进行搜索。使用IndexIVFPQ索引。

由于没有实际的图片库，这里使用numpy生成多维随机数组的方式来模拟数据检索的过程。

1.1 开发环境

参考Faiss(2)：编程环境搭建

1.2 程序总体流程

Faiss总体使用过程可以分为三步：

构建训练数据和查询数据，原始数据集以二维矩阵形式表达,矩阵每一行代表数据库中的一个数据，每一列代表数据库中所有数据的某个特征，每个数据为高维浮点矢量如64维，当数据库中数据量较大时，训练集规模远小于数据库。查询数据与训练数据类型和格式相同。这一步骤是离线进行，更新频率很低。
挑选合适配置参数建立Index（Faiss的核心部件），从数据库中选取训练数据训练并得到聚类中心向量，数据库数据通过add操作建立Index索引。这部分也是离线，更新频率高于上一步。
Search搜索，距离计算+比较得到最后结果。在线进行，目标是低延迟，高吞吐量。

2. 程序设计

1. 设置参数配置

nb = nb            # dataset numbers
nq = nq            # query numbers
nlist = nlist
nprobe = nprobe
topk = topk
d = 64             # dimension
m = 64             # sub quantizer
nbits = 8          # bits of per code

learning_ratio = lr   # 学习率

程序使用固定为64的维度，其中nb表示database，本文以1M数据量为例进行说明。

2. 准备测试样本集和训练集

# prep nq test samples
def CreateDataSet(nb, nq, d):
    # dataset
    np.set_printoptions(threshold = np.inf)
    np.random.seed(1234)

    xb = np.random.random((nb, d)).astype('float32')
    xb[:, 0] += np.arange(nb) / int(nb)
    
    # query
    xq = np.random.random((nq, d)).astype('float32')
    # xq[:, 0] += np.random.randint(low=0, high=1e6, size=nq) / int(1e5)
    xq[:, 0] += np.arange(nq) * 1.0/nq
    
    # prep learning
    learning = int(nb*learning_ratio)
    np.random.seed(900)
    learning_d = np.random.random((learning,d)).astype('float32')
    learning_d[:,0] += np.arange(learning) * 1.0/learning

    return xb, xq， learning_d

这里nq表示要查询的目标向量集中向量的个数。后续查询时，以向量集xq目标向量进行查询。
learning_d是用于训练的训练集，总数是database的十分之一 (nb * lr)，但是由不同的random seed产生不同的数据。

3. 创建index实例

def CreateIndex(nlist, d, m, nbits):
    quantizer = faiss.IndexFlatL2(d)
    index = faiss.IndexIVFPQ(quantizer, d, nlist, m, nbits)

    return index

IndexFlatL2本身也是一个索引，它是最简单的索引类型，只执行强力L2距离搜索。但是这里为了扩展到非常大的数据集，将其作为一个量化器来压缩存储的向量的变体。压缩的方法基于乘积量化。损失一定精度为代价，自身距离也不为0，这是由于有损压缩。

4. 训练、添加向量和搜索

# training
index.train(learning_d)

# add dataset
index.add(xb)

# search
D, I = index.search(xq, topk)

我这里使用的训练集是数据集的1/10。
search函数返回两个列表，D表示search结果的距离（float型）， I表示search结果向量的id号(int型)。

search函数（C++源代码中的实现）：

virtual void search (idx_t n, const float *x, idx_t k, float *distances, idx_t *labels) const = 0;
/*
 * n : 要查询的向量个数
 * x : 输入向量集，即要检索的向量，size: n*d
 * k : 输出向量集个数，即k邻
 * distances : 输出向量集对应的距离向量，size: n*k
 * labels : 输出向量集，size: n*k
*/

在python的接口中只留出两个参数：x和k，也就是说上述python代码分1000次检索xq_t[x]，输出100个近邻结果。

5.拷贝index到GPU中

co = faiss.GpuClonerOptions()
co.useFloat16 = True
res = faiss.StandardGpuResources()
index_gpu = faiss.index_cpu_to_gpu(res, 0, index, co)

这一步其实在创建index实例之后就可以进行，那么后续的train、add则直接调用index_gpu在GPU中进行，也可以在cpu中add和train之后再整体拷贝到GPU中。

由于我用的Tesla P4的shared memory只有48M，而当m设置为64时所需的shared memory为64M，所以我通过co.useFloat16=True来“useFloat16LookupTables”，否则会报如下错误：

Traceback (most recent call last):
  File "faiss/GPU_tim.py", line 132, in <module>
    main(nb, seg, lr)
  File "faiss/GPU_time.py", line 94, in main
    index
  File "/home/montage/.local/lib/python2.7/site-packages/faiss/__init__.py", line 485, in index_cpu_to_all_gpus
    index2 = index_cpu_to_gpu_multiple_py(res, index, co)
  File "/home/montage/.local/lib/python2.7/site-packages/faiss/__init__.py", line 477, in index_cpu_to_gpu_multiple_py
    index = index_cpu_to_gpu_multiple(vres, vdev, index, co)
RuntimeError: Error in void faiss::gpu::GpuIndexIVFPQ::verifySettings_() const at gpu/GpuIndexIVFPQ.cu:432: Error: 'requiredSmemSize <= getMaxSharedMemPerBlock(device_)' failed: Device 0 has 49152 bytes of shared memory, while 8 bits per code and 64 sub-quantizers requires 65536 bytes. Consider useFloat16LookupTables and/or reduce parameters

当然，也可以通过减小m的值来避免此项错误。

6. 计算结果的精确度

IndexIVFPQ的搜索结果的精确度是通过将结果与暴力搜索的结果进行比较得出的，将两者的结果求交集，可以知道每次搜索中有多少是重复的结果，再将交集数量除以topk就是精确度了。

暴力搜索可以直接使用IndexFlatL2索引进行，由于暴力搜索是简单的对向量进行依次比较，所以可以不进行训练。

# 暴力搜索
def ViolenceSearch(xb, xq, d, topk):
    print("start violence search")
    quantizer = faiss.IndexFlatL2(d)
    quantizer.add(xb)
    D, I = quantizer.search(xq, topk)

def CalAccuracy(nq, I, refI, topk):
    print("calculate accuracy...")
    rec = np.zeros(nq)
    for i in range(nq):
        rec[i] = 1.0 * len(set(I[i][:]).intersection(set(refI[i][:])))/topk
    
    accu = sum(rec)*1./nq * 100
    return accu

注：为了在多种参数配置下节省时间，我将各个步骤进行单独封装，以便调用，在实际开发过程中可根据需要，不一定需要按照相同步骤进行。

3. 运行程序及结果

略

你可能感兴趣的:(Faiss)

LLM之向量数据库Chroma milvus FAISS maxmaxma 数据库 milvus faiss
以下是Chroma、Milvus和FAISS的核心区别，从功能定位、架构设计、性能及应用场景等维度进行对比：一、功能定位Chroma轻量级向量数据库：专注于快速构建中小型语义搜索原型，提供简单易用的API，适合快速集成到现有应用中。特点：支持近似最近邻搜索（ANN）、实时性能优化，但对大规模数据处理能力有限。Milvus分布式向量数据库：专为超大规模向量数据设计，支持云原生架构和高可用性，适合企业
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[5]-高阶实战微调汀、人工智能 LLM工业级落地实践 LLM技术汇总 langchain 人工智能大模型推理大模型微调 p-tuning fastchat RAG
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[5]-高阶实战微调1.推荐的模型组合在默认的配置文件中，我们提供了以下模型组合LLM:Chatglm2-6bEmbeddingModels:m3e-baseTextSplitter:ChineseRecursiveTextSplitterKb_dataset:faiss我们推荐开发者根据自己的业务需求进行模型微调，如果不需
RAG技术的PDF智能问答系统 AI Echoes 深度学习
关键要点系统基于RAG（检索增强生成）技术，允许用户上传PDF并进行智能问答。使用Ollama的deepseek-r1模型和FAISS向量数据库，支持普通对话和基于PDF的问答模式。提供简洁的Web界面，支持文件拖拽上传和多轮对话。研究表明，系统适合处理PDF内容查询，但性能可能因PDF复杂性而异。系统概述这个PDF智能问答系统是一个基于RAG技术的工具，旨在帮助用户通过上传PDF文件进行智能交互
Python和FastAPI框架开发和容器化部署AWS上支持多种LLM和向量数据库的微服务API weixin_30777913 python 语言模型微服务 aws
用FastAPI创建一个输入提示词和所使用的LLM名称和向量搜索方式的API，返回LLM输出文本，其中用到OpenAIGPT4o3和AWSBedrock上的多个LLM模型的API，通过内部的类配置使用的模型和向量数据搜索类型，向量数据搜索类型包括faiss向量数据库和AWSKendra向量数据库搜索服务，这样的逻辑用设计模式中的工厂模式实现，用Python实现Docker打包项目Python代码并
打造RAG系统：四大向量数据库Milvus、Faiss、Elasticsearch、Chroma 全面对比与选型指南橙子小哥的代码世界数据库数据库 milvus faiss 人工智能深度学习神经网络 elasticsearch
在当今信息爆炸的时代，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）系统已成为自然语言处理（NLP）领域的重要工具。RAG系统通过结合生成模型和信息检索技术，能够在大规模数据中高效地获取相关信息，生成更为精准和有针对性的内容。而在构建RAG系统时，选择合适的向量数据库是确保系统性能和可扩展性的关键一步。本文将深入对比四大主流向量数据库——Milvus、Fai
大模型与图数据库RAG通俗流程拆解 gallonyin 产品笔记 AI 知识图谱
图构建（略）neo4j、tugraph等均可，不影响GraphRAG核心框架模型向量化模型bce-embedding-base_v1重排序模型bce-reranker-base_v1大语言模型Qwen/Qwen2.5-32B-Instruct图数据库tugraph索引faiss核心流程这个调用链日志展示了一个完整的问答系统处理用户输入“百草园里有什么”的过程。本项目使用和参考了开源项目茴香豆。以下
文档进行embedding，Faiss向量检索被编程为难的小娃娃 embedding faiss
这里采用Langchain的HuggingFaceEmbeddings参照博主，改了一些东西，因为Langchain0.3在0.2的基础上进行了一定的修改fromlangchain.text_splitterimportRecursiveCharacterTextSplitterfromlangchain_huggingfaceimportHuggingFaceEmbeddingsfromlang
Qwen1.5-7B-实现RAG应用详细步骤大数据追光猿大模型数据库 AI编程语言模型人工智能深度学习
1.准备工作1.1安装依赖确保你的环境中安装了以下工具和库：Python：建议使用Python3.8或更高版本。PyTorch：用于运行深度学习模型。Transformers：HuggingFace提供的库，支持加载和运行预训练模型。FAISS：用于向量检索的高效库。GPTQ支持库：如auto-gptq或gptqmodel。安装命令运行以下命令安装所需的Python包：pipinstalltorc
【微服务】SpringBoot 整合Redis Stack 构建本地向量数据库相似性查询小码农叔叔 AI大模型实战与应用 springboot 入门到精通向量数据库 redis stack java使用向量数据库
目录一、前言二、向量数据库介绍2.1什么是向量数据库2.2向量数据库特点2.3向量数据库使用场景三、常用的向量数据库解决方案3.1Milvus3.1.1Milvus是什么3.1.2Milvus主要特点3.2Faiss3.2.1Faiss是什么3.2.2Faiss主要特点3.3Pinecone3.3.1Pinecone是什么3.3.2Pinecone主要特点3.4Weaviate3.4.1Weavi
RagFlow专题三、RagFlow 关键技术（向量数据库、文档分块、Prompt 设计与召回排序优化）伯牙碎琴大模型 prompt 大模型 AI Rag RagFlow
深入解析RagFlow关键技术：向量数据库、文档分块、Prompt设计与召回排序优化在前一篇文章中，我们详细探讨了RagFlow的核心架构，包括数据检索、语义搜索（BM25&向量搜索）以及知识融合，并了解了如何通过RagFlow机制优化信息检索和生成质量。本篇文章将深入解析RagFlow的关键技术，包括：向量数据库（FAISS、Milvus、Elasticsearch）——负责高效的语义检索与存储
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[6]-实现Milvus向量检索+实现自定义关键词调整Embedding模型汀、人工智能 LLM工业级落地实践 langchain milvus embedding 人工智能自然语言处理语言模型大模型
基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[6]-实现Milvus向量检索+实现自定义关键词调整Embedding模型0.Milvus与Faiss对比Milvus相对于Faiss的优势主要体现在以下几个方面：在线数据更新与实时搜索：Milvus支持在线的数据更新和实时的向量搜索，这意味着在数据频繁变动的场景下，用户无需重新构建整个索引，从而大大减少了维护成本。相比之
用Meta的开源工具打造AI驱动的应用：LASER、Faiss与聊天加载器示例 dgay_hua 人工智能 faiss python
MetaPlatforms（原Facebook）在AI技术领域持续创新，推出了多个优秀的开源工具，比如用于多语言句子嵌入的LASER、用于高效相似性搜索的Faiss，以及用于加载和处理Messenger和WhatsApp聊天记录的工具。这些工具可以帮助开发者快速构建AI驱动的应用。在本文中，我们将深入介绍这些工具的功能，并通过可运行的代码示例展示如何将它们应用到实际项目中。技术背景介绍LASER（
向量数据库实战介绍 Zhank10 数据库
本文将介绍三种常用的向量数据库：faiss,Milvus和Qdrant，并给出一个具体的使用例子。向量数据库（VectorDatabase）是一种专门用于存储、管理、查询、检索向量的数据库，主要应用于人工智能、机器学习、数据挖掘等领域。在向量数据库中，数据以向量的形式进行存储和处理，需要将原始的非向量型数据转化为向量表示（比如文本使用Embedding技术获得其表征向量）。这种数据库能够高效地进行
15.4 FAISS 向量数据库实战：构建毫秒级响应的智能销售问答系统少林码僧 AI大模型应用实战专栏 faiss 数据库 gpt 架构语言模型
FAISS向量数据库实战：构建毫秒级响应的智能销售问答系统关键词：FAISS向量数据库、销售知识库构建、相似度检索优化、大规模问答匹配、量化索引技术1.销售问答场景的向量化挑战与解决方案1.1传统检索方案痛点分析
[深入探索USearch：快速高效的单文件向量搜索引擎] stjklkjhgffxw python
引言在数据科学和机器学习领域，最近出现了许多用于近似最近邻搜索（ApproximateNearestNeighbors,ANNS）的工具。尽管FAISS已经是一个非常流行的选择，USearch以其紧凑性和无与伦比的速度正迅速获得关注。USearch不仅仅是一个更小、更快的向量搜索引擎，它还提供了高兼容性和用户自定义指标的灵活性。本文将引导您了解如何安装和使用USearch，并对其与FAISS的主要
如何利用USearch实现快速向量搜索：更轻量、更高效的替代方案 sdfugyd python
引言向量搜索在现代机器学习和信息检索中扮演着重要角色。无论是图像检索、文本相似度计算还是推荐系统，向量搜索都是核心技术之一。本文将介绍一个轻量级、高效的向量搜索引擎——USearch。这种引擎与FAISS在功能上相似，但在设计上更为精简，具备更高的兼容性。接下来，我们将详细讲解如何安装和使用USearch，并提供实用的代码示例。主要内容1.USearch与FAISS的对比USearch的基础功能与
USearch: 高效紧凑的单文件向量搜索引擎 eahba 搜索引擎 python
技术背景介绍近年来，向量搜索技术被广泛应用于诸如推荐系统、图像检索和自然语言处理等领域。FAISS是一个广泛使用的向量搜索库，但我们今天要介绍的是USearch，它是一个更小、更快的单文件向量搜索引擎。虽然USearch和FAISS都采用了HNSW（HierarchicalNavigableSmallWorld）算法，其设计原则和用户体验却有所不同。核心原理解析HNSW算法利用了小世界网络的特性，
【USearch：小型高效的单文件向量搜索引擎揭秘】 afTFODguAKBF python 开发语言
引言在处理大规模数据时，向量搜索引擎扮演着无可替代的角色。本文将介绍USearch，一种小型而快速的单文件向量搜索引擎。我们将探讨其工作原理、安装方法，并通过代码示例展示其应用。主要内容USearchvsFAISSUSearch的基本功能与FAISS相同，都是基于HNSW算法的近似最近邻搜索。然而，USearch在设计上更注重简约和用户自定义指标，同时兼容FAISS，且依赖更少。设计原则紧凑性：U
使用USearch进行快速高效的向量搜索 dgay_hua python
USearch是一款简洁高效的单文件向量搜索引擎，其基本功能与FAISS相同。如果您曾研究过近似最近邻搜索，那么USearch的接口会让您感到熟悉。FAISS是公认的高性能向量搜索引擎标准，而USearch和FAISS都采用了相同的HNSW算法。然而，USearch在设计理念上与FAISS有显著不同，它更加紧凑并且具有广泛的兼容性，同时并不牺牲性能，重点在于用户自定义度量和减少依赖关系。核心原理解
【拥抱AI】如何使用Milvus向量数据库进行数据库检索？奔跑草- 人工智能人工智能 milvus 数据库
使用向量数据库进行数据库检索是一种高效的方法，特别是在处理大规模、高维度的数据时。以下是详细的步骤，帮助你理解和实施这一过程：1.准备环境选择向量数据库常见的向量数据库有：Faiss：由FacebookAIResearch开发，适用于大规模向量搜索。Milvus：开源的向量数据库，支持多种索引类型和相似度度量。Elasticsearch：虽然主要是全文搜索引擎，但也支持向量搜索功能。安装和配置根据
Milvus向量数据库操作教程 2401_85763639 milvus 数据库
Milvus是一款专为向量数据设计的数据库，它具备高性能、高可用和易扩展的特点，主要用于处理由深度神经网络和其他机器学习模型生成的大规模嵌入向量[162][165]。以下是Milvus向量数据库的详细解释：定义与用途：Milvus是一个云原生向量数据库，专为海量向量数据的实时召回而设计。它基于FAISS、Annoy、HNSW等向量搜索库构建，主要解决稠密向量相似度检索的问题[163]。核心优势：高
向量数据库技术全景萌之哧哧数据库
本文深入探讨了向量数据库的基础概念、架构设计及实现技术，详细介绍了HNSW、FAISS和Milvus等关键算法和工具，旨在为高效管理和检索高维向量数据提供全面的技术指南。关注TechLead，复旦博士，分享云服务领域全维度开发技术。拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，复旦机器人智能实验室成员，国家级大学生赛事评审专家，发表多篇SCI核心期刊学术论文，阿里云认证的资深架构师，
Qwen 模型自动构建知识图谱，生成病例 + 评价指标优化策略 2301_79306982 ai 千问语言模型人工智能
关于数据库和检索方式的选择AIMedicalConsultantforVisualQuestionAnswering(VQA)系统：更适合在前端使用向量数据库（如FAISS）结合关系型数据库来实现图像和文本的检索与存储。因为在VQA场景中，你需要对患者上传的图像或文本症状进行语义向量化，以便快速查找相似病例或相关医学图像内容；同时用关系型数据库维护患者基础信息和简单的交互记录即可。AI-Power
Langchain本地知识库部署 MaxCode-1 langchain
本地部署（Docker+LangChain+FAISS）1.概述本地部署LangChain-Chatchat可以为企业提供高效、安全、可控的AI知识库方案。本方案基于Docker、LangChain和FAISS进行本地化部署，适用于企业内部知识库问答、私有化AI应用等场景。2.技术选型2.1LangChainLangChain是一个开源的LLM（大语言模型）应用开发框架，支持多种模型和数据源，适用
编译安装PaddleClas@openKylin（失败，安装好后报错缺scikit-learn） skywalk8163 操作系统人工智能 kylin PaddleClas
编译安装前置需求：手工安装swig和faiss-cpupipinstallswigpipinstallfaiss-cpu小技巧，pip编译安装的时候，可以加上--jobs=64来多核编译。注意先升级pip版本：pipinstallpip-Upip3installfaiss-cpu--config-settings="--jobs=64"--global-option="--jobs=4"还有一种方
【人工智能时代】- 开源向量数据库比较：Chroma, Milvus, Faiss,Weaviate xiaoli8748_软件开发人工智能时代人工智能开源数据库
语义搜索和检索增强生成(RAG)正在彻底改变我们的在线交互方式。实现这些突破性进展的支柱就是向量数据库。选择正确的向量数据库能是一项艰巨的任务。本文为你提供四个重要的开源向量数据库之间的全面比较，希望你能够选择出最符合自己特定需求的数据库。什么是向量数据库?向量数据库是一种将数据存储为高维向量的数据库，高维向量是特征或属性的数学表示。每个向量都有一定数量的维度，根据数据的复杂性和粒度，可以从数十到
使用FAISS进行高效相似性搜索与向量存储 dagGAIYD faiss python
技术背景介绍FacebookAISimilaritySearch(FAISS)是一个用于高效相似性搜索和稠密向量聚类的库。它能够在任意大小的向量集合中进行搜索，即使这些集合可能无法完全加载到内存中。FAISS提供了评估与参数调优的支持代码，使得它在处理大型数据集时非常实用。核心原理解析FAISS的核心在于其利用高效的数据结构和算法，如倒排文件和压缩索引，使得大量向量的相似性搜索成为可能。它主要通过
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他