faiss-4:选择合适的index类型

选择index类型并没有一套精准的法则可以依据，需要根据自己的实际情况选取。

下面的几个问题可以作为选取index的参考：

是否需要精确的结果

如果需要，应选择使用Flat，只有IndexFlatL2 能确保返回精确结果。一般将其作为baseline与其他索引方式对比，以便在精度和时间开销之间做权衡。
但是Flat方式不支持add_with_ids, 如果需要，可以使用IDMap, Flat ，支持GPU

# 导入faiss
import sys
import faiss
import numpy as np 

# 构建数据
d = 512       # 维数
n_data = 2000   
np.random.seed(0) 
data = []
mu = 3
sigma = 0.1
for i in range(n_data):
    data.append(np.random.normal(mu, sigma, d))
data = np.array(data).astype('float32')

# ids, 6位随机数
ids = []
start = 100000
for i in range(data.shape[0]):
    ids.append(start)
    start += 100  # id间隔是100， [100000 100100 100200 ... 299700 299800 299900]
ids = np.array(ids)

Flat不支持add_with_ids

index = faiss.index_factory(d, "Flat")
index.add(data)
dis, ind = index.search(data[:5], 10)
print(ind)

[[   0  798  879  223  981 1401 1458 1174  919   26]
 [   1  981 1524 1639 1949 1472 1162  923  840  300]
 [   2 1886  375 1351  518 1735 1551 1958  390 1695]
 [   3 1459  331  389  655 1943 1483 1723 1672 1859]
 [   4   13  715 1470  608  459  888  850 1080 1654]]

使用IDMap, Flat支持add_with_ids

index = faiss.index_factory(d, "IDMap, Flat")
index.add_with_ids(data, ids)
dis, ind = index.search(data[:5], 10)
print(ind)   # 返回的结果是我们自己定义的id

[[100000 179800 187900 122300 198100 240100 245800 217400 191900 102600]
 [100100 198100 252400 263900 294900 247200 216200 192300 184000 130000]
 [100200 288600 137500 235100 151800 273500 255100 295800 139000 269500]
 [100300 245900 133100 138900 165500 294300 248300 272300 267200 285900]
 [100400 101300 171500 247000 160800 145900 188800 185000 208000 265400]]

关心内存开销

faiss在索引时必须将index读入内存中，如果不需要精确的结果, 并且内存有限, 那么在有限的内存中，要在精确与速度之间做出平衡。

如果不在意内存占用空间，使用“HNSWx”

如果内存空间很大，数据库很小，HNSW是最好的选择(基于图检索的方式)，速度快，精度高，一般4<=x<=64。不支持add_with_ids，不支持移除向量，不需要训练，不支持GPU。

index = faiss.index_factory(d, "HNSW8")  # 选择HNSW8
index.add(data)
dis, ind = index.search(data[:5], 10)
print(ind)

[[ 879  981   26 1132  807 1639 1334 1832 1821  827]
 [   1  981 1524 1639 1949 1472 1162  923  300 1029]
 [   2 1886  375 1351  518  390 1707 1080 1832 1398]
 [   3 1459  331  389  655 1483 1723 1672 1859  650]
 [   4   13  715 1470  608  459  850 1080 1654  665]]

可以看到第一个结果没有检索正确。

如果稍微有点在意，使用“…, Flat“

"…"是聚类操作，聚类之后将每个向量映射到相应的bucket。该索引类型并不会保存压缩之后的数据，而是保存原始数据，所以内存开销与原始数据一致。通过nprobe参数控制速度/精度。
支持GPU,但是要注意，选用的聚类操作必须也支持

index = faiss.index_factory(d, "IVF100, Flat")
index.train(data)
index.add(data)
dis, ind = index.search(data[:5], 10)
print(ind)

[[   0  879  981 1401  919  143    2  807 1515 1393]
 [   1  511 1504  987  747  422 1911  638  851 1198]
 [   2  879  807  981 1401 1143  733  441 1324 1280]
 [   3  740  155 1337 1578 1181 1743  290  588 1340]
 [   4 1176  256 1186  574 1459  218  480 1828  942]]

如果很在意，使用”PCARx,…,SQ8“

如果保存全部原始数据的开销太大，可以用这个索引方式。包含三个部分，

降维
聚类
scalar量化，每个向量编码为8bit 不支持GPU

index = faiss.index_factory(d, "PCAR16,IVF50,SQ8")  # 每个向量降为16维
index.train(data)
index.add(data)
dis, ind = index.search(data[:5], 10)
print(ind)

[[   0  289  671  798 1144  916   31 1512 1716  238]
 [   1 1008  698  206  657  294  383  700  574 1968]
 [   2 1594  754 1850  266  559  774  154 1723 1949]
 [   3 1778 1740 1750  593 1174  572 1852  696 1298]
 [   4 1457  466 1604 1951  912  804  736  362  750]]

如果非常非常在意，使用"OPQx_y,…,PQx"

PQx表示使用x-byte量化向量，一般 $x < = 64$ ，OPQ是一个线性变换，使得其更容易被压缩。

y需要是x的倍数，一般保持y<=d，y<=4*x（推荐y=4*x），支持GPU

index = faiss.index_factory(d, "OPQ32_128,IVF50,PQ32")  
index.train(data)
index.add(data)
dis, ind = index.search(data[:5], 10)
print(ind)

[[   0 1334  807  123   26 1122  769 1966   30  400]
 [   1   20  959  992 1492  911  566  790  145 1794]
 [   2   21 1966 1886  123  769 1171 1883 1850  807]
 [   3   92 1523  271 1934 1793 1090 1067 1299  302]
 [   4 1801  764  753  255 1610 1305  240  734 1031]]

关心数据集的大小

该问题用于聚类选项（上面的...）。将数据集群集到存储桶中，并在搜索时，仅访问桶的一小部分（nprobe存储桶）。对数据集向量的代表性样本执行聚类，通常是数据集的样本。

如果小于1M，使用"…,IVFx,…"

N是数据集中向量个数，x一般取值[4*sqrt(N),16*sqrt(N)],需要30*x ～ 256*x个向量的数据集去训练，支持GPU

如果大于1M，小于10M，使用"…,IVF65536_HNSW32,…"

IVF与HNSW结合使用，使用HNSW进行聚类分配。需要在30*65536和256*65536个向量进行训练，不支持GPU

如果大于10M，小于100M，使用"…,IVF262144_HNSW32,…"

与上面类似，只是用262144（2^{18）替换65536(2}16).

注意，该训练非常慢。支持GPU训练，请参与：[train_ivf_with_gpu.ipynb](https://gist.github.com/mdouze/46d6bbbaabca0b9778fca37ed2bcccf6)

如果大于100M，小于1B，使用"…,IVF1048576_HNSW32,…"

与上面类似，只是用1048576（2^20）代替65536，该训练更慢

参考

http://www.bdata-cap.com/newsinfo/39514.html
https://zhuanlan.zhihu.com/p/357414033
https://github.com/facebookresearch/faiss/wiki/Guidelines-to-choose-an-index
https://github.com/liqima/faiss_note

你可能感兴趣的:(图像搜索,python,faiss,index,选择)

Python中定义函数有哪些方法？老男孩IT教育 python 开发语言
在Python中，函数是组织好的，可重复使用的，用来实现单一，或相关联功能的代码块，它可以提高应用的模块性，和代码的重复利用率。那么Python如何定义一个函数?以下是具体内容介绍。在Python中定义函数有多种方法。最常见的方法是使用def关键字，后跟函数名称和一对圆括号。语法：def函数名称(参数1，参数2，...):函数体示例：定义一个名为greet的函数，它接受一个name参数并打印一条问
如果青青河边草Grace
我的图文如果我选择了沉默，不是我理屈词穷了。只是你那么执拗，我执着不过，放弃；如果我选择了附和，不是我心悦诚服了。你期望得到肯定，我给你好了，奉上；如果我选择了远离，不是我漠不关心了。你的难过装太满，我怕淹我快乐，躲开！人生苦短，莫用悲伤来填；生活不易，需要积极面对；过好当下，且行且享且珍惜！
高仿皮带在哪里有卖，推荐十个购买渠道桃朵桃朵
高仿皮带是一种常见的配饰，许多人都想要购买一条高仿皮带以搭配自己的服装。然而，在购买高仿皮带时，许多人会遇到一些问题，比如不知道在哪里购买以及如何选择适合自己的高仿皮带。本文将为你推荐十个购买高仿皮带的渠道，让你能够轻松地找到适合自己的高仿皮带。【更多详情加薇信了解：FB2260】1.官方网站官方网站是一个非常可靠的购买渠道。许多高仿皮带品牌都有自己的官方网站，可以直接在网站上购买。官方网站上的高
海淘免税店app都是假货吗?海淘免税店app靠谱吗高省爱氧惠
海淘免税店app并不都是假货，整体来说，海淘免税店app还是比较靠谱的。海淘免税店app作为目前比较流行的海淘市场，在圈中人气还是不错的，价格较为低廉。但也不排除一些商家为了盈利选择销售假货的行为，所以大家还是要仔细辨别。首先来推荐做淘客赚钱，经过十多年的发展淘客市场非常大，网购用户都是你的目标群体，在氧惠APP创业，大家只要坚持分享就有钱赚。最重要的是零投资！！！分享出去只要这个人网购，你就有钱
《格言联璧》学问类：聪明用于正路，愈聪明愈好十四施无畏力
《格言联璧》是清代学者金缨（yīng）所著，他用数年功夫，遍览经史典籍和先哲语录；将流传于世的格言，分为学问，存养，持躬（gōng），摄生，敦（dūn）品，处事，接物，齐家，从政，惠吉以及悖（bèi）凶等十一类。整本书收录古圣先贤的名言警句，经过作者精心选择，将最为精华的内容展现出来，全篇读来琅琅上口。现在来具体聊一聊该书《学问类》这一章节：1.聪明用于正路，愈聪明愈好，而文学功名益成其美；聪明用
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
9.单细胞 RNA-seq：聚类分析 denghb001
学习目标：利用多种方法来评估聚类选择的PC基于重要的PC执行单细胞聚类单细胞RNA-seq聚类分析现在我们已经整合了高质量的细胞，我们想知道我们的细胞群中存在的不同细胞类型。image目标：为了生成特定细胞类型的簇，并使用已知的细胞类型的标志基因来确定的簇的身份。为了确定分群是否代表真实的细胞类型或由于生物或技术差异而形成的群集，如在细胞周期的S期的细胞群，特定批次的簇，或具有高线粒体含量的细胞。
如何设计实现完成一个FPGA项目芯作者 D1：verilog设计 D1：VHDL设计 fpga开发
设计并完成一个FPGA项目是一个复杂但非常有价值的工程任务。以下是一个详细的步骤指南，帮助你从零开始完成一个FPGA项目。1.项目定义与需求分析确定项目目标：明确项目要实现的功能和性能指标。需求分析：列出所有功能需求、性能需求、接口需求等。可行性分析：评估技术可行性、成本和时间预算。2.硬件选择FPGA芯片选择：根据项目需求选择合适的FPGA芯片（如Xilinx、Intel/Altera、Latt
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
2022-07-03 回归的只要你愿意
卷一——个人第一次写作长篇纪实感情文学----别了薇薇安丢失【别了薇薇安】的文稿已经六年,中间的曲折原因不在重述，但是转眼回响，如果，我是说如果当年的几次人生转折点，我是否会仍然像这样的选择呢，或许人生就是如此，你不能掌握什么、决定什么，总有上帝最好、最美善的预备。所以，我还是我---我自孤傲、孑然一身；薇薇安呢，已经有了她最美好的人生，幸福的家庭。我们呢，不复再见。补序于2022年6月24日星期
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
基于鸿蒙API10的RTSP播放器(二：视频切换实现) PlumCarefree 鸿蒙实战：RTSP播放器音视频华为 harmonyos
目标：设置一个播放下一个视频的按钮，通过改变url地址实现✔设置一个视频播放底部轨道，轨道左侧固定为00:00，右侧为当前已经播放的时长差✖设置音量调节按钮，再实现滑动增减音量发✖//这里为ArkTS代码，标记为ts只是为了上色好看。注意代码放置位置//1.播放位置状态变量，在结构体之外letlocationIndex:number=0;//2.设置url组，苹果测试地址，最快@Statepriv
Python 集成快递物流 API 助力订单追踪：轻松实现物流可视化幂简集成 API实战指南 python 开发语言 API
嗨，亲爱的读者们！你是否曾经在购物的时候对订单状态感到无比焦急？是不是经常会忍不住去刷新页面，希望能看到快递小哥已经出发的消息？别担心，今天我们要聊的是一种神器，它能让你轻松实现订单的实时追踪——那就是快递物流API。通过Python代码的力量，你可以将这项功能集成到你的网站或应用中，随时随地掌握包裹的动态信息。这篇文章，我们将手把手教你如何使用Python与韵达的快递物流API来实现一个高效的物
python-logging库冰美式QAQ python学习
1.logging模块简介logging模块是Python内置的标准模块，主要用于输出运行日志，可以设置输出日志的等级、日志保存路径、日志输出格式等2.logging库日志级别级别级别数值使用时机DEBUG10详细信息，常用于调试INFO20程序正常运行过程中产生的一些信息WARNING30警告用户，虽然程序还在正常工作，但有可能发生错误ERROR40由于更严重的问题，程序已不能执行一些功能了CR
一文理解 Python 中的环境变量简讯Alfred 和我一起零基础学 Python 简明python教程零基础学python python 环境变量
你好，我是简讯！一枚野生程序员。热爱编程，但目前的工作与编程毫无关系。正在尝试各种副业，目前有做：红包封面商城：如何利用红包封面打造副业购物平台赚取佣金：利用淘宝京东等平台优惠券赚取佣金编辑器使用Neovim多一点，如果你也喜欢使用Nvim，我们可以一起交流。我的Nvim配置：https://github.com/alpha87/nvim。个人公众号经常会分享一些编程相关的文章，还有一些我已经操作
python 标准库之openpyxl的常规操作真的学不了一点。。。 Python学习 python
目录openpyxl（Excel文件处理模块）读sheet读sheet中单元格合并单元格openpyxl模块基本用法安装方法基本使用读取Excel文档（一）获取工作表（二）获取单元格（三）获取行和列写入Excel文档（一）写入单元格（二）保存文件设置单元格样式（一）字体（二）对齐方式（三）边框（四）设置行高和列宽（五）合并和拆分单元格openpyxl(Excel文件处理模块)读sheet读取Exc
Python实时聊天室架构与API实战应用幂简集成 python
尊敬的各位读者，欢迎参与本次共享研讨项目——利用Python构建实时聊天室。在本项目中，我们将引进一款前沿工具——发布订阅频道API，以实现聊天室内的实时交互功能。在当今信息泛滥的社会环境下，实时交流已成为人们日常生活中不可或缺的组成部分。不论是社交平台上的即时通讯，抑或是网络游戏中的实时对决，实时通信技术始终在幕后默默支持着我们的每一次互动。今日，让我们共同踏入Python的奇妙世界，亲手打造专
python离线安装pip 于光yuguang python pip 开发语言
如果您的服务器没有互联网连接，您仍然可以通过其他方式将pip安装到服务器上。以下是一种可能的方法：方法一：离线安装下载pip安装文件：在另一台联网的计算机上，下载pip的安装文件（.whl文件）以及其依赖项的安装文件（如果有）。可以从PyPI下载pip的.whl文件。传输文件：将下载的.whl文件和依赖项文件通过USB等方式传输到没有互联网的服务器上。安装pip：在服务器上，使用pip的安装文件进
DAY5硬币的字&花小苏糖
我记得以前我遇到自己无法抉择的事情都会抛硬币，正反面来决定最终的结果。后来我不敢再拿起硬币抛出去，我很害怕得到的不是我想要的答案。自从毕业进了事务所工作，我就明白这条路需要考证、攒经验，是很辛苦的但我并不后悔。一个月前我为了看书复习考证，萌生了辞职的念头，我不知道自己的选择对不对，我问了我的朋友们，他们各执一词，还是需要我自己来抉择，我犹豫了两天后向领导说了我的想法，领导答应给我两个月的假让我全力
python 编译器spyder 安装_离线安装spyder的Python环境 weixin_39552037 python 编译器spyder 安装
一、介绍：要求在不联网、无法使用anaconda的情况下，在一台离线的win7设备上配置Spyder的python的开发环境，用于提高数据处理效率，且安装方法在win732位和64位的各种设备上均可流畅安装。二、问题难点总结：1.离线安装Python的第三方函数库Python在联网情况下安装第三方包很容易，但离线安装操作比较复杂，如某第三方库a，联网状态下仅一行代码pipinstalla，然而离线
pycharm 运行celery_python远程调试及celery调试夏小龙 pycharm 运行celery
部分来自from:https://www.xncoding.com/2016/05/26/python/pycharm-remote.html你是否经常要在Windows7或MACOSX上面开发Python或Web应用程序，但是它们最后需要在linux上面来运行呢？我们经常会碰到开发时没有问题但是到了正式的Linux环境下面却出现问题。那么怎样保证开发环境跟运行环境的一致呢？通常有两种方法解决。一
QT与Python混合编程经验记录 weixin_30237281 python 人工智能 c/c++
1、如何embeddingpython,Python文档中有专门一章阐述https://docs.python.org/3.5/extending/embedding.htm；1、库文件：在vs--c/c++--附加包含文件中添加目；链接中也要添加，：将python中的include,libs二个目录添加进来2、对于Python，没有调试库，可直接将运行库复制一份，名称后面加上_d，就可用，可不能
python爬虫(5)之CSDN It is a deal️ 小项目 python json 爬虫
CSDN的爬虫相对于doubatop250更加简单，一般只需要title和url即可下面是相关的代码：#爬虫之csdn#分析urlhttps://www.csdn.net/api/articles?type=more&category=python&shown_offset=0（firstpage）#https://www.csdn.net/api/articles?type=more&categ
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
田里种什么药材最赚钱种植周期短利润高的药材高省APP
种植药材是最近几年非常火爆的种植项目，因为很多人发现现在种植粮食不仅不赚钱了，甚至还会陪钱，所以很多农民都放弃了种植粮食。但是不种粮食也不能让土地荒废着吖，于是很多人都选择种起了收益较高的药材来了。种植药材有的品种能赚钱，有的也不怎么赚钱，因此也要选对品种才行，下面我给大家整理了几种比较合适的药材种植品种，以供参考！。高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享
【Python】离线/无网/内网安装第三方库的一种方法 qilei2010 Python python 开发语言后端
有时候，我们使用的电脑没有接入互联网，或者是内部网络电脑，又或者是单机无网络，这时候使用Python，就不能自由的使用pipinstall命令了。下面是一种比较简单的无互联网安装第三方Python库的方法。此方法利用pipfreeze命令从已安装第三方库的电脑上移植库到内网电脑上。注意：以下命令中的D:\pkg文件夹需要自己提前创建。1.准备互联网电脑，优盘，无互联网电脑（下称无网电脑）无网电脑要
利用Python3爬取下载bookset网站的kindle电子书 nobodyyang
突然间发现这个网站，可以下载很多kindle电子书。观摩了下，和前段时间刚写的爬取头条有点类似。该网站链接首页：https://bookset.me/，这次爬取排行榜链接：https://bookset.me/?rating=douban，打开观察发现排行榜其实真正分页规则是https://bookset.me/page/num?rating=douban，其中num代表页数。具体代码如下
python离线安装一个第三方库 Lhj0616 python相关 python 第三方库
文章目录实例步骤下载`xlwt`库将文件转移到目标机器在目标机器上安装`xlwt`验证安装总结步骤可能的问题解决方法检查库的兼容性使用`pip`下载适配特定Python版本的库创建虚拟环境创建虚拟环境（Python3.6）创建虚拟环境（Python3.11）检查和验证库的安装下载多个版本的`.whl`文件总结更新：下载的第三方库有依赖库解决方案实例想离线安装一个第三方库xlwt，python版本分
Python中模块和包的概念及其区别 Good_tea_h python 开发语言
Python中模块和包的概念及其区别在Python中，模块（Module）和包（Package）是组织代码、提高代码重用性和可维护性的重要工具。它们各自扮演着不同的角色，并在Python程序设计中发挥着关键作用。以下将详细阐述模块和包的概念以及它们之间的主要区别。一、模块的概念定义：在Python中，模块是一个包含了函数、类和变量定义的文件。这些文件通常以.py作为文件扩展名。任何.py文件都可以
Nacos 与 Eureka 的区别 litGrey 微服务 eureka
随着微服务架构的流行，服务发现成为了构建分布式系统的关键技术之一。在众多服务发现工具中，Nacos和Eureka是两个非常受欢迎的选择。本文将深入探讨这两者的区别，帮助你在选择适合自己的服务发现解决方案时做出明智的决策。如果你不懂得怎么选择，请记得看最后一点小建议！1.基础对比1.1.架构设计：集中式vs分布式Eureka采用的是客户端-服务器（Client-Server,CS）架构。Eureka
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他