wishchin

CBIR--Survey.C/GPU优化.Sys搭建

一：CBIR综述：转自于wiki：http://zh.wikipedia.org/wiki/CBIR

参考链接：http://blog.csdn.net/kezunhai/article/details/11614989

借用一个图：大致构架，与一般的模式识别构架相似.

Definition：基于内容的图像检索（英语：Content-based image retrieval，CBIR；或content-based visual information retrieval），属于图像分析的一个研究领域。基于内容的图像检索目的是在给定查询图像的前提下，依据内容信息或指定查询标准，在图像数据库中搜索并查找出符合查询条件的相应图片。

互联网络上传统的搜索引擎，包括Google、Yahoo以及MSN都推出相应的图片搜索功能，但是这种搜索主要是基于图片的文件名建立索引来实现查询功能（也许利用了网页上的文字信息）。这种从查询文字，文件名，最会到图片查询的机制并不是基于内容的图像检索。基于内容的图像检索指的是查询条件本身就是一个图像，或者是对于图像内容的描述，它建立索引的方式是通过提取底层特征，然后通过计算比较这些特征和查询条件之间的距离，来决定两个图片的相似程度。

关键技术：查询方式、结果显示方式、图像特征、特征索引技术等；

技术细节

基于内容的图像检索通常包括以下几个部分：

特征提取

可提取的特征可以包括颜色、纹理、平面空间对应关系、外形，或者其他统计特征。图像特征的提取与表达是基于内容的图像检索技术的基础。从广义上讲，图像的特征包括基于文本的特征（如关键字、注释等）和视觉特征（如色彩、纹理、形状、对象表面等）两类。

视觉特征又可分为通用的视觉特征和领域相关的视觉特征。前者用于描述所有图像共有的特征，与图像的具体类型或内容无关，主要包括色彩、纹理和形状；后者则建立在对所描述图像内容的某些先验知识（或假设）的基础上，与具体的应用紧密有关，例如人的面部特征或指纹特征等。

[reference：其中，颜色，纹理，形状，图像边缘特征，是基于人的视觉原理，而语义特征是基于用户查询中对于图像内容的描述。

颜色特征主要包括颜色直方图、颜色矩等，颜色特征是一种全局特征，它描述了图像或图像某个区域所对应的景物的表面性质；

纹理特征是一种统计特征，它需要在包含多个像素点的区域中进行统计计算，纹理特征常具有旋转不变性，并且对噪声有较强的抵抗能力。主要包括粗糙性、方向性、对比性等。纹理特征描述方法大致可分为四类：统计法、结构法、模型法、频谱法等；

形状特征是物体自身的一个重要特征，一般来说一个物体可以有不同的颜色，但它的形状不会有很大差别。

形状描述方法主要有两类：基于边缘和基于区域的形状方法，基于边缘的形状特征提取用面积、周长、偏心率、角点、链码、兴趣点、傅里叶描述子、矩描述子等特征来描述物体的形状，适用于图像边缘较为清晰、容易获取的图像；

基于区域的形状特征提取的主要思路是通过图像分割技术提取出图像中感兴趣的物体，依靠区域内像素的颜色分布信息提取图像特征，适合于区域能够较为准确地分割出来、区域内颜色分布较为均匀的图像。]

（总结：特征提取是一个信息量压缩的过程；如何提取具有强表达能力的特征有相当的专业素养要求。）

相似性（非相似性）的定义

从图像中提取的特征可以组成一个向量，两个图像之间可以通过定义一个距离或者相似性的测量度来计算相似程度。

reference：（相似度定义：参考相似度与距离的对比；范数距离（空间向量相似度）；余弦距离（方向相似度）；）

弥补语义鸿沟

在传统的基于文字的查询技术中，不存在这个问题，因为查询关键字基本能够反映查询意图。但是在基于内容的图像查询中，就存在一个底层特征和上层理解之间的差异（这也就是著名的semantic gap）。主要原因是底层特征不能完全反映或者匹配查询意图。弥补这个鸿沟的技术手段主要有：

相关反馈（relevance feedback）：按照最初的查询条件，查询系统返回给用户查询结果，用户可以人为介入（或者自动）来选择几个最符合他查询意图的返回结果（正反馈），也可以选择最不符合他查询意图的几个返回结果（负反馈）。这些反馈信息被送入系统用来更新查询条件，重新进行查询。从而让随后的搜索更符合查询者的真实意图。

图像分割（image segmentation）：图像的特征可以包括全局特征和局部特征。如果进行一定程度的图像分割，划分出不同的分割区域，这样可以增加局部特征的信息量，也可能在一定程度弥补语义鸿沟。

建立复杂的分类模型：一些比较复杂的非线性分类模型，比如支持向量机（Support Vector Machine）本身就可以起到一定程度的效果来弥补语义鸿沟。

查询模式

按例查询（QBE-Query By Example）：用户提供一个查询图片，在数据库中搜索相似图片。
按绘查询（Query by sketch）：用户在类似画笔的接口上面进行简单的绘画，依次为标准进行查询。[这样目标的拓扑特性是一个很显著的特征]
按描述查询：例如，指定条件可以是30%的黄色，70%的蓝色等。[直方图描述或者其他描述]

应用和研究：

近邻搜索： http://en.wikipedia.org/wiki/Nearest_neighbor_search

二：一个实例：使用OpenDIR搭建简单的图像检索系统

原文链接：http://blog.csdn.net/chenxin_130/article/details/6648280

系统比较潦草，希望大家能理解，不过我没有看，只是转载了；

图像检索看似是一门高深的学问，我们在享受谷歌，百度，Tineye等检索服务的同时，有没有想过自己也能搭建一个图像检索系统呢？OpenDIR是一个在google code上简单的开源文档图像检索应用。常见的图像检索基本是以自然图像的精确或相似检索为主，而OpenDIR则实现于以文本为主体的图像相似检索算法，比如生活中各类文书的电子扫描件等等。目前版本的OpenDIR使用了两种特征，projection histogram feature和density distribution feature，计算向量间的Cosine相似度进行相似匹配。

编译：

该项目的主页在http://code.google.com/p/opendir/，在download中下载新版本的源代码解压后，是一个VC 2008的工程。同时，项目也提供了可执行的压缩包。

在编译工程之前，首要要保证的是VC中已经配置了OpenCV。OpenCV作为开源计算机视觉库，应用已经比较广泛了，甚至在著名河蟹软件的“绿爸”中都能找到它的芳影。具体的安装和配置可以在http://www.opencv.org.cn/及其官网http://opencv.willowgarage.com/wiki/ 找到，这里小斤就不再赘述了。VS2010的话，可以直接下载opencv for VS2010，连Build步骤都省了。

对于OpenDIR，VC2008以上版本，直接打开项目或转换一下，build就可以用了。如果是VC2005等版本，可以直接建立一个空项目，把OpenDIR的一家老小都放进去Build，或者直接改vcproject文件中的Version参数。

使用：

OpenDIR执行时可以输入两个指令，-w和-r，-w 后跟输出的特征数据文件名， -r 后跟输入的特征数据文件名。

后台供检索的图片库，需在inputimage.txt这个文件中指定，使用-w指令后，会将所有后台图像的特征计算后，通过增量的方式存入特征数据文件中。

有了特征数据文件，只要调用-r指令就可以载入特征数据文件，而不需要重新计算后台图片的特征，直接开始检索了。

下载的源码包中已经包含了testimg文件夹和inputimage.txt，其中包含了几张文档图像，以及一张test.jpg的模糊图片用作测试。

在VC工程的属性-Debugging-Command Arguments，我们输入"-w feature.txt -r feature.txt"（引号内的内容），让OpenDIR计算特征数据文件后，再直接载入，进行检索。

执行过程中，可以看到feature.txt被生成了，打开窥一窥：

[plain] view plaincopy

imagepath=testimg\1.jpg
index=0
DDFLength=120
PHFLength=50
FusionFeature=3, 12, 20, 20, 17, 12, 8, 8, 8, 8, 7, 3, 0, 0, 1, 41, 83, 86, 85, 80, 62, 0, 0, 0, 0, 0, 0, 48, 98, 100, 82, 85, 75, 0, 0, 0, 0, 0, 0, 48, 99, 99, 93, 100, 58, 0, 0, 0, 0, 0, 0, 48, 100, 100, 95, 84, 59, 0, 0, 0, 0, 5, 15, 16, 18, 19, 18, 14, 8, 4, 4, 0, 0, 11, 22, 13, 13, 13, 14, 13, 7, 7, 7, 0, 0, 1, 24, 21, 11, 10, 7, 8, 7, 8, 2, 0, 0, 8, 20, 13, 11, 5, 5, 0, 0, 0, 0, 0, 0, 3, 4, 4, 4, 4, 4, 9, 11, 13, 11, 0, 70, 13, 88, 7, 38, 56, 53, 57, 53, 53, 57, 53, 53, 57, 53, 57, 53, 53, 57, 51, 53, 57, 53, 57, 53, 26, 34, 61, 43, 80, 85, 24, 16, 27, 100, 18, 24, 77, 52, 18, 15, 15, 53, 38, 17, 0, 0, 0, 79, 37
imagepath=testimg\2.jpg
index=1
DDFLength=120
PHFLength=50
FusionFeature=7, 16, 15, 17, 16, 16, 10, 14, 15, 12, 13, 10, 8, 1, 29, 31, 32, 32, 32, 32, 32, 31, 0, 0, 0, 3, 100, 99, 100, 100, 100, 100, 100, 100, 3, 0, 0, 3, 100, 98, 96, 98, 90, 100, 100, 100, 3, 0, 0, 3, 100, 100, 99, 99, 97, 100, 100, 100, 3, 0, 4, 9, 51, 51, 51, 51, 52, 50, 51, 48, 1, 0, 14, 10, 10, 6, 2, 2, 3, 2, 2, 2, 0, 0, 7, 23, 20, 15, 12, 8, 0, 0, 0, 0, 0, 0, 19, 25, 16, 16, 16, 15, 13, 16, 15, 15, 17, 13, 9, 14, 13, 13, 14, 12, 12, 5, 5, 5, 5, 6, 56, 58, 15, 45, 66, 12, 8, 15, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 12, 33, 80, 12, 7, 13, 30, 20, 26, 39, 42, 36, 4, 16, 53, 99, 100, 16, 0, 0, 0, 91, 48
imagepath=testimg\3.jpg
index=2
DDFLength=120
PHFLength=50
FusionFeature=73, 85, 63, 53, 28, 21, 21, 20, 20, 20, 20, 17, 18, 99, 98, 100, 64, 24, 21, 21, 22, 24, 23, 21, 40, 78, 50, 53, 53, 46, 51, 45, 44, 23, 27, 22, 43, 71, 52, 54, 27, 23, 24, 31, 20, 22, 24, 19, 17, 73, 61, 75, 69, 72, 57, 56, 45, 28, 26, 17, 18, 65, 64, 66, 45, 61, 46, 51, 41, 19, 24, 22, 43, 36, 24, 25, 24, 12, 9, 6, 0, 0, 0, 0, 63, 59, 13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 59, 46, 48, 35, 13, 2, 0, 0, 0, 0, 0, 0, 57, 59, 60, 46, 33, 37, 63, 44, 53, 48, 52, 47, 59, 60, 7, 18, 57, 72, 21, 31, 32, 36, 8, 17, 14, 100, 79, 96, 34, 1, 34, 70, 40, 17, 41, 91, 61, 96, 26, 21, 49, 47, 3, 8, 37, 48, 12, 18, 21, 14, 20, 29, 46, 30, 32, 25, 39, 55, 18, 9, 95, 43
imagepath=testimg\4.jpg
index=3
DDFLength=120
PHFLength=50
FusionFeature=35, 44, 44, 44, 41, 41, 23, 25, 32, 31, 32, 28, 81, 99, 99, 82, 86, 91, 9, 0, 1, 3, 26, 31, 81, 99, 100, 94, 100, 80, 22, 31, 47, 16, 39, 0, 81, 100, 100, 97, 85, 72, 36, 59, 51, 12, 12, 14, 12, 11, 10, 4, 0, 0, 0, 0, 0, 0, 0, 0, 12, 16, 18, 15, 5, 0, 0, 0, 0, 0, 0, 0, 8, 23, 24, 26, 25, 18, 4, 0, 0, 0, 0, 0, 15, 20, 17, 11, 12, 10, 10, 0, 0, 0, 0, 0, 14, 5, 6, 6, 5, 6, 4, 5, 4, 0, 0, 0, 15, 15, 9, 5, 5, 5, 5, 5, 5, 5, 5, 6, 57, 59, 41, 100, 73, 64, 77, 75, 67, 80, 81, 86, 85, 82, 83, 88, 89, 85, 89, 93, 23, 15, 28, 2, 9, 14, 32, 39, 32, 39, 45, 49, 53, 48, 53, 30, 12, 18, 46, 30, 4, 4, 71, 34, 11, 10, 1, 0, 93, 20
imagepath=testimg\5.jpg
index=4
DDFLength=120
PHFLength=50
FusionFeature=67, 66, 67, 55, 29, 20, 20, 20, 20, 20, 20, 17, 36, 25, 25, 21, 25, 22, 29, 26, 25, 26, 14, 0, 29, 90, 84, 71, 84, 78, 55, 53, 22, 19, 22, 19, 40, 40, 41, 41, 45, 37, 35, 41, 26, 0, 0, 0, 52, 86, 26, 20, 22, 23, 20, 20, 23, 24, 22, 19, 23, 86, 93, 57, 40, 30, 0, 0, 0, 0, 0, 0, 18, 67, 49, 38, 32, 30, 21, 23, 23, 23, 29, 22, 26, 85, 100, 56, 0, 0, 0, 0, 0, 0, 0, 0, 15, 55, 54, 52, 47, 33, 31, 28, 0, 0, 0, 0, 35, 46, 52, 42, 22, 20, 54, 46, 56, 50, 54, 49, 62, 63, 1, 5, 28, 5, 4, 6, 80, 97, 87, 58, 53, 18, 63, 30, 6, 6, 66, 34, 11, 13, 87, 53, 17, 41, 42, 23, 48, 49, 74, 70, 22, 21, 29, 31, 31, 32, 22, 50, 45, 70, 23, 21, 34, 21, 31, 1, 100, 45
imagepath=testimg\6.jpg
index=5
DDFLength=120
PHFLength=50
FusionFeature=28, 39, 40, 38, 40, 39, 32, 17, 34, 32, 32, 26, 37, 30, 30, 25, 15, 13, 14, 11, 18, 16, 16, 12, 0, 50, 25, 13, 0, 0, 0, 0, 0, 0, 0, 0, 27, 45, 18, 12, 12, 12, 12, 12, 12, 12, 12, 10, 42, 57, 42, 43, 41, 46, 48, 28, 29, 23, 12, 10, 47, 39, 27, 19, 15, 16, 17, 13, 15, 13, 14, 13, 8, 31, 30, 41, 39, 49, 43, 30, 27, 23, 7, 0, 12, 44, 43, 28, 31, 47, 27, 29, 52, 27, 28, 22, 0, 0, 0, 3, 73, 57, 5, 100, 46, 0, 0, 0, 24, 33, 35, 55, 81, 14, 41, 71, 13, 12, 12, 17, 59, 60, 20, 59, 12, 7, 11, 37, 97, 33, 11, 10, 18, 21, 11, 13, 1, 15, 26, 99, 92, 80, 50, 9, 11, 88, 61, 8, 10, 16, 59, 57, 45, 89, 100, 97, 20, 6, 11, 11, 14, 25, 27, 28, 29, 20, 14, 0, 95, 37<span style="font-family:Comic Sans MS;font-size:16px;">
</span>

其中的FusionFeature就是特征向量了，每个图像由一个120维的 density distribution feature和一个50维的 projection histogram feature组成。

接着，小斤就输入text.jpg来试一把：

项目主页中介绍了这个text.jpg，是手机拍摄一个文档后二值化的结果，有一坨大噪点，中间看起来是一个插图。

输入test.jpg后，查看检索的相似性结果：

结果：

testimg的1.jpg的相似度最高，这是1.jpg的原图，从段落开始结束的位置分布来看，应该就是它了：

简单的性能测试：

小斤准备使用1000张后台图像进行测试，看看检索的效率如何。

去网上搜集1000张文档图像显然比较累人，这里使用了一个偷懒的办法，找个1000页左右的pdf，使用pdf2image等工具，生成1000张文档图像的jpg，

最后每张在850*1100左右，分辨率还行。

把这么多图像填到inputimage.txt配置文件中，同样有简单的办法，运行cmd，进入存放图像的目录后，使用dir /b命令，每一行会显示一个图像文件名，右键选中标记，圈住他们复制，粘贴到inputimage.txt中就可以了。当然，这样做也有个弊端，就是这些图像和OpenDIR的可执行文件必须是在同一目录下了。

后台图像库算是轻而易举地构建好了，和之前一样，先使用-w指令生成特征数据文件，1000张图的特征计算了1分多钟，但也只要辛苦一次就够了。

完成后，使用-r指令开始检索：

在1000张图片中找到了一模一样的它，相似度100%，花费4ms。

（测试环境Turion X2 RM-74 2.2G，2G内存）

测试多次后，对于精确检索，比如检索后台图库中存在的同一图像，每次都能以100%找到。

对于相似检索，如一些扫描质量比较差的图片或处理过的图像，（类似于之前的test.jpg），虽然检索速度令人满意，但检索结果也就中规中矩了，有时结果风马牛不相及。也许今后融入更好的特征可以提高准确度吧。

三：CPU/GPU优化：http://blog.csdn.net/b5w2p0/article/details/13004265

图像涉及到大规模的并行运算，可以利用GPU的流处理能力进行加速运算;

主要从图像识别开始，简述笔者对于计算机视觉领域的优化的任务的总结和思考：

(一) 图像识别一般符合如下框架：

1. 识别正确率与图像数据和所建立的图像类别模型有关，前者即与所提取的image representation的判别性有关，进一步，与所提取的local description和encoding完的描述子的判别性有关；后者与所采用的数学模型有关，至于具体采用什么模型，与前者encoding完的数据在高维空间中的相对位置关系有关（Data Drive）。

2. 图像理解是一个大规模的数据并行计算过程，用到了大量的矩阵运算。

可以优化的地方:

        1) local feature descriptor的获取，这方面效果最好的是SIFT描述子，是十年来效果最好的，但是效率低，提取一副720*576的图像的特征，可能需要几秒钟，当然提取的时间与图像梯度的复杂度正相关。09年，CVPR best demo 在这方面做了很漂亮的工作，他们将提取一个点的时间减少到2.5毫秒。参看demo（http://mi.eng.cam.ac.uk/~sjt59/hips.html）同时，该实验室也制作了iPhone 应用oMoby，识别效果我认为比Google goggles 效果还要好。提升特征描述的时间，是图像理解的第一步，对于将图像信息转化为计算机可识别信息至关重要。
        2) Local descriptorre-encoding 由于局部特征描述繁杂无序，难以通过训练得到有意义的模型。通过将其量化（建立码书模型）得到统一的，可分的多维空间中的点，以便于通过训练可以将这些模型区分开。
        3) 对于数学模型计算的优化。基本上所有的判别式模型都可以归结为是凸优化问题如支持向量机SVM ，面临大量的数值计算。模型计算过程一般是离线过程。
        这里有一个很好的讲座： http://www.youtube.com/watch?v=g1tLjptuTBo （Kaiyu是NEC美国研究院的研究员，在09年的VOC中拿了classification组第一名。）
重申一下，这里所介绍的最经典的基于统计学习的识别框架，近些年有一些科学家试图跳出这个套路，提出了deep learning等算法，可以参看文末给出的demo。

3.   图像理解相关领域进行优化的价值：

        1) 图像识别技术在03年以后有了突飞猛进的进展。Google 有相关产品，goggles，similar image search（两者均是基于图像内容的检索和识别），微软亚洲研究院中，图像识别是其非常重要的研究领域（如sun,jian所作的工作）, 其他的有：百度淘宝都有以图识图的产品。
        2) 这些图像产品都面临着计算效率的问题，即：图像特征提取慢，数学模型离线训练慢。这方面的优化具有非常有价值的意义。
        3) 优化过程是否可以考虑：强化OpenCV和IPP（这两者我估计在实际产品中用到的很多），CPU+GPU的联合优化（由于是大规模的矩阵运算，有效地利用GPU是可行之路，即：OpenCL），针对特定算法有效利用IA架构CPU优势，分布式计算等。

        4) 扩展：随着图像识别技术的发展，基于相关技术的视频序列识别近些年也得到了更多的应用和发展，比如行为识别等。由此而引发的，传统监控系统向智能监控系统的转变这两年也逐渐兴起，具体内容请看下面。

(二) 智能监控中的优化

所谓智能，是指让计算机具备一部分自主的分析功能。比如监控视频中的目标锁定（detection 可以是基于特征的检测，比如人脸检测，可以使基于行为的检测，比如犯罪分子有某种行为习惯），目标跟踪（tracking），目标识别（recognition首先将目标分割出来，然后利用前面所述的图像识别方法进行识别）。
对于智能监控来说，实时性极为重要。但是detection, tracking, segmentation都是非常耗时的过程(比如采用单纯粒子滤波进行单目标跟踪，对于DVD图像，未优化的程序处理速度不超过15fps，使用效果更好的改进算法，速度可能降至5fps)，计算效率极大的阻碍了前沿技术在工程实际中的应用。
目前智能监控在国内和世界范围内都是非常火的领域。国内海康威视，银江科技等都是监控领域炙手可热的公司，尤其是前者，他在这个领域世界排名大约第六，产品遍及国内各大城市街道，高速公路，大型工业企业。但是目前的主流监控市场是不断的提升监控的分辨率，智能算法很少被引入到实际产品中，很大一部分原因是因为算法的复杂性。尽管一些海归和博士建立了一些拥有自己算法的智能监控系统公司，比如莲花山研究院所办的公司在这方面所作的尝试。
智能监控是一个非常有价值的领域，成长快，利润高。英特尔的优势在于OpenCV中已经开发了大量前沿视觉算法，这些在Intel的CPU上都可以进行优化。

(三) ：移动终端上的性能优化

在移动终端上，图像和语音可能成为和打字同等重要的信息输入方法。比较火的领域有：图像识别，语音识别（如科大讯飞），增强现实（无数的APP），图像拼接（如微软的重量产品Kinect和photosynth(在bing上结合地图有重要应用)）等领域，这些都是与计算能力十分相关的内容，而其本质上也是大规模的矩阵运算，如果能有效地利用OpenCV, Ipp, Intel数学运算库和利用好CPU-GPU的联合运算，都会对性能和功耗有比较大的提升。

视觉识别一般分为图像层次和视频序列的识别；前者在一些大的搜索引擎公司都有所涉及，后者主要集中于国外高校实验室和一些本领域的领军人物的创业型公司（比如莲花山研究院所作的将视觉理论所做的产业化工作，Zhu,chunsong是UCLA的professor，在弯曲评论上有个简单的对他的介绍或者可以到他的Lab网页查看）。国内本土的监控公司，很多也采取了和国内各大高校合作的方式。而实际上，某些基于视频的识别在实验室已经做到相当好的效果，面临的主要问题是：光照，角度形变，尺度，实时性等问题（其实人脸识别尽管已经发展到了相当成熟，仍然面临这个问题，比如无法区分照片中的人脸，光照变化大的时候正确率有较大的下降，甚至已经有人专门研究过什么情况下人脸识别会失效：http://ahprojects.com/art/cv-dazzle）

四：参考资料：http://blog.csdn.net/kezunhai/article/details/11614989

（个人感觉不是太新）要想了解更多关于图像检索的理论知识，请参考：

1）周明全、耿国华、韦娜. 基于内容图像检索技术. 清华大学出版社.

2）孙君顶、赵珊 . 图像低层特征提取与检索技术. 电子工业出版社.

这两本内容重叠的部分比较多，个人觉得周明全编的那本书更言简意赅，但是孙君顶的内容更全，大家可以任选一本即可。

下面介绍几个国外的图像检索的项目或系统：

1）1、QBIC：http://wwwqbic.almaden.ibm.com/
这是IBM的一个系统，采用了三类特征，分别是颜色直方图（描述颜色分布特征）、形状一阶矩（描述形状）以及纹理信息（包括对比度、粗细度、方向性），并且该系统采用数据库技术来处理高维数据。

2）、Blobword：http://elib.cs.berkeley.edu/photos/blobworld/
这是加利福尼亚大学伯克利分校开发的一个系统，该系统利用图像分割技术提取特征，通过EM簇的方法对图像的颜色、纹理和位置进行聚类，实现分割。用户查询时，通过手工选择一个区域，系统返回与选择区域相似的图片返回。

3）、AIMBA (Search IMages By Appearance):http://simba.informatik.uni-freiburg.de/
该系统通过提取图像的颜色和纹理不变特征（对旋转和平移），用户通过自设定权重实现相似性检索。

4）、VIPER (Visual Information Processing for Enhanced Retrieval):http://viper.unige.ch/
该系统采用一种二值特征的高维空间(80000)以及允许快速访问的逆向文件(inverted file)。在HSV颜色空间，计算颜色直方图以及一系列Gabor系数（a set of Gabor coefficients），根据特征出现的次数决定特征的权重。可喜的是，VIPER是一个开源库，可以通过GPL免费获取。现在该库已经扩展为一个用于医学图像检索的系统。源码获取地址：http://www.gnu.org/software/gift/gift.html

5）、CIRES：http://amazon.ece.utexas.edu/~qasim/research.htm
该系统采用颜色直方图(15 bins)作为颜色特征，Gabor特征表示纹理特征，并提取了十字线(line crossing)与交叉线( line junctions)。

6）、FIRE(Flexible Image Retrieval Engine)：http://thomas.deselaers.de/fire/

FIRE是由 Thomas Deselaers及其同事开发的一个开源的图像检索引擎，C++代码编写，细节内容可以参考Thomas Deselaers的博士论文，也可以的可以去上述网站查看更多信息。

7）、IRMA (Image Retrieval in Medical Applications) ：http://wang.ist.psu.edu/

8）、IRMA (Image Retrieval in Medical Applications)：http://www.irma-project.org/

9）、Image Retrieval：http://pages.cs.wisc.edu/~beechung/dlm_image_processing/image_processing/retrieve.html

10）、Content-Based Image Retrieval：http://homes.cs.washington.edu/~shapiro/cbir.html

11）、Content Based Image Retrieval System with Relevance Feedback：http://www.ifp.illinois.edu/~xzhou2/demo/cbir.html

除了以上列出的内容外，还有很多商用的网站：

1）、http://tineye.com/
Tineye是典型的以图找图搜索引擎，输入本地硬盘上的图片或者输入图片网址，即可自动帮你搜索相似图片，搜索准确度相对来说还比较令人满意。TinEye是加拿大Idée公司研发的相似图片搜索引擎，TinEye主要用途有：1、发现图片的来源与相关信息；2、研究追踪图片信息在互联网的传播；3、找到高分辨率版本的图片；4、找到有你照片的网页；5、看看这张图片有哪些不同版本。

2）、http://shitu.baidu.com
百度正式上线了其最新的搜索功能——“识图”（shitu.baidu.com）。该功能是百度基于相似图片识别技术，让用户通过上传本地图片或者输入图片的URL地址之后，百度再根据图像特征进行分析，进而从互联网中搜索出与此相似的图片资源及信息内容。但需要注意的是，用户上传本地图片时，图片的文件要小于5M，格式可为JPG、JPEG、GIF、PNG、BMP等图片文件。

3）、http://www.gazopa.com/
GazoPa搜索图片时，不依据关键词进行检索，而是通过图片自身的某些特征（例如色彩，形状等信息）来进行搜索。GazoPa搜索方式有四种：

第一种是传统的通过关键词搜索图片，但在传统图片搜索领域GazoPa与google等搜索引擎无法竞争。

第二种是创新的通过图片搜索图片，但在此领域GazoPa无法与TinEye相竞争。TinEye很容易就能搜索出与原图最接近的一些结果，而GazoPa很多时候的搜索结果则完全无法与原图匹配。

第三种是通过手绘图片搜索图片，这种方式其实没太大用处。GazoPa虽然有这样那样的不足之处，但也算是一个很有独创性的搜索引擎。GazoPa目前还处在内测阶段，想要加入测试的可以在官网上留下你的邮箱地址，收到邀请后你就可以测试使用了。

第四种是通过视频缩略图搜索视频，GazoPa仅凭一张视频缩略图就可找到相关视频。只要有截图，就可以找到截图的视频！

4）、http://similar-images.googlelabs.com/
Google实验室的图片搜索：输入一个关键词后，例如“lake”，返回的页面里面点击某个图片的下面的Similar images，运用Google 类似图片搜索功能引擎，即刻为你把类似的图片全部搜索出来，展示给用户以便查看。其准确率、相似率相对比较高。

5）、http://www.picitup.com/
Picitup是一个刚开始公测的专业图片搜索引擎，功能非常强大，并支持中文关键字的搜索，是国内图片爱好者的不错选择。Picitup主要支持关键字的搜索，但在它的特色搜索项目——名人匹配搜索（Celebritymatchup）中，你可以通过上传本地照片来进行搜索，不过结果一般让人失望。Picitup可以通过在搜索结果页选择过滤方式来筛选图片，比如可以按颜色、头像（人脸）、风景、产品四种类别来过滤搜索结果。

Picitup最大特点是提供相似图片搜索，即通过关键字找到初始图片，点击初始图片下面的similar pictures按钮，即可搜索与该张图片类似的图片。其实质和Google实验室类似图片搜索是一样的。

6）、http://www.tiltomo.com/
Tiltomo是由 Flickr 开发的一个搜索工具，主要用来维护Flickr 自己的图片数据库，其搜索算法主要是基于相似的主题风格或相似的色调和材质。

7）、http://cn.bing.com/
Live.com允许你进行一次关键字搜索后再执行相似性的搜索。你可以为Live索引中的任意一张图片寻找相似的图片，但搜索结果看起来并不是很精确。

8）、http://www.xcavator.net
Xcavator 和Live.com很相似，你需要先输入一个关键字，然后在搜索结果中挑选一张图片，在根据这张图片的特点来进行搜索。

9）、http://www.incogna.com
Incogna的搜索速度非常快，主要是基于色彩和形状上的相似性。

10）、http://www.terragalleria.com
Terragalleria主要基于视觉上的相似性，而不考虑图片的内容。

11）、http://labs.ideeinc.com/upload/
Byo image search是根据你上传的图片来搜索相似的图片，算法主要是基于色彩，也包括主题风。

12）、搜狗图片搜索：http://image.sogou.com/

作者：kezunhai 出处：http://blog.csdn.net/kezunhai 欢迎转载或分享，但请务必声明文章出处。

你可能感兴趣的:(CBIR--Survey.C/GPU优化.Sys搭建)

【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析... 985小水博一枚呀论文解读深度学习目标检测 YOLO 人工智能算法架构网络
【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析…【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析…文章目录【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解
同城拼车打车约车系统:Java源码全开源构建与优化狂团商城小师妹博纳miui52086 微信小程序小程序微信公众平台
同城拼车系统是一个复杂且功能全面的软件系统，它巧妙地运用互联网技术，将具有相同出行需求的乘客与车主进行精准匹配，旨在实现资源的最大化共享、显著降低出行成本、有效缓解交通拥堵问题，并大幅提升出行效率。Java，作为一种功能强大、应用广泛的编程语言，凭借其出色的跨平台性、丰富的API库以及强大的性能，成为开发此类系统的理想选择。一、Java源码构建系统架构MVC架构：同城拼车系统采用MVC（Model
挪车小程序挪车二维码php+uniapp 狂团商城小师妹博纳miui52086 微信公众平台微信小程序 uni-app 小程序
一款基于FastAdmin+ThinkPHP开发的匿名通知车主挪车微信小程序，采用匿名通话的方式，用户只能在有效期内拨打车主电话，过期失效，从而保护车主和用户隐私。提供微信小程序端和服务端源码，支持私有化部署。更新日志V1.0.4小程序UI重新设计，全面升级1.小程序UI全面升级，布局更加合理，去除冗余元素，界面更加干净、清爽，让您专注于核心内容。2.增加隐私通话开关，在后台自由切换。3.整体优化
探索A10技术的应用与未来发展潜力智能计算研究中心其他
内容概要A10技术是一项正在逐步成熟并对多个行业产生深远影响的前沿技术。其发展历程可以追溯到早期的研发阶段，至今已经经过了多次技术迭代与升级。以下是对A10技术核心应用和优势的概述，通过这些内容可以帮助读者更好地理解其用途：应用领域具体应用主要优势信息技术数据处理与分析提高数据处理效率制造业自动化与智能生产降低生产成本医疗行业远程监控与智能诊断提升医疗服务质量交通运输智能交通系统优化交通流量环保领
“网约车霸主“地位面临挑战专题报告拓端研究室报告汽车新能源汽车
原文链接：tecdat.cn/?p=36528原文出处：拓端数据部落公众号广汽埃安新能源汽车，在中国车市竞争加剧的浪潮中，坚定立场，誓不言退。近期，集团虽遭遇“反内卷”讨论及裁员传言的风暴，但埃安迅速且明确地澄清，所谓的“20%人员效率提升”并非裁员举措，而是优化调整，并承诺对受影响的应届毕业生履行合同赔偿，彰显企业责任感。同时，埃安宣布泰国与长沙新厂的投产及扩招蓝图，力证其持续稳健发展的决心与实
OpenMetadata MySQL 数据库使用率提取管道实现解析 10年JAVA大数据技术研究者数据治理数据库 mysql openmetadata 源码分析
目录架构概述核心组件源码分析使用率指标定义数据提取流程图源码类图配置与扩展指南架构概述OpenMetadata通过可插拔的元数据摄取框架实现对MySQL使用率数据的采集，核心流程包含三个阶段：数据采集层：从MySQLperformance_schema和sysschema获取原始指标指标处理层：将原始数据转换为统一的使用率指标模型数据存储层：将处理后的指标持久化到OpenMetadata服务核心组
【Unity 监狱内部环境资产包】Jails Interior 提供了完整的监狱内部结构，包括牢房、走廊、审讯室、看守室等，并配备了大量高质量的家具、铁栏、门窗和其他装饰，快速搭建沉浸式的监狱场景 Unity游戏资源学习屋 Unity插件
JailsInterior是一款专为Unity设计的监狱内部环境资产包，适用于犯罪题材、恐怖游戏、警察模拟、逃脱解谜等类型的游戏。该插件提供了完整的监狱内部结构，包括牢房、走廊、审讯室、看守室等，并配备了大量高质量的家具、铁栏、门窗和其他装饰，帮助开发者快速搭建沉浸式的监狱场景。详细介绍1.逼真的监狱内部环境提供完整的监狱场景，包括牢房、走廊、审讯室、警卫室等，能够用于各类犯罪、逃脱、警察题材的游
淘宝/天猫店铺订单数据导出、销售报表设计与数据分析指南不会玩技术的技术girl API 数据分析人工智能数据库
在电商运营中，订单数据是店铺运营的核心资产之一。通过对订单数据的导出、整理和分析，商家可以更好地了解销售情况、优化运营策略、提升客户满意度，并制定科学的业务决策。本文将详细介绍淘宝/天猫店铺订单数据的导出方法、销售报表的设计思路以及数据分析的实用技巧，帮助电商从业者高效管理店铺数据。一、订单数据导出（一）手动导出订单数据淘宝和天猫平台提供了手动导出订单的功能，适用于数据量较小或临时性需求的场景。商
MySQL 查询缓存技术深度解析 Minxinbb 数据库 mysql 数据库 dba
在现代数据库管理系统中，查询性能优化是提升应用响应速度和用户体验的关键环节。MySQL作为一款广泛使用的开源关系型数据库，提供了查询缓存功能，用于缓存查询结果，从而在后续相同的查询请求时能够快速返回结果，减少数据库的负载和查询时间。本文将深入探讨MySQL查询缓存技术的原理、配置、使用方法以及优化策略。一、查询缓存的基本原理（一）缓存机制概述MySQL查询缓存的核心思想是将查询语句和其对应的查询结
安心联车辆管理系统在汽车金融领域的应用安心联-车辆监控管理系统汽车金融人工智能
安心联车辆管理系统在汽车金融领域的应用主要体现在通过智能化监控与数据分析技术，提升金融风控能力、优化资产管理和降低运营风险。以下从核心功能、技术赋能和实际场景三个方面展开分析：一、核心功能适配金融场景车辆资产动态监控实时定位与电子围栏：系统基于北斗/GPS双模定位技术，可实时追踪车辆位置，并设置电子围栏限制车辆行驶区域。若车辆驶出授权范围（如贷款合同约定的使用区域），系统立即触发报警并留存轨迹证据
市面上采用多进程架构的游戏或游戏引擎的案例深入分析你一身傲骨怎能输软件架构设计架构游戏游戏引擎
《绝地求生》（PUBG）《绝地求生》（PUBG）是一款采用多进程架构的游戏，这种设计帮助它在处理复杂的游戏逻辑和网络通信时提高了性能和稳定性。以下是一些关于《绝地求生》如何利用多进程架构的具体细节：多进程架构的优势性能优化：多进程架构允许游戏将不同的任务分配到多个处理器核心上运行，这样可以充分利用现代多核CPU的计算能力。例如，游戏的物理计算、AI逻辑、渲染和网络通信可以在不同的进程中并行处理，从
【OpenTiny调研征集】共创技术未来，分享您的声音！前端vue.js开源
欢迎参与2025年OpenTiny开源社区用户调研征集调研背景随着OpenTiny开源项目的不断发展，我们一直致力于为开发者提供高质量的Web前端开发解决方案。为了更好地满足用户需求，提升项目的实用性和易用性，我们决定发起一项用户调研活动，诚挚邀请您参与。调研目的了解用户需求：收集您在使用OpenTiny开源项目过程中的需求、问题和建议，以便我们更好地改进和优化。提升用户体验：通过您的反馈，我们将
mysql实时同步到es 数据库
测试了多个方案同步，最终选择oceanu产品，底层基于Flinkcdc1、实时性能够保证，binlog量很大时也不产生延迟2、配置SQL即可完成，操作上简单下面示例mysql的100张分表实时同步到es，优化备注等文本字段的like查询创建SQL作业CREATETABLEfrom_mysql(idint,cidintNOTNULL,gidbigintNOTNULL,contentvarchar,c
HarmonyOS Next数据处理与模型训练优化 harmonyos
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中数据处理与模型训练优化相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、数据处理对模型训练的重要性（一）关键作用强调在HarmonyOSNext的模型训练世界里，数据就如同建筑的基石，而数据处
数据包结构 Utopia.️ 网络开发语言
据包（数据包）结构是网络通信中的基本组成部分。它定义了在网络上传输数据时的组织方式和格式。了解数据包的结构有助于理解网络通信的工作原理，排查网络问题以及优化网络性能。以下是对数据包结构的详细解释：数据包的基本组成数据包通常由以下几个主要部分组成：头部（Header）：定义：头部包含了用于路由和控制的数据包的元数据。这部分信息帮助网络设备（如路由器和交换机）正确地处理和转发数据包。内容：源地址和目的
在CRM系统中，怎么做才能降低呆坏账的发生？ crmcrm系统crm销售系统
在很多企业的日常运作中，销售团队的表现直接影响到公司的收入和利润。所以，如何制定一套高效的销售流程、如何规划和运作这些流程，是企业管理者特别关注的问题。想象一下，你是一位销售经理，每天的工作除了接待客户，还需要不断优化销售流程，确保每一个环节都顺畅运作。早上，团队成员报到，汇报前一天的销售情况和进展。你会发现，有些客户的支付进度滞后，订单的交付时间也出现了延误。于是，你开始回顾一下销售流程的每一个
管理升级的关键：2024年6大国内项目管理平台实测与选择指南（禅道、钉钉、云效、简道云、Tapd、Teambition）
以下是一篇满足您要求的博客稿件：引言在当今快节奏的商业环境中，项目管理的重要性不言而喻。一款优秀的项目管理工具能够助力团队提高效率、优化流程，从而实现项目的成功交付。2024年，国内有众多项目管理平台可供选择，本文将对禅道、TAPD、云效、简道云、钉钉、Teambition这6大国内项目管理平台进行实测与分析，为您提供选择指南，帮助您找到最适合团队的项目管理工具。项目管理工具介绍禅道：开源且专业，
PHP会务会议系统小程序源码云启软件 PHP商业系统小程序 uni-app vue php
会务会议系统一款基于ThinkPHP+Uniapp框架，精心雕琢的会议管理微信小程序，专为各类高端会议场景量身打造。它犹如一把开启智慧殿堂的金钥匙，为会议流程优化、开支精细化管理、数量精准控制、标准严格设定以及供应商严格筛选等关键环节，铺设了一条标准化的高速公路。这一创新之举，不仅引领我们步入了量化成本节约的新时代，更在风险有效缓解与服务质量显著提升方面，树立了业界的全新标杆。会务平台——会议管理
深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系时光旅人01号深度学习 pytorch opencv
想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。为了让工厂顺利运转，你需要搭建基础设施、安装设备、设置生产线，并配备控制台来管理整个生产过程。以下是这座工厂的详细构建过程：1.工厂的基础设施：Ubuntu比喻：Ubuntu是工厂所在的土地和建筑，提供了基础设施和运行环境。作用：提供操作系统环境，支持安装和运行各种工具和框架
ArcGIS二次开发之WPF中控件的使用 ShirmyMao ArcGIS二次开发 wpf c#arcgis
WPF中ArcGIS控件的使用WPF中插入ArcGIS控件Winform控件上嵌套使用WPF控件WPF中插入ArcGIS控件在WPF中引用ArcGIS的控件需要使用WindowsFromsHost，具体用法如下：添加引用：WindowsFormsIntegration和system.windows.formWpf.xaml中后台代码中：publicAxMapControlMapControl=ne
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
PHP搜索引擎WindSearch，新增Faker伪数据生成功能
WindSearch是一个基于中文分词，由纯PHP开发全文检索引擎，可快速搭建PHP站点的站内搜索，他没有任何繁琐的安装配置、不需要维护调优、不占用服务器内存、可与PHP项目完美融合在一起。Faker数据生成安装导入//将WindSearch代码下载到本地，再像下面这样引入require_once'yourdirname/windsearch/vendor/autoload.php';开始生成//
智能化工作流：探索顶尖工作流管理软件的核心优势团队协作工具
工作流管理软件是一种用于规划、执行和监控业务流程的软件应用程序。以下是关于工作流管理软件的详细介绍：一、定义与功能工作流管理软件旨在帮助团队和企业优化工作流程，提高工作效率。它通常包括任务分配、进度追踪、团队协作、自动化流程、数据分析等功能。通过这类软件，企业可以更好地管理内部流程，确保任务的顺利进行，并实时监控项目的进展情况。二、主要软件推荐板栗看板：可视化管理与团队协作的利器核心功能：板栗看板
简易java调用DeepSeek Api教程 m0_62519278 学习小本本 java 数据库开发语言
一、请求格式首先观察官方文档给出的访问api的样例脚本curlhttps://api.deepseek.com/chat/completions\-H"Content-Type:application/json"\-H"Authorization:Bearer"\-d'{"model":"deepseek-chat","messages":[{"role":"system","content":"
DeepSeek 赋能工业软件之全流程方案爱吃青菜的大力水手人工智能自动化持续部署语言模型开源
deepseek赋能工业软件之全流程方案之侧重半导体FABdeepseek在工业软件中的应用场景“deepseek”大模型在工业软件领域拥有广泛的应用场景，包括以下几个方面：智能调度：利用深度学习和优化算法，根据实时数据动态调整生产计划和资源分配。它可以综合考虑订单需求、设备状态和产能限制，智能生成最优的生产排程方案，减少等待时间和切换成本。例如在汽车制造工厂，deepseek可根据订单需求和设备
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
java竞赛优化输入输出效率 px不是xp 蓝桥准备 java 开发语言
在编程竞赛中，输入输出效率至关重要。Java的`Scanner`和`System.out.println`虽然简单，但在处理大规模数据时会严重拖慢速度。以下是**竞赛专用输入输出模板**及其原理详解，助你轻松应对高频I/O场景。---###⚡竞赛级输入输出模板（Java）importjava.io.*;importjava.util.*;publicclassMain{ publicstatic
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb