Dujing2019

Python计算机视觉编程第七章——图像搜索

Python计算机视觉编程

（一）基于内容的图像检索
（二）视觉单词
（三）图像索引

3.1 建立数据库
3.2 添加图像

（四）在数据库中搜索图像

4.1 利用索引获取候选图像
4.2 用一幅图像进行查询

（五）使用几何特性对结果排序
（六）建立演示程序及 Web 应用

（一）基于内容的图像检索

CBIR（Content-Based Image Retrieval，基于内容的图像检索）

定义 : 即从图像库中查找含有特定目标的图像，也包括从连续的视频图像中检索含有特定目标的视频片段。目前，对于通用的静止图像检索，用于检索的特征主要有颜色（Colour）、纹理（Texture）、草图（Sketch）、形状（Shape）等，其中颜色、形状、纹理等应用尤为普遍。

基本原理：任给定一个检索图像示例 $P$ ，计算其特征向量 $F=\left ( F_{1}, F_{2},F_{3},...F_{n} \right )$ ，其中 $F_{i}$ 为图像的第 $i$ 种特征；根据F检索图像特征索引库，得到与 $F$ 距离最小的特征向量 $F^{'}$ ，则 $F^{'}$ 所对应的图像 $P^{'}$ 即为与P最相似的检索结果。

特点：

模糊查询，检索结果不唯一。（基于内容的图像检索与文字检索的一个主要区别是，基于内容的检索都是属于模糊查询，一般不会给出单一的检索结果，输出的是一个结果排序集合，按图像的相似程度，从最像到最不像）
检索结果逐步逼近。（在检索过程中不断修订检索条件，可以逐步达到最终的检索结果，通过调整特征参数组合，可以得到不同的检索结果）
计算工作量大。（每次查询都需要根据临时提交的特征标准，对全部特征值进行匹配运算；数据计算时对计算机的要求高，查询时间相对长一些）

基于内容的图像检索分为三个层次：

依据提取图像本身的颜色、形状、纹理等低层特征进行检索；
颜色检索：基于颜色特征的图像检索需要解决三个问题：颜色的表示（取决于色彩空间的选择，不同场合采用的方式也是不同，常见的有RGB,HSV模型等）、颜色特征的提取（在基于颜色特征的索引算法中通常用颜色统计直方图、颜色相关图，颜色矩，颜色一致性矢量来表示图像的颜色特征）和基于颜色的相似度量（颜色特征索引的相似度匹配算法根据其颜色索引内容和算法的不同而不同，主要包括直方图相交法，Manhattan距离、绝对距离（L1）、二次距离（L2）、欧几里德距离等。
形状检索：基于形状的检索包括两种：一是基于轮廓线的检索，二是直接针对特定形状的图形进行检索。形状是物体的一个重要特征，但由于物体形状的自动获取很困难，基于形状的检索一般仅限于非常容易识别的物体。形状可以用面积、离心率、圆形度、形状度、曲率、分形维等全局和局部特征来表示。
纹理检索：纹理特征代表了物体的视觉模式，它包含了物体表面的组织结构以及与周围环境之间的关系。图像的纹理特征主要有六个方面：粗糙度、对比度、方向度、线像度、规整度、粗略度，其中最重要的特征主要是纹理的粗糙度、对比度、方向度。
基于图像的低层特征，通过识别图像中的对象类别以及对象之间的空间拓扑关系进行检索；
对象检索：基于对象的方法用于检索图像对象或其子对象，是针对局部特征的。
基于图像抽象属性（场景语义、行为语义、情感语义等）的推理学习进行检索；

矢量空间模型

定义：一个把文本文件表示为标识符（比如索引）向量的代数模型。文档和查询都用向量表示。
$d_{j}=(w_{1,j},w_{2,j},...,w_{t,j})$ $q=(w_{1,q},w_{2,q},...,w_{t,q})$

每一维都对应于一个个别的词组。如果某个词组出现在了文档中，那它在向量中的值就非零。已经发展出了不少的方法来计算这些值，这些值叫做（词组）权重。其中一种最为知名的方式是tf-idf权重（term frequency-inverse document frequency，词频-逆向文档频率）（百度百科）

单词 w 在文档 d 中的词频是：
$tf_{w,d}=\frac{n_{w}}{\sum_{j}^{}n_{j}}$
解释：TF=(该词在文件中的出现次数）/（整个文档中单词的总数）

逆向文档频率为：

$idf_{w,d}=log\frac{|(D)|}{|\left \{ d:w\epsilon d \right \}|}$

解释：IDF=log（语料库D中的文件总数）/（包含单词w 的文档数d）

举例：
假设现在一篇文件的总词语数是1000个，单词"water"出现了20次，则"water"一词在该文件中的词频就是20/1000=0.02。如果“water"一词在100份文件中出现过，文件总数是10000份，则其逆向文件频率就是log(10000/100)=2，最后tf-idf为0.02*2=0.04。

tf-idf计算实验代码：

# -*-coding:utf-8 -*-

# 在词袋模型中,文档的特征就是其包含的word,corpus的每一个元素对应一篇文档
texts = [['human', 'interface', 'computer'],
         ['survey', 'user', 'computer', 'system', 'response', 'time'],
         ['eps', 'use', 'interface', 'system'],
         ['system', 'human', 'system', 'eps'],
         ['user', 'response', 'time'],
         ['trees'],
         ['graph', 'trees'],
         ['graph', 'minors', 'trees'],
         ['graph', 'minors', 'survey']]

# 训练语料的预处理,将原始文本特征表达转换成词袋模型对应的系数向量
from gensim import corpora

# from gensim.models.word2vec import Word2Vec
dictionary = corpora.Dictionary(texts)  # texts就是若干个被拆成单词集合的文档的集合，而dictionary就是把所有单词取一个set(),并对set中每个单词分配一个Id号的map
print(dictionary)
# 是把文档 doc变成一个稀疏向量，[(0, 1), (1, 1)]，表明id为0,1的词汇出现了1次，至于其他词汇，没有出现,在这里可以看出set()中computer的id是0,human的id是1...
corpus = [dictionary.doc2bow(text) for text in texts]
print(corpus)  # 输出为[(0, 1), (1, 1), (2, 1)],就表示id为0,1,2,即单词computer,human,interface,在第一个维度中都出现了一次

# tf-idf的计算
from gensim import models

tfidf = models.TfidfModel(corpus)
print(tfidf)
doc_bow = [(0, 1), (1, 1)]
print(tfidf[doc_bow])
print(tfidf.idfs)

TF-IDF实际上是：TF * IDF。主要思想是：如果某个词或短语在一篇文章中出现的频率高（即TF高），并且在其他文章中很少出现（即IDF高），则认为此词或者短语具有很好的类别区分能力，适合用来分类。

（二）视觉单词

SIFT 局部描述子的思想是将描述子空间量化成一些典型实例，并将图像中的每个描述子指派到其中的某个实例中。这些典型实例可以通过分析训练图像集确定，并被视为视觉单词。所有这些视觉单词构成的集合称为视觉词汇，有时也称为视觉码本。对于给定的问题、图像类型，或在通常情况下仅需呈现视觉内容，可以创建特定的词汇。

利用一些聚类算法可以构建出视觉单词。在采用 K-means 进行聚类时得到的视觉单词是聚类质心。用视觉单词直方图来表示图像，则该模型便称为 BOW 模型。

创建词汇：

创建名为 vocabulary.py 的文件，将下面代码添加进去。该代码创建了一个词汇类，以及在训练图像数据集上训练出一个词汇的方法：

from numpy import *
from scipy.cluster.vq import *

from PCV.localdescriptors import sift


class Vocabulary(object):
    
    def __init__(self,name):
        self.name = name
        self.voc = []
        self.idf = []
        self.trainingdata = []
        self.nbr_words = 0
    
    def train(self,featurefiles,k=100,subsampling=10):
        """ 用含有k个单词的 K-means 列出在 featurefiles 中的特征文件训练出一个词汇。对训练数据下采样可以加快训练速度 """
        
        nbr_images = len(featurefiles)
        # 从文件中读取特征 
        descr = []
        descr.append(sift.read_features_from_file(featurefiles[0])[1])
        # 将所有的特征并在一起，以便后面进行 K-means 聚类 
        descriptors = descr[0] 
        for i in arange(1,nbr_images):
            descr.append(sift.read_features_from_file(featurefiles[i])[1])
            descriptors = vstack((descriptors,descr[i]))
            
        #K-means: 最后一个参数决定运行次数 
        self.voc,distortion = kmeans(descriptors[::subsampling,:],k,1)
        self.nbr_words = self.voc.shape[0]
        
        # 遍历所有的训练图像，并投影到词汇上 
        imwords = zeros((nbr_images,self.nbr_words))
        for i in range( nbr_images ):
            imwords[i] = self.project(descr[i])
        
        nbr_occurences = sum( (imwords > 0)*1 ,axis=0)
        
        self.idf = log( (1.0*nbr_images) / (1.0*nbr_occurences+1) )
        self.trainingdata = featurefiles
    
    def project(self,descriptors):
        """ 将描述子投影到词汇上，以创建单词直方图  """
        
        # 图像单词直方图
        imhist = zeros((self.nbr_words))
        words,distance = vq(descriptors,self.voc)
        for w in words:
            imhist[w] += 1
        
        return imhist

# -*- coding: utf-8 -*-
import pickle
from PCV.imagesearch import vocabulary
from PCV.tools.imtools import get_imlist
from PCV.localdescriptors import sift

#获取图像列表
imlist = get_imlist('first1000/')
nbr_images = len(imlist)
#获取特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]

#提取文件夹下图像的sift特征
for i in range(nbr_images):
    sift.process_image(imlist[i], featlist[i])

#生成词汇
voc = vocabulary.Vocabulary('ukbenchtest')
voc.train(featlist, 1000, 10)
#保存词汇
with open('first1000/vocabulary.pkl', 'wb') as f:
    pickle.dump(voc, f)
print ('vocabulary is:', voc.name, voc.nbr_words)

(‘vocabulary is:’, ‘ukbenchtest’, 1000)

Vocabulary 类包含了一个由单词聚类中心 VOC 与每个单词对应的逆向文档频率构成的向量，为了在某些图像集上训练词汇，train() 方法获取包含有 .sift 描后缀的述子文件列表和词汇单词数k。在 K-means 聚类阶段可以对训练数据下采样，因为如果使用过多特征，会耗费很长时间。可以看到在计算机文件夹中，保存了图像及提取出来的 sift 特征文件。代码最后部分用 pickle 模块保存了整个词汇对象以便后面使用。

（三）图像索引

对图像进行索引就是从这些图像中提取描述子，利用词汇将描述子转换成视觉单词，并保存视觉单词及对应图像的单词直方图。从而可以利用图像对数据库进行查询，并返回相似的图像作为搜索结果。在开始搜索之前，需要建立图像数据库和图像的视觉单词表示。

3.1 建立数据库

使用SQLite 作为数据库。SQLite 将所有信息都保存到一个文件，是一个易于安装和使用的数据库。不涉及数据库和服务器的配置，很容易上手。SQLite 对应的Python 版本是pysqlite，可以从 http://code.google.com/p/pysqlite/ 获取。

在开始之前，首先需要创建表、索引和索引器 Indexer 类，以便将图像数据写入数据库。首先，创建一个名为 imagesearch.py 的文件，

from numpy import *
import pickle
import sqlite3
from functools import cmp_to_key
import operator

class Indexer(object):
    
    def __init__(self,db,voc):
        """ 初始化数据库的名称及词汇对象  """
            
        self.con = sqlite3.connect(db)
        self.voc = voc
    
    def __del__(self):
        self.con.close()
    
    def db_commit(self):
        self.con.commit()
    
    def create_tables(self): 
        """ Create the database tables. """
        
        self.con.execute('create table imlist(filename)')
        self.con.execute('create table imwords(imid,wordid,vocname)')
        self.con.execute('create table imhistograms(imid,histogram,vocname)')        
        self.con.execute('create index im_idx on imlist(filename)')
        self.con.execute('create index wordid_idx on imwords(wordid)')
        self.con.execute('create index imid_idx on imwords(imid)')
        self.con.execute('create index imidhist_idx on imhistograms(imid)')
        self.db_commit()

用pickle 模块将这些数组编码成字符串以及将字符串进行解码； SQLite 可以从 pysqlite2 模块中导入。 Indexer 类连接数据库，并且一旦创建（调用 init() 方法）后就可以保存词汇对象。del() 方法可以确保关闭数据库连接，db_commit() 可以将更改写入数据库文件。

我们仅需一个包含三个表单的简单数据库模式。

表单 imlist 包含所有要索引的图像文件名；imwords 包含了一个那些单词的单词索引、用到了哪个词汇、以及单词出现在哪些图像中；最后，imhistograms 包含了全部每幅图像的单词直方图。根据矢量空间模型，我们需要这些以便进行图像比较。

3.2 添加图像

有了数据库表单，便可以在索引中添加图像。为了实现该功能，需要在 Indexer 类中添加 add_to_index() 方法。将下面的方法添加到 imagesearch.py 中：

def add_to_index(self,imname,descr):
        """ 获取一幅带有特征描述子的图像，投影到词汇上并添加进数据库  """
            
        if self.is_indexed(imname): return
        print 'indexing', imname
        
        # 获取图像id
        imid = self.get_id(imname)
        
        # 获取单词
        imwords = self.voc.project(descr)
        nbr_words = imwords.shape[0]
        
        #将每个单词与图像链接起来 
        for i in range(nbr_words):
            word = imwords[i]
        #  wordid 就是单词本身的数字 
            self.con.execute("insert into imwords(imid,wordid,vocname) values (?,?,?)", (imid,word,self.voc.name))
            
        # 存储图像的单词直方图
        # 用 pickle 模块将 NumPy 数组编码成字符串
        self.con.execute("insert into imhistograms(imid,histogram,vocname) values (?,?,?)", (imid,pickle.dumps(imwords),self.voc.name))

该方法获取图像文件名与 Numpy 数组，该数组包含的是在图像找到的描述子。这些描述子投影到词汇上，并插入到 imwords（逐字）和 imhistograms 表单中。使用两个辅助函数：is_indxed() 用来检查图像是否已经被索引，get_id() 则对一幅图像文件名给定 id 号。将下面的代码添加进 imagesearch.py：

def is_indexed(self,imname):
        """ 如果图像名字（imname）被索引到，就返回 True"""
        
        im = self.con.execute("select rowid from imlist where filename='%s'" % imname).fetchone()
        return im != None
 def get_id(self,imname):
        """ 获取图像 id，如果不存在，就进行添加 ""
        
        cur = self.con.execute(
        "select rowid from imlist where filename='%s'" % imname)
        res=cur.fetchone()
        if res==None:
            cur = self.con.execute(
            "insert into imlist(filename) values ('%s')" % imname)
            return cur.lastrowid
        else:
            return res[0]

import sqlite3
con = sqlite3.connect('testImaAdd.db')
print con.execute('select count (filename) from imlist').fetchone()
print con.execute('select * from imlist').fetchone()

控制台打印结果如下：

最后一行用 fetchall() 来代替 fetchone()，会得到一个包含所有文件名的长列表：

（四）在数据库中搜索图像

建立好图像的索引，我们就可以在数据库中搜索相似的图像了。这里，我们用BoW （Bag-of-Word，词袋模型）来表示整个图像。

为实现搜索，我们在 imagesearch.py 中添加 Searcher 类：

class Searcher(object):
    
    def __init__(self,db,voc):
        """ 初始化数据库的名称. """
        self.con = sqlite.connect(db)
        self.voc = voc
    
    def __del__(self):
        self.con.close()

一个新的 Searcher 对象连接到数据库，一旦删除便关闭连接，这与之前的 Indexer 类中的处理过程相同。如果图像数据库很大，逐一比较整个数据库中的所有直方图往往是不可行的。我们需要找到一个大小合理的候选集（这里的“合理”是通过搜索响应时间、所需内存等确定的），单词索引的作用便在于此：我们可以利用单词索引获得候选集，然后只需在候选集上进行逐一比较。

4.1 利用索引获取候选图像

可以利用建立起来的索引找到包含特定单词的所有图像，这不过是对数据库做一次简单的查询。在 Searcher 类中加入 candidates_from_word() 方法：

    def candidates_from_word(self, imword):
        """  获取包含 imword 的图像列. """

        im_ids = self.con.execute(
            "select distinct imid from imwords where wordid=%d" % imword).fetchall()
        return [i[0] for i in im_ids]

上面会给出包含特定单词的所有图像 id 号。为了获得包含多个单词的候选图像，例如一个单词直方图中的全部非零元素，我们在每个单词上进行遍历，得到包含该单词的图像，并合并这些列表。

这里，我们仍然需要在合并了的列表中对每一个图像 id 出现的次数进行跟踪，因为这可以显示有多少单词与单词直方图中的单词匹配。该过程可以通过下面的 candidates_from_histogram 方法完成：

    def candidates_from_histogram(self, imwords):
        """ 获取具有相似单词的图像列表 """

        # 获取单词 id
        words = imwords.nonzero()[0]

        # 寻找候选图像
        candidates = []
        for word in words:
            c = self.candidates_from_word(word)
            candidates += c

        # 获取所有唯一的单词，并按出现次数反向排序 
        tmp = [(w, candidates.count(w)) for w in set(candidates)]
        tmp.sort(key=cmp_to_key(lambda x, y: operator.gt(x[1], y[1])))
        tmp.reverse()

        # 返回排序后的列表，最匹配的排在最前面
        return [w[0] for w in tmp]

该方法从图像单词直方图的非零项创建单词 id 列表，检索每个单词获得候选集并将其合并到candidates 列表中，然后创建一个元组列表每个元组由单词 id 和次数 count 构成，其中次数 count 是候选列表中每个单词出现的次数。同时，以元组中的第二个元素为准，用 sort() 方法和一个自定义的比较函数对列表进行排序（考虑到后面的效率）。该自定义比较函数进行用 lambda 函数内联声明，对于单行函数声明，使用 lambda 函数非常方便。最后结果返回一个包含图像 id 的列表，排在列表最前面的是最好的匹配图像。

src = imagesearch.Searcher('testImaAdd.db', voc)
locs,descr = sift.read_features_from_file(featlist[0])
iw = voc.project(descr)
print 'ask using a histogram...'
print src.candidates_from_histogram(iw)[:10]

打印了从索引中查找出的前 10 个图像 id，结果如下：

4.2 用一幅图像进行查询

利用一幅图像进行查询时，没有必要进行完全的搜索。为了比较单词直方图，Searcher 类需要从数据库读入图像的单词直方图。将下面的方法添加到 Searcher 类中：

 def get_imhistogram(self, imname):
        """ 返回一幅图像的单词直方图 . """

        im_id = self.con.execute(
            "select rowid from imlist where filename='%s'" % imname).fetchone()
        s = self.con.execute(
            "select histogram from imhistograms where rowid='%d'" % im_id).fetchone()

        # 用 pickle 模块从字符串解码 Numpy 数组
        return pickle.loads(str(s[0]))

这里，为了在字符串和 NumPy 数组间进行转换，我们再次用到了 pickle 模块，这次使用的是 loads()。

现在，我们可以全部合并到查询方法中：

    def query(self, imname):
        """ 查找所有与 imname 匹配的图像列表 . """

        h = self.get_imhistogram(imname)
        candidates = self.candidates_from_histogram(h)

        matchscores = []
        for imid in candidates:
            # 获取名字 
            cand_name = self.con.execute(
                "select filename from imlist where rowid=%d" % imid).fetchone()
            cand_h = self.get_imhistogram(cand_name)
            cand_dist = sqrt(sum(self.voc.idf * (h - cand_h) ** 2))
            matchscores.append((cand_dist, imid))

        # 返回排序后的距离及对应数据库 ids 列表 
        matchscores.sort()
        return matchscores

该 query() 方法获取图像的文件名，检索其单词直方图及候选图像列表（如果你的数据集很大，候选集的大小应该限制在某个最大值）。对于每个候选图像，用标准的欧式距离比较它和查询图像间的直方图，并返回一个经排序的包含距离及图像 id的元组列表。

尝试对前一节的图像进行查询

src = imagesearch.Searcher('testImaAdd.db', voc)
print 'try a query...'
print src.query(imlist[0])[:10]

打印了前 10 个结果，包括候选图像与查询图像间的距离。

（五）使用几何特性对结果排序

BoW 模型的一个主要缺点是在用视觉单词表示图像时不包含图像特征的位置信息，这是为获取速度和可伸缩性而付出的代价。利用一些考虑到特征几何关系的准则重排搜索到的靠前结果，可以提高准确率。最常用的方法是在查询图像与靠前图像的特征位置间拟合单应性。

为了提高效率，可以将特征位置存储在数据库中，并由特征的单词 id 决定它们之间的关联（要注意的是，只有在词汇足够大，使单词 id 包含很多准确匹配时，它才起作用）。

下面是一个载入所有模型文件并用单应性对靠前的图像进行重排的完整例子：

# -*- coding: utf-8 -*-
import pickle
from PCV.localdescriptors import sift
from PCV.imagesearch import imagesearch
from PCV.geometry import homography
from PCV.tools.imtools import get_imlist

# load image list and vocabulary
#载入图像列表
imlist = get_imlist('first1000/')
nbr_images = len(imlist)
#载入特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]

#载入词汇
with open('first1000/vocabulary.pkl', 'rb') as f:
    voc = pickle.load(f)

src = imagesearch.Searcher('testImaAdd.db',voc)

# index of query image and number of results to return
#查询图像索引和查询返回的图像数
q_ind = 0
nbr_results = 20

# regular query
# 常规查询(按欧式距离对结果排序)
res_reg = [w[1] for w in src.query(imlist[q_ind])[:nbr_results]]
print 'top matches (regular):', res_reg

# load image features for query image
#载入查询图像特征
q_locs,q_descr = sift.read_features_from_file(featlist[q_ind])
fp = homography.make_homog(q_locs[:,:2].T)

# RANSAC model for homography fitting
#用单应性进行拟合建立RANSAC模型
model = homography.RansacModel()
rank = {}

# load image features for result
#载入候选图像的特征
for ndx in res_reg[1:]:
    locs,descr = sift.read_features_from_file(featlist[ndx])  # because 'ndx' is a rowid of the DB that starts at 1
    # get matches
    matches = sift.match(q_descr,descr)
    ind = matches.nonzero()[0]
    ind2 = matches[ind]
    tp = homography.make_homog(locs[:,:2].T)
    # compute homography, count inliers. if not enough matches return empty list
    try:
        H,inliers = homography.H_from_ransac(fp[:,ind],tp[:,ind2],model,match_theshold=4)
    except:
        inliers = []
    # store inlier count
    rank[ndx] = len(inliers)

# sort dictionary to get the most inliers first
sorted_rank = sorted(rank.items(), key=lambda t: t[1], reverse=True)
res_geom = [res_reg[0]]+[s[0] for s in sorted_rank]
print ('top matches (homography):', res_geom)

# 显示查询结果
imagesearch.plot_results(src,res_reg[:8]) #常规查询
imagesearch.plot_results(src,res_geom[:8]) #重排后的结果

控制台输出结果：

可视化常规查询图像：

可视化排序后图像:

整个过程，首先载入图像列表、特征列表（分别包含图像文件名和 SIFT 特征文件）及词汇。然后，创建一个 Searcher 对象，执行定期查询，并将结果保存在 res_reg 列表中。然后载入 res_reg 列表中每一幅图像的特征，并和查询图像进行匹配。单应性通过计算匹配数和计数内点数得到。最终，我们可以通过减少内点的数目对包含图像索引和内点数的字典进行排序，可以看到排序效果较好。

（六）建立演示程序及 Web 应用

首先，我们需要用一些 HTML 标签进行初始化，并用 Pickle 载入数据。另外，还需要有与数据库进行交互的 Searcher 对象词汇。创建一个名为 searchdemo.py 的文件，并添加下面具有两个方法的 Search Demo 类：

# -*- coding: utf-8 -*-
import cherrypy
import pickle
import urllib
import os
from numpy import *
#from PCV.tools.imtools import get_imlist
from PCV.imagesearch import imagesearch
import random

"""
This is the image search demo in Section 7.6.
"""


class SearchDemo:

    def __init__(self):
        # 载入图像列表
        self.path = 'first1000/'
        #self.path = 'D:/python_web/isoutu/first500/'
        self.imlist = [os.path.join(self.path,f) for f in os.listdir(self.path) if f.endswith('.jpg')]
        #self.imlist = get_imlist('./first500/')
        #self.imlist = get_imlist('E:/python/isoutu/first500/')
        self.nbr_images = len(self.imlist)
        print (self.imlist)
        print (self.nbr_images)
        self.ndx = list(range(self.nbr_images))
        print (self.ndx)

        # 载入词汇
        # f = open('first1000/vocabulary.pkl', 'rb')
        with open('first1000/vocabulary.pkl','rb') as f:
            self.voc = pickle.load(f)
        #f.close()

        # 显示搜索返回的图像数
        self.maxres = 10

        # header and footer html
        self.header = """
            
            
            Image search
            
            
            """
        self.footer = """
            
            
            """

    def index(self, query=None):
        self.src = imagesearch.Searcher('testImaAdd.db', self.voc)

        html = self.header
        html += """
            

            Click an image to search.  Random selection  of images.
            


            """
        if query:
            # query the database and get top images
            #查询数据库，并获取前面的图像
            res = self.src.query(query)[:self.maxres]
            for dist, ndx in res:
                imname = self.src.get_filename(ndx)
                html += ""
                
                html += ""
                print (imname+"################")
                html += ""
            # show random selection if no query
            # 如果没有查询图像则随机显示一些图像
        else:
            random.shuffle(self.ndx)
            for i in self.ndx[:self.maxres]:
                imname = self.imlist[i]
                html += ""
                
                html += ""
                print (imname+"################")
                html += ""

        html += self.footer
        return html

    index.exposed = True
cherrypy.quickstart(SearchDemo(), '/', config=os.path.join(os.path.dirname(__file__), 'service.conf'))

该类包含一个初始化 int() 方法和一个“索引”页面 index() 方法。这两个方法可以自动地映射至 URL，并且方法中的参数可以直接传递到 URL 中。index 方法里有一个查询参数，在本例中，该参数是查询图像，用来对其他图像排序。如果该参数是空的，就会随机显示一些图像。

index.exposed = True

上面一行使索引 URL 可以被访问，上面 searchsemo.py 中紧接着该行的最后一行通过读取 service.conf 配置文件开启 CherryPy Web服务器。在这个例子中，配置文件如下：

[global]
server.socket_host = “127.0.0.1”
server.socket_port = 8080
server.thread_pool = 50
tools.sessions.on = True
[/]
tools.staticdir.root = “D:\Python\chapter7\BOW\”
tools.staticdir.on = True
tools.staticdir.dir = “”

第一部分指定使用的 IP 地址和端口，第二部分确保本地文件夹可以读取。

打开浏览器，在地址栏输入http://127.0.0.1:8080/，你可以看到随机挑选出来的图像的初始页面：

点击一幅图像进行查询，会显示出搜索出来的前几幅图像：

在搜索出来的图像中单击某图像可以开始新的查询：

你可能感兴趣的:(Python计算机视觉编程)

Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
Python计算机视觉编程——第二章局部图像描述子 adchloe python 计算机视觉开发语言
目录1Harris角点检测器2SIFT2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子1Harris角点检测器Harris角点检测算法是简单的角点检测算法，主要思想是，如果像素周围显示存在多于一个方向的边，认为该点为兴趣点，称为角点。把图像域中点x上的对称半正定矩阵Mr=Ml(x)M_{r}=M_{l}(\mathbf{x})Mr=Ml(x)定义为：M1=∇I ∇IT=[IxIy][IxI
Python计算机视觉编程pdf txt mobi下载及读书笔记 mrxllh0
Python计算机视觉编程pdftxtmobi读书笔记应该是这一学期图像分析比较有用的工具书了，numpy和matplotlib常用的方法基本都有，并且例子也不错。非常好的计算机视觉入门书，亮点在于没有直接使用OpenCV，而是先简单介绍算法原理，再利用NumPy、matplotlib等基本工具进行算法实现，对于已经学习了计算机视觉理论，但是不知道怎么把公式变成代码的人来说很有帮助。作者:[瑞典]
[笔记]Python计算机视觉编程《一》基本的图像操作和处理二进制怪兽 Python 人工智障读书笔记计算机视觉笔记 python
文章目录前言环境搭建计算机视觉简介Python和NumPy第一章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图图像的轮廓直方图1.2.3【交互式标注】1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3
python计算机视觉编程——第一章（基本的图像操作和处理） NCTU_to_prove_safety 算法
第1章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式——save()函数1.1.2创建缩略图1.1.3复制并粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib库1.2.1画图、描点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy库1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.
PIL–Python图像处理类库斯特凡1899
—–前言—–才开始看Python，感觉离时代好远。现在看的是《Python计算机视觉编程》，欢迎交流！—–正题—–PIL，PhthonImagingLibrary，Python图像图里类库。提供了通用的图像处理功能，以及大量有用的基本图像操作，如图像缩放、裁剪、旋转、颜色转换等。代码例子:fromPILimportImage#读取图像im=Image.open("empire.jpeg")thum
python计算机视觉编程.pdf微盘_Python计算机视觉编程pdf weixin_39860280
下载地址：网盘下载内容简介······《python计算机视觉编程》是计算机视觉编程的权威实践指南，依赖python语言讲解了基础理论与算法，并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外，书中附带的练习还能让读者巩固并学会应用编程知识。《python计算机视觉编程》适合的读者
python画龙舟_Python计算机视觉编程第二章——局部图像描述子 weixin_39999781 python画龙舟
Python计算机视觉编程局部图像描述子(一)Harris角点检测器(二)SIFT(尺度不变特征变换)2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子(三)匹配地理标记图像3.1从Panoramio下载地理标记图像3.2使用局部描述子匹配3.3可视化连接的图像局部图像描述子本节旨在寻找图像间的对应点和对应区域。介绍用于图像匹配的两种局部描述子算法。图像的局部特征是许多计算机视觉算法的基础，
Python计算机视觉编程第三章图像到图像的映射 LuoY、 Python计算机视觉编程
第三章图像到图像的映射3.1单应性变换3.1.1直接线性变换算法3.1.2仿射变换3.2图像扭曲3.2.1图像中的图像3.2.2图像配准3.3创建全景图3.3.1RANSAC3.3.2稳健的单应性矩阵估计3.3.2拼接图像本章讲解图像之间的变换，以及一些计算变换的实用方法。这些变换可用于图像扭曲变形和图像配准。3.1单应性变换单应性变换是一个人平面内的点映射到另一个平面内的二维投影
Python计算机视觉编程第四章照相机模型与增强现实 LuoY、 Python计算机视觉编程 python 计算机视觉 ar
第四章照相机模型与增强现实4.1针孔照相机模型4.1.1照相机矩阵4.1.2三维点的投影4.1.3照相机矩阵的分解4.1.4计算照相机中心4.2照相机标定4.3以平面和标记物体进行姿态估计4.4增强现实4.1针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精确度。在针孔照相机模型中，在光线投影到
python图像处理笔记-八-针孔照相机模型与照相机标定 BluePing
参考教材：python计算机视觉编程视觉SLAM十四讲，从理论到实践针孔照相机模型针孔摄像机模型（有时称作摄影照相机模型），是计算机视觉中广泛应用的照相机模型。原因是：简单精度足够这个名字来源于一种简单的照相机，他利用小孔成像原理进行成像，换句话说就是：在光线投影到图像平面前，从唯一一个点经过，这个经过的点就叫做：照相机中心，记做C，如下图所示：（这张图来自于他人博客：https://blog.c
Python计算机视觉编程_03 chuxiao_scx python 机器学习
基于SIFT算法的全景拼接前言1.单应性变换2.RANSAC算法3.Multi-BandBlending策略4.代码实现前言什么是全景拼接？简单来说就是将两幅或多幅具有重叠区域的图像，合并成一张大图如图所示，7张不同的图像最后拼接成一幅大图，那么问题很明显，如何拼接呢？1.单应性变换如果是最简单图像拼接，很明显，我们只需要对其进行平移，将重叠区域叠加，很轻松的就能得到一幅拼接图像。但实际上两幅图像
Python计算机视觉编程——第6章图像聚类海鸥丸拉面 python 聚类计算机视觉
目录6.1K-means聚类6.1.1Scipy聚类包6.1.2图像聚类6.1.3在主成分上可视化图像6.1.4像素聚类6.2层次聚类图像聚类6.3谱聚类6.1K-means聚类K-means是一种将输入数据划分成k个簇的简单的聚类算法。K-means反复提炼初始评估的类中心，步骤如下：以随机或猜测的方式初始化类中心ui,i=1...k;将每个数据点归并到离他距离最近的类中心所属的类ci；对所有属
Python计算机视觉编程--第四章娇娇是大熊 python python
照相机模型与增强现实一、针孔照相机模型1.1照相机矩阵1.2三维点的投影1.3照相机矩阵的分解1.4照相机中心二、照相机标定一、针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精准度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。在光线投影到图像平面之前，从唯一一个点经
Python计算机视觉编程——第8章图像内容分类海鸥丸拉面 python 计算机视觉分类
目录8.1K临近分类法（KNN）8.1.1一个简单的二维示例8.1.2用稠密SIFT作为图像特征8.1.3图像分类：手势识别8.2贝叶斯分类器用PCA降维8.3支持向量机8.3.1使用LibSVM8.1K临近分类法（KNN）在分类算法中，最简单且用的最多的一种方法之一就是KNN(K-NearsetNeighbor，K邻近分类法)，这种算法把要分类的对象（例如一个特征向量）与训练集中已知类标记的所有
Python计算机视觉编程——第10章 OpenCV 海鸥丸拉面计算机视觉 python opencv
目录10.1OpenCV的Python接口10.2OpenCV基础知识10.2.1读取和写入图像10.2.2颜色空间10.2.3显示图像及结果10.3处理视频10.3.1视频输入10.3.2将视频读取到NumPy数组中10.4跟踪10.4.2Lucas-Kanade算法1.使用跟踪器2.使用发生器10.1OpenCV的Python接口OpenCV是一个C++库，它包含了计算机视觉领域的很多模块。除
Python计算机视觉编程_01 chuxiao_scx python 计算机视觉 opencv
基本的图像操作和处理前言1.图像直方图1.1.原理1.2.结果演示2.高斯滤波2.1.原理2.2.结果演示3.直方图均衡化3.1.原理3.2.结果演示后记前言本篇博客介绍在vscode中使用opencv进行图像处理的基本操作，使用的语言为python，vscode中按照python可以参考我以前写的这篇博客：vscode中配置python环境至于在vscode导入opencv包就请各位自行百度解决
机器学习算法：支持向量机（SVM）夏天是冰红茶 #计算机视觉机器学习支持向量机算法
参考书籍：Solem《python计算机视觉编程》、李航《统计学习方法》、周志华《机器学习》要理解好支持向量机需要较好的数学功底，且能不被公式以及文字绕晕，这里我们就理清楚支持向量机的大体过程。具体的数学计算推导其实已经封装好了，那么理解算法的原理也对我们将来的学习很有帮助，比如以后做科研的时候，大家冥思苦想找不到方法的时候，你走上前去说，唉这个方法就能解决，是不是特别能得到满足。0、概念提前知超
Python计算机视觉编程第一章——基本的图像操作和处理海鸥丸拉面计算机视觉图像处理 python
目录1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3Unmpy1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.6图像的主成分分析（PCA）1.3.7使用p
Python计算机视觉编程第一章基本的图像操作和处理 LuoY、 python 计算机视觉图像处理
第一章基本的图像操作和处理1.1PIL:Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3直方图均衡化1.3.4图像平均1.3.5使用pickle模块1.4SciPy1
python计算机视觉编程 Hesilan python 自然语言处理机器学习
@《python计算机视觉处理编程》第一章笔记Python计算机视觉编程笔记，还在学习之中红色：imtools函数蓝色：函数功能绿色：拓展知识1、fromPILimportImage输入pillow包，图像缩放，裁剪、旋转、颜色转换pil_im=Image.open(‘D:\RGB\Testpicture\pexels-photo-417173.jpg’)打开一张图片print(pil_img.s
《Python 计算机视觉编程》学习笔记（一）书生丶丶 python 计算机视觉学习
《Python计算机视觉编程》文章目录前言第1章基本的图像操作和处理引言1.1PIL：Python图像处理类库图像读取、显示、显示对应灰度图更改图像格式（后缀）创建缩略图复制和粘贴图像区域调整尺寸和旋转1.2Matplotlib绘制图像、点和线图像轮廓和直方图交互式标注1.3NumPy图像数组表示灰度变换直方图均衡化图像的主成分分析（PCA）1.4SciPy图像模糊图像导数形态学：对象计数一些有用
Python计算机视觉编程 - 第三章图像映射 -全景拼接煮酒忆南山 python
全景拼接原理简述在同一位置拍摄的两幅或者多幅图片是单应性相关的，我们经常使用该约束将很多图像缝补起来，拼成一个全景图。全景图像拼接最重要的两个步骤是：1.特征匹配2.图像拼接在本次测试中，我使用的是sift特征匹配,在特征匹配之后，我们使用RANSAC算法求解得到单应性矩阵。其基本思想是，数据中包含正确的点和噪声点，合理的模型能够在描述正确数据点的同时摒弃噪声点，在这里的用途就是排除掉不符合大部分
Python计算机视觉编程第二章局部图像描述子仙蓝计算机视觉计算机视觉 python 算法
Python计算机视觉编程第二章局部图像描述子1Harris角点检测1.1基本概念1.2例子2在图像中寻找对应点2.1基本概念2.2例子3SIFT(尺度不变特征变换)3.1介绍3.2兴趣点3.3描述子3.4检测兴趣点——例子3.5匹配描述子——例子4地理特征匹配4.1需要安装PCV环境4.2测试图片4.3实现代码1Harris角点检测1.1基本概念Harris角点检测算法（也称Harris&Ste
图像检索代码python tf_Python计算机视觉编程（八）图像检索埃斯蓬托的篡位者图像检索代码python tf
图像检索BOW模型基于BOW的图像检索特征提取视觉词典TF-IDF常用参数图像检索具体实现流程BOW模型Bag-of-wordsmodels模型(词袋模型)词袋模型对于给定的两个文档，进行分割可以建构出一个有n个元素词典，根据词典每个词在两个文档中的出现的频率，表示成两个n维向量。基于BOW的图像检索特征提取学习视觉词典针对输入特征集，根据视觉词典进行量化把输入图像，根据TF-IDF转化成视觉单词
python内实现k-means聚类 superdont 图像处理 python python计算机视觉
《Python计算机视觉编程》学习笔记fromscipy.cluster.vqimport*importnumpyasnpfrommatplotlibimportpyplotaspltclass1=1.5*np.random.randn(100,2)##print(class1)class2=np.random.randn(100,2)+np.array([8,8])##print(class2)
Python计算机视觉编程学习笔记十 OPENCV Belouga- 数字图像处理计算机视觉 python
OPENCV（一）OpenCV的Python接口（二）OpenCV基础知识2.1图像读取和写入2.2颜色空间2.3显示图像及结果2.4平移与缩放（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割cv2.watershed()5.3利用霍夫变换检测直线（一）OpenCV的Pyth
Python计算机视觉编程第十章——OpenCV基础知识 Dujing2019 Python计算机视觉编程
Python计算机视觉编程（一）OpenCV的Python接口（二）OpenCV基础知识2.1读取和写入图像2.2颜色空间2.3显示图像及结果（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割5.3利用霍夫变换检测直线（一）OpenCV的Python接口OpenCV是一个C++
Python计算机视觉编程学习笔记七图像搜索白鲸鱼2020 python 数字图像处理计算机视觉
图像搜索（一）基于内容的图像检索（二）视觉单词2.1：创建词汇2.2：创建图像索引2.3：在数据库中搜索图像（三）使用几何特性对结果排序（一）基于内容的图像检索CBIR（Content-BasedImageRetrieval，基于内容的图像检索）CBIR的实现依赖于两个关键技术的解决：图像特征提取和匹配。定义:即从图像库中查找含有特定目标的图像，也包括从连续的视频图像中检索含有特定目标的视频片段。
Python计算机视觉编程学习笔记三图像到图像的映射白鲸鱼2020 计算机视觉 python 数字图像处理
图像到图像的映射（一）单应性变换1.2仿射变换（二）图像扭曲2.1图像中的图像2.2图像配准（三）创建全景图3.1RANSAC3.2拼接图像（一）单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。本质上，单应性变换H，按照下面的方程映射二维中的点（齐次坐标
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。