Liaojiajia2019

六、【python计算机视觉编程】图像聚类

图像聚类

（一）K-means聚类（K均值聚类）

（1）Scipy聚类包
（2）图像聚类
（3）在主成分上可视化图像
（4）像素聚类

（二）层次聚类
（三）谱聚类

聚类可以用于识别、划分图像数据集，组织与导航。还可以对聚类后的图像进行相似性可视化。

所谓聚类，就是将相似的事物聚集在一起，而将不相似的事物划分到不同的类别的过程，是数据分析之中十分重要的一种手段。

在数据分析的术语之中，聚类和分类是两种技术。分类是指我们已经知道了事物的类别，需要从样品中学习分类的规则，是一种有指导学习；而聚类则是由我们来给定简单的规则，从而得到分类，是一种无指导学习。两者可以说是相反的过程。

（一）K-means聚类（K均值聚类）

K-Means概念：
假设有一些数据,但是没有标签.我们没有他们的类别信息,因此每个点都是一样的.你并不能够看出他们的类别信息。

这时候我们需要引入距离和相似性的概念：
我们认为距离越近的对象是越相似的。比如可以用点的欧式距离来衡量。当然,其他的距离度量方式也是可以的。
我们的目标就是让这些数据来自动为自己分组。那为了实现这些自动分组的方法，这里就要形式化地定义聚类。对于K-means来说，它是将某一类定义为具有代表性的点，就像一个数据对象。该点为该聚类中对象的均值(K-means就是这么来的)。.

K-means是一种将输入数据划分成k个簇的简单的聚类算法。K-means反复提炼初始评估的类中心。K-means能够发现K个不同的簇，且每个簇的中心采用簇中所含值的均值计算而成。簇个数K是我们自己定义的，每一个簇通过其质心，即该簇中所有点的中心来描述。

K-Means算法原理：
对给定的样本集，事先确定聚类簇数K，让簇内的样本尽可能紧密分布在一起，使簇间的距离尽可能大。该算法试图使集群数据分为n组独立数据样本，使n组集群间的方差相等，数学描述为最小化惯性或集群内的平方和。K-Means作为无监督的聚类算法，实现较简单，聚类效果好，因此被广泛使用。

K-Means算法步骤如下：

输入：样本集D，簇的数目k，最大迭代次数N；

输出：簇划分（k个簇，使平方误差最小）；

以随机或猜测的方式初始化类中心u_i，i=1……k；（注：采用随机的方法实现简单，但是簇的质量往往比较差，所以有好几种关于中心选取的解决方案，比如先使用层次聚类进行聚类，从层次聚类中提取K个簇，并用这些簇的质心作为初始质心。也有通过使类内总方差最小的方式，选择方差最小的类中心。）
将每个数据点归并到离它距离最近的类中心所属的类c_i； （注：常用的距离度量方法包括：欧几里得距离和余弦相似度。两者都是评定个体间差异的大小的。欧几里得距离度量会受指标不同单位刻度的影响，所以一般需要先进行标准化。余弦相似度倾向给出更优解。）
对所有属于该类的数据点求平均，将平均值作为新的类中心；
重复步骤（2）和步骤（3）直到收敛。

K-means试图使类内总方差最小：
$V=\sum_{i=1}^{k}\sum_{x_{j}\in c_{i}}^{ }(x_{j}-\mu _{i})^{2}$ 其中， $x_{j}$ 是输入数据，并且是矢量。该算法是启发式提炼算法，在很多情形下都适用，但是不能保证得到最优的结果。为了避免初始化类中心时没选取好类中心初值所造成的影响，该算法通常会初始化不同的类中心进行多次运算，然后选择方差 $V$ 最小的结果。

K-means算法的缺陷是：必须预先设定聚类数k，如果选择不恰当则会导致聚类出来的结果很差。当样本集规模大时，收敛速度会变慢；对孤立点数据敏感，少量噪声就会对平均值造成较大影响；k的取值十分关键，对不同数据集，k选择没有参考性，需要大量实验。

K-means算法优点是：容易实现，可以并行计算，并且对于很多别的问题不需要任何调整就能够直接使用；聚类效果较优；算法的可解释度比较强；主要需要调参的参数仅仅是簇数k。

K-means算法的关键：在于初始中心的选择和距离公式。

K-means算法复杂度：

时间复杂度：O(tKmn)，其中，t为迭代次数，K为簇的数目，m为记录数，n为维数。

空间复杂度：O((m+K)n)，其中，K为簇的数目，m为记录数，n为维数。

K-Means算法的应用：
K-means算法通常可以应用于维数、数值都很小且连续的数据集。

文档分类器
物品传输优化
识别犯罪地点
客户分类
球队状态分析
保险欺诈检测
乘车数据分析
网络分析犯罪分子
呼叫记录详细分析
IT警报的自动化聚类

（1）Scipy聚类包

K-means算法很容易实现，可以使用Scipy矢量量化包scipy.clusterr.vq中有K-means的实现，下面是使用方法。

运用Scipy聚类包，编写代码：

# -*- coding: utf-8 -*-

#导入scipy中K-means的相关工具
from scipy.cluster.vq import *

#randn是NumPy中的一个函数
from numpy import *
from pylab import *

#生成简单的二维数据:生成两类二维正态分布数据
class1 = 1.5 * randn(100,2)
class2 = randn(100,2) + array([5,5])
features = vstack((class1,class2))

#用 k=2 对这些数据进行聚类:
centroids,variance = kmeans(features,2)

"""
由于 SciPy 中实现的 K-means 会计算若干次(默认为 20 次),并为我们选择方差最
小的结果,所以这里返回的方差并不是我们真正需要的。
"""

#用 SciPy 包中的矢量量化函数对每个数据点进行归类:通过得到的 code ,我们可以检查是否有归类错误
code,distance = vq(features,centroids)

#可视化结果：画出这些数据点及最终的聚类中心：函数 where() 给出每个类的索引
figure()
ndx = where(code==0)[0]
plot(features[ndx,0],features[ndx,1],'*')
ndx = where(code==1)[0]
plot(features[ndx,0],features[ndx,1],'r.')
plot(centroids[:,0],centroids[:,1],'go')
axis('off')
show()

代码运行结果：

实验分析：
上图显示了原数据聚完类后的结果，绿色圆点表示聚类中心，预测出的类分别标记为蓝色星号和红色点。

（2）图像聚类

文件selectedfontimeages.zip包含66幅来自该字体数据集fontinages的图像（为了便于说明这些聚类簇，选择这些图像做简单概述）。利用之前计算过的前40个主成分进行投影，用投影系数作为每幅图像的向量描述符。用pickle模块载入模型文件，在主成分上对图像进行投影，然后用下面的方法聚类：

 # -*- coding: utf-8 -*-
from PCV.tools import imtools
import pickle
from scipy import *
from pylab import *
from PIL import Image
from scipy.cluster.vq import *
from PCV.tools import pca

# Uses sparse pca codepath.
imlist = imtools.get_imlist('selectedfontimages/a_selected_thumbs')

# 获取图像列表和他们的尺寸
im = array(Image.open(imlist[0]))  # open one image to get the size
m, n = im.shape[:2]  # get the size of the images
imnbr = len(imlist)  # get the number of images
print ("The number of images is %d" % imnbr)

# Create matrix to store all flattened images
immatrix = array([array(Image.open(imname)).flatten() for imname in imlist], 'f')

# PCA降维
V, S, immean = pca.pca(immatrix)

# 保存均值和主成分
#f = open('./a_pca_modes.pkl', 'wb')
f = open('./a_pca_modes.pkl', 'wb')
pickle.dump(immean,f)
pickle.dump(V,f)
f.close()


# get list of images
imlist = imtools.get_imlist('selectedfontimages/a_selected_thumbs')
imnbr = len(imlist)

# load model file
with open('a_pca_modes.pkl','rb') as f:
    immean = pickle.load(f)
    V = pickle.load(f)
# create matrix to store all flattened images
immatrix = array([array(Image.open(im)).flatten() for im in imlist],'f')

# project on the 40 first PCs
immean = immean.flatten()
projected = array([dot(V[:40],immatrix[i]-immean) for i in range(imnbr)])

# k-means
projected = whiten(projected)
centroids,distortion = kmeans(projected,4)
code,distance = vq(projected,centroids)

# plot clusters
for k in range(4):
    ind = where(code==k)[0]
    figure()
    gray()
    for i in range(minimum(len(ind),40)):
        subplot(4,10,i+1)
        imshow(immatrix[ind[i]].reshape((25,25)))
        axis('off')
show()

实验效果：

说明：
上面的code变量中包含的是每幅图像属于哪个簇。这里设定聚类数k=4，同时用Scipy的whiten()函数对数据“白化”处理，并进行归一化，使每个特征具有单位方差。可以改变其中的参数，比如主成分数目和k，观察聚类结果有何改变。将每个簇显示在一个独立图像窗口中，且在该图形窗口中最多可以显示40幅图像。用pylab的subplot()函数来设定网格数。

（3）在主成分上可视化图像

补充知识：

什么是主成分？

概念： 主成分分析（Principal Component Analysis，PCA），是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量，转换后的这组变量叫主成分。它已经应用于人脸识别和图像压缩领域中，并且是高维数据计算模型的常用技术。 简单说是把高维数据将成低维数据，比如100000x100000的矩阵降成100000x100的。

基本思想：
在“预处理”阶段通常要先对原始数据进行降维，而PCA就是做这个工作的。
本质上讲，PCA就是将高维的数据通过线性变换投影到低维空间上去，但这个投影不是随便的投影，遵循一个指导思想，那就是：找出最能够代表原始数据的投影方法。 这里怎么理解这个思想呢？“最能代表原始数据”希望降维后的数据不能失真，也就是说，被PCA降掉的那些维度只能是那些噪声或是冗余的数据。
PCA的目的就是 “降噪”和“去冗余” 。“降噪”的目的就是使保留下来的维度间的相关性尽可能小，而“去冗余”的目的就是使保留下来的维度含有的“能量”即方差尽可能大。

为了便于观察上面如何利用主成分进行聚类的，可以在一对主成分方向的坐标上可视化这些图像。一种方法是将图像投影到两个主成分上，改变投影为：

projected = array([dot(V[[0,2]],immatrix[i]-immean) for i in range(imnbr)])

以得到相应的坐标（在这里 V[[0,2]] 分别是第一个和第三个主成分）。当然，也可以将其投影到所有成分上，之后挑选出需要的列。

用PIL中的ImageDraw模块进行可视化。用下面的脚本可以生成如图所示的效果：


 # -*- coding: utf-8 -*-
from PCV.tools import imtools, pca
from PIL import Image, ImageDraw
from pylab import *
from PCV.clustering import  hcluster

imlist = imtools.get_imlist('selectedfontimages/a_selected_thumbs')
imnbr = len(imlist)

# Load images, run PCA.
immatrix = array([array(Image.open(im)).flatten() for im in imlist], 'f')
V, S, immean = pca.pca(immatrix)

# Project on 2 PCs.
projected = array([dot(V[[0, 1]], immatrix[i] - immean) for i in range(imnbr)])  
#projected = array([dot(V[[1, 2]], immatrix[i] - immean) for i in range(imnbr)])  

# height and width
h, w = 1200, 1200

# create a new image with a white background
img = Image.new('RGB', (w, h), (255, 255, 255))
draw = ImageDraw.Draw(img)

# draw axis
draw.line((0, h/2, w, h/2), fill=(255, 0, 0))
draw.line((w/2, 0, w/2, h), fill=(255, 0, 0))

# scale coordinates to fit
scale = abs(projected).max(0)
scaled = floor(array([(p/scale) * (w/2 - 20, h/2 - 20) + (w/2, h/2)
                      for p in projected])).astype(int)

# paste thumbnail of each image
for i in range(imnbr):
  nodeim = Image.open(imlist[i])
  nodeim.thumbnail((25, 25))
  ns = nodeim.size
  box = (scaled[i][0] - ns[0] // 2, scaled[i][1] - ns[1] // 2,
         scaled[i][0] + ns[0] // 2 + 1, scaled[i][1] + ns[1] // 2 + 1)
  img.paste(nodeim, box)

#tree = hcluster.hcluster(projected)
#hcluster.draw_dendrogram(tree,imlist,filename='fonts.png')

figure()
imshow(img)
axis('off')
img.save('pca_font.png')
show()

实验效果图：

说明：
这里用到了整数或floor向下取整除法运算//，通过移去小数点后面的部分，可以返回各个缩略图在白色背景中对应的整数坐标位置。这类图像说明这些字体图像在40维里的分布情况，对于选择一个好的描述子很有帮助。看到，二维投影后相似的字体图像距离较近。

这是生成聚类树的效果图：

tree = hcluster.hcluster(projected)
hcluster.draw_dendrogram(tree,imlist,filename='fonts.png')

（4）像素聚类

将图像区域或像素合并成有意义的部分称为图像分割。单纯在像素水平上应用 K-means可以用于一些简单图像的图像分割，但是对于复杂图像得出的结果往往是毫无意义的。要产生有意义的结果，往往需要更复杂的类模型而非平均像素色彩或空间一致性。

下面在RGB三通道的像素值上运用K-means进行聚类：


# coding=utf-8

from scipy.cluster.vq import *
from scipy import *
from pylab import *
from PIL import Image


# 添加中文字体支持
from matplotlib.font_manager import FontProperties
font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)

steps = 50  # image is divided in steps*steps region
infile = 'empire.jpg'
im = array(Image.open(infile))
dx = im.shape[0]//steps
dy = im.shape[1]//steps
# compute color features for each region
features = []
for x in range(steps):
    for y in range(steps):
        R = mean(im[x*dx:(x+1)*dx,y*dy:(y+1)*dy,0])
        G = mean(im[x*dx:(x+1)*dx,y*dy:(y+1)*dy,1])
        B = mean(im[x*dx:(x+1)*dx,y*dy:(y+1)*dy,2])
        features.append([R, G, B])
features = array(features,'f')     # make into array
# cluster
centroids, variance = kmeans(features, 3)
code, distance = vq(features, centroids)
# create image with cluster labels
codeim = code.reshape(steps, steps)
#codeim = imresize(codeim, im.shape[:2], 'nearest')

figure()
ax1 = subplot(121)
title(u'原图', fontproperties=font)
#ax1.set_title('Image')
axis('off')
imshow(im)

ax2 = subplot(122)
title(u'聚类后的图像', fontproperties=font)
#ax2.set_title('Image after clustering')
axis('off')
imshow(codeim)

show()

遇到的问题：

查了好多博客才知道，这是由于Scipy.misc这个工具包已经在版本1.2.0以后停止使用了，使用skimage.transform.resize. 来替代。说明如下图。

使用如上的方法，出现了各种各样的问题，就把上面的其中一个代码注释了就可以出现如下的效果图。#codeim = imresize(codeim, im.shape[:2], 'nearest')

实验效果图：

注意：
把书上的改为：dx = im.shape[0]//steps dy = im.shape[1]//steps 这样就可以了。如果只想得到整数的结果，丢弃分数部分，可以使用运算符 //，// 得到的是整除的结果。使用list[n]访问list元素时，必须保证n是个整数！

说明：
K-means的输入是一个有steps×steps行的数组，数组的每一行有3列，各列分别为区域块R、G、B三个通道的像素平均值。为可视化最后的结果，用skimage.transform中的resize()函数在原图像坐标中显示这幅图像。上图显示了用50×50和100×100窗口对两幅相对比较简单的示例图像进行像素聚类后的结果。注意，K-means标签的次序是任意的。

（二）层次聚类

层次聚类（或凝聚式聚类）是另一种简单但有效的聚类算法，其思想是基于样本间成对距离建立一个简相似性树。 该算法首先将特征向量距离最近的两个样本归并为一组，并在树中建立一个”平均“节点，将这两个距离最近的样本作为该”平均“节点下的子节点；然后再剩下的包含任意平均节点的样本中寻找下一个最近的对，重复进行前面的操作。在每一个节点处保存了两个子节点之间的距离。遍历整个树，通过设定的阈值，遍历过程可以在比阈值大的节点位置终止，从而提取出聚类簇。

层次聚类技术是第二类重要的聚类方法。层次聚类方法对给定的数据集进行层次的分解，直到满足某种条件为止，传统的层次聚类算法主要分为两大类算法：

凝聚的层次聚类： AGNES算法(AGglomerative NESting) $\rightarrow$ 采用 自底向上 的策略。
最初将每个对象作为一个簇，然后这些簇根据某些准则被一步一步合并，两个簇间的距离可以由这两个不同簇中距离最近的数据点的相似度来确定；聚类的合并过程反复进行直到所有的对象满足簇数目。
分裂的层次聚类： DIANA算法(DIvisive ANALysis) $\rightarrow$ 采用 自顶向下 的策略。
首先将所有对象置于一个簇中，然后按照某种既定的规则逐渐细分为越来越小的簇(比如最大的欧式距离)，直到达到某个终结条件(簇数目或者簇距离达到阈值)。

到目前为止，凝聚层次聚类技术最常见

层次聚类常常使用称作 树状图 的类似于树的图显示，该图显示簇-子簇联系和簇合并（凝聚）或分类的次序。对于二维点的集合，层次聚类也可以使用嵌套簇图表示。如下图所示。

补充知识：
【1】基本凝聚层次聚类算法：

1.如果需要，计算邻近性矩阵；
2.合并最接近的两个簇；
3.更新邻近性矩阵，以反映新的簇与原来的簇之间的邻近性；
4.直到仅剩下一个簇。

【2】定义簇之间的邻近性：
上面算法的关键操作是计算两个簇之间的邻近性，主要有以下几种：

最小距离（MIN）：两个聚簇中最近的两个样本之间的距离(single/word-linkage聚类法)，最终得到模型容易形成链式结构
最大距离(MAX)：两个聚簇中最远的两个样本的距离(complete-linkage聚类法)，如果存在异常值，那么构建可能不太稳定
组平均：两个聚簇中样本间两两距离的平均值(average-linkage聚类法)，两个聚簇中样本间两两距离的中值(median-linkage聚类法)

【3】层次聚类优化算法：
1.BIRCH 算法(平衡迭代削减聚类法)：是一种非常有效的聚类技术，用于欧几里得向量空间数据，即平均值有意义的数据。BIRCH 能够用一遍扫描有效地对这种数据进行聚类，并可以使用附加的扫描改进聚类。BIRCH 还能有效地处理离群点。

BIRCH 基于聚类特征和聚类特征树的概念。基本思想是：数据点的簇可以用三元组 $(N, L S, S S)$ 表示：

$N$ 是簇中点的个数
$L S$ 是点的线性和
$S S$ 是点的平方和

BIRCH 算法通过构建满足 分枝因子和簇直径限制 的聚类特征树来求聚类，聚类特征树其实是一个具有两个参数分枝因子和类直径的高度平衡树；分枝因子规定了树的每个节点的子女的最多个数，而类直径体现了对这一类点的距离范围；非叶子节点为它子女的最大特征值；聚类特征树的构建可以是动态过程的，可以随时根据数据对模型进行更新操作。

优缺点：

1.适合大规模数据集，线性效率；
2.只适合分布呈凸形或者球形的数据集、需要给定聚类个数和簇之间的相关参数；

2.CURE 算法(使用代表点的聚类法)：该算法先把每个数据点看成一类，然后合并距离最近的类直至类个数为所要求的个数为止，但是和 AGNES 算法的区别是：取消了使用所有点或用中心点+距离来表示一个类，而是从每个类中抽取固定数量、分布较好的点作为此类的代表点，并将这些代表点乘以一个适当的收缩因子，使它们更加靠近类中心点。

CURE 使用簇中的多个代表点来表示一个簇：

1.第一个代表点选择离簇中心点最远的点。
2.其余的点选择离所有已经选取的点最远的点
3. 理论上，这些点捕获了簇的几何形状。

代表点的收缩特性可以调整模型可以匹配那些非球形的场景，而且收缩因子的使用可以减少噪音对聚类的影响。

优缺点：

1.能够处理非球形分布的应用场景
2.采用随机抽样和分区的方式可以提高算法的执行效率

层次聚类有若干优点，例如，利用树结构可以可视化数据间的关系，并显示这些簇是如何关联的。在树中，一个好的特征向量可以给出一个很好的分离结果。另外一个优点是，对于给定的不同的阈值，可以直接利用原来的树，而不需要重新计算。不足之处在于，实际需要的聚类簇，需要选择一个合适的阈值。

创建文件 hcluster.py，将下面代码添加进去：

# -*- coding: utf-8 -*-
from itertools import combinations

class ClusterNode(object):
    def __init__(self,vec,left,right,distance=0.0,count=1):
        self.left = left
        self.right = right
        self.vec = vec
        self.distance = distance
        self.count = count  #只用于加权平均
        
    def extract_clusters(self,dist):
        """从层次聚类树中提取距离小于dist的子树簇群列表"""
        if self.distance < dist:
            return [self]
        return self.left.extract_clusters(dist) + self.right.extract_clusters(dist)
    
    def get_cluster_elements(self):
        """在聚类子树种返回元素的id"""
        return self.left.get_cluster_elements() + self.right.get_cluster_elements()
    
    def get_height(self):
        """返回节点的高度，高度是各分支的和"""
        return self.left.get_height() + self.right.get_height()
    
    def get_depth(self):
        """返回节点的深度，深度是每个子节点取最大再加上它的自身距离"""
        return max(self.left.get_depth(),self.left.get_depth()) +self.distance
    
class ClusterLeafNode(object):
    def __init__(self,vec,id):
        self.vec = vec
        self.id = id
        
    def extract_clusters(self,dist):
        return [self]
    
    def get_clusters_elements(self):
        return [self.id]
    
    def get_height(self):
        return 1
    
    def get_depth(self):
        return 0
    
    def L2dist(v1,v2):
        return sqrt(sum((v1-v2)**2))
    
    def L1dist(v1,v2):
        return sum(abs(v1-v2))
    
    def hcluster(features,distfcn=L2dist):
        """用层次聚类对行特征进行聚类"""
       #用于保存计算出的距离
       distance = {}
       
       #每行初始化为一个簇
       node = [(ClusterLeafNode(array(f),id=i) for i,f in enumerate(features))]
       
       while len(node)>1:
           closet = float('Inf')
           
           #遍历每对，寻找最小距离
           for ni,nj in combinations(node,2):
               if (ni,nj) not in distances:
                   distances[ni,nj] = distfcn(ni.vec,nj.vec)
                   
                d = distances[ni,nj]
                if d

 
  注：在scipy聚类包中，有一个层次聚类的版本，如果你喜欢可以直接使用。因为需要创建树、并用缩略图可视化树状图的类，所以不使用该版本。 
  我们为树节点创建了两个类，即ClusterNode和ClusterLeafNode，这两个类将用于创建聚类树，其中函数hcluster()用于创建树。首先创建一个包含叶节点的列表，然后根据选择的距离度量方式将距离最近的对归并到一起，返回的终节点即为树的根。对于一个行为特征向量的矩阵，运行hcluster()会创建和返回聚类树。 
  距离度量的选择依赖于实际的特征向量，利用欧式距离L₂（同时提供了L₁距离度量函数），可以创建任意距离度量函数，并将它作为参数传递给hcluster()。对于每个子树，计算其所有节点特征向量的平均值，作为新的特征向量来表示该子树，并将每个子树视为一个对象。当然，还有其他将哪两个节点合并在一起的方案，比如在两个子树中使用对象间距离最小的单向锁，及在两个子树中用对象间距离最大的完全锁。选择不同的锁会生成不同类型的聚类树。 
  全连接的凝聚层次聚类的操作步骤：
 1、获取所有样本的距离矩阵
 2、将每个数据点作为一个单独的簇
 3、基于最不相似(距离最远)样本的距离，合并两个最接近的簇
 4、更新样本的距离矩阵
 5、重复2到4，直到所有样本都属于同一个簇为止。 
  下面编写代码实现上面的操作：
 1、获取样本
 随机产生5个样本，每个样本包含3个特征(x，y，z) 
  import pandas as pd
import numpy as np
 
if __name__ == "__main__":
    np.random.seed(1)
    #设置特征的名称
    variables = ["x","y","z"]
    #设置编号
    labels = ["s1","s2","s3","s4","s5"]
    #产生一个(5,3)的数组
    data = np.random.random_sample([5,3])*10
    #通过pandas将数组转换成一个DataFrame
    df = pd.DataFrame(data,columns=variables,index=labels)
    #查看数据
    print(df)
 
  
 2、获取所有样本的距离矩阵
 通过SciPy来计算距离矩阵，计算每个样本间两两的欧式距离，将矩阵矩阵用一个DataFrame进行保存，方便查看 
  from scipy.spatial.distance import pdist,squareform
    #获取距离矩阵
    '''
    pdist:计算两两样本间的欧式距离,返回的是一个一维数组
    squareform：将数组转成一个对称矩阵
    '''
    dist_matrix = pd.DataFrame(squareform(pdist(df,metric="euclidean")),
                               columns=labels,index=labels)
    print(dist_matrix)
 
  
 3、获取全连接矩阵的关联矩阵
 通过scipy的linkage函数，获取一个以全连接作为距离判定标准的关联矩阵(linkage matrix) 
  from scipy.cluster.hierarchy import linkage
    #以全连接作为距离判断标准，获取一个关联矩阵
    row_clusters = linkage(dist_matrix.values,method="complete",metric="euclidean")
    #将关联矩阵转换成为一个DataFrame
    clusters = pd.DataFrame(row_clusters,columns=["label 1","label 2","distance","sample size"],
                            index=["cluster %d"%(i+1) for i in range(row_clusters.shape[0])])
    print(clusters)

 
   
  4、通过关联矩阵绘制树状图
 使用scipy的dendrogram来绘制树状图 
  from scipy.cluster.hierarchy import dendrogram
import matplotlib.pyplot as plt
row_dendr = dendrogram(row_clusters,labels=labels)
plt.tight_layout()
plt.ylabel("欧式距离")
plt.show()
 
  
 通过上面的树状图，可以直观的发现。首先是s1和s5合并，s2和s3合并，然后s2、s3、s4合并，最后再和s1、s5合并。 
  在实际图像处理中的应用： 
  
# -*- coding: utf-8 -*-
import os
from PCV.clustering import hcluster
from matplotlib.pyplot import *
from numpy import *
from PIL import Image

# 创建图像列表
path = 'F:\\Anaconda\\chapter6\\picture\\data\\sunsets\\flickr-sunsets-small'
imlist = [os.path.join(path, f) for f in os.listdir(path) if f.endswith('.jpg')]
# 提取特征向量，每个颜色通道量化成 8 个小区间
features = zeros([len(imlist), 512])
for i, f in enumerate(imlist):
    im = array(Image.open(f))
    # 多维直方图 
    h, edges = histogramdd(im.reshape(-1, 3), 8, normed=True, range=[(0, 255), (0, 255), (0, 255)])
    features[i] = h.flatten()
tree = hcluster.hcluster(features)

# 设置一些（任意的）阈值以可视化聚类簇 
clusters = tree.extract_clusters(0.23 * tree.distance)
# 绘制聚类簇中元素超过 3 个的那些图像
for c in clusters:
    elements = c.get_cluster_elements()
    nbr_elements = len(elements)
    if nbr_elements > 3:
        figure()
        for p in range(minimum(nbr_elements, 20)):
            subplot(4, 5, p + 1)
            im = array(Image.open(imlist[elements[p]]))
            imshow(im)
            axis('off')
show()

hcluster.draw_dendrogram(tree, imlist, filename='sunset.pdf')
 
  实验效果图：
 
 
 
 说明：
 用100幅日落图像进行层次聚类，将RGB空间的512个小区间直方图作为每幅图像的特征向量。树中挨得近的图像具有相似的颜色分布。树状图的高和子部分由距离决定，这些都需要调整，以适应所选择的图像分辨率。随着坐标向下传递到下一级，会递归绘制出这些节点，上述代码用20×20像素绘制叶节点的缩略图，，使用 get_height() 和 get_depth() 这两个辅助函数可以获得树的高和宽。 
  （三）谱聚类 
  谱： 方阵作为线性算子，它的所有特征值的全体统称为方阵的谱。方阵的谱半径为最大的特征值。矩阵 $A$ 的谱半径是矩阵 $A^TA$ 的最大特征值。 
  谱聚类：是一种基于图论的聚类方法，通过对样本数据的拉普拉斯矩阵的特征向量进行聚类，从而达到对样本数据聚类的谱。谱聚类可以理解为将高维空间的数据映射到低维，然后在低维空间用其它聚类算法（如KMeans）进行聚类。 
  谱聚类的过程：
 给定一个n×n的相似性矩阵 $S$ ，s_ij为相似性分数，可以创建一个矩阵，称为拉普拉斯矩阵： $L=I-D^{-1/2}SD^{-1/2}$  其中， $I$ 是单位矩阵， $D$ 是对角矩阵，对角线上的元素是 $S$ 对应行元素之和，D=diag(d_i), $d~i~=\sum_{j}^{ }s_{ij}$  。拉普拉斯矩阵中的 $D^{-1/2}$ 为： $D^{-1/2}=\begin{bmatrix} \frac{1}{\sqrt{d_{1}}} & & & \\ &\frac{1}{\sqrt{d_{2}}} & & \\ & & \ddots & \\ & & & \frac{1}{\sqrt{d_{n}}} \end{bmatrix}$ 
 为了简介表示，使用较小的值并且要求 $s_{ij}\geqslant 0$ 。 
  计算 $L$ 的特征向量，并使用k个最大特征值对应的k个特征向量，构建出一个特征向量集，从而可以找到聚类簇。创建一个矩阵，该矩阵的各列是由之前求出的k个特征向量构成，每一行可以看作一个新的特征向量，长度为k。本质上，谱聚类算法是将原始空间中的数据转换成更容易聚类的新特征向量。在某些情况下，不会首先使用聚类算法。 
  谱聚类的优点： 
   
   仅仅需要输入相似性矩阵，并且可以采用所想到的任何度量方式构建该相似性矩阵。正如，K-means和层次聚类需要计算特征向量求平均；而对于谱聚类，特征向量没类别限制，只要有一个“距离”或者“相似性”的概念即可。 
   当聚类的类别个数较小的时候，谱聚类的效果会很好，但是当聚类的类别个数较大的时候，则不建议使用谱聚类； 
   谱聚类算法使用了降维的技术，所以更加适用于高维数据的聚类； 
   谱聚类算法建立在谱图理论基础上，与传统的聚类算法相比，它具有能在任意形状的样本空间上聚类且收敛于全局最优解。 
   
  谱聚类的缺点： 
   
   谱聚类对相似度图的改变和聚类参数的选择非常的敏感； 
   谱聚类适用于均衡分类问题，即各簇之间点的个数相差不大，对于簇之间点个数相差悬殊的聚类问题，谱聚类则不适用。 
   
  下面编写使用拉普拉斯矩阵的特征向量对字体图像进行谱聚类的代码： 
  # -*- coding: utf-8 -*-
from PCV.tools import imtools, pca
from PIL import Image, ImageDraw
from pylab import *
from scipy.cluster.vq import *

imlist = imtools.get_imlist('F:\\Anaconda\\chapter6\\picture\\data\\fontimages\\a_thumbs')
imnbr = len(imlist)

# Load images, run PCA.
immatrix = array([array(Image.open(im)).flatten() for im in imlist], 'f')
V, S, immean = pca.pca(immatrix)

# Project on 2 PCs.
projected = array([dot(V[[0, 1]], immatrix[i] - immean) for i in range(imnbr)])

n = len(projected)
# 计算距离矩阵
S = array([[sqrt(sum((projected[i] - projected[j]) ** 2))
            for i in range(n)] for j in range(n)], 'f')
# 创建拉普拉斯矩阵
rowsum = sum(S, axis=0)
D = diag(1 / sqrt(rowsum))
I = identity(n)
L = I - dot(D, dot(S, D))
# 计算矩阵 L 的特征向量
U, sigma, V = linalg.svd(L)
k = 5
# 从矩阵 L 的前k个特征向量（eigenvector）中创建特征向量（feature vector） # 叠加特征向量作为数组的列
features = array(V[:k]).T
# k-means 聚类 
features = whiten(features)
centroids, distortion = kmeans(features, k)
code, distance = vq(features, centroids)
# 绘制聚类簇
for c in range(k):
    ind = where(code == c)[0]
    figure()
    gray()
    for i in range(minimum(len(ind), 39)):
        im = Image.open(imlist[ind[i]])
        subplot(4, 10, i + 1)
        imshow(array(im))
        axis('equal')
        axis('off')
show()
 
  实验效果图：
 
 
 
 说明：
 在上面的实验中，用两两间的欧式距离创建矩阵S，并对k个特征向量用常规的K-means进行聚类。注意，矩阵V包含的是对特征值进行排序后的特征向量。然后，绘制出这些聚类簇。观察到，上面分别显示出了五类，根据不同的特征向量，将相同的类聚集起来，形成这些聚类图像。

Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
Python计算机视觉编程——第二章局部图像描述子 adchloe python 计算机视觉开发语言
目录1Harris角点检测器2SIFT2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子1Harris角点检测器Harris角点检测算法是简单的角点检测算法，主要思想是，如果像素周围显示存在多于一个方向的边，认为该点为兴趣点，称为角点。把图像域中点x上的对称半正定矩阵Mr=Ml(x)M_{r}=M_{l}(\mathbf{x})Mr=Ml(x)定义为：M1=∇I ∇IT=[IxIy][IxI
Python计算机视觉编程pdf txt mobi下载及读书笔记 mrxllh0
Python计算机视觉编程pdftxtmobi读书笔记应该是这一学期图像分析比较有用的工具书了，numpy和matplotlib常用的方法基本都有，并且例子也不错。非常好的计算机视觉入门书，亮点在于没有直接使用OpenCV，而是先简单介绍算法原理，再利用NumPy、matplotlib等基本工具进行算法实现，对于已经学习了计算机视觉理论，但是不知道怎么把公式变成代码的人来说很有帮助。作者:[瑞典]
[笔记]Python计算机视觉编程《一》基本的图像操作和处理二进制怪兽 Python 人工智障读书笔记计算机视觉笔记 python
文章目录前言环境搭建计算机视觉简介Python和NumPy第一章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图图像的轮廓直方图1.2.3【交互式标注】1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3
python计算机视觉编程——第一章（基本的图像操作和处理） NCTU_to_prove_safety 算法
第1章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式——save()函数1.1.2创建缩略图1.1.3复制并粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib库1.2.1画图、描点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy库1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.
PIL–Python图像处理类库斯特凡1899
—–前言—–才开始看Python，感觉离时代好远。现在看的是《Python计算机视觉编程》，欢迎交流！—–正题—–PIL，PhthonImagingLibrary，Python图像图里类库。提供了通用的图像处理功能，以及大量有用的基本图像操作，如图像缩放、裁剪、旋转、颜色转换等。代码例子:fromPILimportImage#读取图像im=Image.open("empire.jpeg")thum
python计算机视觉编程.pdf微盘_Python计算机视觉编程pdf weixin_39860280
下载地址：网盘下载内容简介······《python计算机视觉编程》是计算机视觉编程的权威实践指南，依赖python语言讲解了基础理论与算法，并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外，书中附带的练习还能让读者巩固并学会应用编程知识。《python计算机视觉编程》适合的读者
python画龙舟_Python计算机视觉编程第二章——局部图像描述子 weixin_39999781 python画龙舟
Python计算机视觉编程局部图像描述子(一)Harris角点检测器(二)SIFT(尺度不变特征变换)2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子(三)匹配地理标记图像3.1从Panoramio下载地理标记图像3.2使用局部描述子匹配3.3可视化连接的图像局部图像描述子本节旨在寻找图像间的对应点和对应区域。介绍用于图像匹配的两种局部描述子算法。图像的局部特征是许多计算机视觉算法的基础，
Python计算机视觉编程第三章图像到图像的映射 LuoY、 Python计算机视觉编程
第三章图像到图像的映射3.1单应性变换3.1.1直接线性变换算法3.1.2仿射变换3.2图像扭曲3.2.1图像中的图像3.2.2图像配准3.3创建全景图3.3.1RANSAC3.3.2稳健的单应性矩阵估计3.3.2拼接图像本章讲解图像之间的变换，以及一些计算变换的实用方法。这些变换可用于图像扭曲变形和图像配准。3.1单应性变换单应性变换是一个人平面内的点映射到另一个平面内的二维投影
Python计算机视觉编程第四章照相机模型与增强现实 LuoY、 Python计算机视觉编程 python 计算机视觉 ar
第四章照相机模型与增强现实4.1针孔照相机模型4.1.1照相机矩阵4.1.2三维点的投影4.1.3照相机矩阵的分解4.1.4计算照相机中心4.2照相机标定4.3以平面和标记物体进行姿态估计4.4增强现实4.1针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精确度。在针孔照相机模型中，在光线投影到
python图像处理笔记-八-针孔照相机模型与照相机标定 BluePing
参考教材：python计算机视觉编程视觉SLAM十四讲，从理论到实践针孔照相机模型针孔摄像机模型（有时称作摄影照相机模型），是计算机视觉中广泛应用的照相机模型。原因是：简单精度足够这个名字来源于一种简单的照相机，他利用小孔成像原理进行成像，换句话说就是：在光线投影到图像平面前，从唯一一个点经过，这个经过的点就叫做：照相机中心，记做C，如下图所示：（这张图来自于他人博客：https://blog.c
Python计算机视觉编程_03 chuxiao_scx python 机器学习
基于SIFT算法的全景拼接前言1.单应性变换2.RANSAC算法3.Multi-BandBlending策略4.代码实现前言什么是全景拼接？简单来说就是将两幅或多幅具有重叠区域的图像，合并成一张大图如图所示，7张不同的图像最后拼接成一幅大图，那么问题很明显，如何拼接呢？1.单应性变换如果是最简单图像拼接，很明显，我们只需要对其进行平移，将重叠区域叠加，很轻松的就能得到一幅拼接图像。但实际上两幅图像
Python计算机视觉编程——第6章图像聚类海鸥丸拉面 python 聚类计算机视觉
目录6.1K-means聚类6.1.1Scipy聚类包6.1.2图像聚类6.1.3在主成分上可视化图像6.1.4像素聚类6.2层次聚类图像聚类6.3谱聚类6.1K-means聚类K-means是一种将输入数据划分成k个簇的简单的聚类算法。K-means反复提炼初始评估的类中心，步骤如下：以随机或猜测的方式初始化类中心ui,i=1...k;将每个数据点归并到离他距离最近的类中心所属的类ci；对所有属
Python计算机视觉编程--第四章娇娇是大熊 python python
照相机模型与增强现实一、针孔照相机模型1.1照相机矩阵1.2三维点的投影1.3照相机矩阵的分解1.4照相机中心二、照相机标定一、针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精准度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。在光线投影到图像平面之前，从唯一一个点经
Python计算机视觉编程——第8章图像内容分类海鸥丸拉面 python 计算机视觉分类
目录8.1K临近分类法（KNN）8.1.1一个简单的二维示例8.1.2用稠密SIFT作为图像特征8.1.3图像分类：手势识别8.2贝叶斯分类器用PCA降维8.3支持向量机8.3.1使用LibSVM8.1K临近分类法（KNN）在分类算法中，最简单且用的最多的一种方法之一就是KNN(K-NearsetNeighbor，K邻近分类法)，这种算法把要分类的对象（例如一个特征向量）与训练集中已知类标记的所有
Python计算机视觉编程——第10章 OpenCV 海鸥丸拉面计算机视觉 python opencv
目录10.1OpenCV的Python接口10.2OpenCV基础知识10.2.1读取和写入图像10.2.2颜色空间10.2.3显示图像及结果10.3处理视频10.3.1视频输入10.3.2将视频读取到NumPy数组中10.4跟踪10.4.2Lucas-Kanade算法1.使用跟踪器2.使用发生器10.1OpenCV的Python接口OpenCV是一个C++库，它包含了计算机视觉领域的很多模块。除
Python计算机视觉编程_01 chuxiao_scx python 计算机视觉 opencv
基本的图像操作和处理前言1.图像直方图1.1.原理1.2.结果演示2.高斯滤波2.1.原理2.2.结果演示3.直方图均衡化3.1.原理3.2.结果演示后记前言本篇博客介绍在vscode中使用opencv进行图像处理的基本操作，使用的语言为python，vscode中按照python可以参考我以前写的这篇博客：vscode中配置python环境至于在vscode导入opencv包就请各位自行百度解决
机器学习算法：支持向量机（SVM）夏天是冰红茶 #计算机视觉机器学习支持向量机算法
参考书籍：Solem《python计算机视觉编程》、李航《统计学习方法》、周志华《机器学习》要理解好支持向量机需要较好的数学功底，且能不被公式以及文字绕晕，这里我们就理清楚支持向量机的大体过程。具体的数学计算推导其实已经封装好了，那么理解算法的原理也对我们将来的学习很有帮助，比如以后做科研的时候，大家冥思苦想找不到方法的时候，你走上前去说，唉这个方法就能解决，是不是特别能得到满足。0、概念提前知超
Python计算机视觉编程第一章——基本的图像操作和处理海鸥丸拉面计算机视觉图像处理 python
目录1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3Unmpy1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.6图像的主成分分析（PCA）1.3.7使用p
Python计算机视觉编程第一章基本的图像操作和处理 LuoY、 python 计算机视觉图像处理
第一章基本的图像操作和处理1.1PIL:Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3直方图均衡化1.3.4图像平均1.3.5使用pickle模块1.4SciPy1
python计算机视觉编程 Hesilan python 自然语言处理机器学习
@《python计算机视觉处理编程》第一章笔记Python计算机视觉编程笔记，还在学习之中红色：imtools函数蓝色：函数功能绿色：拓展知识1、fromPILimportImage输入pillow包，图像缩放，裁剪、旋转、颜色转换pil_im=Image.open(‘D:\RGB\Testpicture\pexels-photo-417173.jpg’)打开一张图片print(pil_img.s
《Python 计算机视觉编程》学习笔记（一）书生丶丶 python 计算机视觉学习
《Python计算机视觉编程》文章目录前言第1章基本的图像操作和处理引言1.1PIL：Python图像处理类库图像读取、显示、显示对应灰度图更改图像格式（后缀）创建缩略图复制和粘贴图像区域调整尺寸和旋转1.2Matplotlib绘制图像、点和线图像轮廓和直方图交互式标注1.3NumPy图像数组表示灰度变换直方图均衡化图像的主成分分析（PCA）1.4SciPy图像模糊图像导数形态学：对象计数一些有用
Python计算机视觉编程 - 第三章图像映射 -全景拼接煮酒忆南山 python
全景拼接原理简述在同一位置拍摄的两幅或者多幅图片是单应性相关的，我们经常使用该约束将很多图像缝补起来，拼成一个全景图。全景图像拼接最重要的两个步骤是：1.特征匹配2.图像拼接在本次测试中，我使用的是sift特征匹配,在特征匹配之后，我们使用RANSAC算法求解得到单应性矩阵。其基本思想是，数据中包含正确的点和噪声点，合理的模型能够在描述正确数据点的同时摒弃噪声点，在这里的用途就是排除掉不符合大部分
Python计算机视觉编程第二章局部图像描述子仙蓝计算机视觉计算机视觉 python 算法
Python计算机视觉编程第二章局部图像描述子1Harris角点检测1.1基本概念1.2例子2在图像中寻找对应点2.1基本概念2.2例子3SIFT(尺度不变特征变换)3.1介绍3.2兴趣点3.3描述子3.4检测兴趣点——例子3.5匹配描述子——例子4地理特征匹配4.1需要安装PCV环境4.2测试图片4.3实现代码1Harris角点检测1.1基本概念Harris角点检测算法（也称Harris&Ste
图像检索代码python tf_Python计算机视觉编程（八）图像检索埃斯蓬托的篡位者图像检索代码python tf
图像检索BOW模型基于BOW的图像检索特征提取视觉词典TF-IDF常用参数图像检索具体实现流程BOW模型Bag-of-wordsmodels模型(词袋模型)词袋模型对于给定的两个文档，进行分割可以建构出一个有n个元素词典，根据词典每个词在两个文档中的出现的频率，表示成两个n维向量。基于BOW的图像检索特征提取学习视觉词典针对输入特征集，根据视觉词典进行量化把输入图像，根据TF-IDF转化成视觉单词
python内实现k-means聚类 superdont 图像处理 python python计算机视觉
《Python计算机视觉编程》学习笔记fromscipy.cluster.vqimport*importnumpyasnpfrommatplotlibimportpyplotaspltclass1=1.5*np.random.randn(100,2)##print(class1)class2=np.random.randn(100,2)+np.array([8,8])##print(class2)
Python计算机视觉编程学习笔记十 OPENCV Belouga- 数字图像处理计算机视觉 python
OPENCV（一）OpenCV的Python接口（二）OpenCV基础知识2.1图像读取和写入2.2颜色空间2.3显示图像及结果2.4平移与缩放（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割cv2.watershed()5.3利用霍夫变换检测直线（一）OpenCV的Pyth
Python计算机视觉编程第十章——OpenCV基础知识 Dujing2019 Python计算机视觉编程
Python计算机视觉编程（一）OpenCV的Python接口（二）OpenCV基础知识2.1读取和写入图像2.2颜色空间2.3显示图像及结果（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割5.3利用霍夫变换检测直线（一）OpenCV的Python接口OpenCV是一个C++
Python计算机视觉编程学习笔记七图像搜索白鲸鱼2020 python 数字图像处理计算机视觉
图像搜索（一）基于内容的图像检索（二）视觉单词2.1：创建词汇2.2：创建图像索引2.3：在数据库中搜索图像（三）使用几何特性对结果排序（一）基于内容的图像检索CBIR（Content-BasedImageRetrieval，基于内容的图像检索）CBIR的实现依赖于两个关键技术的解决：图像特征提取和匹配。定义:即从图像库中查找含有特定目标的图像，也包括从连续的视频图像中检索含有特定目标的视频片段。
Python计算机视觉编程学习笔记三图像到图像的映射白鲸鱼2020 计算机视觉 python 数字图像处理
图像到图像的映射（一）单应性变换1.2仿射变换（二）图像扭曲2.1图像中的图像2.2图像配准（三）创建全景图3.1RANSAC3.2拼接图像（一）单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。本质上，单应性变换H，按照下面的方程映射二维中的点（齐次坐标
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt