stroll丶life

python计算机视觉编程（三）——Harris角点 SIFT 匹配地理标记图像

局部图像描述子

准备

VLFeat
pydot工具包

Harris角点

原理
代码实现

SIFT

原理
代码实现

Harris与SIFT的对比
匹配地理标记图像
一些用到的函数

准备

使用的到一些函数在文末给出

VLFeat

使用开源工具包VLFeat提供的二进制文件来计算图像的SIFT特征
链接: http://www.vlfeat.org/建议下载20以前的版本，最新版本产生的SIFT特征文本为空
将bin目录下对应的系统文件夹复制出来

之后将process_image函数中路径改成相应的位置

pydot工具包

用pydot可以直接可视化他们直接的关联
1.安装graphviz

pip install graphviz

2.安装graphviz软件，地址在：https://graphviz.gitlab.io/_pages/Download/Download_windows.html

3.把安装后的graphviz软件的bin目录设为环境变量，重启。

4.安装pydot

pip install pydot

由于sift速度较慢，建议把图片压缩后使用！！！

Harris角点

原理

角点检测最原始的想法就是取某个像素的一个邻域窗口，当这个窗口在各个方向上进行小范围移动时，观察窗口内平均的像素灰度值的变化（即，E(u,v)）。

从上图可知，我们可以将一幅图像大致分为三个区域（‘flat’，‘edge’，‘corner’），这三个区域变化是不一样的。

将函数二维泰勒展开

于是对于局部微小的移动量 [u,v]，可以近似得到下面的表达：

其中M是 22 矩阵，可由图像的导数求得：

窗口移动导致的图像变化量：实对称矩阵M的特征值分析

记M的特征值为 λ 1, λ 2

定义：角点响应函数R

角点计算流程:
对角点响应函数R进行阈值处理：
R > threshold
提取R的局部极大值

代码实现

Harris角点检测

from pylab import *
from PIL import Image
from scipy.ndimage import filters
from sift import *

# 读入图像
im = array(Image.open('123.jpg').convert('L'))

# 检测harris角点
harrisim = compute_harris_response(im)
filtered_coords = get_harris_points(harrisim,6)

plot_harris_points(im, filtered_coords)

Harris角点匹配

from pylab import *
from PIL import Image
from pylab import *
from numpy import *
from scipy.ndimage import filters
from sift import *


im1 = array(Image.open("123.jpg").convert("L"))
im2 = array(Image.open("456.jpg").convert("L"))

# resize加快匹配速度
im1 = imresize(im1, (int(im1.shape[1]/2), int(im1.shape[0]/2)))
im2 = imresize(im2, (int(im2.shape[1]/2), int(im2.shape[0]/2)))

wid = 5
harrisim = compute_harris_response(im1, 5)
filtered_coords1 = get_harris_points(harrisim, wid+1)
d1 = get_descriptors(im1, filtered_coords1, wid)

harrisim = compute_harris_response(im2, 5)
filtered_coords2 = get_harris_points(harrisim, wid+1)
d2 = get_descriptors(im2, filtered_coords2, wid)

print ('starting matching')
matches = match_twosided(d1, d2)

figure()
gray() 
plot_matches(im1, im2, filtered_coords1, filtered_coords2, matches)
show()

可以看出特征点的匹配比较混乱，下文将介绍SIFT，它的效果非常不错，缺点就是比较耗时。

SIFT

原理

SIFT算法实现特征匹配主要有三个流程， 1、提取关键点； 2、对关键点附加
详细的信息（局部特征），即描述符； 3、通过特征点（附带上特征向量的关
键点）的两两比较找出相互匹配的若干对特征点，建立景物间的对应关系。
1.高斯模糊
高斯模糊是在Adobe Photoshop等图像处理软件中广泛使用的处理
效果，通常用它来减小图像噪声以及降低细节层次。这种模糊技术生成
的图像的视觉效果是好像经过一个半透明的屏幕观察图像。
二维高斯函数
高斯卷积核是实现尺度变换的唯一变换核，并且是唯一的线性核。高斯模糊是一种图像滤波器，它使用正态分布(高斯函数)计算模糊模板，并使用该模板与原图像做卷积运算，达到模糊图像的目的。

2.尺度空间
尺度空间理论最早于1962年提出，其主要思想是通过对原始图像进行尺度变换，获得图像多尺度下的空间表示。从而实现边缘、角点检测和不同分辨率上的特征提取，以满足特征点的尺度不变性。尺度空间中各尺度图像的模糊程度逐渐变大，能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。尺度越大图像越模糊。
2.1高斯金字塔
高斯金子塔的构建过程可分为两步：
（ 1）对图像做高斯平滑；
（ 2）对图像做降采样。
为了让尺度体现其连续性，在简单下采样的基础上加上了高斯滤波。一幅图像可以产生几组（ octave）图像，一组图像包括几层（ interval）图像。

高斯图像金字塔共o组、 s层，则有：

σ——尺度空间坐标；
s——sub-level层坐标；
σ0——初始尺度；
S——每组层数（一般为3~5）
最后可将组内和组间尺度归为：

i——金字塔组数
n——每一组的层数
2.2DOG
使用高斯金字塔每组中相邻上下两层图像相减，得到高斯差分图像，进行极值检测。

可以通过高斯差分图像看出图像上的像素值变化情况。（如果没有变化，也就没有特征。特征必须是变化尽可能多的点。）DOG图像描绘的是目标的轮廓。
2.3DoG的局部极值点
特征点是由DOG空间的局部极值点组成的。为了寻找DoG函数的极值点，每一个像素点要和它所有的相邻点比较，看其是否比它的图像域和尺度域的相邻点大或者小。中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9× 2个点共26个点比较，以确保在尺度空间和二维图像空间都检测到极值点。

3关键点定位
3.1去除边缘响应
由于DoG函数在图像边缘有较强的边缘响应，因此需要排除边缘响应。DoG函数的峰值点在边缘方向有较大的主曲率，而在垂直边缘的方向有较小的主曲率。主曲率可以通过计算在该点位置尺度的2×2的Hessian矩阵得到，导数由采样点相邻差来估计：

Dxx 表示DOG金字塔中某一尺度的图像x方向求导两次
D的主曲率和H的特征值成正比。令 α ， β为特征值，则

该值在两特征值相等时达最小。 Lowe论文中建议阈值T为1.2，即时保留关键点，反之剔除
4方向分配
通过尺度不变性求极值点，可以使其具有缩放不变的性质。而利
用关键点邻域像素的梯度方向分布特性，可以为每个关键点指定方向参数
方向，从而使描述子对图像旋转具有不变性。
像素点的梯度表示：

梯度幅值：
梯度方向：
通过求每个极值点的梯度来为极值点赋予方向。
方向直方图的生成
确定关键点的方向采用梯度直方图统计法，统计以关键点为原点，一定区域内的图像像素点对关键点方向生成所作的贡献。
关键点主方向：极值点周围区域梯度直方图的主峰值也是特征点方向。
关键点辅方向：在梯度方向直方图中，当存在另一个相当于主峰值80%能量的峰值时，则将这个方向认为是该关键点的辅方向。
这可以增强匹配的鲁棒性， Lowe的论文指出大概有15%关键点具有
多方向，但这些点对匹配的稳定性至为关键。
5关键点特征描述
下图是一个SIFT描述子事例。其中描述子由2× 2× 8维向量表征，也即是2× 2个8方向的方向直方图组成。左图的种子点由8× 8单元组成。每一个小格都代表了特征点邻域所在的尺度空间的一个像素，箭头方向代表了像素梯度方向，箭头长度代表该像素的幅值。然后在4×4的窗口内计算8个方向的梯度方向直方图。绘制每个梯度方向的累加可形成一个种子点，如右图所示：一个特征点由4个种子点的信息所组成。
6关键点匹配
分别对模板图（参考图， reference image）和实时图（观测图，observation image）建立关键点描述子集合。目标的识别是通过两点集内关键点描述子的比对来完成。具有128维的关键点描述子的相似性度量采用欧式距离。

穷举匹配

模板图中关键点描述子：

实时图中关键点描述子：

任意两描述子相似性度量：
要得到配对的关键点描述子需满足：
关键点的匹配可以采用穷举法来完成，但是这样耗费的时间太多，一
般都采用kd树的数据结构来完成搜索。搜索的内容是以目标图像的关
键点为基准，搜索与目标图像的特征点最邻近的原图像特征点和次邻
近的原图像特征点。
Kd树是一个平衡二叉树

代码实现

SIFT特征检测

from PIL import Image
from pylab import *
from numpy import *
import os
from sift import *

imname = '123.jpg'
im1 = array(Image.open(imname).convert('L'))
process_image(imname, 'empire.sift')
l1,d1 = read_features_from_file('empire.sift')

figure()
gray()
plot_features(im1, l1, circle=True)
show()

SIFT特征匹配

from PIL import Image
from pylab import *
import sys
import sift

if len(sys.argv) >= 3:
  im1f, im2f = sys.argv[1], sys.argv[2]
else:
  im1f = '123.jpg'
  im2f = '456.jpg'
im1 = array(Image.open(im1f))
im2 = array(Image.open(im2f))

sift.process_image(im1f, 'out_sift_1.txt')
l1, d1 = sift.read_features_from_file('out_sift_1.txt')
figure()
gray()
subplot(121)
sift.plot_features(im1, l1, circle=False)

sift.process_image(im2f, 'out_sift_2.txt')
l2, d2 = sift.read_features_from_file('out_sift_2.txt')
subplot(122)
sift.plot_features(im2, l2, circle=False)

matches = sift.match_twosided(d1, d2)
print ('{} matches'.format(len(matches.nonzero()[0])))

figure()
gray()
sift.plot_matches(im1, im2, l1, l2, matches, show_below=True)
show()

明显与Harris相比特征点的匹配更为准确

Harris与SIFT的对比

from PIL import Image
from pylab import *
import sift

imname = '123.jpg'
im = array(Image.open(imname).convert('L'))
sift.process_image(imname, 'empire.sift')
l1, d1 = sift.read_features_from_file('empire.sift')

figure()
gray()
subplot(131)
sift.plot_features(im, l1, circle=False)
subplot(132)
sift.plot_features(im, l1, circle=True)

# 检测harris角点
harrisim = sift.compute_harris_response(im)

subplot(133)
filtered_coords = sift.get_harris_points(harrisim, 6, 0.1)
imshow(im)
plot([p[1] for p in filtered_coords], [p[0] for p in filtered_coords], '*')
axis('off')

show()

三图分别为SIFT特征，用圆圈表示SIFT特征，Harris角点
明显的看出SIFT特征数量较多，同时通过上文的匹配点匹配效果来看，SIFT的效果远远优于Harris，缺点是运行时间长

匹配地理标记图像

可以通过匹配多张图片的描述子，找到他们之间的对应关系

from pylab import *
from PIL import Image
import sift
import pydot
import os

def get_imlist(path):
        
    return [os.path.join(path,f) for f in os.listdir(path) if f.endswith('.jpg')]

download_path = "D:/opencv-py/image"  
path = "D:/opencv-py/image"  

imlist = get_imlist(download_path)
nbr_images = len(imlist)

featlist = [imname[:-3] + 'sift' for imname in imlist]
for i, imname in enumerate(imlist):
    sift.process_image(imname, featlist[i])

matchscores = zeros((nbr_images, nbr_images))

for i in range(nbr_images):
    for j in range(i, nbr_images):  # only compute upper triangle
        print ('comparing ', imlist[i], imlist[j])
        l1, d1 = sift.read_features_from_file(featlist[i])
        l2, d2 = sift.read_features_from_file(featlist[j])
        matches = sift.match_twosided(d1, d2)
        nbr_matches = sum(matches > 0)
        print ('number of matches = ', nbr_matches)
        matchscores[i, j] = nbr_matches
print ("The match scores is: \n", matchscores)

for i in range(nbr_images):
    for j in range(i + 1, nbr_images):  # no need to copy diagonal
        matchscores[j, i] = matchscores[i, j]
threshold = 2  # min number of matches needed to create link

g = pydot.Dot(graph_type='graph')  # don't want the default directed graph

for i in range(nbr_images):
    for j in range(i + 1, nbr_images):
        if matchscores[i, j] > threshold:
            # first image in pair
            im = Image.open(imlist[i])
            im.thumbnail((100, 100))
            filename = path + str(i) + '.png'
            im.save(filename)  # need temporary files of the right size
            g.add_node(pydot.Node(str(i), fontcolor='transparent', shape='rectangle', image=filename))

            im = Image.open(imlist[j])
            im.thumbnail((100, 100))
            filename = path + str(j) + '.png'
            im.save(filename)  # need temporary files of the right size
            g.add_node(pydot.Node(str(j), fontcolor='transparent', shape='rectangle', image=filename))

            g.add_edge(pydot.Edge(str(i), str(j)))
g.write_png('whitehouse.png')

一些用到的函数

sift.py

from PIL import Image
import os
from numpy import *
from pylab import *
from scipy.ndimage import filters
def imresize(im,sz):
    pil_im = Image.fromarray(uint8(im))
    
    return array(pil_im.resize(sz))

def compute_harris_response(im,sigma=3):
    imx = zeros(im.shape)
    filters.gaussian_filter(im, (sigma,sigma), (0,1), imx)
    imy = zeros(im.shape)
    filters.gaussian_filter(im, (sigma,sigma), (1,0), imy)
    
    Wxx = filters.gaussian_filter(imx*imx,sigma)
    Wxy = filters.gaussian_filter(imx*imy,sigma)
    Wyy = filters.gaussian_filter(imy*imy,sigma)
    
    Wdet = Wxx*Wyy - Wxy**2
    Wtr = Wxx + Wyy
    
    return Wdet / Wtr

def get_harris_points(harrisim,min_dist=10,threshold=0.1):
    corner_threshold = harrisim.max() * threshold
    harrisim_t = (harrisim > corner_threshold) * 1
    
    coords = array(harrisim_t.nonzero()).T
    
    candidate_values = [harrisim[c[0],c[1]] for c in coords]
    
    index = argsort(candidate_values)[::-1]
    
    allowed_locations = zeros(harrisim.shape)
    allowed_locations[min_dist:-min_dist,min_dist:-min_dist] = 1
    
    filtered_coords = []
    for i in index:
        if allowed_locations[coords[i,0],coords[i,1]] == 1:
            filtered_coords.append(coords[i])
            allowed_locations[(coords[i,0]-min_dist):(coords[i,0]+min_dist), 
                        (coords[i,1]-min_dist):(coords[i,1]+min_dist)] = 0
    
    return filtered_coords


def plot_harris_points(image,filtered_coords):
    """ Plots corners found in image. """
    
    figure()
    gray()
    imshow(image)
    plot([p[1] for p in filtered_coords],[p[0] for p in filtered_coords],'*')
    axis('off')
    show()
def get_descriptors(image,filtered_coords,wid=5):
    """ For each point return pixel values around the point
        using a neighbourhood of width 2*wid+1. (Assume points are 
        extracted with min_distance > wid). """
    
    desc = []
    for coords in filtered_coords:
        patch = image[coords[0]-wid:coords[0]+wid+1,
                            coords[1]-wid:coords[1]+wid+1].flatten()
        desc.append(patch)
    
    return desc
def match(desc1,desc2,threshold=0.5):
    """ For each corner point descriptor in the first image, 
        select its match to second image using
        normalized cross correlation. """
    
    n = len(desc1[0])
    
    # pair-wise distances
    d = -ones((len(desc1),len(desc2)))
    for i in range(len(desc1)):
        for j in range(len(desc2)):
            d1 = (desc1[i] - mean(desc1[i])) / std(desc1[i])
            d2 = (desc2[j] - mean(desc2[j])) / std(desc2[j])
            ncc_value = sum(d1 * d2) / (n-1) 
            if ncc_value > threshold:
                d[i,j] = ncc_value
            
    ndx = argsort(-d)
    matchscores = ndx[:,0]
    
    return matchscores
def match_twosided(desc1,desc2,threshold=0.5):
    """ Two-sided symmetric version of match(). """
    
    matches_12 = match(desc1,desc2,threshold)
    matches_21 = match(desc2,desc1,threshold)
    
    ndx_12 = where(matches_12 >= 0)[0]
    
    # remove matches that are not symmetric
    for n in ndx_12:
        if matches_21[matches_12[n]] != n:
            matches_12[n] = -1
    
    return matches_12
def appendimages(im1,im2):
    """ Return a new image that appends the two images side-by-side. """
    
    # select the image with the fewest rows and fill in enough empty rows
    rows1 = im1.shape[0]    
    rows2 = im2.shape[0]
    
    if rows1 < rows2:
        im1 = concatenate((im1,zeros((rows2-rows1,im1.shape[1]))),axis=0)
    elif rows1 > rows2:
        im2 = concatenate((im2,zeros((rows1-rows2,im2.shape[1]))),axis=0)
    # if none of these cases they are equal, no filling needed.
    
    return concatenate((im1,im2), axis=1)
def plot_matches(im1,im2,locs1,locs2,matchscores,show_below=True):
    """ Show a figure with lines joining the accepted matches 
        input: im1,im2 (images as arrays), locs1,locs2 (feature locations), 
        matchscores (as output from 'match()'), 
        show_below (if images should be shown below matches). """
    
    im3 = appendimages(im1,im2)
    if show_below:
        im3 = vstack((im3,im3))
    
    imshow(im3)
    
    cols1 = im1.shape[1]
    for i,m in enumerate(matchscores):
        if m>0:
            plot([locs1[i][1],locs2[m][1]+cols1],[locs1[i][0],locs2[m][0]],'c')
    axis('off')
def process_image(imagename, resultname, params="--edge-thresh 10 --peak-thresh 5"):
    """ 处理一幅图像，然后将结果保存在文件中"""

    if imagename[-3:] != 'pgm':
        #创建一个pgm文件
        im = Image.open(imagename).convert('L')
        im.save('tmp.pgm')
        imagename ='tmp.pgm'
    cmmd = str("D:\Python36\Lib\win64\sift.exe "+imagename+" --output="+resultname+" "+params)
    os.system(cmmd)

def read_features_from_file(filename):
    """读取特征属性值，然后将其以矩阵的形式返回"""
    f = loadtxt(filename)
    return f[:,:4], f[:,4:] #特征位置，描述子

def write_featrues_to_file(filename, locs, desc):
    """将特征位置和描述子保存到文件中"""
    savetxt(filename, hstack((locs,desc)))

def plot_features(im, locs, circle=False):
    """显示带有特征的图像
       输入：im（数组图像），locs（每个特征的行、列、尺度和朝向）"""

    def draw_circle(c,r):
        t = arange(0,1.01,.01)*2*pi
        x = r*cos(t) + c[0]
        y = r*sin(t) + c[1]
        plot(x, y, 'b', linewidth=2)

    imshow(im)
    if circle:
        for p in locs:
            draw_circle(p[:2], p[2])
    else: 
        plot(locs[:,0], locs[:,1], 'ob')
    axis('off')

Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
Python计算机视觉编程——第二章局部图像描述子 adchloe python 计算机视觉开发语言
目录1Harris角点检测器2SIFT2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子1Harris角点检测器Harris角点检测算法是简单的角点检测算法，主要思想是，如果像素周围显示存在多于一个方向的边，认为该点为兴趣点，称为角点。把图像域中点x上的对称半正定矩阵Mr=Ml(x)M_{r}=M_{l}(\mathbf{x})Mr=Ml(x)定义为：M1=∇I ∇IT=[IxIy][IxI
Python计算机视觉编程pdf txt mobi下载及读书笔记 mrxllh0
Python计算机视觉编程pdftxtmobi读书笔记应该是这一学期图像分析比较有用的工具书了，numpy和matplotlib常用的方法基本都有，并且例子也不错。非常好的计算机视觉入门书，亮点在于没有直接使用OpenCV，而是先简单介绍算法原理，再利用NumPy、matplotlib等基本工具进行算法实现，对于已经学习了计算机视觉理论，但是不知道怎么把公式变成代码的人来说很有帮助。作者:[瑞典]
[笔记]Python计算机视觉编程《一》基本的图像操作和处理二进制怪兽 Python 人工智障读书笔记计算机视觉笔记 python
文章目录前言环境搭建计算机视觉简介Python和NumPy第一章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图图像的轮廓直方图1.2.3【交互式标注】1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3
python计算机视觉编程——第一章（基本的图像操作和处理） NCTU_to_prove_safety 算法
第1章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式——save()函数1.1.2创建缩略图1.1.3复制并粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib库1.2.1画图、描点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy库1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.
PIL–Python图像处理类库斯特凡1899
—–前言—–才开始看Python，感觉离时代好远。现在看的是《Python计算机视觉编程》，欢迎交流！—–正题—–PIL，PhthonImagingLibrary，Python图像图里类库。提供了通用的图像处理功能，以及大量有用的基本图像操作，如图像缩放、裁剪、旋转、颜色转换等。代码例子:fromPILimportImage#读取图像im=Image.open("empire.jpeg")thum
python计算机视觉编程.pdf微盘_Python计算机视觉编程pdf weixin_39860280
下载地址：网盘下载内容简介······《python计算机视觉编程》是计算机视觉编程的权威实践指南，依赖python语言讲解了基础理论与算法，并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外，书中附带的练习还能让读者巩固并学会应用编程知识。《python计算机视觉编程》适合的读者
python画龙舟_Python计算机视觉编程第二章——局部图像描述子 weixin_39999781 python画龙舟
Python计算机视觉编程局部图像描述子(一)Harris角点检测器(二)SIFT(尺度不变特征变换)2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子(三)匹配地理标记图像3.1从Panoramio下载地理标记图像3.2使用局部描述子匹配3.3可视化连接的图像局部图像描述子本节旨在寻找图像间的对应点和对应区域。介绍用于图像匹配的两种局部描述子算法。图像的局部特征是许多计算机视觉算法的基础，
Python计算机视觉编程第三章图像到图像的映射 LuoY、 Python计算机视觉编程
第三章图像到图像的映射3.1单应性变换3.1.1直接线性变换算法3.1.2仿射变换3.2图像扭曲3.2.1图像中的图像3.2.2图像配准3.3创建全景图3.3.1RANSAC3.3.2稳健的单应性矩阵估计3.3.2拼接图像本章讲解图像之间的变换，以及一些计算变换的实用方法。这些变换可用于图像扭曲变形和图像配准。3.1单应性变换单应性变换是一个人平面内的点映射到另一个平面内的二维投影
Python计算机视觉编程第四章照相机模型与增强现实 LuoY、 Python计算机视觉编程 python 计算机视觉 ar
第四章照相机模型与增强现实4.1针孔照相机模型4.1.1照相机矩阵4.1.2三维点的投影4.1.3照相机矩阵的分解4.1.4计算照相机中心4.2照相机标定4.3以平面和标记物体进行姿态估计4.4增强现实4.1针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精确度。在针孔照相机模型中，在光线投影到
python图像处理笔记-八-针孔照相机模型与照相机标定 BluePing
参考教材：python计算机视觉编程视觉SLAM十四讲，从理论到实践针孔照相机模型针孔摄像机模型（有时称作摄影照相机模型），是计算机视觉中广泛应用的照相机模型。原因是：简单精度足够这个名字来源于一种简单的照相机，他利用小孔成像原理进行成像，换句话说就是：在光线投影到图像平面前，从唯一一个点经过，这个经过的点就叫做：照相机中心，记做C，如下图所示：（这张图来自于他人博客：https://blog.c
Python计算机视觉编程_03 chuxiao_scx python 机器学习
基于SIFT算法的全景拼接前言1.单应性变换2.RANSAC算法3.Multi-BandBlending策略4.代码实现前言什么是全景拼接？简单来说就是将两幅或多幅具有重叠区域的图像，合并成一张大图如图所示，7张不同的图像最后拼接成一幅大图，那么问题很明显，如何拼接呢？1.单应性变换如果是最简单图像拼接，很明显，我们只需要对其进行平移，将重叠区域叠加，很轻松的就能得到一幅拼接图像。但实际上两幅图像
Python计算机视觉编程——第6章图像聚类海鸥丸拉面 python 聚类计算机视觉
目录6.1K-means聚类6.1.1Scipy聚类包6.1.2图像聚类6.1.3在主成分上可视化图像6.1.4像素聚类6.2层次聚类图像聚类6.3谱聚类6.1K-means聚类K-means是一种将输入数据划分成k个簇的简单的聚类算法。K-means反复提炼初始评估的类中心，步骤如下：以随机或猜测的方式初始化类中心ui,i=1...k;将每个数据点归并到离他距离最近的类中心所属的类ci；对所有属
Python计算机视觉编程--第四章娇娇是大熊 python python
照相机模型与增强现实一、针孔照相机模型1.1照相机矩阵1.2三维点的投影1.3照相机矩阵的分解1.4照相机中心二、照相机标定一、针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精准度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。在光线投影到图像平面之前，从唯一一个点经
Python计算机视觉编程——第8章图像内容分类海鸥丸拉面 python 计算机视觉分类
目录8.1K临近分类法（KNN）8.1.1一个简单的二维示例8.1.2用稠密SIFT作为图像特征8.1.3图像分类：手势识别8.2贝叶斯分类器用PCA降维8.3支持向量机8.3.1使用LibSVM8.1K临近分类法（KNN）在分类算法中，最简单且用的最多的一种方法之一就是KNN(K-NearsetNeighbor，K邻近分类法)，这种算法把要分类的对象（例如一个特征向量）与训练集中已知类标记的所有
Python计算机视觉编程——第10章 OpenCV 海鸥丸拉面计算机视觉 python opencv
目录10.1OpenCV的Python接口10.2OpenCV基础知识10.2.1读取和写入图像10.2.2颜色空间10.2.3显示图像及结果10.3处理视频10.3.1视频输入10.3.2将视频读取到NumPy数组中10.4跟踪10.4.2Lucas-Kanade算法1.使用跟踪器2.使用发生器10.1OpenCV的Python接口OpenCV是一个C++库，它包含了计算机视觉领域的很多模块。除
Python计算机视觉编程_01 chuxiao_scx python 计算机视觉 opencv
基本的图像操作和处理前言1.图像直方图1.1.原理1.2.结果演示2.高斯滤波2.1.原理2.2.结果演示3.直方图均衡化3.1.原理3.2.结果演示后记前言本篇博客介绍在vscode中使用opencv进行图像处理的基本操作，使用的语言为python，vscode中按照python可以参考我以前写的这篇博客：vscode中配置python环境至于在vscode导入opencv包就请各位自行百度解决
机器学习算法：支持向量机（SVM）夏天是冰红茶 #计算机视觉机器学习支持向量机算法
参考书籍：Solem《python计算机视觉编程》、李航《统计学习方法》、周志华《机器学习》要理解好支持向量机需要较好的数学功底，且能不被公式以及文字绕晕，这里我们就理清楚支持向量机的大体过程。具体的数学计算推导其实已经封装好了，那么理解算法的原理也对我们将来的学习很有帮助，比如以后做科研的时候，大家冥思苦想找不到方法的时候，你走上前去说，唉这个方法就能解决，是不是特别能得到满足。0、概念提前知超
Python计算机视觉编程第一章——基本的图像操作和处理海鸥丸拉面计算机视觉图像处理 python
目录1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3Unmpy1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.6图像的主成分分析（PCA）1.3.7使用p
Python计算机视觉编程第一章基本的图像操作和处理 LuoY、 python 计算机视觉图像处理
第一章基本的图像操作和处理1.1PIL:Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3直方图均衡化1.3.4图像平均1.3.5使用pickle模块1.4SciPy1
python计算机视觉编程 Hesilan python 自然语言处理机器学习
@《python计算机视觉处理编程》第一章笔记Python计算机视觉编程笔记，还在学习之中红色：imtools函数蓝色：函数功能绿色：拓展知识1、fromPILimportImage输入pillow包，图像缩放，裁剪、旋转、颜色转换pil_im=Image.open(‘D:\RGB\Testpicture\pexels-photo-417173.jpg’)打开一张图片print(pil_img.s
《Python 计算机视觉编程》学习笔记（一）书生丶丶 python 计算机视觉学习
《Python计算机视觉编程》文章目录前言第1章基本的图像操作和处理引言1.1PIL：Python图像处理类库图像读取、显示、显示对应灰度图更改图像格式（后缀）创建缩略图复制和粘贴图像区域调整尺寸和旋转1.2Matplotlib绘制图像、点和线图像轮廓和直方图交互式标注1.3NumPy图像数组表示灰度变换直方图均衡化图像的主成分分析（PCA）1.4SciPy图像模糊图像导数形态学：对象计数一些有用
Python计算机视觉编程 - 第三章图像映射 -全景拼接煮酒忆南山 python
全景拼接原理简述在同一位置拍摄的两幅或者多幅图片是单应性相关的，我们经常使用该约束将很多图像缝补起来，拼成一个全景图。全景图像拼接最重要的两个步骤是：1.特征匹配2.图像拼接在本次测试中，我使用的是sift特征匹配,在特征匹配之后，我们使用RANSAC算法求解得到单应性矩阵。其基本思想是，数据中包含正确的点和噪声点，合理的模型能够在描述正确数据点的同时摒弃噪声点，在这里的用途就是排除掉不符合大部分
Python计算机视觉编程第二章局部图像描述子仙蓝计算机视觉计算机视觉 python 算法
Python计算机视觉编程第二章局部图像描述子1Harris角点检测1.1基本概念1.2例子2在图像中寻找对应点2.1基本概念2.2例子3SIFT(尺度不变特征变换)3.1介绍3.2兴趣点3.3描述子3.4检测兴趣点——例子3.5匹配描述子——例子4地理特征匹配4.1需要安装PCV环境4.2测试图片4.3实现代码1Harris角点检测1.1基本概念Harris角点检测算法（也称Harris&Ste
图像检索代码python tf_Python计算机视觉编程（八）图像检索埃斯蓬托的篡位者图像检索代码python tf
图像检索BOW模型基于BOW的图像检索特征提取视觉词典TF-IDF常用参数图像检索具体实现流程BOW模型Bag-of-wordsmodels模型(词袋模型)词袋模型对于给定的两个文档，进行分割可以建构出一个有n个元素词典，根据词典每个词在两个文档中的出现的频率，表示成两个n维向量。基于BOW的图像检索特征提取学习视觉词典针对输入特征集，根据视觉词典进行量化把输入图像，根据TF-IDF转化成视觉单词
python内实现k-means聚类 superdont 图像处理 python python计算机视觉
《Python计算机视觉编程》学习笔记fromscipy.cluster.vqimport*importnumpyasnpfrommatplotlibimportpyplotaspltclass1=1.5*np.random.randn(100,2)##print(class1)class2=np.random.randn(100,2)+np.array([8,8])##print(class2)
Python计算机视觉编程学习笔记十 OPENCV Belouga- 数字图像处理计算机视觉 python
OPENCV（一）OpenCV的Python接口（二）OpenCV基础知识2.1图像读取和写入2.2颜色空间2.3显示图像及结果2.4平移与缩放（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割cv2.watershed()5.3利用霍夫变换检测直线（一）OpenCV的Pyth
Python计算机视觉编程第十章——OpenCV基础知识 Dujing2019 Python计算机视觉编程
Python计算机视觉编程（一）OpenCV的Python接口（二）OpenCV基础知识2.1读取和写入图像2.2颜色空间2.3显示图像及结果（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割5.3利用霍夫变换检测直线（一）OpenCV的Python接口OpenCV是一个C++
Python计算机视觉编程学习笔记七图像搜索白鲸鱼2020 python 数字图像处理计算机视觉
图像搜索（一）基于内容的图像检索（二）视觉单词2.1：创建词汇2.2：创建图像索引2.3：在数据库中搜索图像（三）使用几何特性对结果排序（一）基于内容的图像检索CBIR（Content-BasedImageRetrieval，基于内容的图像检索）CBIR的实现依赖于两个关键技术的解决：图像特征提取和匹配。定义:即从图像库中查找含有特定目标的图像，也包括从连续的视频图像中检索含有特定目标的视频片段。
Python计算机视觉编程学习笔记三图像到图像的映射白鲸鱼2020 计算机视觉 python 数字图像处理
图像到图像的映射（一）单应性变换1.2仿射变换（二）图像扭曲2.1图像中的图像2.2图像配准（三）创建全景图3.1RANSAC3.2拼接图像（一）单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。本质上，单应性变换H，按照下面的方程映射二维中的点（齐次坐标
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

python计算机视觉编程（三）——Harris角点 SIFT 匹配地理标记图像

局部图像描述子

准备

VLFeat

pydot工具包

Harris角点

原理

代码实现

SIFT

原理

代码实现

Harris与SIFT的对比

匹配地理标记图像

一些用到的函数

你可能感兴趣的:(Python计算机视觉编程)