马卫飞

计算机视觉的专家和网站

视觉跟踪综述
目标跟踪是绝大多数视觉系统中不可或缺的环节。在二维视频跟踪算法中，基于目标颜色信息或基于目标运动信息等方法是常用的跟踪方法。从以往的研究中我们发现，大多数普通摄像头（彩色摄像头）下非基于背景建模的跟踪算法都极易受光照条件的影响。这是因为颜色变化在某种程度上是光学的色彩变化造成的。如基于体素和图像像素守恒假设的光流算法它也是假设一个物体的颜色在前后两帧没有巨大而明显的变化。
但在特定的场景应用中（如视频监控等领域），不失有一些经典的跟踪算法可以实现较好的跟踪效果。以下主要介绍三种经典的跟踪算法：CamShift算法、光流跟踪以及粒子滤波算法。最后将给出一个各种跟踪方法间的比较。
1、 CamShift（Continuously Adaptive Mean Shift）跟踪算法
CamShift算法是一种基于均值漂移的算法。均值移动的理论基础是概率密度估计。均值移动的过程实际上就是在概率密度空间中寻找局部极大点。从其全称可知CamShift的算法基础实际上是MeanShift算法，均值移动的操作过程可用如下几步来表示：
(a) 计算以初始点x0为中心的某一核窗所对应的均值移动向量mG(x0)；
(b) 根据mG(x0)来移动核窗的中心位置，也即把mG(x0)中的加权平均值部分赋予x0，把x0作为新的初始点，并转回步骤(a)；
(c) 重复(a)、(b)过程，直到满足某一预定的条件。
因此，均值移动过程就是寻找数据分布最密处的过程。
均值移动的实现过程可图示为：
　　(1) 计算目标区域的均值、移动目标区域
　　
　　(2) 重新计算目标区域均值，还存在移动向量，继续移动目标区域
　　
　　(3) 移动向量越来越小
　　
　　
　　(4) 找到局部极大点，停止移动
　　
　　
　　以上过程只是一次MeanShift算法过程，在连续帧上使用MeanShift算法就是CamShift跟踪算法。CamShift同经典的均值移动跟踪算法的基本思想是相同的，所不同的它是建立在颜色概率分布图和矩的基础之上。CamShift对室内环境下的目标跟踪具有较高的鲁棒性。
1、光流跟踪算法
将三维空间中的目标和场景对应于二维图像平面运动时，他们在二维图像平面的投影就形成了运动，这种运动以图像平面亮度模式表现出来的流动就称为光流。光流法是对运动序列图像进行分析的一个重要方法，光流不仅包含图像中目标的运动信息，而且包含了三维物理结构的丰富信息，因此可用来确定目标的运动情况以及反映图像其它等信息。
光流是空间运动物体在观测成像面上的像素运动的瞬时速度。光流的研究是利用图像序列中的像素强度数据的时域变化和相关性来确定各自像素位置的“运动”，即研究图像灰度在时间上的变化与景象中物体结构及其运动的关系。一般情况下，光流由相机运动、场景中目标运动或两者的共同运动产生。光流计算方法大致可分为三类：基于匹配的、频域的和梯度的方法。
　　(1) 基于匹配的光流计算方法包括基于特征和基于区域两种。基于特征的方法不断地对目标主要特征进行定位和跟踪，对大目标的运动和亮度变化具有鲁棒性。存在的问题是光流通常很稀疏，而且特征提取和精确匹配也十分困难。基于区域的方法先对类似的区域进行定位，然后通过相似区域的位移计算光流。这种方法在视频编码中得到了广泛的应用。然而，它计算的光流仍不稠密。
　　(2) 基于频域的方法利用速度可调的滤波组输出频率或相位信息。虽然能获得高精度的初始光流估计，但往往涉及复杂的计算。另外，进行可靠性评价也十分困难。
　　(3) 基于梯度的方法利用图像序列的时空微分计算2D速度场（光流）。由于计算简单和较好的效果，基于梯度的方法得到了广泛的研究。虽然很多基于梯度的光流估计方法取得了较好的光流估计，但由于在计算光流时涉及到可调参数的人工选取、可靠性评价因子的选择困难，以及预处理对光流计算结果的影响，在应用光流对目标进行实时监测与自动跟踪时仍存在很多问题。
　　光流法检测运动物体的基本原理是：给图像中的每一个像素点赋予一个速度矢量，这就形成了一个图像运动场，在运动的一个特定时刻，图像上的点与三维物体上的点一一对应，这种对应关系可由投影关系得到，根据各个像素点的速度矢量特征，可以对图像进行动态分析。如果图像中没有运动物体，则光流矢量在整个图像区域是连续变化的。当图像中有运动物体时，目标和图像背景存在相对运动，运动物体所形成的速度矢量必然和邻域背景速度矢量不同，从而检测出运动物体及位置。采用光流法进行运动物体检测的问题主要在于大多数光流法计算耗时，实时性和实用性都较差。但是光流法的优点在于光流不仅携带了运动物体的运动信息，而且还携带了有关景物三维结构的丰富信息，它能够在不知道场景的任何信息的情况下，检测出运动对象。
　　
　　对于视频监控系统来说，所用的图像基本都是摄像机静止状态下摄取得，所以对有实时性和准确性要求的系统来说，纯粹使用光流法来检测目标不太实际。更多的是利用光流计算方法与其它方法相结合来实现对目标检测和运动估计。
　　然而，在实际应用中，由于遮挡性、多光源、透明性和噪声等原因，使得光流场基本方程的灰度守恒假设条件不能满足，不能求解出正确的光流场，同时大多数的光流计算方法相当复杂，计算量巨大，不能满足实时的要求，因此，一般不被对精度和实时性要求比较高的监控系统所采用。
3、粒子滤波跟踪算法
粒子滤波算法有很多变种，以Rob Hess实现的这种最基本的粒子滤波算法为例。它的核心思想是随机采样和重要性重采样。在不知道目标在哪里的情况下，随机向场景中分散粒子，撒完粒子后，根据特征相似度计算每个粒子的重要性，然后在重要的地方多撒粒子，不重要的地方少撒粒子。所以说粒子滤波较之蒙特卡洛滤波计算量较小。这种思想虽然简单，但效果往往很好。
粒子滤波实现对目标的跟踪通常分以下四个步骤：
(1) 初始化阶段-提取跟踪目标特征
该阶段要人工指定跟踪目标，程序计算跟踪目标的特征，比如可以采用目标的颜色特征。这点和CamShift算法类似，不能实现自动初始化。但我们可以在初始时给定一个颜色样本，实现程序的半自动初始化。然后计算该区域色调(Hue)空间的直方图，即为目标的特征。直方图可以用一个向量来表示，所以目标特征就是一个N*1的向量V。
(2) 搜索阶段—分撒搜索粒子
获取目标特征后，在场景中分撒许多搜索粒子去搜索目标对象。粒子分撒有许多种方式。比如，a) 均匀分撒。即在整个图像平面均匀的撒粒子(uniform distribution)；b)在上一帧得到的目标附近按照高斯分布来放，可以理解成，靠近目标的地方多放，远离目标的地方少放。Rob Hess的代码用的是后一种方法。粒子放出去后按照初始化阶段得到的目标特征(色调直方图，向量V)计算它所处的位置处图像的颜色特征，得到一个色调直方图，向量Vi，计算该直方图与目标直方图的相似性（直方图匹配）。相似性有多种度量，最简单的一种是计算sum(abs(Vi-V))。每个粒子算出相似度后再做一次归一化，使得所有的粒子得到的相似度加起来等于1。
(3) 决策阶段
分撒出去的每个粒子将返回其所处位置的图像信息。比如，“一号粒子处图像与目标的相似度是0.3”,“二号粒子处图像与目标的相似度是0.02”,“三号粒子处图像与目标的相似度是0.0003”,“N号粒子处图像与目标的相似度是0.013”然后做加权平均。设N号粒子的图像像素坐标是(Xn,Yn),它报告的相似度是Wn,于是目标最可能的像素坐标X = sum(Xn*Wn),Y = sum(Yn*Wn)。
(4) 重采样阶段Resampling
在新的一帧图像里，为了搜索到目标的新位置，需要再分撒粒子进行搜索。但现在应该怎样分撒呢？这要根据上一帧各个粒子返回的相似度报告。比如，“一号粒子处图像与目标的相似度是0.3”,“二号粒子处图像与目标的相似度是0.02”,“三号粒子处图像与目标的相似度是0.0003”,“N号粒子处图像与目标的相似度是0.013”。综合所有粒子的报告，一号粒子处的相似度最高，三号粒子处的相似度最低，于是要重新分撒粒子，在相似度最高的粒子那里放更多条粒子，在相似度最低的粒子那里少放粒子，甚至把原来那条粒子也撤回来。这就是Sampling Importance Resampling，根据重要性重采样(更具重要性重新放粒子)。
(2)->(3)->(4)->(2)如是反复循环，即完成了目标的动态跟踪。
粒子滤波跟踪算法可用于视频监控领域，可以跟踪速度较快的跟踪目标。

4、其他跟踪算法及优缺点
　　将其他一些常用的跟踪算法及优缺点形成了一个表，其原理不做赘述，可参阅相关文献。
　　
local orientation correlation (LOC) , flocks of features tracking (FF) , optical flow tracking using templates on a regular grid (OF) and local feature tracking, KLT-tracker(KLT) , and boosted detection (BD).

参考
[1] 《基于均值移动的人脸跟踪简介》未公开
[2] http://kb.cnblogs.com/a/1742263/
[3] AIDIA – Adaptive Interface for Display Interaction
[4] http://baike.baidu.com/view/2810997.htm
分类: 目标跟踪
posted @ 2012-04-18 16:05 Hanson-jun 阅读(68) 评论(0) 编辑

机器视觉开源处理库汇总
从cvchina搞到的机器视觉开源处理库汇总，转来了，很给力，还在不断更新。。。
通用库/General Library
OpenCV
无需多言。
RAVL
Recognition And Vision Library. 线程安全。强大的IO机制。包含AAM。
CImg
很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。
图像，视频IO/Image, Video IO
FreeImage
DevIL
ImageMagick
FFMPEG
VideoInput
portVideo
AR相关/Augmented Reality
ARToolKit
基于Marker的AR库
ARToolKitPlus
ARToolKit的增强版。实现了更好的姿态估计算法。
PTAM
实时的跟踪、SLAM、AR库。无需Marker，模板，内置传感器等。
BazAR
基于特征点检测和识别的AR库。
局部不变特征/Local Invariant Feature
VLFeat
目前最好的Sift开源实现。同时包含了KD-tree，KD-Forest，BoW实现。
Ferns
基于Naive Bayesian Bundle的特征点识别。高速，但占用内存高。
SIFT By Rob Hess
基于OpenCV的Sift实现。
目标检测/Object Detection
AdaBoost By JianXin.Wu
又一个AdaBoost实现。训练速度快。
行人检测 By JianXin.Wu
基于Centrist和Linear SVM的快速行人检测。
（近似）最近邻/ANN
FLANN
目前最完整的（近似）最近邻开源库。不但实现了一系列查找算法，还包含了一种自动选取最快算法的机制。
ANN
另外一个近似最近邻库。
SLAM & SFM
SceneLib [LGPL]
monoSLAM库。由Androw Davison开发。
图像分割/Segmentation
SLIC Super Pixel
使用Simple Linear Iterative Clustering产生指定数目，近似均匀分布的Super Pixel。
目标跟踪/Tracking
TLD
基于Online Random Forest的目标跟踪算法。
KLT
Kanade-Lucas-Tracker
Online boosting trackers
Online Boosting Trackers
直线检测/Line Detection
DSCC
基于联通域连接的直线检测算法。
LSD [GPL]
基于梯度的，局部直线段检测算子。
指纹/Finger Print
pHash [GPL]
基于感知的多媒体文件Hash算法。（提取，对比图像、视频、音频的指纹）
视觉显著性/Visual Salience
Global Contrast Based Salient Region Detection
Ming-Ming Cheng的视觉显著性算法。
FFT/DWT
FFTW [GPL]
最快，最好的开源FFT。
FFTReal [WTFPL]
轻量级的FFT实现。许可证是亮点。
音频处理/Audio processing
STK [Free]
音频处理，音频合成。
libsndfile [LGPL]
音频文件IO。
libsamplerate [GPL ]
音频重采样。
小波变换
快速小波变换（FWT）
FWT
BRIEF: Binary Robust Independent Elementary Feature 一个很好的局部特征描述子，里面有FAST corner + BRIEF实现特征点匹配的DEMO：http://cvlab.epfl.ch/software/brief/
http://code.google.com/p/javacv

Java打包的OpenCV, FFmpeg, libdc1394, PGR FlyCapture, OpenKinect, videoInput, and ARToolKitPlus库。可以放在Android上用~

libHIK,HIK SVM，计算HIK SVM跟Centrist的Lib。http://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK.htm

一组视觉显著性检测代码的链接：http://cg.cs.tsinghua.edu.cn/people/~cmm/saliency/

分类: 编码杂记
posted @ 2012-04-18 16:05 Hanson-jun 阅读(175) 评论(0) 编辑

不规则物体形状匹配综述
不规则物体形状匹配综述
　
　　物体识别是计算机视觉应用的一项基本任务。识别通常基于目标物体的灰度信息、颜色信息或形状信息。物体识别的目的就是要找到一个包含可以区分不同目标物体的有效信息的描述。由于要识别的物体是事先知道的，所以目标物体的几何特征可以被直接应用到识别任务中。
　　不规则物体的形状匹配是一种有效的利用物体几何特征进行识别的方法。根据匹配对象的不同，可以将不规则物体的形状匹配分为基于区域的匹配方法和基于轮廓的匹配方法。
一、基于轮廓特征的形状匹配
　　基于轮廓特征的形状匹配在实际中更为常用，这主要有两方面的原因：一是基于轮廓特征的匹配计算量小，可以较好的满足实时性要求；二是要识别的目标物通常是预先知道的，那么它的几何信息完全可以被用于识别过程中。为了识别不规则物体，主要任务就是设计一种基于（少量的）目标物几何约束先验知识的有效匹配方法。
1. 链码直方图(chain code histogram)
　　链码直方图将人眼看上去相似的物体归为一类。因此利用它不能进行精确的识别和分类。
　　方向链码（Freeman链码）是用来表示物体轮廓的典型链码表示法。一条离散曲线可以定义为Z2域内一组数量有限的8联通点。因此，一条数字化二值曲线可以用方向链码表示方向链码是相邻两像素连线的8种可能的方向值。一条曲线被网格离散化后形成n个链码方向，最终此曲线链码可表示为{ai}n，每条链指向8个方向重的一个方向，ai={0,1,2,3,4,5,6,7}，i为像素的索引值，ai是由像素(i)指向像素(i+1)的方向链码。
　　链码直方图的计算简单而且快速。计算公式如下：
　　　　
　　其中，nk是一个链码中链码值k的数目，n是一个链码中的节点数。
　　
　　　(a)编码的方向示意，(b)简单物体形状，(c)形状的链码表示，(d)链码直方图
　　链码法的特点：
　　(1) 计算量小，可满足实时性要求；
　　(2) 具有平移、尺度不变性；
　　(3) 具有90度旋转不变性；
　　(4) 规格化链码直方图可以达到更好的旋转不变性。
2. 成对几何直方图(Pairwise Geometric Histogram)
　　成对几何直方图通过相对角和相对位置特征来描述目标轮廓，并采用关系直方图统计这对几何特征来进行形状索引。采用这种编码方式需要具备一定的前提，即对于一个不规则物体我们可以将其近似为一个几何多边形。这种编码方法可以很好地描述一个多边形物体。
　　将不规则形状近似为多边形，并将其定义为边缘点的集合。这样它所包含的轮廓边缘（线段）就可以由连续的边缘点来表示。接下来我们计算多边形的PGH：将每一个轮廓边缘视为其方向上的基准线，那么它与其他轮廓边缘间的相对角以及最大最小垂直距离(dmin和dmax)可以被计算出来。边缘之间的角度定义了直方图的行，然后在其中增加对应的计算出来的最大和最小距离的所有直方块，就得到了当前多边形的PGH。
　　它具有如下特点：
　　(1) 计算简单，可满足实时性要求；
　　(2) 具有平移、尺度不变性；
　　(3) 具有360度旋转不变性。
3. 简单形状描述符的结合(Combination of Simple Shape Descriptors)
　　如图，它们是几种简单的形状描述符，分别代表了凹凸性、主轴、致密性、差异性和椭圆差异性。
　　凹凸性：轮廓凸包周长与原轮廓周长的比率。（所有凸起的覆盖轮廓称为凸包）
　　主轴：过物体质心的正交轴，主轴之间的比例可以由物体轮廓的协方差矩阵计算出来
　　致密性：物体区域面积与等面积的正方形周长的比例，也可以是圆。
　　差异性：表现为与模板比较的比例均方误差。
　　
　　单独用这几种简单描述符的任何一种来表示形状进行匹配，都不能达到较好的匹配结果。但是如果我们将这五种简单形状描述符进行结合，同时用它们来描述一个形状，那么这个形状的描述信息就非常丰富了，匹配的结果也会很好。
这种形状描述方式具有如下的特点：
　　(1) 单独的任何一种简单描述符都不能用于精确识别物体，但是多种简单描述符的结合可以达到很高的识别效率；
　　(2) 计算简单，可以达到实时性；
　　(3) 具有平移、尺度不变性；
　　(4) 理论上360度旋转不变性。
4. 基于hausdorff距离的形状匹配
　　Hausdorff距离用来计算两个点集之间的匹配程度。给定两个有限集A={a1,a2,…,ap}和B={b1,b2,…,bq},A，B之间的Hausdorff距离定义如下：
　　
　　其中：
　　
　　
　　Hausdorff距离H(A,B)取h(A,B)和h(B,A)的最大值，这样通过计算h(A,B)和h(B,A)就可以获得两个点集A，B之间的匹配程度。
　　
　　为了减少计算量，可以取角点进行匹配。但这样匹配率将降低。基于hausdorff距离的形状匹配的特点;
　　(1) 对每个边缘点进行hausdorff距离计算，计算量稍大，但对不是过于复杂的轮廓（如小尺寸轮廓），可以满足实时性；
　　(2) 具有平移、尺度不变性；
　　(3) 具有旋转不变性；
二、基于区域特征的形状匹配
　　基于不变矩的形状匹配是典型的基于区域的匹配方法。其中，基于Hu不变矩的形状匹配应用最为广泛。
图像的矩函数在模式识别、目标分类中得到了广泛的应用。在1961年首先基于代数不变量引入矩不变量。通过对几何矩的非线性组合，导出了一组对于图像平移、尺度、旋转变化不变的矩，这种矩就成为Hu矩。
一幅大小为M×N的二维图像其中(p+q)阶矩：

对于二值图像，其零阶矩就是该形状区域的面积。因此，将面积归一化，每一个图像矩除以零阶矩得到的商具有形状的尺度变化无关性。
　　求图像的p+q阶中心矩，面积归一化，使得具有平移、尺度不变性。
　　(1)
　　(2)
　　计算图像的7个面积归一化的中心矩，{m11,m02,m20,m21,m12,m03,m30}Hu不变矩是关于这7个矩的函数。具有平移、旋转和尺度不变性。
　　
　　彩色图像Hu不变矩的计算流程如下：
　　
　　基于Hu矩的形状匹配所具有的特点：
　　(1) Hu不变矩只能用于对区域的检测，不能用于边界的检测，但由于计算简单，计算量不大，可以满足实时性；
　　(2) 具有平移、尺度不变性；
　　(3) 具有旋转不变性。
三、匹配方法间的比较
　　
　　
　　CCH（链码直方图）：是一种基于轮廓匹配方法。具有较强的平移不变性，尺度不变性一般，具有90度的旋转不变性。由于编码简单，执行速度快。计算量和所需内存都较小，适合差别明显的物体，对平滑和非平滑物体的识别并不明显；
　　PGH（成对几何直方图）：是一种基于轮廓匹配方法。具有较强的平移不变性和尺度不变性，具有360度的旋转不变性。执行速度快，可以较好地识别多边形物体和部分自封闭的物体，由于它的计算过程，对非多边形物体的识别可能会浪费计算量；
　　CFSS（五种简单形状描述符结合）：是一种基于轮廓匹配方法。具有较强的平移不变性和尺度不变性，具有360度的旋转不变性。执行速度处于CCH方法和PGH方法之间。识别率与PGH相当，但是比它需要更少的计算时间和内存。
　　HAUSDORFF距离：是一种基于轮廓匹配方法。具有较强的平移不变性，但是尺度不变性和旋转不变性都较差。由于处理的数据维数较多，执行效率是这五种方法中最慢的一个。可用于匹配部分重和形状物体。
　　Hu不变矩：是一种基于区域的形状匹配方法。具有较强的平移、尺度和旋转不变性，其中旋转不变性为360度。但由于匹配的数据量大，执行速度较慢。适合于进行一些更精确的匹配。
分类: 目标识别
posted @ 2012-04-18 16:04 Hanson-jun 阅读(42) 评论(0) 编辑

Hough变换原理
一、简单介绍
Hough变换是图像处理中从图像中识别几何形状的基本方法之一。Hough变换的基本原理在于利用点与线的对偶性，将原始图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点。这样就把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题。也即把检测整体特性转化为检测局部特性。比如直线、椭圆、圆、弧线等。
二、Hough变换的基本思想
设已知一黑白图像上画了一条直线，要求出这条直线所在的位置。我们知道，直线的方程可以用y=k*x+b 来表示，其中k和b是参数，分别是斜率和截距。过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一族直线。方程y0=kx0+b在参数k–b平面上是一条直线，(你也可以是方程b=-x0*k+y0对应的直线)。这样，图像x–y平面上的一个前景像素点就对应到参数平面上的一条直线。我们举个例子说明解决前面那个问题的原理。设图像上的直线是y=x, 我们先取上面的三个点：A(0,0), B(1,1), C(22)。可以求出，过A点的直线的参数要满足方程b=0, 过B点的直线的参数要满足方程1=k+b, 过C点的直线的参数要满足方程2=2k+b, 这三个方程就对应着参数平面上的三条直线，而这三条直线会相交于一点(k=1,b=0)。　同理，原图像上直线y=x上的其它点(如(3,3),(4,4)等)　对应参数平面上的直线也会通过点(k=1,b=0)。这个性质就为我们解决问题提供了方法，就是把图像平面上的点对应到参数平面上的线，最后通过统计特性来解决问题。假如图像平面上有两条直线，那么最终在参数平面上就会看到两个峰值点，依此类推。
简而言之，Hough变换思想为：在原始图像坐标系下的一个点对应了参数坐标系中的一条直线，同样参数坐标系的一条直线对应了原始坐标系下的一个点，然后，原始坐标系下呈现直线的所有点，它们的斜率和截距是相同的，所以它们在参数坐标系下对应于同一个点。这样在将原始坐标系下的各个点投影到参数坐标系下之后，看参数坐标系下有没有聚集点，这样的聚集点就对应了原始坐标系下的直线。
在实际应用中，y=k*x+b形式的直线方程没有办法表示x=c形式的直线(这时候，直线的斜率为无穷大)。所以实际应用中，是采用参数方程p=x*cos(theta)+y*sin(theta)。这样，图像平面上的一个点就对应到参数p—theta平面上的一条曲线上，其它的还是一样。
三、Hough变换推广
1、已知半径的圆
其实Hough变换可以检测任意的已知表达形式的曲线，关键是看其参数空间的选择，参数空间的选择可以根据它的表达形式而定。比如圆的表达形式为，所以当检测某一半径的圆的时候，可以选择与原图像空间同样的空间作为参数空间。那么圆图像空间中的一个圆对应了参数空间中的一个点，参数空间中的一个点对应了图像空间中的一个圆，圆图像空间中在同一个圆上的点，它们的参数相同即a，b相同，那么它们在参数空间中的对应的圆就会过同一个点（a，b），所以，将原图像空间中的所有点变换到参数空间后，根据参数空间中点的聚集程度就可以判断出图像空间中有没有近似于圆的图形。如果有的话，这个参数就是圆的参数。
2、未知半径的圆
对于圆的半径未知的情况下，可以看作是有三个参数的圆的检测，中心和半径。这个时候原理仍然相同，只是参数空间的维数升高，计算量增大。图像空间中的任意一个点都对应了参数空间中的一簇圆曲线。，其实是一个圆锥型。参数空间中的任意一个点对应了图像空间中的一个圆。
3、椭圆
椭圆有5个自由参数，所以它的参数空间是5维的，因此他的计算量非常大，所以提出了许多的改进算法。
四、总结

图像空间中的在同一个圆，直线，椭圆上的点，每一个点都对应了参数空间中的一个图形，在图像空间中这些点都满足它们的方程这一个条件，所以这些点，每个投影后得到的图像都会经过这个参数空间中的点。也就是在参数空间中它们会相交于一点。所以，当参数空间中的这个相交点的越大的话，那么说明元图像空间中满足这个参数的图形越饱满。越象我们要检测的东西。
Hough变换能够查找任意的曲线，只要你给定它的方程。Hough变换在检验已知形状的目标方面具有受曲线间断影响小和不受图形旋转的影响的优点，即使目标有稍许缺损或污染也能被正确识别。
转自：http://blog.csdn.net/icerain_3321/article/details/1665280
posted @ 2012-04-18 16:02 Hanson-jun 阅读(24) 评论(0) 编辑

介绍n款计算机视觉库/人脸识别开源库/软件
计算机视觉库 OpenCV
OpenCV是Intel®开源计算机视觉库。它由一系列 C 函数和少量 C++ 类构成，实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个C函数的跨平台的中、高层 API。它不依赖于其它的外部库——尽管也可以使用某些外部库。 OpenCV 对非商业…
人脸识别 faceservice.cgi
faceservice.cgi 是一个用来进行人脸识别的 CGI 程序，你可以通过上传图像，然后该程序即告诉你人脸的大概坐标位置。faceservice是采用 OpenCV 库进行开发的。
OpenCV的.NET版 OpenCVDotNet
OpenCVDotNet 是一个 .NET 对 OpenCV 包的封装。
人脸检测算法 jViolajones
jViolajones是人脸检测算法Viola-Jones的一个Java实现，并能够加载OpenCV XML文件。示例代码：http://www.oschina.net/code/snippet_12_2033
Java视觉处理库 JavaCV
JavaCV 提供了在计算机视觉领域的封装库，包括：OpenCV、ARToolKitPlus、libdc1394 2.x 、PGR FlyCapture和FFmpeg。此外，该工具可以很容易地使用Java平台的功能。 JavaCV还带有硬件加速的全屏幕图像显示（CanvasFrame），易于在多个内核中执行并行代码（并…
运动检测程序 QMotion
QMotion 是一个采用 OpenCV 开发的运动检测程序，基于 QT。
视频监控系统 OpenVSS
OpenVSS - 开放平台的视频监控系统 - 是一个系统级别的视频监控软件视频分析框架（VAF）的视频分析与检索和播放服务，记录和索引技术。它被设计成插件式的支持多摄像头平台，多分析仪模块（OpenCV的集成），以及多核心架构。
手势识别 hand-gesture-detection
手势识别，用OpenCV实现
人脸检测识别 mcvai-tracking
提供人脸检测、识别与检测特定人脸的功能，示例代码 cvReleaseImage( &gray ); cvReleaseMemStorage(&storage); cvReleaseHaarClassifierCascade(&cascade);…
人脸检测与跟踪库 asmlibrary
Active Shape Model Library (ASMLibrary©) SDK, 用OpenCV开发，用于人脸检测与跟踪。
Lua视觉开发库 libecv
ECV 是 lua 的计算机视觉开发库(目前只提供linux支持)
OpenCV的.Net封装 OpenCVSharp
OpenCVSharp 是一个OpenCV的.Net wrapper，应用最新的OpenCV库开发，使用习惯比EmguCV更接近原始的OpenCV，有详细的使用样例供参考。
3D视觉库 fvision2010
基于OpenCV构建的图像处理和3D视觉库。示例代码： ImageSequenceReaderFactory factory; ImageSequenceReader* reader = factory.pathRegex(“c:/a/im_%03d.jpg”, 0, 20); //ImageSequenceReader* reader = factory.avi(“a.avi”); if (reader == NULL) { …
基于QT的计算机视觉库 QVision
基于 QT 的面向对象的多平台计算机视觉库。可以方便的创建图形化应用程序，算法库主要从 OpenCV，GSL，CGAL，IPP，Octave 等高性能库借鉴而来。
图像特征提取 cvBlob
cvBlob 是计算机视觉应用中在二值图像里寻找连通域的库.能够执行连通域分析与特征提取.
实时图像/视频处理滤波开发包 GShow
GShow is a real-time image/video processing filter development kit. It successfully integrates DirectX11 with DirectShow framework. So it has the following features: GShow 是实时图像/视频处理滤波开发包，集成DiretX11。…
视频捕获 API VideoMan
VideoMan 提供一组视频捕获 API 。支持多种视频流同时输入（视频传输线、USB摄像头和视频文件等）。能利用 OpenGL 对输入进行处理，方便的与 OpenCV，CUDA 等集成开发计算机视觉系统。
开放模式识别项目 OpenPR
Pattern Recognition project（开放模式识别项目），致力于开发出一套包含图像处理、计算机视觉、自然语言处理、模式识别、机器学习和相关领域算法的函数库。
OpenCV的Python封装 pyopencv
OpenCV的Python封装，主要特性包括：提供与OpenCV 2.x中最新的C++接口极为相似的Python接口，并且包括C++中不包括的C接口提供对OpenCV 2.x中所有主要部件的绑定：CxCORE (almost complete), CxFLANN (complete), Cv (complete), CvAux (C++ part almost…
视觉快速开发平台 qcv
计算机视觉快速开发平台，提供测试框架，使开发者可以专注于算法研究。
图像捕获 libv4l2cam
对函数库v412的封装，从网络摄像头等硬件获得图像数据，支持YUYV裸数据输出和BGR24的OpenCV IplImage输出
计算机视觉算法 OpenVIDIA
OpenVIDIA projects implement computer vision algorithms running on on graphics hardware such as single or multiple graphics processing units(GPUs) using OpenGL, Cg and CUDA-C. Some samples will soon support OpenCL and Direct Compute API'…
高斯模型点集配准算法 gmmreg
实现了基于混合高斯模型的点集配准算法，该算法描述在论文： A Robust Algorithm for Point Set Registration Using Mixture of Gaussians, Bing Jian and Baba C. Vemuri. ，实现了C++/Matlab/Python接口…
模式识别和视觉库 RAVL
Recognition And Vision Library (RAVL) 是一个通用 C++ 库，包含计算机视觉、模式识别等模块。
图像处理和计算机视觉常用算法库 LTI-Lib
LTI-Lib 是一个包含图像处理和计算机视觉常用算法和数据结构的面向对象库，提供 Windows 下的 VC 版本和 Linux 下的 gcc 版本，主要包含以下几方面内容： 1、线性代数 2、聚类分析 3、图像处理 4、可视化和绘图工具
OpenCV优化 opencv-dsp-acceleration
优化了OpenCV库在DSP上的速度。
C++计算机视觉库 Integrating Vision Toolkit
Integrating Vision Toolkit (IVT) 是一个强大而迅速的C++计算机视觉库，拥有易用的接口和面向对象的架构，并且含有自己的一套跨平台GUI组件，另外可以选择集成OpenCV
计算机视觉和机器人技术的工具包 EGT
The Epipolar Geometry Toolbox (EGT) is a toolbox designed for Matlab (by Mathworks Inc.). EGT provides a wide set of functions to approach computer vision and robotics problems with single and multiple views, and with different vision se…
OpenCV的扩展库 ImageNets
ImageNets 是对OpenCV 的扩展，提供对机器人视觉算法方面友好的支持，使用Nokia的QT编写界面。
libvideogfx
视频处理、计算机视觉和计算机图形学的快速开发库。
Matlab计算机视觉包 mVision
Matlab 的计算机视觉包，包含用于观察结果的 GUI 组件，貌似也停止开发了，拿来做学习用挺不错的。
Scilab的计算机视觉库 SIP
SIP 是 Scilab（一种免费的类Matlab编程环境）的图像处理和计算机视觉库。SIP 可以读写 JPEG/PNG/BMP 格式的图片。具备图像滤波、分割、边缘检测、形态学处理和形状分析等功能。
STAIR Vision Library
STAIR Vision Library (SVL) 最初是为支持斯坦福智能机器人设计的，提供对计算机视觉、机器学习和概率统计模型的支持。
posted @ 2012-04-18 15:57 Hanson-jun 阅读(111) 评论(0) 编辑

UIUC某童鞋收集的代码合集
Jia-Bin Huang童鞋收集，此童鞋毕业于国立交通大学，之前拍过很多CVPR举办地科罗拉多州的照片，这里大多为matlab code,
link: https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html
包括：
Feature Extraction：
SIFT [1] [Demo program][SIFT Library] [VLFeat]
PCA-SIFT [2] [Project]
Affine-SIFT [3] [Project]
SURF [4] [OpenSURF] [Matlab Wrapper]
Affine Covariant Features [5] [Oxford project]
MSER [6] [Oxford project] [VLFeat]
Geometric Blur [7] [Code]
Local Self-Similarity Descriptor [8] [Oxford implementation]
Global and Efficient Self-Similarity [9] [Code]
Histogram of Oriented Graidents [10] [INRIA Object Localization Toolkit] [OLT toolkit for Windows]
GIST [11] [Project]
Shape Context [12] [Project]
Color Descriptor [13] [Project]
Pyramids of Histograms of Oriented Gradients [Code]
Space-Time Interest Points (STIP) [14] [Code]
Boundary Preserving Dense Local Regions [15][Project]
Image Segmentation：
Normalized Cut [1] [Matlab code]
Gerg Mori’ Superpixel code [2] [Matlab code]
Efficient Graph-based Image Segmentation [3] [C++ code] [Matlab wrapper]
Mean-Shift Image Segmentation [4] [EDISON C++ code] [Matlab wrapper]
OWT-UCM Hierarchical Segmentation [5] [Resources]
Turbepixels [6] [Matlab code 32bit] [Matlab code 64bit] [Updated code]
Quick-Shift [7] [VLFeat]
SLIC Superpixels [8] [Project]
Segmentation by Minimum Code Length [9] [Project]
Biased Normalized Cut [10] [Project]
Segmentation Tree [11-12] [Project]
Entropy Rate Superpixel Segmentation [13] [Code]
Object Detection：
A simple object detector with boosting [Project]
INRIA Object Detection and Localization Toolkit [1] [Project]
Discriminatively Trained Deformable Part Models [2] [Project]
Cascade Object Detection with Deformable Part Models [3] [Project]
Poselet [4] [Project]
Implicit Shape Model [5] [Project]
Viola and Jones’s Face Detection [6] [Project]
Saliency Detection
Itti, Koch, and Niebur’ saliency detection [1] [Matlab code]
Frequency-tuned salient region detection [2] [Project]
Saliency detection using maximum symmetric surround [3] [Project]
Attention via Information Maximization [4] [Matlab code]
Context-aware saliency detection [5] [Matlab code]
Graph-based visual saliency [6] [Matlab code]
Saliency detection: A spectral residual approach. [7] [Matlab code]
Segmenting salient objects from images and videos. [8] [Matlab code]
Saliency Using Natural statistics. [9] [Matlab code]
Discriminant Saliency for Visual Recognition from Cluttered Scenes. [10] [Code]
Learning to Predict Where Humans Look [11] [Project]
Global Contrast based Salient Region Detection [12] [Project]
Image Classification
Pyramid Match [1] [Project]
Spatial Pyramid Matching [2] [Code]
Locality-constrained Linear Coding [3] [Project] [Matlab code]
Sparse Coding [4] [Project] [Matlab code]
Texture Classification [5] [Project]
Multiple Kernels for Image Classification [6] [Project]
Feature Combination [7] [Project]
SuperParsing [Code]
Image Matting
Closed Form Matting [Code]
Spectral Matting [Project]
Learning-based Matting [Code]
等等等等。。。。
大家可以去那个网址自己看。。。。
posted @ 2012-04-18 15:53 Hanson-jun 阅读(49) 评论(0) 编辑

图像处理方面的网站
http://blog.damiles.com
www.bernardotti.it
http://www.ohloh.net/tags/recognition
http://www.diphernet.com/
http://www.mat.ucsb.edu/projects/tater/
http://enblend.sourceforge.net/
http://www.infra.kth.se/courses/1N1652/
http://www.csie.ntu.edu.tw/~b93082/VFX/hw2/vfx02.htm#t3
http://graphics.cs.msu.ru/en/research/calibration/
http://www.vlfeat.org/~vedaldi/
http://svn.openframeworks.cc/browser/listing.php?repname=addons&path=%2FofxOpenCv%2Ftrunk%2FofxOpenCv%2F&rev=29&sc=1
http://cvlab.epfl.ch/software/ferns/index.php
http://staff.science.uva.nl/~rvalenti/index.php?content=projects
http://mpac.ee.ntu.edu.tw/~ck/project_panorama/#Downloads
http://www.sharewareconnection.com/titles/cross-stitch.htm
http://mpac.ee.ntu.edu.tw/~sutony/vfx_stitching/pano.htm
http://mpac.ee.ntu.edu.tw/people.php
http://mpac.ee.ntu.edu.tw/index.php
http://www.cse.cuhk.edu.hk/~csc5280/project3/RoyChan/index.htm
http://personal.ie.cuhk.edu.hk/~gbq008/csc_project_3.htm
http://graphics.cs.cmu.edu/courses/15-463/2008_fall/463.html
http://www-2.cs.cmu.edu/%7ecdtwigg/
http://cs-people.bu.edu/edwardaa/cs580/p1/p1.html#goals
http://www.cs.toronto.edu/~smalik/2530/mosaic/results.html
http://www.cs.princeton.edu/gfx/
http://idea.hosting.lv/a/gfx/
http://www.cs.toronto.edu/~esteger/mosaic/index.html
http://home.so-net.net.tw/lioucy
http://web.ics.purdue.edu/~kim497/

CUDA:
http://gforge.man.poznan.pl/gf/project/cudaopencv/scmsvn/
http://wiki.livedoor.jp/mikk_ni3_92/d/CUDA::2%C3%CD%B2%BD::%CA%A3%BF%F4%CB%E7
http://cudasample.net/

一、研究群体
http://www-2.cs.cmu.edu/~cil/vision.html
这是卡奈基梅隆大学的计算机视觉研究组的主页，上面提供很全的资料，从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件，甚至还有一个搜索引擎。

http://www.cmis.csiro.au/IAP/zimage.htm
这是一个侧重图像分析的站点，一般。但是提供一个Image Analysis环境—ZIMAGE and SZIMAGE。

http://www.via.cornell.edu/
康奈尔大学的计算机视觉和图像分析研究组，好像是电子和计算机工程系的。侧重医学方面的研究，但是在上面有相当不错资源，关键是它正在建设中，能够跟踪一些信息。

http://www2.parc.com/istl/groups/did/didoverview.shtml
有一个很有意思的项目：DID(文档图像解码)。

http://www-cs-students.stanford.edu/
斯坦福大学计算机系主页，自己找吧:(

http://www.fmrib.ox.ac.uk/analysis/
主要研究：Brain Extraction Tool,Nonlinear noise reduction,Linear Image Registration,

Automated Segmentation,Structural brain change analysis,motion correction,etc.

http://www.cse.msu.edu/prip/
这是密歇根州立大学计算机和电子工程系的模式识别–图像处理研究组，它的FTP上有许多的文章(NEW)。

http://pandora.inf.uni-jena.de/p/e/index.html
德国的一个数字图像处理研究小组，在其上面能找到一些不错的链接资源。

http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html
CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture.

http://cfia.gmu.edu/
The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links

between academic institutes, industry and government agencies, and to transfer key technologies to

help industry build next

generation commercial and military imaging and multimedia systems.

http://peipa.essex.ac.uk/info/groups.html
可以通过它来搜索全世界各地的知名的计算机视觉研究组(CV Groups)，极力推荐。

二、图像处理GPL库
http://www.ph.tn.tudelft.nl/~klamer/cppima.html
Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的库函数的文档，当然你也可以下载压缩的GZIP包，里面包含TexInfo格式的文档。

http://iraf.noao.edu/
Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software

system for the reduction and analysis of astronomical data.

http://entropy.brni-jhu.org/tnimage.html
一个非常不错的Unix系统的图像处理工具，看看它的截图。你可以在此基础上构建自己的专用图像处理工具包。

http://sourceforge.net/projects/
这是GPL软件集散地，到这里找你想要得到的IP库吧。

三、搜索资源
当然这里基本的搜索引擎还是必须要依靠的，比如Google等，可以到我常用的链接看看。下面的链接可能会节省你一些时间：

http://sal.kachinatech.com/
http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml
四、大拿网页
http://www.ai.mit.edu/people/wtf/
这位可是MIT人工智能实验室的BILL FREEMAN。大名鼎鼎！专长是：理解–贝叶斯模型。

http://www.merl.com/people/brand/
MERL(Mitsubishi Electric Research Laboratory)中的擅长“Style Machine”高手。

http://research.microsoft.com/~ablake/
CV界极有声望的A.Blake 1977年毕业于剑桥大学三一学院并或数学与电子科学学士学位。之后在MIT，Edinburgh，Oxford先后组建过研究小组并成为Oxford的教授，直到1999年进入微软剑桥研究中心。主要工作领域是计算机视觉。

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html
这位牛人好像正在学习汉语，并且搜集了诸如“两只老虎(Two Tigers)”的歌曲，嘿嘿:)
他的主页上面还有几个牛：Shumeet Baluja, Takeo Kanade。他们的Face Detection作的绝对是世界一流。他毕业于卡奈基梅隆大学的计算机科学系，兴趣是计算机视觉。

http://www.ifp.uiuc.edu/yrui_ifp_home/html/huang_frame.html
这位老牛在1963年就获得了MIT的博士学位！他领导的Image Lab比较出名的是指纹识别。

下面这些是我搜集的牛群(大部分是如日中天的Ph.D们)，可以学习的是他们的Study Ways!

Finn Lindgren(Sweden):Statistical image analysis http://www.maths.lth.se/matstat/staff/finn/
Pavel Paclik(Prague):statistical pattern recognition http://www.ph.tn.tudelft.nl/~pavel/
Dr. Mark Burge:machine learning and graph theory http://cs.armstrong.edu/burge/
yalin Wang:Document Image Analysis http://students.washington.edu/~ylwang/
Geir Storvik: Image analysis http://www.math.uio.no/~geirs/
Heidorn http://alexia.lis.uiuc.edu/~heidorn/
Joakim Lindblad:Digital Image Cytometry http://www.cb.uu.se/~joakim/index_eng.html
S.Lavirotte: http://www-sop.inria.fr/cafe/Stephane.Lavirotte/
Sporring:scale-space techniques http://www.lab3d.odont.ku.dk/~sporring/
Mark Jenkinson:Reduction of MR Artefacts http://www.fmrib.ox.ac.uk/~mark/
Justin K. Romberg:digital signal processing http://www-dsp.rice.edu/~jrom/
Fauqueur:Image retrieval by regions of interest http://www-rocq.inria.fr/~fauqueur/
James J. Nolan:Computer Vision http://cs.gmu.edu/~jnolan/
Daniel X. Pape:Information http://www.bucho.org/~dpape/
Drew Pilant:remote sensing technology http://www.geo.mtu.edu/~anpilant/index.html

五、前沿期刊(TOP10)
这里的期刊大部分都可以通过上面的大拿们的主页间接找到，在这列出主要是为了节省直接想找期刊投稿的兄弟的时间:)

IEEE Trans. On PAMI http://www.computer.org/tpami/index.htm
IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm
Pattern Recognition http://www.elsevier.com/locate/issn/00313203
Pattern Recognition Letters http://www.elsevier.com/locate/issn/01678655
神经网络

Neural Networks Tutorial Review
http://hem.hj.se/~de96klda/NeuralNetworks.htm
ftp://ftp.sas.com/pub/neural/FAQ.html

Image Compression with Neural Networks
http://www.comp.glam.ac.uk/digimaging/neural.htm

Backpropagator’s Review
http://www.dontveter.com/bpr/bpr.html

Bibliographies on Neural Networks
http://liinwww.ira.uka.de/bibliography/Neural/

Intelligent Motion Control with an Artificial Cerebellum
http://www.q12.org/phd.html

Kernel Machines
http://www.kernel-machines.org/

Some Neural Networks Research Organizations
http://www.ieee.org/nnc/
http://www.inns.org/

Neural Network Modeling in Vision Research
http://www.rybak-et-al.net/nisms.html

Neural Networks and Machine Learning
http://learning.cs.toronto.edu/

Neural Application Software
http://attrasoft.com

Neural Network Toolbox for MATLAB
http://www.mathworks.com/products/neuralnet/

Netlab Software
http://www.ncrg.aston.ac.uk/netlab/

Kunama Systems Limited
http://www.kunama.co.uk/

Computer Vision

Computer Vision Homepage, Carnegie Mellon University
www.cs.cmu.edu/~cil/vision.html

Annotated Computer Vision Bibliography
http://iris.usc.edu/Vision-Notes/bibliography/contents.html
http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html

Lawrence Berkeley National Lab Computer Vision and Robotics Applications
http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html

CVonline by University of Edinburgh
The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision, www.dai.ed.ac.uk/CVonline

Computer Vision Handbook, www.cs.hmc.edu/~fleck/computer-vision-handbook

Vision Systems Courseware
www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html

Research Activities in Computer Vision
http://www-syntim.inria.fr/syntim/analyse/index-eng.html

Vision Systems Acronyms
www.vision-systems-design.com/vsd/archive/acronyms.html

Dictionary of Terms in Human and Animal Vision
http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html

Metrology based on Computer Vision
www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html

Digital Photography

Digital Photography, Scanning, and Image Processing
www.dbusch.com/scanners/scanners.html

Educational Resources, Universities

Center for Image Processing in Education
www.cipe.com
Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology
http://wally2.rit.edu/pubs/guides/imagingcall.html

Mathematical Experiences through Image Processing, University of Washington
www.cs.washington.edu/research/metip/metip.html

Vismod Tech Reports and Publications, MIT
http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker

Vision Lab PhD dissertation list, University of Antwerp
http://wcc.ruca.ua.ac.be/~visielab/theses.html

INRIA (France) Research Projects: Human-Computer Interaction, Image Processing, Data Management, Knowledge Systems
www.inria.fr/Themes/Theme3-eng.html

Image Processing Resources
http://eleceng.ukc.ac.uk/~rls3/Contents.htm

Publications of Carsten Steger
http://www9.informatik.tu-muenchen.de/people/steger/publications.html

FAQs

comp.dsp FAQ
www.bdti.com/faq/dsp_faq.htm
Robotics FAQ
www.frc.ri.cmu.edu/robotics-faq

Where’s the sci.image.processing FAQ?
www.cc.iastate.edu/olc_answers/packages/graphics/sci.image.processing.faq.html

comp.graphics.algorithms FAQ, Section 3, 2D Image/Pixel Computations
www.exaflop.org/docs/cgafaq

Astronomical Image Processing System FAQ
www.cv.nrao.edu/aips/aips_faq.html
来自: http://hi.baidu.com/jiamn/blog/item/aaa063f9ae34141d6c22ebce.html
posted @ 2012-04-18 15:48 Hanson-jun 阅读(45) 评论(0) 编辑

计算机视觉文献与代码资源及资料
下面是前端时间搜集整理的一些和计算机视觉、模式识别的资源，拿出来与大家分享下。以后，我将把图像处理真正的作为我的兴趣来玩玩了，也许不把研究作为谋生的手段，会更好些。

标题
作者
主题
关键字
类别
来源
备注
nipsfast.ppt
Nando de Freitas
N-Body problems in learning
Fast N-Body Learning
Ppt
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

nipsfgtf.ppt
Ramani Duraiswami
Fast Multipole Methods Fast Gaussian Transform
FM and FGT
ppt
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

Gray.pdf/ppt
Alex Gray
Statistical N-Body/Proximity Data Structures
N-Body and Data Structures
Ppt/pdf
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

dt-nips04.pdf/ppt
Dan Huttenlocher
Fast Distance Transforms
FDT
Ppt/pdf
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

High.pdf/ppt
Alexander Gray
Fast high-dimensional function integration
Fast integration
Ppt/pdf
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

Fast04.pdf/ppt
David Lowe
Fast high-dimensional feature indexing for object recognition
Feature indexing
Ppt/pdf
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

ihler-fast.pdf/ppt
Alexander lhler
Fast methods and non-parametric BP
Non-parametric BP
Ppt/pdf
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

fastview.pdf
Dustin Lang
Comparing fast methods
Overview fast methods
pdf
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

nbody_methods.tar.gz

code
http://www.cs.ubc.ca/~awll/nbody_methods.html

demo_rbpf_gauss.tar

Rao Blackwellised particle filtering for conditionally Gaussian Models
particle filtering for conditionally
code
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

demorbpfdbn.tar.gz

Rao Blackwellised Particle Filtering

code
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html
http://www.cs.ubc.ca/~nando/software.html

upf_demos.tar.gz

Unscented Particle Filter
Particle Filter
code
http://www.cs.ubc.ca/~nando/nipsfast/schedule.html

BPF_1_3.zip

Boosted Particle Filter
Tracking
code
http://www.cs.ubc.ca/~okumak/research.html
1
flyer_14_800.mpg

Source image
Database
Image
http://www.cs.ubc.ca/~okumak/research.html
1
trans_flyer_14_800.mpg

image transformed
Database
Image
http://www.cs.ubc.ca/~okumak/research.html
1
LBP.c/h
Topi Mäenpää
LBP operator
Texture
code
http://www.ee.oulu.fi/~topiolli/cpplibs/files/

calibr_v30.zip

Camera Calibration
Computer vision
code
http://www.ee.oulu.fi/mvg/page/camera_calibration
_toolbox_for_matlab
2

LEAR(Learning and Recognition in Vision
Common dataset
Human/car horse soccer human actions
dataset
http://lear.inrialpes.fr/data
3
Lic.zip/highlight.zip
Robby T. Tan
Color Constancy Through Inverse Intensity Chromaticity Space
Highlight Removal from single image
code
http://www.commsp.ee.ic.ac.uk/~rtan/

2008_oxford_fog.pdf
Robby T. Tan
Defog
Defog from single
pdf
http://www.commsp.ee.ic.ac.uk/~rtan/

08_cvpr.pdf
Robby T. Tan
Defog
Defog from single
pdf
http://www.commsp.ee.ic.ac.uk/~rtan/

Retinex_frankle_mccann

Retinex

Code
http://www.cs.sfu.ca/~colour/publications/IST-2000/
Some
Retinex_maccann99

Retinex

code
http://www.cs.sfu.ca/~colour/publications/IST-2000/
pictures
Gamut.tar.bz2

Retinex

code
http://kobus.ca/research/programs/colour_constancy/index.html

Video.avi/dehaze.m

dehazing
Raanan Fattal
code
http://www.cs.huji.ac.il/~raananf/projects/defog/index.html

MPTK-Windows-bin-0-5-6-beta.zip
Matching pursuit(MP)
Alogrithm
CNRS
Code
http://mptk.irisa.fr/downloads

generateDictionaries.txt
GenerateGabor
Alogrithm

code
http://www.scholarpedia.org/article/Matching_pursuit

Notes:
1. 视频和源码都是对应的文章的：
Kenji Okuma, Ali Taleghani, Nando De Freitas, Jim Little, David G. Lowe. Boosted Particle Filter: Multitarget Detection and Tracking. the European Conference on Computer Vision(ECCV), May 2004.
2. 该网站下面还有其他一些资源可以下载：
http://www.ee.oulu.fi/mvg/page/downloads
是个研究组织：http://lear.inrialpes.fr/ ，除此之外，还有一些源码。
计算机视觉文献与代码资源

CVonline
http://homepages.inf.ed.ac.uk/rbf/CVonline
http://homepages.inf.ed.ac.uk/rbf/CVonline/unfolded.htm
http://homepages.inf.ed.ac.uk/rbf/CVonline/CVentry.htm

李子青的大作：
Markov Random Field Modeling in Computer Vision
http://www.cbsr.ia.ac.cn/users/szli/mrf_book/book.html
Handbook of Face Recognition (PDF)

http://www.umiacs.umd.edu/~shaohua/papers/zhou04hfr.pdf

张正友的有关参数鲁棒估计著作：

Parameter Estimation Techniques:A Tutorial with Application to Conic Fitting

http://research.microsoft.com/~zhang/INRIA/Publis/Tutorial-Estim/Main.html

Andrea Fusiello“计算机视觉中的几何”教程：Elements of Geometric Computer Vision
http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FUSIELLO4/tutorial.html#x1-520007

有关马尔可夫蒙特卡罗方法的资料：

An introduction to Markov chain Monte Carlo
http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/SENEGAS/mcmc.html

Markov Chain Monte Carlo for Computer Vision— A tutorial at ICCV05
http://civs.stat.ucla.edu/MCMC/MCMC_tutorial.htm

有关独立成分分析（Independent Component Analysis , ICA）的资料：
An ICA-Page
http://www.cnl.salk.edu/~tony/ica.html
Fast ICA
http://www.cis.hut.fi/projects/ica/fastica/

   The Kalman Filter (介绍卡尔曼滤波器的终极网页)
  http://www.cs.unc.edu/~welch/kalman/index.html

Cached k-d tree search for ICP algorithms
http://kos.informatik.uni-osnabrueck.de/download/3dim2007/paper.html

几个计算机视觉研究工具

Machine Vision Toolbox for Matlab
http://www.petercorke.com/Machine%20Vision%20Toolbox.html

Matlab and Octave Function for Computer Vision and Image Processing
http://www.csse.uwa.edu.au/~pk/research/matlabfns/

Bayes Net Toolbox for Matlab
http://www.cs.ubc.ca/~murphyk/Software/BNT/bnt.html

OpenCV (Chinese)
http://www.opencv.org.cn/index.php/%E9%A6%96%E9%A1%B5

Gandalf (A Computer Vision and Numerical Algorithm Labrary)
http://gandalf-library.sourceforge.net/

CMU Computer Vision Home Page
http://www.cs.cmu.edu/afs/cs/project/cil/ftp/html/vision.html

Machine Learning Resource Links
http://www.cse.ust.hk/~ivor/resource.htm

The Bayesian Filtering Library
http://www.orocos.org/bfl

Optical Flow Algorithm Evaluation (提供了一个动态贝叶斯网络框架，例如递归信息处理与分析、卡尔曼滤波、粒子滤波、序列蒙特卡罗方法等，C++写的)
http://of-eval.sourceforge.net/

MATLAB code for ICP algorithm
http://www.usenet.com/newsgroups/comp.graphics.visualization/msg00102.html

牛人主页：
朱松纯（Song-Chun Zhu）
http://www.stat.ucla.edu/~sczhu/

David Lowe (SIFT) (很帅的一个老头哦 ^ ^)
http://www.cs.ubc.ca/~lowe/

Andrea Vedaldi (SIFT)
http://vision.ucla.edu/~vedaldi/index.html

Pedro F. Felzenszwalb
http://people.cs.uchicago.edu/~pff/

Dougla Dlanman (Brown的一个研究生，在其主页上搜集了大量算法教程和源码)
http://mesh.brown.edu/dlanman/courses.html

Jianbo Shi (Ncuts 的始作俑者)
http://www.cis.upenn.edu/~jshi/

Active Vision Group (Oxford的一个机器视觉研究团队，特色是SLAM，监视，导航)
http://www.robots.ox.ac.uk/ActiveVision/index.html

Juyang Weng（机器学习的专家，Autonomous Mental Development 是其特色）
http://www.cse.msu.edu/~weng/
测试图片或视频：
Middlebury College‘s Stereo Vision Data Set

http://cat.middlebury.edu/stereo/data.html

Intelligent Vehicle:
IVSource
www.ivsoruce.net
Robot Car
http://www.plyojump.com/robot_cars.html
How to Build a Robot: The Computer Vision Part
http://www.societyofrobots.com/programming_computer_vision_tutorial.shtml
计算机视觉应关注的资源
来自美国帝腾大学的链接。
Camera Calibration Links to toolboxes (mostly MATLAB) for camera calibration.
Paul Debevec. Modeling and Rendering Architecture from Photographs.
Marc Pollefeys, Tutorial on 3D Modeling from Images,, ECCV 2000,

Available here: notes (12.1MB pdf)
Richard Szeliski NIPS 2004 Tutorial on Acquiring Detailed 3D Models From Images and Video,

Available here: slides (37.6 MB, ppt)
Peter Corke did his thesis work on visual servoing for robot applications and has authored a robotics toolkit and vision toolkit for MATLAB.

local copy of thesis: Corke thesis (4.36 MB, pdf)
robot toolkit: robot.zip (568 KB, zip)
vision toolkit: mv.zip (1.08 MB, zip)
P. D. Kovesi., MATLAB Functions for Computer Vision and Image Analysis.
School of Computer Science & Software Engineering, The University of Western Australia.
Available locally as a zip archive MatlabFns.zip (4.8 MB, updated 21 May 2005)
Philip Torr, among many other contributions, submitted a Structure and motion toolkit in Matlab to the MathSoft File Exhange.
Local copy here: torrsam.zip (2.4 MB, zip).

本文引用地址：http://blog.sciencenet.cn/home.PHP?mod=space&uid=454498&do=blog&id=456240
posted @ 2012-04-18 15:45 Hanson-jun 阅读(54) 评论(0) 编辑

描述子距离种类
1.hausdorff距离

　　微分动力系统原理这本书里有介绍

　　Hausdorff距离是描述两组点集之间相似程度的一种量度，它是两个点集之间距离的一种定义形式：假设有两组集合A={a1,…,ap},B={b1,…,bq},则这两个点集合之间的Hausdorff距离定义为H(A,B)=max(h(A,B),h(B,A)) (1)

　　其中,

　　h(A,B)=max（a∈A）min（b∈B）‖a-b‖ (2)

　　h(B,A)=max（b∈B）min（a∈A）‖b-a‖ (3)

　　‖·‖是点集A和B点集间的距离范式(如:L2或Euclidean距离).

　　这里,式(1)称为双向Hausdorff距离,是Hausdorff距离的最基本形式;式(2)中的h(A,B)和h(B,A)分别称为从A集合到B集合和从B集合到A集合的单向Hausdorff距离.即h(A,B)实际上首先对点集A中的每个点ai到距离此点ai最近的B集合中点bj之间的距离‖ai-bj‖进行排序,然后取该距离中的最大值作为h(A,B)的值.h(B,A)同理可得.

　　由式(1)知,双向Hausdorff距离H(A,B)是单向距离h(A,B)和h(B,A)两者中的较大者,它度量了两个点集间的最大不匹配程度

2.欧式距离

　　欧几里得距离定义：欧几里得距离（ Euclidean distance）也称欧式距离，它是一个通常采用的距离定义，它是在m维空间中两个点之间的真实距离。

　　在二维和三维空间中的欧式距离的就是两点之间的距离，二维的公式是

　　d = sqrt((x1-x2)^+(y1-y2)^)

　　三维的公式是

　　d=sqrt((x1-x2)^+(y1-y2)^+(z1-z2)^)

　　推广到n维空间，欧式距离的公式是

　　d=sqrt( ∑(xi1-xi2)^ ) 这里i=1,2..n

　　xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标

　　n维欧氏空间是一个点集,它的每个点可以表示为(x(1),x(2),…x(n)),其中x(i)(i=1,2…n)是实数,称为x的第i个坐标,两个点x和y=(y(1),y(2)…y(n))之间的距离d(x,y)定义为上面的公式.

　　欧氏距离看作信号的相似程度。距离越近就越相似，就越容易相互干扰，误码率就越高。

　　所谓欧氏距离变换，是指对于一张二值图像（再次我们假定白色为前景色，黑色为背景色），将前景中的像素的值转化为该点到达最近的背景点的距离。

　　欧氏距离变换在数字图像处理中的应用范围很广泛，尤其对于图像的骨架提取，是一个很好的参照。

　　========

　　欧氏距离：（∑（Xi-Yi）2）1/2，即两项间的差是每个变量值差的平方和再平方根，目的是计算其间的整体距离即不相似性。

　　我们熟悉的欧氏距离虽然很有用，但也有明显的缺点。它将样品的不同属性（即各指标或各变量）之间的差别等同看待，这一点有时不能满足实际要求。例如，在教育研究中，经常遇到对人的分析和判别，个体的不同属性对于区分个体有着不同的重要性。因此，有时需要采用不同的距离函数。

3.马氏距离：
马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的，表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同的是它考虑到各种特性之间的联系（例如：一条关于身高的信息会带来一条关于体重的信息，因为两者是有关联的）并且是尺度无关的(scale-invariant)，即独立于测量尺度。对于一个均值μ，为协方差矩阵为Σ的多变量向量,其马氏距离为((x-μ)’Σ^(-1)(x-μ))^(1/2)。
马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:
　　如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离’.
　　其中σi 是 xi 的标准差.

马氏优缺点：
　　1）马氏距离的计算是建立在总体样本的基础上的，这一点可以从上述协方差矩阵的解释中可以得出，也就是说，如果拿同样的两个样本，放入两个不同的总体中，最后计算得出的两个样本间的马氏距离通常是不相同的，除非这两个总体的协方差矩阵碰巧相同；
　　2）在计算马氏距离过程中，要求总体样本数大于样本的维数，否则得到的总体样本协方差矩阵逆矩阵不存在，这种情况下，用欧式距离计算即可。
　　3）还有一种情况，满足了条件总体样本数大于样本的维数，但是协方差矩阵的逆矩阵仍然不存在，比如三个样本点（3，4），（5，6）和（7，8），这种情况是因为这三个样本在其所处的二维空间平面内共线。这种情况下，也采用欧式距离计算。
　　4）在实际应用中“总体样本数大于样本的维数”这个条件是很容易满足的，而所有样本点出现3）中所描述的情况是很少出现的，所以在绝大多数情况下，马氏距离是可以顺利计算的，但是马氏距离的计算是不稳定的，不稳定的来源是协方差矩阵，这也是马氏距离与欧式距离的最大差异之处。
　　优点：它不受量纲的影响，两点之间的马氏距离与原始数据的测量单位无关；由标准化数据和中心化数据(即原始数据与均值之差）计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。缺点：它的缺点是夸大了变化微小的变量的作用。
　　如果用dij表示第i个样品和第j个样品之间的距离，那么对一切i，j和k，dij应该满足如下四个条件：
　　①当且仅当i=j时，dij=0
　　②dij>0
　　③dij=dji（对称性）
　　④dij≤dik+dkj（三角不等式）
　　显然，欧氏距离满足以上四个条件。满足以上条件的函数有多种，本节将要用到的马氏距离也是其中的一种。
　　第i个样品与第j个样品的马氏距离dij用下式计算：
　　dij =((x i 一x j)TS-1(x i一xj) )1/2(T、-1、1/2都是上标)
　　其中，T表示转置，x i 和x j分别为第i个和第j个样品的m个指标所组成的向量，S为样本协方差矩阵。

本文引用地址：http://blog.sciencenet.cn/home.php?mod=space&uid=261330&do=blog&id=526762
posted @ 2012-04-18 15:44 Hanson-jun 阅读(40) 评论(0) 编辑

涉足计算机视觉领域要知道的
做机器视觉和图像处理方面的研究工作，最重要的两个问题：其一是要把握住国际上最前沿的内容；其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最高成就的几个超级专家(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献)，解决第二个问题的办法是你最好能够找到一个实际应用的项目，边做边写文章。做好这几点的途径之一就是利用网络资源，利用权威网站和专家们的个人主页。
依照下面目录整理：
[1]研究群体(国际国内)[2]专家主页[3]前沿国际国内期刊与会议[4]搜索资源[5]GPL软件资源
一、研究群体
用来搜索国际知名计算机视觉研究组(CV Groups)：
国际计算机视觉研究组清单http://peipa.essex.ac.uk/info/groups.html
美国计算机视觉研究组清单 http://peipa.essex.ac.uk/info/groups.html#USA
http://www-2.cs.cmu.edu/~cil/vision.html或 http://www.cs.cmu.edu/~cil/vision.html
这是卡奈基梅隆大学的计算机视觉研究组的主页，上面提供很全的资料，从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件，甚至还有一个搜索引擎。著名的有人物Tomasi， Kanade等。
卡内基梅隆大学双目实验室http://vision.middlebury.edu/stereo/
卡内基梅隆研究组http://www.cs.cmu.edu/~cil/v-groups.html
还有几个实验室：
Calibrated Imaging Laboratory 图像
Digital Mapping Laboratory 映射
Interactive Systems Laboratory 互动
Vision and Autonomous Systems Center视觉自适应
http://www.via.cornell.edu/
康奈尔大学的计算机视觉和图像分析研究组，好像是电子和计算机工程系的。侧重医学方面的研究，但是在上面有相当不错资源，关键是它正在建设中，能够跟踪一些信息。
Cornell University——Robotics and Vision group
http://www-cs-students.stanford.edu/ 斯坦福大学计算机系主页
1. http://white.stanford.edu/
2. http://vision.stanford.edu/
3. http://ai.stanford.edu/美国斯坦福大学人工智能机器人实验室
The Stanford AI Lab (SAIL) is the intellectual home for researchers in the Stanford Computer Science Department whose primary research focus is Artificial Intelligence. The lab is located in the Gates…
Vision and Imaging Science and Technology
http://www.fmrib.ox.ac.uk/analysis/
主要研究：Brain Extraction Tool， Nonlinear noise reduction， Linear Image Registration， Automated Segmentation， Structural brain change analysis， motion correction， etc.
http://www.cse.msu.edu/prip/—密歇根州立大学计算机和电子工程系的模式识别–图像处理研究组，它的FTP上有许多的文章(NEW)。
美国密歇根州大学认知模型和图像处理实验室
The Pattern Recognition and Image Processing (PRIP) Lab faculty and students investigate the use of machines to recognize patterns or objects. Methods are developed to sense objects， to discover which…http://www.cse.msu.edu/rgroups/prip/
http://pandora.inf.uni-jena.de/p/e/index.html
德国的一个数字图像处理研究小组，在其上面能找到一些不错的链接资源。
柏林大学 http://www.cv.tu-berlin.de/
德国波恩大学视觉和认识模型小组
Computer Vision Group located within the Division III of the Computer Science Department in the University of Bonn in Germany. This server offers information on topics concerning our computer vision http://www-dbv.informatik.uni-bonn.de/
http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html
CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture.
http://cfia.gmu.edu/
The mission of the Center for Image Analysis is to foster multi-disciplinary research in image， multimedia and related technologies by establishing links between academic institutes， industry and government agencies， and to transfer key technologies to help industry build next generation commercial and military imaging and multimedia systems.
英国的Bristol大学的Digital Media Group在高级图形图像方面不错。主要就是涉及到场景中光线计算的问题，比如用全局光照或是各种局部光照对高动态图的处理，还有近似真实的模拟现实环境 (照片级别的)，还有用几张照片来建立3D模型(人头之类的)。另外也有对古代建筑模型复原。http://www.cs.bristol.ac.uk/Research/Digitalmedia/
而且根据Times全英计算机排名在第3，也算比较顶尖的研究了
http://www.cmis.csiro.au/IAP/zimage.htm
这是一个侧重图像分析的站点，一般。但是提供一个Image Analysis环境—ZIMAGE and SZIMAGE。
麻省理工视觉实验室MIT http://groups.csail.mit.edu/vision/welcome/
AI Laboratory Computer Vision group
Center for Biological and Computational Learning
Media Laboratory， Vision and Modeling Group
Perceptual Science group
UC Berkeley http://0-vision.berkeley.edu.ilstest.lib.neu.edu/vsp/index.html
http://www.cs.berkeley.edu.ilste … n/vision_group.html
加州大学伯克利分校视觉实验室David A. Forsyth：http://www.cs.berkeley.edu/~daf/
UCLA(加州大学洛杉矶分校) http://vision.ucla.edu/视觉实验室
英国牛津的A.Zisserman：http://www.robots.ox.ac.uk/~az/ 机器人实验室
美国南加州大学智能机器人和智能系统研究所University of Southern California， Los Angeles
IRIS is an interdepartmental unit of USC’s School of Engineering with ties to USC’s Information Sciences Institute (ISI). Members include faculty， graduate students， and research staff associated with… http://iris.usc.edu/ Computer Vision 实验室
美国南加州大学计算机视觉实验室介绍：
Computer Vision Laboratory at the University of Southern California is one of the major centers of computer vision research for thirty years. they conduct research in a number of basic and applied are…http://iris.usc.edu/USC-Computer-Vision.html
英国约克大学高级计算机结构神经网络小组
The Advanced Computer Architecture Group has had a thriving research programme in neural networks for over 10 years. The 15 researchers， led by Jim Austin， focus their work in the theory and applicati…http://www.cs.york.ac.uk/arch/neural/
瑞士戴尔莫尔感知人工智能研究所
IDIAP is a research institute established in Martigny in the Swiss Alps since 1991. Active in the areas of multimodal interaction and multimedia information management， the institute is also the leade…http://www.idiap.ch/
英国萨里大学视觉，语言和信号处理中心
The Centre for Vision， Speech and Signal Processing (CVSSP) is more than 60 members strong， comprising 12 academic staff， 18 research fellows and more than 44 research students. The activities of the …http://www.ee.surrey.ac.uk/Research/VSSP/
美国阿默斯特马萨诸塞州立大学计算机视觉实验室
The Computer Vision Laboratory was established in the Computer Science Department at the University of Massachusetts in 1974 with the goal of investigating the scientific principles underlying the con…http://vis-www.cs.umass.edu
University of Massachusetts——Computer Vision Laboratory for Perceptual Robotics
美国芝加哥伊利诺伊斯大学贝克曼研究中心智能机器人和计算机视觉实验室
Includes the following groups: Professor Seth Hutchinson’s Research Group Professor David Kriegman’s Research Group Professor Jean Ponce’s Research Group Professor Narendra Ahuja’s Research Gro…http://www-cvr.ai.uiuc.edu/
Computer Vision and Robotics Laboratory
Vision Interfaces and Systems Laboratory (VISLab)
英国伯明翰大学计算机科学学校视觉研究小组
The vision group at the School of Computer Science (a RAE 5 rated department) performs research into a wide variety of computer vision and image understanding areas. Much of this work is performed in …http://www.cs.bham.ac.uk/research/vision/
微软研究院机器学习与理解研究小组 / 计算机视觉小组
The research group focuses on the development of more advanced and intelligent computer systems through the exploitation of statistical methods in machine learning and computer vision. The site lists …http://research.microsoft.com/mlp/
http://research.microsoft.com/en-us/groups/vision/
微软公司的文献：http://research.microsoft.com/research/pubs
微软亚洲研究院：http://research.microsoft.com/asia/，值得关注Harry Shum， Jian Sun， Steven Lin， Long Quan(兼职HKUST)etc.
瑞典隆德大学数学系视觉组：http://www.maths.lth.se/matematiklth/personal/andersp/
感觉国外搞视觉的好多是数学系出身，大约做计算机视觉对数学要求很高吧。
澳大利亚国立大学：http://users.rsise.anu.edu.au/~hartley/
美国北卡大学：http://www.cs.unc.edu/~marc/
法国INRIA：http://www-sop.inria.fr/odyssee/team/ 由Olivier.Faugeras领衔的牛人众多。
比利时鲁汶大学的L.Van Gool： www.esat.kuleuven.ac.be/psi/visics/
据说在这个只有中国一个小镇大小的地方的鲁汶大学在欧洲排行top10，名列世界top100，还出了几个诺贝尔奖，视觉研究也很强.
美国明德http://vision.middlebury.edu/stereo/
以下含有非顶尖美国学校研究组，没有链接(个别的上面已经提到)，供参考。
Amerinex Applied Imaging， Inc.
Boston University
Image and Video Computing Research group
University of California at Santa Barbara加州大学芭芭拉分校
Vision Research Lab
University of California at San Diego加州大学圣迭戈分校
Computer Vision & Robotics Research Laboratory
Visual Computing laboratory
University of California at Irvine加州大学欧文分校，加州南部一城，在圣安娜东南，
Computer Vision laboratory
University of California， Riverside加州大学河滨分校
Visualization and Intelligent Systems Laboratory (VISLab)

University of California at Santa Cruz
Perceptual Science Laboratory

Caltech (加州理工)
Vision group

University of Central Florida
Computer Vision laboratory

University of Florida
Center for Computer Vision and Visualization

Colorado State University
Computer Vision group

Columbia University
Automated Vision Environment (CAVE)
Robotics group

University of Georgia， Athens
Visual and Parallel Computing Laboratory

Harvard University（哈佛）
Robotics Laboratory

University of Illinois at Urbana-Champaign
Robotics and Computer Vision

University of Iowa
Division of Physiologic Imaging

Jet Propulsion Laboratory
Machine Vision and Tracking Sensors group

Khoral Research， Inc

Lawrence Berkeley Laboratories
Imaging and Collaborative Computing Group
Imaging and Distributed Computing

Lehigh University
Image Processing and Pattern Analysis Lab
Vision And Software Technology Laboratory

University of Louisville
Computer Vision and Image Processing Lab

University of Maryland
Computer Vision Laboratory

University of Miami
Underwater Vision and Imaging Laboratory

University of Michigan密歇根
AI Laboratory

Michigan State University 密歇根州立
Pattern Recognition and Image Processing laboratory

Environmental Research Institute of Michigan (ERIM) 密歇根大学有汽车车身检测研究

University of Missouri-Columbia
Computational Intelligence Research Laboratory

NEC
Computer Vision and Image Processing

University of Nevada
Computer Vision Laboratory

Notre-Dame University
Vision-Based Robotics using Estimation

Ohio State University
Signal Analysis and Machine Perception Laboratory

University of Pennsylvania
GRASP laboratory
Medical Image Processing group
Vision Analysis and Simulation Technologies (VAST) Laboratory

Penn State University 宾夕法尼亚大学
Computer Vision
Precision Digital Images

Purdue University普渡大学
Robot Vision laboratory
Video and Image Processing Laboratory (VIPER)

Rensselaer Polytechnic Institute (RPI)
Computer Science Vision

University of Rochester
Center for Electronic Imaging Systems
Vision and Robotics laboratory

Rutgers University (The State University of New Jersey)
Image Understanding Lab

University of Southern California
Computer Vision

University of South Florida
Image Analysis Research group

Stanford Research Institute International (SRI)
RADIUS – Research and Development for Image Understanding Systems
The Perception program at SRI’s AI Center

SUNY at Stony Brook
Computer Vision Lab

University of Tennessee
Imaging， Robotics and Intelligent Systems laboratory

University of Texas， Austin
Laboratory for Vision Systems

University of Utah
Center for Scientific Computing and Imaging
Robotics and Computer Vision

University of Virginia
Computer Vision Research (CS)

University of Washington
Image Computing Systems Laboratory
Information Processing Laboratory
CVIA Laboratory

University of West Florida
Image Analysis/Robotics Research Laboratory

University of Wisconsin
Computer Vision group

Vanderbilt University
Center for Intelligent Systems

Washington State University
Imaging Research laboratory

Wright-Patterson
Model-Based Vision laboratory

Wright State University
Intelligent Systems Laboratory

University of Wyoming
Wyoming Image and Signal Processing Research (WISPR)

Yale University
Computational Vision Group http://www.cs.yale.edu/
School of Medicine， Image Processing and Analysis group

国内：
中科院模式识别国家重点实验室 http://www.nlpr.ia.ac.cn/English/rv/mainpage.html
虹膜识别、掌纹识别、人脸识别、
莲花山http://www.stat.ucla.edu/~sczhu/Lotus/
天津大学精密测试技术及仪器国家重点实验室
研究方向包括：激光及光电测试技术、传感及测量信息技术、微纳测试与制造技术、制造质量控制技术。该实验室是国内精密测试领域惟一的国家重点实验室。
“智能微系统及其集成应用技术”、“微结构光学测试技术”、“油气储运安全检测技术”、“先进制造中的视觉测量及其关键技术”、“正交偏振激光器原理、特性及其在精密计量中的应用研究”等5项代表性成果（07.3）。

中科院长春光机所 http://www.ciomp.ac.cn/ny/keyan.asp

中科院沈阳自动化所http://www.sia.ac.cn/index.php

中科院西安光机所http://www.opt.ac.cn/yanjiushi/gpcxjs1.htm

北京大学智能科学系http://www.cis.pku.edu.cn/vision/vision.htm
三维视觉计算与机器人，生物特征识别与图像识别

二、专家网页
http://www.ai.mit.edu/people/wtf/
这位可是MIT人工智能实验室的BILL FREEMAN。专长是：理解–贝叶斯模型。

http://www.merl.com/people/brand/
MERL(Mitsubishi Electric Research Laboratory)中的擅长“Style Machine”。

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html
这位专家好像正在学习汉语，主页并且搜集了诸如“两只老虎(Two Tigers)”的歌曲。
他的主页上面还有几个专家：Shumeet Baluja， Takeo Kanade。他们的Face Detection作的绝对是世界一流。毕业于卡奈基梅隆大学的计算机科学系，兴趣是计算机视觉。

三、前沿国际国内期刊与会议
这里的期刊大部分都可以通过上面的专家们的主页间接找到
1.国际会议 2.国际期刊 3.国内期刊 4.神经网络 5.CV 6.数字图象 7.教育资源，大学 8.常见问题
1. 国际会议
现在，国际上计算机视觉方面的三大国际会议是ICCV， CVPR和ECCV，统称之为ICE。
ICCV的全称是International Comference on Computer Vision。ICCV两年一次，与ECCV正好错开，是公认的三个会议中级别最高的。

ECCV的全称是Europeon Conference on Computer Vision，是一个欧洲的会议。

CVPR的全称是Internaltional Conference on Computer Vision and Pattern Recogintion国际计算机视觉与模式识别会议。这是一个一年一次的会议，举办地在美国。
ICIP—
BMVC—
MVA—
国际模式识别会议(ICPR )：
亚洲计算机视觉会议(ACCV)：
2.国际期刊
以计算机视觉为主要内容之一的国际刊物也有很多，如:
International Journal of Computer Vision
IEEE Trans. On PAMI http://www.computer.org/tpami/index.htm
IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm
Pattern Recognition http://www.elsevier.com/locate/issn/00313203
Pattern Recognition Letters http://www.elsevier.com/locate/issn/01678655
IEEE Trans. on Robotics and Automation，
IEEE TPAMI
IEEE TIP
CVGIP Computer Vision. Graphics and Image Processing，
Visual Image Computing，
IJPRAI(Internatiorial Journat of Pattern Recognition and Artificial Intelligence)

众所周知， computer vision(cv) 存在ICCV/CVPR/ECCV三个顶级会议，它们档次差不多，都应该在一流会议行列，没有必要给个高下。有些us的人认为ICCV/CVPR略好于ECCV，而欧洲人大都认为ICCV/ECCV略好于CVPR，某些英国的人甚至认为BMVC好于CVPR。简言之，三个会议差不多，各有侧重和偏好。

笔者就个人经验浅谈三会异同，以供大家参考和讨论。三者乃cv领域的旗舰和风向标，其oral paper (包括best paper) 代表当年度cv的最高水准，在此引用Harry Shum的一句话，想知道某个领域在做些什么，找最近几年此领域的proceeding看看就知道了。 ICCV/CVPR由IEEE Computer Society牵头组织， ECCV好像没有专门负责的组织。 CVPR每年(除2002年)都在美国开， ECCV每两年开一次，仅限欧洲， ICCV也是每两年一次，各洲轮值。基本可以保证每年有两个会议开，这样研究者就有两次跻身牛会的机会。
就录取率而言，三会都有波动。如ICCV2001录取率>30%，且出现两个人(华人)各有三篇第一作者的paper的情况，这在顶级牛会是不常见的 (灌水嫌疑)。但是， ICCV2003， 2005两次录取率都很低，大约20%左右。 ECCV也是类似规律，在2004年以前都是>30%， 2006年降低到20%左右。 CVPR的录取率近年来一直偏高，从2004年开始一直都在[25%，30%]。最近一次CVPR2006是28.1%， CVPR2007还不知道统计数据。笔者猜测为了维持录取paper的绝对数量，当submission少的时候录取率偏高，反之偏低，近几年三大会议的投稿数量全部超过1000，相对2000年前，三会录取率均大幅度降低，最大幅度50%->20%。对录取率走势感兴趣的朋友，可参考 http://vrlab.epfl.ch/~ulicny/statistics/(CVPR2004的数据是错的)，http://www.adaptivebox.net/research/bookmark/CICON_stat.html.

显然，投入cv的人越来越多，这个领域也是越来越大，这点颇不似machine learning一直奉行愚蠢的小圈子主义。另外一点值得注意， ICCV/ECCV只收vision相关的topic，而cvpr会收少量的pattern recognition paper，如finger print等，但是不收和image/video完全不占边的pr paper，如speech recognition等。我一个朋友曾经review过一篇投往CVPR的speech的paper，三个reviewer一致拒绝，其中一个reviewer搞笑的指出，你这篇paper应该是投ICASSP被据而转投CVPR的。就topic而言， CVPR涵盖最广。还有一个没有验证过的原因导致CVPR录取率高: 很多us的researcher不愿意或没有足够的经费到us以外的地方开会，故CVPR会优先接收很多来自us的paper (让大家都happy)。

以上对三会的分析对我们投paper是很有指导作用的。目前的research我想绝大部分还是纸上谈兵，必经 read paper -> write paper -> publish paper -> publish paper on top conferences and journals流程。故了解投paper的一些基本技巧，掌握领域的走向和热点，是非常必要的。避免做无用功，选择切合的topic，改善presentation，注意格式 (遵守规定的模板)，我想这是很多新手需要注意的问题。如ICCV2007明文规定不写summary page直接reject，但是仍然有人忽视，这是相当不值得的。
3.国内期刊
自动化学报、计算机学报、软件学报、电子学报，中国图象图形学报，模式识别与人工智能，光电子激光，精密光学工程等。
4.神经网络
神经网络-Neural Networks Tutorial Review
http://hem.hj.se/~de96klda/NeuralNetworks.htm
ftp://ftp.sas.com/pub/neural/FAQ.html

Image Compression with Neural Networks
http://www.comp.glam.ac.uk/digimaging/neural.htm

Backpropagator’s Review
http://www.dontveter.com/bpr/bpr.html

Bibliographies on Neural Networks
http://liinwww.ira.uka.de/bibliography/Neural/

Intelligent Motion Control with an Artificial Cerebellum
http://www.q12.org/phd.html

Kernel Machines
http://www.kernel-machines.org/

Some Neural Networks Research Organizations
http://www.ieee.org/nnc/
http://www.inns.org/

Neural Network Modeling in Vision Research
http://www.rybak-et-al.net/nisms.html

Neural Networks and Machine Learning
http://learning.cs.toronto.edu/

Neural Application Software
http://attrasoft.com

Neural Network Toolbox for MATLAB
http://www.mathworks.com/products/neuralnet/

Netlab Software
http://www.ncrg.aston.ac.uk/netlab/

Kunama Systems Limited http://www.kunama.co.uk/
5.Computer Vision(计算机视觉)
Annotated Computer Vision Bibliography
http://iris.usc.edu/Vision-Notes/bibliography/contents.html
http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html

Lawrence Berkeley National Lab Computer Vision and Robotics Applications
http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html

CVonline by University of Edinburgh
The Evolving， Distributed， Non-Proprietary， On-Line Compendium of Computer Vision， www.dai.ed.ac.uk/CVonline

Computer Vision Handbook，
www.cs.hmc.edu/~fleck/computer-vision-handbook

Vision Systems Courseware
www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html

Research Activities in Computer Vision
http://www-syntim.inria.fr/syntim/analyse/index-eng.html

Vision Systems Acronyms
www.vision-systems-design.com/vsd/archive/acronyms.html

Dictionary of Terms in Human and Animal Vision
http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html

Metrology based on Computer Vision
www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html
6.Digital Photography 数字图像
Digital Photography， Scanning， and Image Processing
www.dbusch.com/scanners/scanners.htm l
7.Educational Resources， Universities 教育资源，大学
Center for Image Processing in Education
www.cipe.com
Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology
http://wally2.rit.edu/pubs/guides/imagingcall.html

Mathematical Experiences through Image Processing， University of Washington
www.cs.washington.edu/research/metip/metip.html

Vismod Tech Reports and Publications， MIT
http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker

Vision Lab PhD dissertation list， University of Antwerp
http://wcc.ruca.ua.ac.be/~visielab/theses.html

INRIA (France) Research Projects: Human-Computer Interaction， Image Processing， Data Management， Knowledge Systems
www.inria.fr/Themes/Theme3-eng.html

Image Processing Resources
http://eleceng.ukc.ac.uk/~rls3/Contents.htm

Publications of Carsten Steger
http://www9.informatik.tu-muench … r/publications.html
8.FAQs（常见问题）
comp.dsp FAQ
www.bdti.com/faq/dsp_faq.htm
Robotics FAQ
www.frc.ri.cmu.edu/robotics-faq

Where’s the sci.image.processing FAQ?
www.cc.iastate.edu/olc_answers/p … processing.faq.html

comp.graphics.algorithms FAQ， Section 3， 2D Image/Pixel Computations
www.exaflop.org/docs/cgafaq

Astronomical Image Processing System FAQ
www.cv.nrao.edu/aips/aips_faq.html
四、搜索资源
http://sal.kachinatech.com/
http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml 北京大学

Google输入：computer vision 或computer vision groups可以获得很多结果

网络资源：
CVonline http://homepages.inf.ed.ac.uk/rbf/CVonline/视觉研究组列表
Computer vision test Image http://www.cs.cmu.edu/~cil/v-images.html卡内基梅隆标准图片库
视觉论文搜索：Paper search
http://www.researchindex.com

五、图像处理GPL库（代码库图像库等）
http://www.ph.tn.tudelft.nl/~klamer/cppima.html
Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的库函数的文档，当然你也可以下载压缩的GZIP包，里面包含TexInfo格式的文档。

http://iraf.noao.edu/
Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility， a general purpose software system for the reduction and analysis of astronomical data

http://entropy.brni-jhu.org/tnimage.html
一个非常不错的Unix系统的图像处理工具，看看它的截图。你可以在此基础上构建自己的专用图像处理工具包。

http://sourceforge.net/projects/
这是GPL软件集散地，可以搜索IP库。

国内的CSDN http://www.csdn.net/
转载：http://blog.sciencenet.cn/home.php?mod=space&uid=509980&do=blog&id=436782

你可能感兴趣的:(CV_计算机视觉,OpenCv专栏,ML_Note)

【华为OD机试真题E卷】54、统一限载货物数最小值 | 机试真题+思路参考+代码解析（C++、Java、Py） KFickle Java Py）华为od c++java 华为OD机试真题统一限载货物数最小值
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++代码Java代码Python代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题D、E卷，每题都使用C++，Java，Python语言进行解答，每个题目的思路分析都非常详细，持续更新，支持在线OJ刷题，订阅后评论获取权限，有代码问题随时解答，代码仅供学习参考一、题目题目描述火车站附近
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
（视频演示）基于OpenCV的实时视频跟踪火焰识别软件V1.0源码及exe下载是刃小木啦~ opencv 人工智能计算机视觉
本文介绍了基于OpenCV的实时视频跟踪火焰识别软件，该软件通过先进的图像处理技术实现对实时视频中火焰的检测与跟踪，同时支持导入图片进行火焰识别。主要功能包括相机选择、实时跟踪和图片模式。软件适用于多种场合，用于保障人民生命财产安全。源码及exe文件可通过蓝奏云网盘下载。软件简介《基于OpenCV的实时视频跟踪火焰识别软件》是一款创新的计算机视觉应用软件，旨在通过先进的图像处理技术实现对实时视频中
【华为OD技术面试手撕真题】113、组合总和 | 手撕真题+思路参考+代码解析（C & C++ & Java & Python & JS） KJ.JK 华为OD技术面试手撕真题华为od 面试 c语言华为od机试E卷华为od机试真题组合总和
文章目录一、题目题目描述样例1二、代码参考C语言思路C语言代码C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码JS语言思路JS代码作者：KJ.JK个人博客首页：KJ.JK专栏介绍：本专栏更新每年华为OD机试的高频手撕代码题，每个题目都会使用五种语言进行解答（C&C++&Java&Python&JS），思路分析都非常详细，争取实现最低的时间复杂度和高通过率，每
OpenCV 100道面试题及参考答案（7万字长文）大模型大数据攻城狮大厂面试大厂面经 android面试计算机视觉 opencv 实时互动 webrtc
OpenCV简介OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉库，它提供了丰富的函数和工具，用于处理图像和视频。OpenCV最初由英特尔公司开发，现在由一个开源社区维护和发展。主要功能和用途OpenCV的主要功能包括图像和视频处理、特征提取、目标检测、人脸识别、物体跟踪等。它可以用于各种领域，如机器人技术、医学影像、安全监控、自动驾驶等。在图像
OpenCV iOS-视频处理源代码大师 OpenCV完整教程
OpenCViOS-视频处理OpenCViOS-视频处理先决条件：在您的iOS项目中包含OpenCV库视频帧处理项目示例用户界面添加相机处理框架基本视频处理开始提示OpenCViOS-视频处理教程介绍了如何使用iPhone的摄像头和OpenCV处理视频帧。先决条件：Xcode4.3或更高版本iOS编程的基本知识（Objective-C，界面生成器）在您的iOS项目中包含OpenCV库OpenCV库
深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题羊城迷鹿 DeepSeek LLama-Factory 思维链
文章目录问题背景初始测试与问题发现LLaMAFactory测试结果对照实验：Ollama测试系统性排查与解决方案探索1.尝试更换模板2.深入研究官方文档3.自定义模板实现优化界面展示：实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-Qwen-1.5B，即由Qwen2.5-Math
使用OpenCV和Python将图像读取为RGB UixnContext opencv python 人工智能 OpenCV
在计算机视觉和图像处理中，OpenCV是一个广泛使用的开源库，提供了许多功能强大的图像处理工具。其中一个常见的任务是将图像读取为RGB格式，以便进一步处理和分析。在本文中，我将向您展示如何使用OpenCV和Python来实现这个任务。首先，确保您已经安装了OpenCV库。您可以使用以下命令在Python中安装OpenCV：pipinstallopencv-python一旦安装完成，我们可以开始写代
ODE卷-矩阵匹配-200分春秋招笔试突围华为OD刷题笔记E卷华为OD刷题笔记E+D卷矩阵线性代数
专栏订阅->赠送OJ在线评测矩阵匹配问题描述给定一个N×MN\timesM
人工智能开发趋势光影少年人工智能
人工智能开发趋势：未来技术的演进与创新引言人工智能（AI）正在以惊人的速度发展，并在各行各业中发挥越来越重要的作用。从自然语言处理到计算机视觉，从自动化决策到自主学习，AI的发展方向正变得更加智能化、自动化和人性化。本文将探讨当前AI开发的最新趋势，并展望未来的发展方向。1.生成式AI的崛起近年来，生成式AI（如ChatGPT、StableDiffusion、DALL·E）展现出强大的内容创作能力
【第10天】给定一个字符 c ，要求转换成大写进行输出 | 初识ASCII码执梗《Java入门100练》c语言 java 算法蓝桥杯数据结构
本文已收录于专栏《Java入门一百例》学习指引序、专栏前言一、什么是ASCII？二、【例题2】2、解题思路3、模板代码4、代码解析三、【例题2】2、解题思路3、模板代码4、代码解析四、奇淫巧技五、推荐专栏六、课后习题序、专栏前言本专栏开启，目的在于帮助大家更好的掌握学习Java，特别是一些Java学习者难以在网上找到系统地算法学习资料帮助自身入门算法，同时对于专栏内的内容有任何疑问都可在文章末
大模型驱动的智能代码生成系统 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型驱动的智能代码生成系统关键词大模型智能代码生成自然语言处理计算机视觉系统设计与实现摘要本文深入探讨了基于大模型的智能代码生成系统的构建与实现。首先，我们分析了智能代码生成的背景与意义，随后介绍了大模型的基本原理及其在代码生成中的潜力。接着，我们详细阐述了智能代码生成系统的设计与实现过程，包括系统需求分析、架构设计、模型集成与优化等方面。随后，本文通过自然语言处理、计算机视觉和代码生成应用，展
Python实现扫雷游戏叫兽-郭老师【Python】游戏开发游戏 python
提供学习或者毕业设计使用，功能基本都有，不能和市场上正式游戏相提比论，请理性对待！通过购买专栏或者CSDN问答提问，采纳后，私信博主。提供源码！说明：需要的话联系博主！谢谢。如果需要一步一步解析步骤，可以联系博主，博主可以提供详细实现步骤。博客下方有我vx。代码：#扫雷游戏im
Python图片识别脚本：从零开始实现图像识别！ Python_trys python 开发语言编程 Python入门 Python基础 Python识别 Python学习
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】图像识别是计算机视觉领域的一个重要应用，Python凭借其丰富的库和工具，成为了实现图像识别的首选语言之一。本文将带你从零开始，使用Python编写一个简单的图片识别脚本。我们将使用OpenCV和TensorFlow来实现这个功能。1.环境准备在开始之前，我们需要安装一些必要的Python库。你可以使用pip来安装这些库：pipinsta
【RISC-V CPU debug 专栏 4 -- RV CSR寄存器介绍】主公讲 ARM #【RISC-V 处理器 debug 学习专栏】risc-v RV CSR CSR 访问
文章目录Overview1.CSR寄存器访问指令2.为何CSR地址不是4字节对齐(1)CSR寄存器空间是独立的地址空间(2)节省编码空间(3)对硬件实现的简化3.CSR的物理大小和对齐无关4.RISC-V中的GPR寄存器及其作用GPR的详细用途CSR（控制状态寄存器）与GPR的区别GPR和CSR结合使用的案例总结Overview思考个问题：RISC-V64bitCSR寄存器是如何访问的，为何地址不
HW面试经验分享 | 北京蓝中研判岗黑客老李面试经验分享安全职场和发展前端
更多面试分享看我专栏找我哦~一起讨论交流！欢迎各位来专栏或简历找我哦目录：所面试的公司：某安全厂商所在城市：北京面试职位：国护蓝中研判岗面试过程：面试官的问题：1、面试官先就是很常态化的让我做了一个自我介绍2、自我介绍不错，听你讲熟悉TOP10漏洞，可以讲下自己熟悉哪些方面吗？3、sql注入原理可以讲下吗？4、sql注入绕WAF有了解吗，平常有挖过相关漏洞吗？5、那sql报错盲注呢，可以讲下嘛，包
YOLOv12改进之A2(区域注意力) 清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法
注意力回顾注意力机制作为深度学习领域的核心技术，已广泛应用于自然语言处理和计算机视觉等多个领域。在YOLOv12改进之A2中，注意力机制扮演着关键角色。已有研究成果包括：Transformer架构：引入了自注意力机制，有效捕捉输入序列中的长距离依赖关系。CBAM模块：提出了通道和空间注意力的结合，显著提升了图像分类和目标检测的性能。SENet：引入了通道注意力机制，通过自适应学习特征通道的重要性，
【c语言日寄】二维数组的深度解构 siy2333 c语言日寄 c语言开发语言笔记学习
【作者主页】siy2333【专栏介绍】⌈c语言日寄⌋：这是一个专注于C语言刷题的专栏，精选题目，搭配详细题解、拓展算法。从基础语法到复杂算法，题目涉及的知识点全面覆盖，助力你系统提升。无论你是初学者，还是进阶开发者，这里都能满足你的需求！【食用方法】1.根据题目自行尝试2.查看基础思路完善题解3.学习拓展算法【Gitee链接】资源保存在我的Gitee仓库：https://gitee.com/siy
「AI」人工智能的发展阶段：ANI、AGI与ASI 何曾参静谧「AI」人工智能人工智能 agi
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
ThreeJS入门（140）：THREE.Mouse 知识详解，示例代码还是大剑师兰特 #ThreeJS中文API全解大剑师 threejs教程 threejs示例 threejs入门 1024程序员节
作者：还是大剑师兰特，曾为美国某知名大学计算机专业研究生，现为国内GIS领域高级前端工程师，CSDN知名博主，深耕openlayers、leaflet、mapbox、cesium，webgl，ThreeJS，canvas，echarts等技术开发，欢迎加微信（gis-dajianshi），一起交流。查看本专栏目录-本文是第140篇入门文章文章目录常量使用场景示例常量的使用总结THREE.MOUSE
（一）React 基础小刀肉0812 React react.js 前端前端框架
专栏持续更新中~~目录目录一、React介绍1.1什么是React1.2React的特点1.3ReactVSVueVSAngular1.基本概述2.语法和核心概念对比2.1组件语法2.1.1React组件2.1.2Vue组件2.1.3Angular组件2.2数据绑定2.2.1React（单向数据流）2.2.2Vue（双向数据绑定）2.2.3Angular（双向数据绑定）2.3事件绑定3.性能对比4
基于OpenCV的Java人脸识别系统设计与实现小呀白呀兔 java spring boot
基于OpenCV的Java人脸识别系统设计与实现1.引言随着计算机视觉技术的发展，人脸识别在安全监控、身份验证等领域得到了广泛应用。本文将详细介绍如何使用OpenCV库和Java语言构建一个简单的人脸识别系统。该系统能够从图像中检测人脸，并通过深度学习模型提取特征进行比对，最终输出相似度评分及置信度等级。2.环境搭建为了确保项目顺利运行，请按照以下步骤配置开发环境：安装JDK：确保已安装JavaD
python绘制汉字_OpenCV Python 绘制中文字 weixin_39657444 python绘制汉字
By凌顺2019年9月12日本示例使用的OpenCV版本是：4.1.1运行Python的编辑器：Jupyternotebook示例目的通过使用PLI在图片上添加中文字符。PIL(PythonImagingLibrary)是Python常用的图像处理库，而Pillow是PIL的一个友好Fork，提供了了广泛的文件格式支持，强大的图像处理能力，主要包括图像储存、图像显示、格式转换以及基本的图像处理操作
OpenCV实现在图像中绘制汉字海上的风浪 opencv 人工智能计算机视觉编程
在本文中，我将向您展示如何使用OpenCV库在图像中绘制汉字。OpenCV是一个广泛使用的计算机视觉库，它提供了许多强大的功能，包括图像处理和绘图。首先，我们需要安装OpenCV库。您可以通过在终端或命令提示符中运行以下命令来安装它：pipinstallopencv-python接下来，我们将使用Python编写代码来实现在图像中绘制汉字。请确保您已经安装了Python和OpenCV库。impor
【精华推荐】AI大模型学习必逛的十大顶级网站大模型入门学习人工智能学习大模型入门 llama 大模型教程大模型学习大模型
随着人工智能技术的快速发展，AI大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。对于希望深入学习AI大模型的开发者和研究者来说，找到合适的学习资源至关重要。本文将为大家推荐十大必备网站，帮助你更好地理解和应用AI大模型。1.CourseraCoursera是一个在线学习平台，提供各类AI和机器学习课程，包括斯坦福大学的机器学习课程和深度学习专项课程。通过视频讲解
OpenCV计算摄影学（15）无缝克隆（Seamless Cloning）调整图像颜色的函数colorChange() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::colorChange是OpenCV中用于调整图像颜色的函数。它允许你通过乘以不同的系数来独立地改变输入图像中红色、绿色和蓝色通道的强度，从而实现对图像色彩的调整。这个功能对于需要精细控制图像色调的应用非常有用。函数原型voidcv::colorChang
【数据库初阶】MySQL中表的约束（上） bsefef 面试学习路线阿里巴巴数据库 mysql android
??博主首页：??专栏首页：数据库初阶??其它专栏：C++初阶|C++进阶|初阶数据结构亲爱的小伙伴们，大家好！在这篇文章中，我们将深入浅出地为大家讲解MySQL中表的约束帮助您轻松入门，快速掌握核心概念。如果文章对您有所启发或帮助，请别忘了点赞??、收藏??、留言??支持！您的每一份鼓励，都是我持续创作的源动力。让我们携手前行，共同进步！文章目录@[toc]`0.什么是表的约束``1.NULL&
Python深度学习之路：TensorFlow与PyTorch对比步入烟尘 Python超入门指南全册 python 深度学习 tensorflow
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
2025华为OD机试真题目录 B+C+D+E卷，使用C语言进行解答（544道） KJ.JK B+C+D+E卷算法华为od机试真题华为OD 华为OD机试真题 c语言
文章目录前言其他华为OD机试题清单一、什么是华为OD，什么是华为OD机试？二、华为OD面试流程？三、华为OD机试通过率高吗？四、华为OD薪资待遇？五、怎么刷题？通过华为OD机试？华为OD原题刷题列表部分文章试读演示部分思路参考展示本专栏题库列表：华为OD机试真题(C语言)B+C+D卷最后作者：KJ.JK前言本文是2025华为OD机试真题(C语言)专栏的目录贴（持续更新中…）专栏介绍：2025年最新
Python从0到100（十八）：面向对象编程应用是Dream呀 python 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。