何以少团栾。

【Image Registration】图像配准综述

文章目录

一、图像配准定义
二、图像配准应用场景
- 2.1 医学图像领域
- 2.2 其他领域
三、图像配准分类
四、图像配准过程
- 4.1 特征检测（Feature detection）
- 4.2 特征匹配（Feature matching）
- - 4.2.1 基于区域的方法（Area-based methods）
  - - 4.2.1.1 基于相关性的方法（Correlation-like methods）
    - 4.2.1.2 傅里叶方法（Fourier methods）
    - 4.2.1.3 基于互信息的方法（Mutual information methods）
    - 4.2.1.4 基于优化的方法（Optimization methods）
  - 4.2.2 基于特征的方法（Feature-based methods）
  - - 4.2.2.1 基于特征的空间关系
    - 4.2.2.2 基于特征描述符
    - 4.2.2.3 Relaxation methods
    - 4.2.2.4 Pyramids and wavelets
  - 4.2.3 总结
- 4.3 变换模型估计（Transform model estimation）
- - 4.3.1 Transformation
  - 4.3.2 Optimization
  - 4.3.3 全局映射模型（Global mapping models）
  - 4.3.4 局部映射模型（Local mapping models）
  - 4.3.5 径向基函数（Mapping by radial basis functions）
  - 4.3.6 弹性配准（Elastic registration）
五、图像配准效果评估（Validation & Visualization）

一、图像配准定义

图像配准 是将在同一场景下，但不同时间点，或不同视角，或不同采集设备拍摄的多幅（≥2）图像进行匹配。假设有两幅图像 Fixed Image 和 Moving Image，图像配准就是要寻找一种空间变换（Transformation），将 moving image 变换到 fixed image 上，使得两幅图中对应同一空间位置的点一一对应，从而达到信息融合的目的。图像配准英文通常为：Image Registration，还有一些别名包括：Image Fusion，Superimposition，Matching，Merge。

注：上面说了图像配准是将 moving image（B）通过变换配准到 fixed image（A）上。实际上，要首先将 A 和 B 中的点都换算到世界坐标系中，即先计算 A-to-world 转换坐标 $M_A$ ，再计算 world-to-B 转换坐标 $M_B^{-1}$ ，最终将 B 配准到 A 的转换是 $M_B^{-1}M_A$ 。在配准应用时，换算到世界坐标系的过程被我们省略了。

【图像配准目标】在几何上对齐两个图像，即让两幅图像在空间坐标上一致。
【图像配准需求来源】刚开始看图像配准，我在想为什么要这么做，把两幅图统一起来有什么意义？

由于不同的成像条件（时间、视角、相机），导致对同一对象的成像结果有差异。而许多图像分析任务，比如图像融合、变化检测都需要将多幅图像统一到一个坐标系下，因此图像配准就是它们的关键前置任务。

以医学图像应用举例：医学图像配准需求的来源，就是医学图像有多种模态的数据（比如 CT，MR，超声，PET，SPECT），不同模态的图像能够反映人体的不同特征，比如 MRI 反应人体解剖结构，PET 反应人体功能结构。那么医生就希望这些图像能够叠加在一个坐标系下（同一基准下）反应人体结构特点，而不需要靠自己的想象来实现图像叠加。

（上图是将一个人大脑的核磁共振图像（左）与其大脑的功能图像（中）进行配准，得到叠加结果（右）以同时展示解剖结构信息和功能信息）

由于待配准的图像具有多样性，因此无法设计出一种通用的配准方法用于所有任务。在设计配准方法时，要从数据角度和应用角度出发，综合考虑图像的特征、假定的几何变形类型、图像噪声、所需的配准精度等信息。

二、图像配准应用场景

2.1 医学图像领域

临床诊断（Diagnosis）：将病人的多模态数据融合到同一坐标系下辅助诊断（Combing information from multiple imagingmodalities）
监测疾病（Studying disease progression）：观测疾病发生和发展（Monitoring changes in size, shape, position or image intensity over time）
影像引导手术（Image guided surgery or radiotherapy）：将病人的术前与术中图像进行实时配准与融合，帮助医生在手术中进行更精确的治疗（Relating pre-operative images and surgical plans to the physical reality of the patient）
患者与标准图谱（Patient comparison or atlas construction）：将标准解剖图谱和具体病人结构进行融合（Relating one individual’s anatomy to a standardized atlas）

【说明-1】临床诊断： 将同一病人的多模态术前图像进行叠加，帮助医生更精确地观察病灶和解剖结构。

（上图 Moving image 为 DTI 图像，能够展示人体大脑内神经束的走向；Fixed image 为 MR 图像，通过核磁共振展示病人大脑内的肿瘤，此时需要将病人大脑肿瘤切除，同时不能伤害神经结构，就需要将两幅图像叠加起来）

【说明-2】患者与标准图谱： 临床上有大量的解剖图谱，是根据前人经验绘制的标准人体解剖结构。利用计算机可以将这些标准图谱扫描到计算机中对病人的解剖结构进行分割。但是每一个具体的病人，其解剖结构不一定是标准结构，可能会有差别，所以就需要将标准图谱与具体病人的影像进行叠加，帮助理解具体病人的解剖结构。

2.2 其他领域

遥感领域：多光谱分类，环境监测，变化检测，图像拼接，天气预报，创建超分辨率图像，将信息集成到地理信息系统
计算机视觉领域：目标定位，自动质量控制，视频分析，模式识别，自动跟踪对象的运动变化
制图领域：地图信息更新

三、图像配准分类

图像配准的分类标准不唯一，常见的包括：

应用领域（Application）：医学图像，遥感图像，自然图像
图像采集方式（Method of image acquisition）：多视角配准（multi-view），多时相配准（multi-temporal），多模态配准（multi-modal），配准到模型（Scene to model registration）
图像维度（Dimensionality）：2D到2D，3D到3D，2D到3D
转换空间（Domain of transformation）：Local 局部配准，Global 全局配准，决定是局部还是全局要根据需求决定
配准思想（Nature of registration basis）：基于图像本身的配准（Image-based）和不基于图像本身的配准（Non-image based），其中 Image-based 又包括内部配准机制（Intrinsic）和外部配准机制（Extrinsic）
变形类型（Nature of the transformation）：Rigid 刚体配准，Affine 仿射配准，Projective 投影配准，Curved 曲线配准
是否交互（Interaction）：Interactive 交互式，Semi-automatic 半自动，Automatic 全自动
优化过程（Optimization procedure）：求优过程有不同的算法
图像模态（Modalities involved）常见于医学领域：Monomodal 同模态间配准（比如CT和CT配准），Multimodal 不同模态间配准（比如CT和MR配），Modality to model 标准模型与不同模态图像配准
配准对象（Subject）常见于医学领域：Intra-subject 同个体图像间配准（比如同一个人不同时期的图像），Inter-subject 不同个体间图像配准，Atlas 解剖图谱和个体间配准

【说明-3】按图像采集方法分类：

Different viewpoint（multi-view analysis）多视角配准：即配准同一场景下，从不同视角获取的图像。这样配准的目的是获取更大的 2D 图像或 3D 图像。应用举例：对从不同视角获取的遥感图像进行拼接，对计算机视觉中目标的立体形状进行恢复（三维重建）。
Different times（multi-temporal analysis）多时相配准：即配准同一场景同一视角下，不同时间点获取的图像。这样配准的目的是评估场景中出现的变化。应用举例：遥感图像中，检测全球土地的使用情况、土地规划；计算机视觉中，用于安全监控和运动追踪的自动变化检测；医学图像中，治疗过程监测，肿瘤变化监测。
Different sensors（multi-modal analysis）多模态配准：即配准同一场景下，由不同成像设备获取的图像。这样配准的目的是整合不同来源的信息，以获得更详细和复杂的数据。应用举例：遥感图像中，融合全色图像与多光谱图像或雷达图像，其中全色图像提供了更好的空间分辨率，多光谱图像具有更好的光谱分辨率，雷达图像能够不受云层和太阳光照的影响；医学图像中，融合来自记录人体解剖结构成像设备的图像（MRI、超声、CT）与来自监测身体功能和代谢活动的成像设备的图像（PET、SPECT、MRS），融合的结果可以用于放射治疗或核医学。
Scene to model registration 配准到模型：即将来自同一场景中的图像和模型进行配准。模型可以是场景的计算机表示，比如地图、具有相似内容的另一个场景/患者，平均样本等。这样配准的目的是将图像匹配到模型中去并进行比较。应用举例：遥感图像中，将航空或卫星数据配准到地图中；医学图像中，将患者图像与解剖图谱进行比较；计算机视觉中，将实时获取的图像与目标模板进行匹配，自动质量检测。

【说明-4】按配准思想分类：

基于图像本身的配准方法（Image-based）包括：

内部配准机制（Intrinsic），即基于内部特征的配准，内部特征就是从图像内部提取的信息。
外部配准机制（Extrinsic），通过在患者身上人为地固定标记物或向体内注入显影物质以获得在图像上的确定的标记点。

【说明-5】按变形类型分类：

图像的空间变换可以分为刚体变换（Rigid）和非刚体变换（Deformable），其中：

刚体配准模型属于线性变换，包括平移、旋转、缩放和仿射变换。线性变换本质上是全局的，因此无法模拟图像间的局部几何差异；
非刚体变换模允许弹性变换，能够局部地扭曲 moving image，使其与 fixed image 对准。非刚性变换包括径向基函数（薄板或曲面样条函数，多重二次曲面函数和紧支撑变换），物理连续模型（粘性流体）和大变形模型（微分同胚）。

注意：线性配准（Linear Registration）不是刚体配准（Rigid Registarion），刚体配准只是线性配准中的一部分。线性配准包括三个基本操作：平移（Translation），放缩（Scaling），旋转（Rotation），也允许一些其他变换操作，比如对边的平行移动，将一个正方形变成平行四边形，但线性配准不允许局部形变。

四、图像配准过程

医学图像通用配准框架：

moving image 将参照 fixed image 进行形变，在形变过程中可能会丢失像素，因此需要 Interpolator，即插值。可以用不同的插值方法对缺失的像素点进行恢复。接着，测量变换后的 moving image 和 fixed image 间相似性的标准叫 Metric，标准也有很多方法实现。对转化矩阵 Transform 进行形变，通过迭代更新 Optimizer 达到最优。

通常，配准过程包含四个步骤：特征检测（Feature detection），特征匹配（Feature matching），变换模型估计（Transform model estimation）和 图像重采样和变换（Image resampling and transformation）。

Feature detection，特征检测。检测目标显著或独特的区域，包括封闭边界的区域、边缘、轮廓、线的交点、角点等。为了方便处理，这些特征可以用 “代表点” 来表示，比如中心、线的端点，特征点等，这些点可以被统称为 Control Points（CPs）。
（特征检测，这里使用 corner 作为特征）
Feature matching，特征匹配。建立 moving image 与 fixed image 特征间的对应关系，使用特征描述符（feature descriptor）、相似性度量和特征之间的空间关系确定配准的准确性。

（特征匹配，匹配对儿用数字标出）
Transform model estimation，变换模型估计。估计映射模型的类型和参数，将 moving image 与 fixed image 进行对齐。其中，映射模型的参数是通过建立特征间的对应关系来计算的。

（变换模型估计，利用在特征匹配中已建立的对应关系估计变换模型）
Image resampling and transformation，图像重采样和变换。即对 moving image 通过映射模型进行变换。

（图像重采样和变换，使用适当的插值技术对图像进行重采样和变换）

4.1 特征检测（Feature detection）

传统的特征检测过程，特征是由专家手动进行选择。在自动特征检测方面，主要有两种方法：基于区域的方法（Area-based methods）和 基于特征的方法（Feature-based methods）。基于区域的方法不进行显著特征检测，直接将预定义大小的窗口甚至是整幅图像作为特征用于特征匹配步骤，所以严格来说称不上是特征检测。基于特征的方法提取图像中的显著特征，比如重要区域（森林、湖泊、田野），线（区域边界、海岸线、道路、河流），点（区域拐点，线段交叉点，高曲率曲线上的点）等。与基于区域的方法相比，基于特征的方法不直接处理图像强度值，而是使用了更高级的特征信息。这样做有利于适应光照改变或多采集设备分析的情况。

显著特征需要有一下几个特性：

与图像其他部分不同
在整幅图中都有这样的特征
待配准的两幅图中都能够检测到

基于特征的方法需要提取包括：区域特征（Region features），线特征（Line features），点特征（Point features）

区域特征（Region features）：区域特征一般是具有高对比度、边缘封闭的区域，比如水库、湖泊、建筑物、森林、城市地区。这些区域通常由它们的重心表示，因为重心在旋转、缩放、倾斜时能够保持不变，且在灰度变化或存在噪声时比较稳定。
如何检测区域特征？
通过图像分割技术检测[72，137]，分割的质量会直接影响到配准效果
对尺度变化具有不变性的特征选择
线特征（Line features）：线条特征一般是线段、物体轮廓、海岸线、道路或医学图像中的细长解剖结构。线条通常由线的两个端点或线中点表示。
如何检测线特征？
通过边缘检测方法，比如 Canny 检测器[28]，或基于高斯拉普拉斯算子的检测器[126]
边缘检测方法survey阅读（edge detection） [222]
点特征（Point features）：点特征一般是线交点、道路交叉口、水域质心、油气田、高方差点、使用 Fabor 小波检测到的局部曲率不连续的点、曲线拐点、小波变换的局部极值、特定相似性度量下的显著点和角点。
如何检测出点特征？
大部分点特征检测器都将点定义为线交点、闭合边界区域的质心或小波变换的局部模极大值。
另外，角点（corner）自成一类点特征，因为 corner 很难像线交点这类点被定义，一般角点直观上理解为区域边界上的高曲率点。角点通常被用作 control points（CPs），因为其具有几何不变性，且很容易感知。
检测角点（corner）survey读（corner detection）：[155, 172, 220, 156]

总结：对于特征比较明显的图像（比如遥感和计算机视觉应用），推荐使用基于特征的特征检测方法，因为这些图像包含很多可识别的细节（城镇、河流、道路、森林、房间设施等）。但医学图像通常没有丰富的细节信息，通常会采用基于区域的特征检测方法。医学图像应用中，还可以通过专家交互式地选择或引入患者的外在特征，来补充显著特征的缺失 [123]。

关于基于区域和基于特征的特征检测方法实用性 survey：[151]，分析了对于各种对比度和清晰度图像的适用性。此外，现在已经有了同时使用基于区域和基于特征的特征检测方法[85]。

4.2 特征匹配（Feature matching）

从 moving image 和 fixed image 中分别完成特征检测后，检测到的特征可以通过两图像相近区域的平均图像强度、特征空间分布或特征描述符来进行匹配。另外有些工作将特征检测和特征匹配两步进行了融合，即在检测两幅图的对应特征时，也同时估计映射函数（mapping function）的参数。

4.2.1 基于区域的方法（Area-based methods）

Area-based methods：基于区域的方法也叫 correlation-like methods 或者 template matching。在 4.1 已经提到过，这类方法严格上说没有特征检测步骤，也就是不对图像中的显著特征进行检测，而直接将预定义大小的窗口，甚至是整幅图像用于特征匹配步骤【4，12，145】。

基于区域的方法局限性在于：1）简单地使用窗口只能对刚性变换（例如平移、旋转等）进行配准，如果图像间发生了更复杂的弹性变换（例如透视变换等），那么简单的窗口就无法进行配准，这也是基于区域方法基本思想的固有缺点；2）对于 moving image 和 fixed image 中不具有 “显著性” 的窗口内容，可能会导致无法正确匹配；3）特征的检测应当是在图像的不同部分进行选取，而基于窗口的选择方法也无法做到这一点。

4.2.1.1 基于相关性的方法（Correlation-like methods）

基于相关性的方法（Correlation-like methods）：基本思想是度量 moving image 和 fixed image 之间的相似度，目标是找出相似度最大的窗口对，通过不断匹配窗口对达到匹配两幅图像的目的。

（1）经典的基于区域的特征匹配方法：Cross-Correlation（CC），通过图像的强度直接对图像进行匹配，而不使用任何图像结构上的分析。因此CC的缺点：对图像的强度变化很敏感。通常，图像噪声、拍摄时照明强度的变化、使用不同的采集设备都会导致图像强度发生变化。CC的基本思想：计算 moving image 和 fixed image 中窗口对（window pairs）之间的相似性，并搜索相似性最大的两个窗口对（最大化问题），搜索的最优结果就是匹配的窗口对。根据 CC 方法的基本思想可以知道，它比较适用于匹配空间位置发生平移的图像，但其实它对轻微的旋转和缩放也能够适用。CC计算相似性：

基于 CC，还有 Normalized CC 和很多变体方法【146】。为了使 CC 能够处理平移之外的其他复杂几何变形，【17，83】提出为每个假定的几何变换都计算一次 CC，【170】解决因透视变化和因镜头缺陷而导致不同的配准问题，【98，99】解决图像存在部分遮挡的配准问题。

（2）与 CC 类似的方法是 Sequential Similarity Detection Algorithm（SSDA），使用顺序搜索策略和 L1 距离作为距离度量标准。SSDA的基本思想：计算窗口对间图像强度值差的绝对值（L1 距离）并求和，若累加和超过了给定的阈值，则说明该窗口对不匹配。SSDA 相比 CC，计算方法更简单，因此速度更快，但是可能不如 CC 准确。在距离度量的方法上，还可以使用平方差之和（Sum of squared differences）【211】。

（3）第三种方法是 Correlation Ratio-based Method（CR），与 CC 不同的是，CR 假设图像强度可以由函数进行表示，因此 CR 能够处理图像间强度不一致（多模态图像）的问题。关于多模态图像匹配的各种方法比较，可以参考【154】。

Correlation-like methods 的两个主要缺点：

相似度最大值的平坦性。由于图像内部具有自相似性，因此计算窗口对的相似度时，其最大值往往具有 “平坦性”，即有多个很近似的值，都可以作为最大值。解决方法包括：通过对图像进行预处理或使用边缘/矢量相关来锐化最大值【145，196，6】。
高计算复杂度。在寻找匹配窗口对时，相当于要计算当前窗口和对应图像每个窗口的相似性，因此计算量很大。

4.2.1.2 傅里叶方法（Fourier methods）

傅里叶方法（Fourier methods）适合以下几种情况的特征匹配：

图像包含频率相关的噪声
成像条件发生改变（随时间变化的照明等）
对计算速度有要求（待配准的图像越大，节省计算时间越显著）

（细节没看，回头再补上吧）

4.2.1.3 基于互信息的方法（Mutual information methods）

基于互信息（Mutual Information，MI）的方法：MI 来源于信息论，用于衡量两个数据集之间统计概念上的依赖性，尤其适用于不同模态的图像配准。比如在医学图像配准应用中，需要将患者的解剖图像和功能图像进行配准以辅助诊断。MI方法的基本思想：通过最大化 MI，找到最优解。

两个随机变量 X 和 Y 之间的 MI 由下式给出，其中 $H(X) = -E_X(log(P(X)))$ 表示随机变量 $X$ 的熵， $P (X)$ 表示 $X$ 的概率分布。

4.2.1.4 基于优化的方法（Optimization methods）

基于优化的方法：要求取最小差异度量或最大相似度量是一个多维优化问题，其维度就是几何变换的自由度。问题的自由度越高或相似性度量越复杂，就需要越复杂的优化算法来寻找全局最大值。优化方法的基本思想：将匹配问题看作一个寻找全局最大/最小值的优化问题，设计能量函数（Energy function）并将其最小化，当能量函数达到最小时就找到了最优解。另外，能量函数通常由两部分组成，一项是相似性度量/相异性度量，另一项是正则化项/惩罚项。在刚体变换问题中，正则化项通常被省略，但在非刚体变换中，通常存在正则化项。

关于优化方法的论文，可以参考：
【166】使用 Gauss-Newton 数值最小化算法对平方差之和进行最小化；
【201】使用 Gradient descent 优化算法寻找 MI 的最大值；
【164】使用 Levenberg-Marquardt 优化算法最小化对应像素间的强度差异。

4.2.2 基于特征的方法（Feature-based methods）

在第一步特征检测之后，我们能够得到由控制点（CPs）表示的图像特征，例如点特征（点本身），线特征（线端点或线中点），区域特征（区域重心），基于特征的匹配方法目的是使用这些特征的空间关系或各种特征描述符找到它们之间的成对对应关系。

4.2.2.1 基于特征的空间关系

基于特征空间关系的方法：基本思想是利用控制点之间的距离和它们的空间分布完成特征匹配。通常适用于检测到的特征比较模糊，或特征邻域局部失真的情况。

关于基于特征空间关系的论文，可以参考：
【71】利用 Graph matching algorithm（图匹配算法）进行配准；
【175】利用 Clustering techinique（聚类技术）进行配准；
【14，22】利用 chamfer matching 进行配准；
【18】Iterative Closest Point（ICP）算法用于 3D 图像配准。

4.2.2.2 基于特征描述符

基于特征描述符：基本思想是利用特征的描述符来估计特征间的对应关系，即匹配 moving image 和 fixed image 中具有最相似描述的特征。在特征描述空间中寻找最佳匹配特征对时，可以使用带阈值的最小距离规则或匹配似然系数。

特征描述符需要满足以下几个条件，但这些条件不一定都必须（能够）满足：

invariance，不变性。来自 moving image 和 fixed image 的相应特征的描述必须相同；
uniqueness，唯一性。不同的特征应具有不同的描述；
stability，稳定性。特征经过轻微的变形后，其描述应和未变形之前的描述相近；
independence，独立性。若特征描述是一个向量，则其元素间应功能独立。

4.2.2.3 Relaxation methods

[todo]

4.2.2.4 Pyramids and wavelets

[todo]

4.2.3 总结

当待配准的图像没有很多细节信息，且显著特征是由图像灰度而非局部形状或结构提供时，优先考虑使用基于区域的特征匹配方法。为了加快搜索速度，基于区域的方法通常采用金字塔图像表示和复杂的优化算法来找到相似矩阵的最大值。基于区域的匹配方法缺点在于：1）moving image 和 fixed image 必须具有相似的强度函数，也就是强度函数要么相同，要么至少是具有统计意义上的相关性（常见于多模态图像配准）；2）只允许图像间的平移或小幅度的旋转，尽管现在基于区域的方法也可以推广到完全旋转和缩放，但由于计算量太大实际应用中不常用。

当图像的局部结构信息更重要时，则优先使用基于特征的匹配方法，其能够配准不同性质的图像，可以处理复杂的图像失真问题。使用基于特征的方法关键是要有鲁棒的特征描述符，即对图像间所有假定的差异都具有不变性。基于特征的匹配方法共有缺点在于，特征可能难以检测，或存在时间上的不稳定因素。

4.3 变换模型估计（Transform model estimation）

什么是 Transformation？Transformation 关系到两幅图特征位置的变换（坐标转换），主要包括以下四种变换方式：

刚性（Rigid）：旋转、平移和放缩变换，图像的细节结构不会发生变化。
仿射（Affine）：剪切（shearing）、放缩（scaling），剪切结果的特点是图像任何两个对边之间保持平行。
曲线（Curved）：允许直线和曲线配准，不一定是刚性配准。
投影（Perspective）：变换方式更加灵活，对边关系都可能发生变化。

配准算法（Registration algorithms）的目的就是找到变换模型（Tranformation），即找到坐标转换矩阵，以实现两个不同图像的融合。配准算法可以分为 Rigid & Affine 类算法，Non-rigid 类算法，

1. Rigid & Affine 类配准算法

Landmark-based：找两幅图像中的特征点进行配准（这里的 landmark 指特征点）
Information theory-based：基于信息论实现配准
Edge-based：找两幅图像中对应的边缘实现配准
Voxel intensity-based：衡量图像间灰度的一致性实现配准

2. Non-rigid 类配准算法

Basis functions：使用基函数
Splines：使用样条函数
Physics-based：物理配准方法，比如使用 Elastic（柔性体）、Fluid（流体）、Optical flow（光流方法），这类方法来自其他领域

配准算法的 Tranformation 还需要一个迭代的优化过程（Optimization），从一个不太精确的配准到一个最优配准。优化过程为：

先假设一个初始的 transformation，然后对其进行反复优化
在每一个 iteration，将当前估计的 transformation 用于相似性计算（similarity measure）
根据上一步测算出的相似性，估计出新的 transformation，进行下一次迭代，直到算法收敛得到最优 transformation

4.3.1 Transformation

1. Rigid & Affine 类配准算法

1）Landmark-based regisitration：比如同一个人不同时期的图像发生了一些细微的变化，但仍然存在一些相对没有变化的点（下图中的红色点），通过找到这些特征点之间的对应关系，就能找到整幅图间的 transformation。通过计算这些点之间的相关性，找到这些点的质心，甚至通过旋转这些点，使这些点之间的距离达到最小，来实现 tranformation。Landmarks 的类型包括： 1）Intrinsic 内部特征点，比如图像内部的解剖结构特征点；2）Extrinsic 外部特征点，比如在对病人做成像前，人为地在其身体上标记一些很容易成像的点。

2）Surface-based regisitration：求取两幅图像对应的表面，通过计算并最小化两个表面间的距离来实现 tranformation。常用的基于表面的配准算法包括：1）The “Head and Hat” Algorithm；2）The Iterative Closest Point Algorithm（ICP），迭代式最近邻算法；3）Registration using crest lines。

3）Voxel intensity-based：通过计算图像间灰度的差异并最小化实现 tranformation。比如计算出要配准的两幅图像的灰度直方图（gray histogram），两个图间的灰度直方图称作 joint-histogram。当 joint-histogram 中间的白线越集中（相当于一致性分析），说明配准效果越好（joint-histogram 本身就可以作为一种测度来衡量配准的效果）。基于图像灰度配准的常用算法包括：1）Registration by minimizing intensity difference 最小化灰度差异；2）Correlation techniques 最大化相关性；3）Ratio image uniformity 最大化一致性比率；4）Partitioned Intensity Uniformity 图像部分间的灰度统一性。

4）Information theory based：信息论里有熵、互信息等概念，都是用于衡量信息多少的标准。可以通过最大化两幅图像中共享信息的最大值来实现最优配准。基于信息论的常用算法包括：1）Joint entropy 相关熵，衡量两幅图像混合之后信息量的总和，信息量越小说明配准效果越好，也就是要求最小值来获得最优配准；2）Mutual information 互信息，衡量用一幅图像描述另一幅图像能够有多好，也就是看两幅图像是不是达到了最优的匹配，通过求最大值来获得最优配准；3）Normalized Mutual Information 正规化互信息，和基于互信息的方法思想一样。

2. Non-rigid 类配准算法

1）Basis functions：利用基函数可以很好地表达形变场，例如用傅里叶基函数/三角基函数（Fourier/trigonometric basis），小波基函数（wavelet basis）。使用基函数来处理优点在于可以很好地实现平滑约束。

2）Splines：在两幅图像中求取一些 control points（CPs），通过样条函数表达 CPs 间的差异来实现配准。

3）Physics-based：将变形过程看作一种物理形变过程，主要包括以下几种：1）Elastic Regisitration：线弹性配准，由 internal force 和 external force 共同促进，可以通过 Navier linear elastic patial differential equation（Navier 线弹性偏微分方程）来描述；2）Fluid Regisitration：基于流体场的配准；3）Mechanical models：通过机械模型的形变实现图像的配准；4）Optical flow：利用光流场实现配准。

4.3.2 Optimization

求优过程就是对配准过程中 Transformation 参数最优化的过程。通过对目标函数（objective function）求最大/最小值，实现参数的最优化。

常用的目标函数包括：

Intra-modal：均方差 Mean squared difference（minimise），正规化互相关 Normalised cross correlation（maximise），熵差 Entropy of difference（minimise）
Inter-modal（or intra-modal）：互信息 Mutual information（maximise），正规化互信息 Normalised mutual information（maximise），熵相关性 Entropy correlation coefficient（maximise），AIR损失函数 AIR cost function（minimise）

以 Mean squared difference 为例，在图像 A 和 B 上找到相对应的点并计算灰度值的差异 $D i f f e r e n c e (i n d e x) = A (i n d e x) - B (i n d e x)$ ，计算图中所有对应点灰度值差异的平方并求和 $Sum += Difference(index)^2$ ，最后除所有像素的总数 $M a t c h (A, B) = S u m / n u m b e r O f P i x e l s$ ，就得到了整个图像的灰度差异性。

通过反复计算图中每个像素点的差异求优的方法属于一种 exhaustive search，虽然稳定但计算速度太慢。目前更常用的优化算法是梯度下降 Gradient Descent，可以大大减少计算量。

对变换模型进行估计，要解决的任务包括：1）选择映射模型的类型，2）映射模型的参数估计。映射模型的类型需要与 moving image 假定的几何变换类型、图像采集方法、配准所需精度相匹配。构建映射模型之后，moving image 就能够通过变形覆盖到 fixed image 上，且两幅图对应的控制点应该尽可能的接近。

映射模型根据它们所支持的数据量分类：

全局模型（Global mapping models），使用所有控制点估计一组对整幅图像有效的映射模型参数；
局部模型（Local mapping models），将图像看作是很多小块（patches）的组合，模型的参数则取决于它们在图像中支持的位置，即需要为每个 patch 定义映射模型的参数。

映射模型根据用于估计模型参数的控制点的重叠精度分类：

插值函数（Interpolating function），将 moving image 的控制点准确无误地映射到 fixed image 控制点上；
近似函数（Approximating function），在最终的配准精度和其他要求之间找到最佳 trade-off。由于控制点本身可能不是很精确，所以近似模型更常用。

4.3.3 全局映射模型（Global mapping models）

最常用的全局映射模型：低次的二元多项式。其相似变换也是最简单的形式，包括平移、选装和缩放。这种模型也被称作 “shape-preserving mapping”，因为它保留了角度的曲率，且由控制点明确规定了变换形式。

除此之外，还有仿射变换模型（仍属于线性模型）：仿射变换模型可以将四边形映射到正方形上，模型由 3 个非共线控制点定义，以保留直线和直线平行度。

更复杂一些的就是透视投影模型：该模型能够在保留直线的同时将四边形映射到正方形上，模型由 4 个独立的控制点定义。

除以上列举的，还有二阶或三阶的多项式模型，但实际应用中不太使用这些高阶模型。因为在 moving image 与 fixed image 进行对齐时，高级模型可能会导致不必要的扭曲。通常，控制点的个数会多于确定映射模型所需的最小数量，通过最小二乘拟合映射模型的参数，使其能够最小化控制点的平方误差之和。

4.3.4 局部映射模型（Local mapping models）

全局映射模型可能无法正确处理局部变形的图像，因此在图像发生局部几何失真的情况下，使用局部映射模型效果更好。加权最小二乘法（weighted least square）和加权平均法（weighted mean method）的变体：分段线性映射（piecewise linear mapping）【67】和分段三次映射（piecewise cubic mapping）【68】，都可以进行局部图像配准。

4.3.5 径向基函数（Mapping by radial basis functions）

[todo]

4.3.6 弹性配准（Elastic registration）

[todo]

五、图像配准效果评估（Validation & Visualization）

对两幅图像的配准效果进行定量评估比较难，因为没有 ground truth，不知道什么情况才是最优的配准效果。

有一种评估方法是，通过计算机模拟一个 model 实现评估。比如将一幅图人为地平移、旋转、放缩，这样我们就已经知道这幅图发生了什么变化，也就是知道 ground truth。接着让算法实现配准，看能不能达到理想的效果，但是临床上用这种方法衡量不太准确，仍然需要从视觉上进行衡量。还通过人工做一些 ground truth，或者通过解剖结构间的差异来估算。

医学图像中最经典的两种评估方法：

单模态图像配准常使用 相关性（Correlation Coefficient, CC） 衡量配准效果
多模态图像配准常使用 互信息（Mutual Information, MI） 衡量配准效果

此外，在配准完成后需要向用户展示结果，常用的展示方法包括：

Color overlay，将两幅图像以不同颜色进行彩色叠加
Interleaved pixel or chessboard fusion，将图像切成很多小方块，在相邻方块间显示不同图像，通过观察两个小方块之间的衔接评估配准效果
Dynamic alternating display，快速切换两幅图像，观察配准效果
Split view displays，将两幅图并行显示
Subtraction images，做两幅图的减法，显示出差异区域

相关参考书及综述：
Optimization Algorithms on Matrix Manifolds
Shapes and diffeomorphisms
Geometric Mechanics and Symmetry
《图像配准技术及其MATLAB编程实现》
Image registration methods： A survey
Image Registration Techniques： A Survey
Deformable Medical Image Registration: A Survey
医学图像相关综述：
Slice-to-volume medical image registration：A survey
A Survey on Deep Learning in Medical Image Analysis
医学图像配准技术罗述谦
https://zhuanlan.zhihu.com/p/80985475

参考文献：
【1】Zitova B, Flusser J. Image registration methods: a survey[J]. Image and vision computing, 2003, 21(11): 977-1000.

你可能感兴趣的:(#,Survey,计算机视觉)

目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
When Large Language Models Meet Speech: A Survey on Integration Approaches UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
主要内容研究背景：大语言模型（LLMs）在自然语言处理领域取得显著进展，其与语音的融合具有广泛应用前景，但缺乏相关集成方法的综述。文章将语音与LLMs集成方法分为基于文本、基于潜在表示和基于音频令牌三大类。集成方法基于文本的集成：通过级联集成、LLM重打分和LLM生成式错误纠正等方式，利用文本作为LLMs的输入和输出，处理语音相关任务，但存在信息损失和准确性与多样性平衡的问题。基于潜在表示的集成：
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
探索Sfm-python: 一款强大的计算机视觉库缪昱锨Hunter
探索Sfm-python:一款强大的计算机视觉库去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，Sfm-python是一个值得关注的开源项目，它以简洁高效的Python接口提供结构化从运动（StructurefromMotion,SfM）算法。如果你对3D重建、图像匹配或地理定位有兴趣，那么这个项目将是你不可或缺的工具。让我们一起深入了解一下它的技术细节、应用场景
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
Halcon 和 opencv比有什么区别与优劣 yuanpan opencv 人工智能计算机视觉
Halcon和OpenCV都是机器视觉领域的重要工具，但它们的设计目标、功能特点和适用场景有所不同。以下是两者的详细对比：1.定位与目标用户Halcon：定位：商业机器视觉软件，专注于工业应用。目标用户：工业自动化、质量控制、机器人引导等领域的专业开发者。OpenCV：定位：开源计算机视觉库，适用于通用图像处理和计算机视觉任务。目标用户：学术研究、教育、初创公司以及需要低成本解决方案的开发者。2.
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。