数据融合杂记

A Review of Data Fusion Techniques

本文将数据融合技术分为三类:数据关联(data association)、状态估计(state estimation)、决策融合(decision fusion),然后分别介绍了数据融合技术的分类方式(第二节)、数据关联的一般方法(第三节)、状态估计的一般方法(第四节)以及决策融合的一般方法(第五节),并在最后进行了总结。

第二节

本文提出了五种分类方式:根据输入数据源间的关系、根据输入输出数据的类型、根据使用数据的抽象等级、根据JDL模型、根据数据的结构类型

https://zhuanlan.zhihu.com/p/122364721

第三节

Data association: The process of assign and compute the weights that relates the observations or tracks (A track can be defined as an ordered set of points that follow a path and are generated by the same target.) from one set to the observation of tracks of another set.

数据关联就是分配和计算与观察值或轨迹(轨迹定义为沿着一条路径并由同一目标生成的有序集合)相关的权重,实现从一组轨迹的观测值映射到另一组数据的过程。简单理解就是对一组轨迹的观测值进行重新排序来反映目标真实的运动。数据关联通常在状态估计之前进行,只有获得准确的数据关联处理结果,才能保证后续处理的正确性。

文中提到的方法如下:

  •  近邻(Nearest Neighbors)与 K-Means

近邻算法是最简单的数据关联技术,其通过设定距离度量以及阈值来对相似的值进行聚类。使用的距离度量标准通常有绝对距离(Absolute distance)、欧式距离(Euclidean distance)或是自定义的距离统计函数(statistical function of the distance)。近邻算法可以在较短时间内找到一个近似可行的结果,但在密集环境(cluttered environment)以及噪声严重的环境(highly noisy environments)中性能较差。

K-Means算法较近邻算法性能有所提高。然而其也有若干缺点:不是每次都能找到最佳的聚类中心、必须先知道聚类个数K且要保证K值即为最佳聚类数、算法需保证数据集的协方差是不相关的或者其已经标准化。由此产生了各种改进的K-Means算法。

  • 概率数据关联(Probabilistic Data Association)与联合概率数据关联(Joint PDA)

概率数据关联为一个目标的一次有效测量的每一个可能性设置一个关联概率。目标的状态估计是由在所有情形下预测状态的加权和得到的。

联合概率数据关联是一种非最优的,在密集环境中跟踪多目标的方法。联合概率数据关联与概率数据关联相似,但是联合概率数据关联的关联概率是由所有目标的所有观测值计算得到。

https://blog.csdn.net/weixin_41971870/article/details/103711467

  • 多重假设检验(Multiple Hypothesis Test)

多重假设检验使用多个(more than two)连续观测结果进行关联来获得更好的观测结果。其他只使用两个连续观测结果很可能产生错误。与概率数据关联以及联合概率数据关联不同,多重假设检验估计所有可能的假设并在每次迭代中更新假设。多重假设检验最主要的缺点是计算量较大。

  • 分布式联合概率数据关联(Distributed JPDA)

 

  • 分布式多重假设检验(Distributed MHT)

 

  • 图形化模型(Graphical Models)

图形化模型是表示和推理概率以及独立性的一种形式。图形化模型表示了联合概率的条件分解。在一个图形化模型中,节点表示随机变量,边表示随机变量之间可能的关联,面表示保留相关变量排序的子结构的复制。图形中表示了随机变量之间的联合分布,据此可以将其分解为一组仅由一组变量决定的因子。图形化模型主要分为两类:贝叶斯网络(Bayesian networks),又称直接图形化模型马尔可夫随机域(Markov random fields),又称间接图形化模型。直接图形化模型在表示随机变量之间的因果关系时效果较好,间接图形化模型在表示随机变量之间的软约束时更适用。

https://zhuanlan.zhihu.com/p/125104004

第四节

State estimation techniques aim to determine the state of the target under movement (typically the position) given
the observation or measurements. State estimation techniques are also known as tracking techniques.

状态估计的目标是通过观测和测量来确定目标运动的状态(主要是位置)。因此状态估计技术也被称为是跟踪技术。状态估计相是数据融合中一个常见步骤,因为目标的观测值可能来自于多个传感器或多个数据源,数据融合的终极目标是从观测值中获得一个全局的状态估计。

估计问题就是寻找一组与数据最匹配的向量状态。从数学的角度看,就是对于一组冗余的观测值,寻找一组参数来实现对数据的最优拟合。通常,这些数据中会有错误值、噪声。状态估计处于JDL模型的第一层,可以分为以下两个大类:

  • 线性动态分析。此时状态估计问题有标准解法。当物体的状态和测量值的方程是线性的,且噪声服从高斯分布,且非密集环境,可以通过基于卡尔曼滤波计算理论得到最优解。
  • 非线性动态分析。此时状态估计问题变得比较复杂,没有解析解。目前还没有能够较好地解决这一问题的方法。

常见的状态估计方法如下:

  • 最大似然(Maximum Likelihood)和最大后验(Maximum A Posteriori probability)

最大似然是一种是一种基于概率论的估计方法。当状态变量为一个未知的概率分布式可以选用概率分布方法。

最大后验估计是根据经验数据获得对难以观察的量的点估计。与最大似然估计类似,但是最大的不同时,最大后验估计的融入了要估计量的先验分布在其中。故最大后验估计可以看做规则化的最大似然估计。

https://blog.csdn.net/hellozhxy/article/details/82701133

https://blog.csdn.net/liangjiubujiu/article/details/84871196

  • 卡尔曼滤波(Kalman Filter)

https://blog.csdn.net/weixin_42647783/article/details/88080646

  • 粒子滤波(Particle Filter)

https://blog.csdn.net/guo1988kui/article/details/82778293

  • 分布式卡尔曼滤波(Distributed Kalman Filter)

 

  • 分布式粒子滤波(Distributed Particle Filter)

 

  • 协方差一致性法(Covariance Consistency Methods)

 协方差一致法分为协方差交叉(Covariance Intersection)和协方差联合(Covariance Union)

 

https://zhuanlan.zhihu.com/p/136539078

第五节

A decision is typically taken based on the knowledge of the perceived situation, which is provided by many sources in the data fusion domain.  These techniques aim to make a high-level inference about the events and activities that are produced from the detected targets. These techniques often use symbolic information, and the fusion process requires to reason while accounting for the uncertainties and constraints. 

一个决策通常是由来自多源数据领域的已知情景得到的知识而做出的。决策融合技术旨在对被测目标产生的事件与活动进行高级别的预测。这些技术通常使用符号信息,且融合过程中需要在考虑不确定性和约束的同时进行推理。决策融合方法属于JDL模型中的第二层级(形势评估)和第四层级(影响评估)。 

决策融合的常见方法如下:

  • 贝叶斯方法

贝叶斯方法的问题如下:需要已知先验概率、事件较多时复杂度高、事件必须相互独立、难以描述决策的不确定性

https://www.cnblogs.com/SUNYZBlog/p/9610378.html

  • Dempster-Shafer证据推理法

https://blog.csdn.net/qq_30142403/article/details/80448991

  • 溯因推理(Abductive Reasoning)

当一个事件被观测后,溯因推理试图寻找最佳的解释。在概率推理的范畴里,溯因推理根据一些观测变量来寻找系统变量的后验最大似然函数。溯因推理更多的是一种推理模式而不是数据融合技术。

  • 语义方法(Semantic Methods)

对于多来源语义数据的融合能够得到比单一来源的语义数据更为准确的结果。语义信息融合本质上是一种处理原始传感器数据的机制,每个节点只处理合成的语义信息。语义信息融合通常包含两步,搭建知识体系和模式匹配。第一步将最合适的知识合并为语义信息。然后第二步开始融合相关的参数并且提供一个语义的解释。语义融合可以看作是将传感器数据整合并翻译为正式的语言的方法。因此,得到的结果会与存储在数据库中相近的语句进行比较。这一策略的核心在于表达相同行为的语句在语义上也是相似的。

https://zhuanlan.zhihu.com/p/139771522

你可能感兴趣的:(数据)