2 模式识别-相似性测度-样本集

武汉理工大学资源 郭志强

2 模式识别-相似性测度-样本集_第1张图片

2 模式识别-相似性测度-样本集_第2张图片

2 模式识别-相似性测度-样本集_第3张图片

 

欧氏距离缺点:会受到量纲,的影响不同的量纲表示不同分量,会有不同的距离结果

线性代数中相似矩阵中的T是什么意思? 转置矩阵

举例(使用归一化的方法(数据规范化)的方法可以减轻缺点)

    如下图所示,a图是原图,两轴单位都是mm,当改变某一轴的单位时得到其他两个图,可见形状发生了改变,特征举例也自然发生改变。

2 模式识别-相似性测度-样本集_第4张图片

2 模式识别-相似性测度-样本集_第5张图片

 

矩阵里的 每个值表示该模式(特征)在某个分量上的离散程度即方差,值越大,距离均值的距离就越大。

马氏距离一定程度上克服了欧氏距离的弊端,对于样本模式来讲具有 平移、旋转、缩放的运算不变性,是很好的距离方式。

当该协方差矩阵C等于一个单位矩阵时欧式距离=马氏距离,欧氏距离其实是马氏距离的特殊例子。

2 模式识别-相似性测度-样本集_第6张图片

 

明氏距离:两个样本累加,m次方, 开m次方。

当m=1,k=2时明氏距离=欧氏距离

欧式距离和街坊距离(明示距离m=1时)的区别:如下图,欧式距离是斜边,街坊距离是两个直角边,很明显街坊距离大于欧氏距离。

2 模式识别-相似性测度-样本集_第7张图片

 

注意汉明距离是两个N维的二值样本向量(矩阵里只有1和-1)。

汉明距离的范围是 0~N,当 累加项等于 N 时等于0,当累加项等于 -N 时 等于N。

角度相似函数的值为0~1,值越大则表示无关性越高。

2 模式识别-相似性测度-样本集_第8张图片

 

太泥摸头(Tanimoto)测度:主要针对的特征向量是0和1的情况。

Tanimoto = 两特征交集(分子-相同位置的1的个数)/ 两特征并集(分母-两个特征1的总数)如果结果为1说明两个向量完全不相等,如果结果为0说明两个向量完全相等。

2 模式识别-相似性测度-样本集_第9张图片

你可能感兴趣的:(计算机模式识别)