数据挖掘导论课后习题答案 第二章(二)

19.余弦计算公式:

相关计算公式:

数据挖掘导论课后习题答案 第二章(二)_第1张图片

欧几里得公式:

数据挖掘导论课后习题答案 第二章(二)_第2张图片

Jaccard 系数:

(a)

     cov=0

(b)

  cov=-1

d(x,y)=2

(c)

\

cov=0

d(x,y)=2

(d)

cov=0.25

J=0.6

(e)

cov=0

20.

(a)[-1,1].很多时候数据正值比较多,因此只有[0,1]

(b) 两个对象相似,但是对象的值不一定相等,比如向量x=(1,1,1,1),y=(2,2,2,2)

(c)如果两个向量有平均值0,cov(x,y)=cos(x,y)

(d)因为所有的100,000个点能够落入曲线上,所以欧几里得距离和余弦度量存在函数关系。具体来说,欧几里得距离和余弦度量存在相反关系。举例说明,如果两个点是一样的,他们的余弦度量是相似的,他们的欧几里得距离是0,但是如果两个数据有很高的欧几里得距离,它们的余弦度量就接近于0,请注意,所有示例数据点 来自正象限,即只有正值。这个意味着所有的余弦值都是正的。

(e)因为所有的100,000个点能够落入曲线上,所以欧几里得距离和相关性存在函数关系。具体来说,欧几里得距离和相关性存在相反关系。举例说明,如果两个点是一样的,他们的相关性是相似的,他们的欧几里得距离是0,但是如果两个数据有很高的欧几里得距离,它们的相关就接近于0,请注意,所有示例数据点 来自正象限,即只有正值。这个意味着所有的相关值都是正的。

(f)

数据挖掘导论课后习题答案 第二章(二)_第3张图片

(g)

数据挖掘导论课后习题答案 第二章(二)_第4张图片

21题以后的题目偏定理证明题目,对于初学者来说先熟悉概念和应用比较重要。所以有空再翻译啦

你可能感兴趣的:(数据挖掘)