【20211129】【Python】使用Python计算欧氏距离的方法

        该问题源于工作中使用 k 折交叉验证选取最优的 KMeans 算法参数,过程中使用欧氏距离来评价参数的优劣。


1. 代公式,封装成函数

【20211129】【Python】使用Python计算欧氏距离的方法_第1张图片

def calEuclidean(x, y):
    dist = np.sqrt(np.sum(np.square(x-y)))   # 注意:np.array 类型的数据可以直接进行向量、矩阵加减运算。np.square 是对每个元素求平均~~~~
    return dist

2. 调用 numpy 函数库

        使用 numpy.linalg.norm(x, y) 可以计算向量 x 和向量 y 的欧氏距离~

def choose_bestK(myData):
    ''' 
        使用 K 折交叉验证,结合 KMeans 聚类算法,选取最优的 K
        Input: myData 是训练集
     '''
    kMax = 5
    scoreLis = []
    for k in range(1, kMax+1):
        kmeans = KMeans(n_clusters=k)
        kmeans.fit(myData)
        mu = kmeans.cluster_centers_
        score = 0
        for i, l in enumerate(kmeans.labels_):   # i是索引,l是类簇
            score += np.linalg.norm(myData[i, :] - mu[l, :])   # 计算欧氏距离

        scoreLis.append(score)

    return np.argmin(scoreLis)+1   # 返回 score 最小的对应索引

        (参考:Python 计算Numpy向量之间的欧氏距离) 

        (参考:欧几里得度量)


知识点

1. np.square() 函数

        函数功能:计算数组/向量/矩阵的元素的平方。

        返回:返回一个新数组/向量/矩阵,他们的元素是源数组/向量/矩阵元素的平方。

        (参考:Python中的numpy.square())

2. 类似地,对元素进行计算的还有 np.exp()、np.sqrt()、np.log()、np.sign() 等。

        (参考:Numpy数学函数abs,sqrt(),square(),exp(),log(),sign(), 四舍五入函数,modf(),isnan(),isfinite()、isinf(),三角函数,二元函数等)

你可能感兴趣的:(Python,python,开发语言,后端)