DBSCAN聚类效果不稳定问题

DBSCAN聚类算法含义:

https://blog.csdn.net/lys_828/article/details/108702381


DBSCAN聚类参数主要有这两个:eps  和  min_simples


DBSCAN调参可视化部分:

# 测试调参部分
mask_test1 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)
mask_test2 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)
# 存放各个参数的组合计算出来的模型评估得分和噪声比 # 注意浮点数int计算时末尾为x.99999
for i in tqdm.tqdm(np.arange(0.05, 1.0, 0.05), total=len(np.arange(0.05, 1.0, 0.05))):
    for j in np.arange(50, 1500, 50):
        try:  # 因为不同的参数组合,有可能导致计算得分出错,所以用try
            features = StandardScaler().fit_transform(get_lane_embedding_feats_result['lane_embedding_feats'])
            db = DBSCAN(eps=i, min_samples=j).fit(features)
            labels = db.labels_  # 得到DBSCAN预测的分类便签
            k = metrics.silhouette_score(features, labels)  # 轮廓系数评价聚类的好坏,值越大越好
            raito = len(labels[labels[:] == -1]) / len(labels)  # 计算噪声点个数占总数的比例
            n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)  # 获取分簇的数目
            mask_test1[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = k
            mask_test2[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = raito
        except:
            mask_test1[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = 0.0
            mask_test2[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = 1.0
plt.figure('mask_test1')
plt.imshow(mask_test1 * 255, cmap='gray')
plt.figure('mask_test2')
plt.imshow(mask_test2 * 255, cmap='gray')
plt.show()
plt.pause(5)

在使用训练得到的模型进行测试的过程中,聚类时遇到DBSCAN最优聚类参数不稳定的情况:

                         左图:轮廓系数评价聚类的好坏,值越大越好          右图:计算噪声点个数占总数的比例,值越小越好

DBSCAN聚类效果不稳定问题_第1张图片

DBSCAN聚类效果不稳定问题_第2张图片

DBSCAN聚类效果不稳定问题_第3张图片

 分析原因:

  1. 测试图未进行统一:将三个测试图统一到统一亮度、色度。代码:https://blog.csdn.net/qq_36638362/article/details/109311353            结果:未使得优化
  2. 训练集含有多种不同类型的对象,对应的标签:重新进行标签训练。结果:未使得优化
  3. 。。。。。分析中

你可能感兴趣的:(python,python,深度学习)