如何应对K-均值算法中数据集噪声过大的情况?

我正在使用K-均值算法对数据进行聚类,但是数据集中存在大量噪声,导致聚类结果不准确。请问有没有方法可以应对这种情况?我已经尝试过剔除异常值、缩小特征值范围以及调整距离度量等方法,但是效果不是很好。求教各位大佬是否还有其他的解决方案。谢谢!

提问时间:2023-10-06 18:09:05 编辑时间:2023-10-06 18:09:07 提问者: 零度星辰
  • 竹林之谣
    7

    对于数据集中存在大量噪声的情况,可以考虑使用基于密度的聚类算法,如DBSCAN(Density-Based Spatial Clustering of Applications with Noise),它可以自动识别并排除噪声点,从而得到更准确的聚类结果。另外,也可以尝试使用层次聚类算法或混合聚类算法,可以在一定程度上提高聚类结果的准确性。

    回答时间:2023-10-06 18:09:10