我正在探索使用K-均值算法进行数据聚类时,是否能够克服数据集中存在大量重复数据的干扰。具体而言,我的数据集中有一些特征值完全相同的数据点,它们可能会影响K-均值算法的聚类效果。我想知道是否有一种有效的方法可以在使用K-均值算法时解决这些问题。如果您有相关的实践经验或知...