如何在K-均值算法中选择最佳的初始质心数量?

我正在尝试使用K-均值算法,但我不确定应该选择多少个初始质心数量才能得到最佳的聚类。我已经尝试过使用手肘方法和轮廓系数来确定最佳的质心数量,但是结果不够理想。我想请教一下,还有什么方法可以确定最佳数量的初始质心?是否有其他技巧或工具可以用来优化选择最佳的K值?谢谢!

提问时间:2023-06-07 01:56:53 编辑时间:2023-06-07 01:56:55 提问者: 风吹过的草地
  • 雪山飞狐
    10

    除手肘方法和轮廓系数方法外,还可以使用“Gap统计量”(Gap statistic)来确定最佳的初始质心数量。Gap统计量将原始数据和由随机数据生成的参考数据进行比较,通过比较两者的聚类结果,计算出最佳的初始质心数量。此外,还可以使用层次聚类(hierarchical clustering)等其他聚类算法,作为辅助方法优化选择最佳的K值。

    回答时间:2023-06-07 01:56:58