如何在K-均值算法的聚类结果中发现数据的关联和相关性?

我正在尝试使用K-均值算法对数据进行聚类,但是我发现对于一些数据点,它们被归为同一类别并不代表它们之间存在很高的相关性或关联性。我想了解如何在聚类结果中发现这些关联和相关性,以更好地分析我的数据。是否有哪位专家可以提供一些技巧或建议,帮助我解决这个问题?谢谢!

提问时间:2023-07-27 00:49:42 编辑时间:2023-07-27 00:49:44 提问者: Silver_Strider
  • 青衣侠客
    8

    可以通过计算每个聚类中数据点之间的距离和协方差来发现数据的关联性和相关性。距离越小,表示数据点越相似,而协方差表示变量之间的线性相关性。可以利用聚类结果进行分组,并计算类内数据点的协方差矩阵,从而确定数据点之间的关系。另外,也可以尝试使用其他聚类算法,例如层次聚类、密度聚类等,以便更好地发现数据的关联和相关性。

    回答时间:2023-07-27 00:49:47