我在进行高维数据的决策树算法建模时,遇到了如何选择最佳分割节点的问题。具体来说,由于高维数据比较复杂,每个特征的权重都可能不同,因此需要通过某种方法选择一个最佳的分割节点来实现分类。我尝试了一些常用的算法(如信息增益、基尼系数等),但是由于维度过高,导致计算成本...
提问者:Zen_Mind在使用决策树算法中,通常使用基尼系数来衡量一个节点的不纯度,即该节点包含的数据点类别不一致程度。基尼系数越小,该节点的不纯度越低,意味着该节点可以更好地分类数据。在构建决策树时,我们希望将基尼系数最小化,以得到一个更加纯净的树模型。基尼系数的计算方式是对该节点包...
提问者:跑跑