信息熵 - cyberCoder

1690909849

在R语言中，熵是指“不确定性”或“信息量”的度量。更具体地说，熵是对随机变量不确定性的数量级进行度量的一种方式。它可以用公式进行计算，其中包含随机变量的概率和对数运算。在信息理论中，熵通常被用来描述消息的数量、复杂度和有效性。在R语言中，熵常被用来解决特定问题，例...

提问者：Mystic_Sunset

1687972361

请问一下什么是信息熵？我正在学习决策树，并且看到这个概念，在理解它与决策树之间的关系时感到有些困惑。我知道它是用来描述信息的混乱程度以及随机事件发生的不确定性。但是我还是很难完全理解这个概念和它对决策树的影响。希望能有人能够用简单易懂的方式讲解一下。谢谢！ ...

提问者：Black_Thunder

1686957130

当我使用决策树算法处理一个离散数据集时，发现该数据集的某些属性具有非常高的离散度，即该属性取值较多且相对不均匀。这种情况下，决策树算法需要采取合适的方式来处理这些属性。其中一种常见的方式是采用信息增益比(IR)或增益率(CR)作为分裂属性的准则，这两种准则都是在信息熵基...

提问者：Soul_Surfer