→ 决策树是一种树形算法,用于确定行动过程,树的每个分支代表一个可能的决策、发生或反应。
让我们看一下术语:-
熵——熵是数据集中“随机性”或“杂质”的度量。
熵应该很低!
信息增益——它是数据集拆分后熵减少的度量,也称为熵减少。
信息增益应该很高!
叶节点——叶节点承载分类或决策。
根节点——最顶层的决策节点被称为根节点。
示例:- 决策树如何工作?
假设你妈妈告诉你去超市带些口粮。让我们来看看 ;
问题陈述:-根据特征对所有口粮进行分类。
这是清单:大米、小麦、豆类、盐、糖、姜黄粉
让我们确定这个人是否带来了正确的东西。
训练数据集:-
我们必须以信息增益最高的方式构建分割数据的条件。
现在,如果我们看看我们的树;
由于 ,现在每个分支都包含单个标签类型,我们可以说这种情况下的熵已达到最小值。
这棵树现在可以最准确地预测数据集中存在的所有动物类别。
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
这就是这篇文章的全部内容,我知道我已经计算了熵和信息增益,对此我很抱歉,但我很快就会在 insha'Allah 上做,还有一些其他的例子。
如果有任何错误请纠正我,我会很高兴学习。
快乐学习!
我的 领英 不要犹豫,联系我