决策树(Decision Tree),基于“树”结构进行决策:
每个内部结点对应一个属性测试;
每个分支对应属性测试的一种可能取值;
每个叶结点对应一个决策结果。
学习过程:通过对训练样本的分析来确定“划分属性”(即内部结点所对应的属性)。
预测过程:将测试示例从根结点开始,沿着划分属性所构成的“判定测试序列”下行,直到叶结点。
策略:分而治之(Divide-and-Conquer)
自根至叶递归;
在每个内部结点寻找一个划分(或测试)属性。
递归停止条件:
当前结点包含的样本全属于同一类别,无需划分;
当前属性集为空, 或是所有样本在所有属性上取值相同,无法划分;
当前结点包含的样本集合为空,不能划分。