Java教程

数据挖掘十八般武艺(一):决策树

本文主要是介绍数据挖掘十八般武艺(一):决策树,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

一、算法原理

(1)基本算法

决策树(Decision Tree),基于“树”结构进行决策:
        每个内部结点对应一个属性测试;
        每个分支对应属性测试的一种可能取值;
        每个叶结点对应一个决策结果。

学习过程:通过对训练样本的分析来确定“划分属性”(即内部结点所对应的属性)。

预测过程:将测试示例从根结点开始,沿着划分属性所构成的“判定测试序列”下行,直到叶结点。

策略:分而治之(Divide-and-Conquer)
        自根至叶递归;
        在每个内部结点寻找一个划分(或测试)属性。

递归停止条件:
        当前结点包含的样本全属于同一类别,无需划分;
        当前属性集为空, 或是所有样本在所有属性上取值相同,无法划分;
        当前结点包含的样本集合为空,不能划分。

 

(2)划分

(3)剪枝

算法实验

这篇关于数据挖掘十八般武艺(一):决策树的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!