决策树是最经常使用的数据挖掘算法
基本概念
决策树(Decision Tree)
- 它通过对训练样本的学习,并建立分类规则,然后依据分类规则,对新样本数据进行分类预测,属于有监督学习。
优点
1)决策树易于理解和实现
- 使用者不需要了解很多的背景知识,通过决策树就能够直观形象的了解分类规则;
2)决策树能够同时处理数值型和非数值型数据
- 在相对短的时间内,能够对大型数据做出可行且效果良好的结果;
逻辑-类比找对象
决策树分类的思想类似于找对象,例如一个女孩的母亲要给这个女孩介绍男朋友,于是母女俩有了下面的对话:
女儿问:“多大年龄了”;母亲答:“26”
女儿接着问:“长得帅不帅?”;母亲答:“挺帅的。”
女儿问:“收入高不?”;母亲答:“不算很高,中等情况”
女儿问:“是公务员吗?”;母亲答:“是,在财政局上班”
最后,女儿做出决定说:“那好,我去见见!”
这个女孩的决策过程就是典型的分类树决策: