朴素贝叶斯
朴素的原因是假设各个特征之间是相互独立的。
过程:
- 确定特征属性
- 获取训练样本
- 对每个类别计算p(yi)
- 对每个特征属性计算所有划分的条件概率
- 对每个类别计算p(x|yi)p(yi)
- 以p(x|yi)p(yi)的最大项作为x所属的类别
优点:
- 算法逻辑简单,易于实现
- 分类过程中的时间和空间开销比较小
缺点:理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。
理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。