对于输入x,类别标签Y:
判别模型:由数据直接学习决策面Y=f(x)或条件概率P(Y|x)作为预测模型
生成模型:由数据学习联合概率分布P(x,Y),然后求出条件概率P(Y|x)作为预测模型
模型区别:
判别模型寻找不同类别之间的分离面,反映不同类别之间的差异。
生成模型通过统计反映同类数据的相似度。
模型的优点和缺点:
判别模型主要缺点:
1,不能反映数据本身的特征
判别模型主要优点:
1,模型简单,容易学习。
2,分类性能好,分类边界灵活。
生成模型的主要缺点:
1,模型复杂
生成模型主要优点:
1,信息量丰富。
2,模型可以通过增量学习得到
模型的联系:
生成模型可以得到判别模型,即P(Y|x)=P(x,Y)/P(x),而判定模型不能得到生成模型
模型应用:
生成模型主要用在NLP领域,判别模型主要应用在模式识别领域。