• R: 判别分析


    判别与聚类的比较:

    聚类分析和判别分析有相似的作用,都是起到分类的作用。

    判别分析是已知分类然后总结出判别规则,是一种有指导的学习;

    聚类分析则是有了一批样本,不知道它们的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的观测比较接近,不同类的观测相差较多,这是无指导的学习。
        所以,聚类分析依赖于对观测间的接近程度(距离)或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果

    判别分析

    基本原理:从已知的各种分类情况中总结规律训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。

    常用判别方法:最大似然法,Bayes判别法,距离判别法,Fisher判别法,逐步判别法等。

    注意事项:1. 判别分析的基本条件分组类型在两组以上,解释变量必须是可测的;

              2. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);

              3. 各解释变量之间服从多元正态分布不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。

    相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。

    应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。

     本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。

    Bayes 和 距离判别:都要考虑两个、或多个总体协方差(方差是协方差的一种)相等或不等的情况,由 var.equal= 的逻辑参数表示,默认是 FALSE,表示认为两总体协方差不等。

    用样本的协方差可以估计总体的协方差。

    在Bayes方法中我们把相等和不等的两个结果都列了出来,距离判别里我们默认两总体协方差不等。

    一般使用时,我们都以两总体的协方差不等作为标准来进行后续计算。

     Bayes判别

    Bayes判断 假定我们对研究对象有一定的认识,这种认识常用先验概率来描述。。。

    取得样本后,用样本来修正已有的先验概率分布,得出后延概率分布。。

    再通过后验分布进行各种统计推断。。

    参考文献:

    https://blog.csdn.net/zhubo22/article/details/8194772   总述 聚类与判别之间的关系

    https://blog.csdn.net/tiaaaaa/article/details/58145126  判别分析的实例与原理。

    https://blog.csdn.net/chen790646223/article/details/45450301  各种判别和分类方法。

  • 相关阅读:
    对于“口袋精灵”单元测试
    12-17:项目进度
    12-15:项目进度
    12-14:项目进度
    12-13:项目进度
    12-12:项目进度
    12-11:项目进度
    12-10:项目进度
    12-9:项目进度
    12-6:项目进度
  • 原文地址:https://www.cnblogs.com/li-20151130/p/9114249.html
Copyright © 2020-2023  润新知