通常采用的距离函数为:欧几里得距离 d(x,y)=||x-y||2
但在统计分析及计算中,通常采用马氏距离:马氏距离考虑了总体的分布情况
距离:两堆沙子,一堆紧凑一些,一堆松散一些,判断一块石头属于哪一堆?
不应该只计算直线距离,也许这块石头在紧凑的一堆的沙子的分布中属于异常值,所以应该考虑总体的分布情况。
因此距离判别的距离函数采用的为马氏距离。马氏距离的R函数:mahalanobis(x,center,cov,inverted=FALSE) x样本数据;center为样本中心(均值),cov为样本的协方差
主要分为两种情况:
1.两总体的协方差矩阵相等
2.两总体的协方差矩阵不相等