工作原理:
分级聚类通过连续不断将最为相似的集群两两合并,来构造出一个群组的层级结构。
其中的每个群组都是从单一元素开始的。每次迭代的过程中,分级聚类算法会计算每2个
集群间的距离,并将距离最近的两个集群合并为一个新的集群,这一过程会一直继续下去,直到只剩一个群组为止
分级聚类的过程:
从图中可以看出,元素的相似程度是通过它们的相对位置来体现的---两个原色距离越近,他们就越相似。开始时,群组还只有一个元素,
在第二步中,我们可以看到A和B,这两个紧靠在一起的元素,已经合并成一个新集群,新群组所在的位置位于这两个元素的中间,第三步中,新群组又和C进行了合并。因为D和E现在是距离最近的两个元素,所以他们共同构成了一个新的群组。