• 算法导论 第21章 不相交集合的数据结构


    文章作者:Slyar 文章来源:Slyar Home (www.slyar.com) 转载请注明,谢谢合作。

    等价关系与等价类

    从数学上看,等价类是一个对象(或成员)的集合,在此集合中的所有对象应满足等价关系。若用符号"≡"表示集合上的等价关系,那么对于该集合中的任意对象x,y, z,下列性质成立:

    1、自反性:x ≡ x

    2、对称性:若 x ≡ y 则 y ≡ x

    3、传递性:若 x ≡ y 且 y ≡ z 则 x ≡ z

    因此,等价关系是集合上的一个自反、对称、传递的关系。

    等价关系

    通过金属线连接起来的电器的连通性,就是一种等价关系。这种关系显然具有自反性,因为任何一个器件都是与自身连通的;如果a 电连通b,那么b一定也电连通a,因此这种关系具有对称性; 若a连通到b,并且b连通到c,那么a连通到c 。

    不相交集合的链表表示

    每一个集合用一个链表表示。每个链表中的第一个对象作为它所在集合的代表。

    每一个对象的结构:

    1)集合成员

    2)指向包含下一个集合成员的对象的指针

    3)指向代表的指针

    每个链表都包含head指针和tail指针,head指向链表的代表,tail指向链表中最后的对象。

    MAKE-SET(x): O(1),创建新链表,其仅有对象为x

    FIND-SET(x): O(1),返回x指向代表的指针

    UNION(x,y): 将x所在的链表拼接到y所在链表的表尾。注意,对于原先x所在链表中的每一个对象,都需要更新其指向代表的指针。

    加权合并启发式策略:设每个表还包括了表的长度,合并时,总是把较短的表拼到较长的表上。

    使用加权合并策略,对m个MAKE-SET, UNION和FIND-SET操作所构成的序列(其中n个MAKE-SET操作,因此UNION操作的次数至多为n-1),花费的总时间为O(m+nlgn)。

     

    不相交集合森林

    并查集的一般用途就是用来维护某种具有自反、对称、传递性质的关系的等价类。并查集一般以树形结构存储,多棵树构成一个森林,每棵树构成一个集合,树中的每个节点就是该集合的元素,找一个代表元素作为该树(集合)的祖先。

    并查集支持以下三种操作:

    1、Make_Set(x) 把每一个元素初始化为一个集合

    初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身。

    2、Find_Set(x) 查找一个元素所在的集合

    查找一个元素所在的集合,只要找到这个元素所在集合的祖先即可。判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。

    3、Union(x,y) 合并x,y所在的两个集合

    合并两个不相交集合操作很简单:首先设置一个数组Father[x],表示x的"父亲"的编号。那么,合并两个不相交集合的方法就是,找到其中一个集合的祖先,将另外一个集合的祖先指向它。

    合并

    并查集的优化

    1、Find_Set(x)时 路径压缩

    寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?

    答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回归"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了。

    路径压缩

    2、Union(x,y)时 按秩合并

    即合并的时候将元素少的集合合并到元素多的集合中,这样合并之后树的高度会相对较小。

    思想是使包含较少结点的树的根指向包含较多结点的树的根,并不是显式的记录以每个结点为根的子树大小,而是一种简化分析的方法。用秩表示结点高度的一个上界。在按秩合并中,具有较小秩的根在UNION操作中要指向较大秩的根。

    如果将按秩合并和路径压缩分开使用的话,都不能改善不相交集合森林的操作的运行时间;如果联合起来使用,则改善的幅度更大。两种方同时使用的时候,最坏情况运行时间为O(ma(n)),其中a(n)是一个增长极其缓慢的函数。其中路径压缩和按秩合并完全兼容,使得两个优化方法可以同时实现。定理证明:M次Union和Find的运行时间为O(MlogN)。

    c语言实现源码:

     1 #include <stdio.h>
     2 #include <stdlib.h>
     3 #include "disjset.h"
     4  
     5  /*不想交集ADT的数据结构:使用树来表示每一个集合,树上的每一个元素都有相同的根。
     6  S[i] < 0表示结点i为树的根结点,S[i]的绝对值表示树的秩(树的高度的估值)。
     7  S[i] > 0表示i结点是非根结点,S[i]表示结点i的父亲结点。*/
     8  
     9  
    10  /*开始时每个集合含有一个元素,该元素都为一个集合的根节点*/
    11  void initialize(DisjSet S)
    12  {
    13      int i;
    14      for( i = NumSets; i > 0; i --)
    15          S[i] = -1;
    16  }
    17  /*按秩求并,使得较小秩的树成为较大秩的树的子树*/
    18  void SetUnion(DisjSet S, SetType Root1, SetType Root2)
    19  {
    20      if(S[Root2] < S[Root1])/*Root2树的秩大于Root1树的秩,把Root1合并到Root2上*/
    21      {
    22          S[Root1] = Root2;
    23      }
    24      else/*Root1树的秩大于等于Root2树的秩,把Root2合并到Root1上*/
    25      {
    26          if(S[Root1] == S[Root2])
    27             S[Root1] --;
    28          S[Root2] = Root1;
    29      }
    30  }
    31  /*路径压缩*/
    32  SetType Find(ElementType X, DisjSet S)
    33  {
    34      if(S[X] <= 0)
    35          return X;
    36      else
    37          return S[X] = Find(S[X], S);/*把X到根的路径上的每个结点都使它的父节点变成根*/
    38  }
  • 相关阅读:
    eval()
    promise
    console.log()和console.dir()、console.table()的区别
    SSM框架搭建+easyui增删改查
    虚成员
    关键字 explicit
    复制控制
    变量、静态变量
    关键字 extern
    关键字 static
  • 原文地址:https://www.cnblogs.com/bigrabbit/p/2684026.html
Copyright © 2020-2023  润新知