并查集 - 润新知

并查集

1.引出并查集

         并查集，英文译为Disjoint Set，即不相交集合。常用来解决集合相交问题。为什么叫并查集呢？这是因为并查集中包括两个主要的步骤：（1）合并（2）查找。不妨看看下面的例题：

在某个城市里住着n个人，任何两个认识的人不是朋友就是敌人，而且满足：

n 我朋友的朋友是我的朋友；

n 我敌人的敌人是我的朋友；

       已知关于 n个人的m条信息（即某2个人是朋友或者敌人），假设所有是朋友的人一定属于同一个团伙，请计算该城市最多有多少团伙？

         分析：要知道有多少个团伙，就要知道每个人属于哪个团伙？还有做到的是若A属于Team1同时也属于Team2那么就要合并Team1和Team2。这就是并查集的“并”和“查”了。显然天生就要用到并查集解决这个题了。

2.并查集实现

         2.1现在来看看怎么实现并查集算法吧？主要看看并（merge）和查（find）怎么实现？

还是举个例子吧。存在下面的几个集合{1,3,7}, {4}, {2,5,9,10}, {6,8}，如果用编号最小的元素标记所在集合即为set[i]。表示如下：

                                  i       1 2 3 4 5 6 7 8 9 10

                                     set[i]        1 2 1 4 2   6 1 6 2   2

对应的代码：

find1(x)

{

    return set[x];

}

Merge1(a,b)

{

         i = min(a,b);

    j = max(a,b);

for (k=1; k<=N; k++)

{

      if (set[k] == j)

            set[k] = i;

   }

}

Find的时间复杂度为O（1）,merge的时间复杂度为O(N)。那么能不能优化呢？？



         2.2并查集中的集合要是表示成树，难道不是很顺理成章的事情吗？？我们试一试吧。

                                     i       1 2 3 4 5 6 7 8 9 10

                                     set[i]        1 2   3 2 1 3 4 3 3   4

         set[i] = i , 则i表示本集合，并是集合对应树的根

         set[i] = j, j<>i, 则 j 是 i 的父节点.

         对应的数结构

                            1                                   2                                            3

                            |                                   |                                   |       |       |

                            5                                   4                                   6       8       9

                                                        |                |

                                                        7                10

代码：

find2(x)

{

   r = x;

   while (set[r] != r)

      r = set[r];

   return r;

}

merge2(a, b)

{

    if (a<b)

       set[b] = a;

    else

       set[a] = b;

}

Find的最坏的情况时间复杂度是O(N),merge的复杂度为O(1)，那么这个优化了吗？这就要避免find出现最坏的情况了。其实可以将深度小的树合并到深度大的树。这样假设两棵树的深度分别为h1和h2, 则合并后的树的高度h是:

1.max(h1,h2), if h1<>h2.

2.h1+1, if h1=h2.

看看代码优化过的代码吧？（find没有变化，变化的merge）

merge3(a,b)

{

         if (height(a) == height(b))

         {

             height(a) = height(a) + 1;

       set[b] = a;

   }

   else if (height(a) < height(b))

      set[a] = b;

   else

      set[b] = a;

}

这样优化过后，显然树的高度不会超过logN了。这样find的复杂度也就不会是O（n）了吧。

         2.3作为一个IT应该善于思考滴，想想还能不能优化呢？这一次我们采取一种叫做路径压缩的技术进行优化。思路是这样的：第一步，找到根结点。第二步，修改查找路径上的所有节点，将它们都指向根结点。这显然可以缩短find的复杂度吧。看看代码：

find(x)

{

         r = x;

         while (set[r] <> r) //找根节点

                   r = set[r];

         i = x;

         while (i <> r) //修改查找路径中所有节点指向根节点

         {

                   j = set[i];

set[i] = r;

i = j;

}

}

3．总结一下：

         并查集算法的时间复杂度主要是find和merge。2.2和2.3的优化本质上都是从find上面优化的，方法都是降低树的高度。2.2是合并的降低的；2.3是查找根节点的时候降低的。另外我们在用并查集的时候，只需要调用merge的。

4．例子

Problem Description

某省调查城镇交通状况，得到现有城镇道路统计表，表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通（但不一定有直接的道路相连，只要互相间接通过道路可达即可）。问最少还需要建设多少条道路？

Input

测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数，分别是城镇数目N ( < 1000 )和道路数目M；随后的M行对应M条道路，每行给出一对正整数，分别是该条道路直接连通的两个城镇的编号。为简单起见，城镇从1到N编号。
注意:两个城市之间可以有多条道路相通,也就是说
3 3
1 2
1 2
2 1
这种输入也是合法的
当N为0时，输入结束，该用例不被处理。

Output

对每个测试用例，在1行里输出最少还需要建设的道路数目。

Sample Input

4 2

1 3

4 3

3 3

1 2

1 3

2 3

5 2

1 2

3 5

999 0

0

Sample Output

1

0

2

998

#include "stdio.h"

int bin[1002];

int findx(int x)

{

    int r=x;

    while(bin[r] !=r)

        r=bin[r];

    return r;

}

void merge(int x,int y)

{

    int fx,fy;

    fx = findx(x);

    fy = findx(y);

    if(fx != fy)

        bin[fx] = fy;

}

int main()

{

    int n,m,i,x,y,count;

    while(scanf("%d",&n),n)

    {

        for(i=1;i<=n;i++)

            bin[i] = i;

        for(scanf("%d",&m);m>0;m--)

        {

            scanf("%d %d",&x,&y);

            merge(x,y);

        }

        for(count=-1, i=1;i<=n;i++)

            if(bin[i] == i)

                count ++;

        printf("%d\n",count);

    }

}
相关阅读:
[转]asp.net core中的View Component
[转] 三层架构、MVC
[转]Javascript异步编程之三Promise: 像堆积木一样组织你的异步流程
 T4语法快速入门
 [转]ASP.NET Core 十种方式扩展你的 Views
(装机)关于WINRE/ESP/LRS_ESP/MSR/PBR这些分区
 C#设计模式系列目录
 [转]RESTful API 设计指南
 .gitignore释疑
 [转]Subdirectory Checkouts with git sparse-checkout
原文地址：https://www.cnblogs.com/BeyondAnyTime/p/BeyondAnyTime.html