并查集
概念:
在计算机科学中,并查集是一种树型的数据结构,用于处理一些不交集(Disjoint Sets)的合并及查询问题。有一个联合-查找算法(union-find algorithm)定义了两个用于此数据结构的操作:
- Find:确定元素属于哪一个子集。这个确定方法就是不断向上查找找到它的根节点,它可以被用来确定两个元素是否属于同一子集。
- Union:将两个子集合并成同一个集合
由于支持这两种操作,一个不相交集也常被称为联合-查找数据结构(union-find data structure)或合并-查找集合(merge-find set)。其他的重要方法,MakeSet,用于建立单元素集合。有了这些方法,许多经典的划分问题可以被解决。
为了更加精确的定义这些方法,需要定义如何表示集合。一种常用的策略是为每个集合选定一个固定的元素,称为代表,以表示整个集合。接着,Find(x) 返回 x 所属集合的代表,而 Union 使用两个集合的代表作为参数。
并查集森林
并查集森林是一种将每一个集合以树表示的数据结构,如上图所示。其中每一个节点保存着到它的父节点的引用(见意大利面条堆栈)。这个数据结构最早由Bernard A. Galler和Michael J. Fischer于1964年提出,[1]但是经过了数年才完成了精确的分析。
在并查集森林中,每个集合的代表即是集合的根节点。“查找”根据其父节点的引用向根行进直到到底树根。“联合”将两棵树合并到一起,这通过将一棵树的根连接到另一棵树的根。实现这样操作的一种方法是
function MakeSet(x) x.parent := x function Find(x) if x.parent == x return x else return Find(x.parent) function Union(x, y) xRoot := Find(x) yRoot := Find(y) xRoot.parent := yRoot
这是并查集森林的最基础的表示方法,这个方法不会比链表法好,这是因为创建的树可能会严重不平衡;然而,可以用两种办法优化。
优化方法一:按秩合并
第一种方法,称为“按秩合并”,即总是将更小的树连接至更大的树上。因为影响运行时间的是树的深度,更小的树添加到更深的树的根上将不会增加秩除非它们的秩相同。在这个算法中,术语“秩”替代了“深度”,因为同时应用了路径压缩时(见下文)秩将不会与高度相同。单元素的树的秩定义为0,当两棵秩同为r的树联合时,它们的秩r+1。只使用这个方法将使最坏的运行时间提高至每个MakeSet、Union或Find操作、0(logn)。
优化后的MakeSet
和Union
伪代码:
function MakeSet(x) x.parent := x x.rank := 0 function Union(x, y) xRoot := Find(x) yRoot := Find(y) if xRoot == yRoot return // x和y不在同一个集合,合并它们。 if xRoot.rank < yRoot.rank xRoot.parent := yRoot else if xRoot.rank > yRoot.rank yRoot.parent := xRoot else yRoot.parent := xRoot xRoot.rank := xRoot.rank + 1
优化方法二:路径压缩
第二个优化,称为“路径压缩”,是一种在执行“查找”时扁平化树结构的方法。关键在于在路径上的每个节点都可以直接连接到根上;他们都有同样的表示方法。为了达到这样的效果,Find
递归地经过树,改变每一个节点的引用到根节点。得到的树将更加扁平,为以后直接或者间接引用节点的操作加速。
这儿是Find
:
function Find(x) if x.parent != x x.parent := Find(x.parent) return x.parent
合并两个不相交集合
操作很简单:先设置一个数组(阵列)Father[x],表示x的“父亲”的编号。 那么,合并两个不相交集合的方法就是,找到其中一个集合最父亲的父亲(也就是最久远的祖先),将另外一个集合的最久远的祖先的父亲指向它。
void Union(int x,int y) { fx = getfather(x); fy = getfather(y); if(fy!=fx) father[fx]=fy; }
判断两个元素是否属于同一集合
仍然使用上面的数组。则本操作即可转换为寻找两个元素的最久远祖先是否相同。寻找祖先可以采用递归实现,见后面的路径压缩算法。
bool same(int x,int y) { return getfather(x)==getfather(y); } /*返回true 表示相同根结点,返回false不相同*/
641.并查集-臭虫也疯狂 (10分)
C时间限制:1000 毫秒 | C内存限制:3000 Kb
题目内容:
霍普教授研究臭虫的性取向。实验前他弄清楚了n个臭虫的性别,并在臭虫的背上标了数字编号(1~n)。现在给一批臭虫的编号
配对,要检查里面有没有同性恋。
输入描述
第一行是整数c,下面接着有c个测试用例。
每个测试用例的第一行是臭虫的数目n(1~2000),以及配对的数目m(1~10^6)。接下来的行就是m个配对的臭虫编号.
输出描述
一共c行, 每行打印“testcase i:没有发现同性恋”,或者“testcase i:发现同性恋”
输入样例
2
3 3
1 2
2 3
1 3
4 2
1 2
3 4
输出样例
testcase 1:发现同性恋
testcase 2:没有发现同性恋
思路:
代码1的思路:
这个代码是超时的,3s应该能过,但是1s就超时了,但是我还是想把这个代码放进去
整体思路:pre数组是存你的祖先的,enemy是存你的敌人的
因为性别是雌雄,所以相当于分成两堆臭虫
每输入一组x,y时,判断x,y他们的祖先是否是一样的,也就是说是否在一堆里面,如果在一堆,那么性别相同,所以发现同性恋
如果不相同,if(enemy[x]) join(enemy[x],y); 那么就把enemy[x]和y合在一堆,也就是说x和y是分别的两堆,那么性别一定不相同,enemy[x]也与x性别不相同,就是说enemy[x]与y的性别是相同的,所以合并成一堆,找到enemy[x]的祖先,然后就让enemy[x]的祖先指向y的祖先。
if(enemy[y])一样的理解
最后分别把各自的敌人记录下来。
代码1:
#include<iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
const int maxn = 2001;
int pre[maxn],enemy[maxn];
int find(int x){
return pre[x] == x?x:find(pre[x]);
}
void join(int x,int y){
pre[find(x)] = find(y);
}
bool judge(int x,int y){
return find(x)==find(y);
}
int main()
{
int t;
cin>>t;
for(int i=1;i<=t;i++){
int n,m;
cin>>n>>m;
for(int i=1;i<=n;i++)
pre[i] = i;
memset(enemy,0,sizeof(enemy));//不能掉
bool flag = true;
for(int i=1;i<=m;i++){
int x,y;
scanf("%d%d",&x,&y);
if(judge(x,y)){
flag = false;
}
else{
if(enemy[x]){
join(enemy[x],y);
}
if(enemy[y]){
join(enemy[y],x);
}
enemy[x] = y;
enemy[y] = x;
}
}
printf("testcase %d:",i);
if(!flag)
cout<<"发现同性恋"<<endl;
else
cout<<"没有发现同性恋"<<endl;
}
return 0;
}
思路:
这个代码是没有超时的,这个就很有趣了,当然理解了好久,勉勉强强的懂了
种类并查集:
首先f[i]存储的是自己的祖先,开始时,每个都是一个独立的集合,相当于说祖先就是自己
r[i]存储的是i与f[i]的关系,如果r[i]==0,就是i与f[i]是同性,当r[i]==1时,是异性
种类并查集和基础并查集大致一样,多了两句代码:getf函数中的 r[x] = (r[x] + r[f[x]]) % 2 和 Union函数中的 r[fb] = (r[a]+1-r[b]+2)%2,不用多想,这两句就是种类并查集的关键,所以在这里就重点解释这两句的意思。
getf函数中的 r[x] = (r[x] + r[f[x]]) % 2:
这一句其实是实时更新 r[x], 因为我们知道,在压缩路径的同时,x的直接父节点f[x]可能就会变了(变的话就是变为root),所以r[x]也可能随之改变,怎么变呢?是不是可以这样表示:root->x = root->f[x] + f[x]->x。有可能你会问,root也不一定是f[x]的直接父节点啊,记住,因为路径压缩是递归的,所以在此之前,root已经是f[x]的直接父节点了,所以root->f[x] 这一句是没毛病的。
Union函数中的 r[fb] = (r[a]+1-r[b]+2)%2:
在Union函数中涉及了两种情况:fa == fb,即a,b根节点相同,属于同一棵树,只判断a和b跟根节点的关系是否相同就行了,即r[a] == r[b]。
fa != fb时,分属两棵树,需要将它们联系在一起,做法就是将一个根节点挂在另一个根节点上,即f[fb] = fa,同时更新 r数组的关系,怎么更新?我们的做法是将fb挂在fa上,根据我们定义的关系,可以这样表示 fa->fb = fa->a + a->b + b->fb,翻译过来就是r[fb] = (r[a] + 1 - r[b] + 2) %2,其中 + 1是题目暂时给出的关系,为异性,+2是避免负数。
a->b 为1,因为刚开始输入的时候a和b就是异性的关系,所以为1。
代码2:
#include<iostream>
#include<stdio.h>
using namespace std;
const int maxn = 2001;
int f[maxn],r[maxn];
bool flag;
int getf(int x){
if(x==f[x])
return x;
int t = getf(f[x]);
r[x] = (r[x]+r[f[x]])%2;
f[x] = t;
return t;
}
void Union(int a,int b){
int fa = getf(a);
int fb = getf(b);
if(fa==fb){
if(r[a]==r[b])
flag= false;
return ;
}
f[fb] = fa;;
r[fb] = (r[b]+1-r[a]+2)%2;
}
int main(){
int t;
cin>>t;
for(int i=1;i<=t;i++){
int n,m;
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++){
f[i] = i;
r[i] = 0;
}
flag =true;
int a,b;
for(int i=1;i<=m;i++){
scanf("%d%d",&a,&b);
if(flag) Union(a,b);
}
printf("testcase %d:",i);
if(!flag)
cout<<"发现同性恋"<<endl;
else
cout<<"没有发现同性恋"<<endl;
}
return 0;
}