这题是用线段树解决区间问题,看了两天多,算是理解一点了。
Description
LogLoader, Inc. is a company specialized in providing products for analyzing logs. While Ikki is working on graduation design, he is also engaged in an internship at LogLoader. Among his tasks, one is to write a module for manipulating time intervals, which have confused him a lot. Now he badly needs your help.
In discrete mathematics, you have studied several basic set operations, namely union, intersection, relative complementation and symmetric difference, which naturally apply to the specialization of sets as intervals.. For your quick reference they are summarized in the table below:
Ikki has abstracted the interval operations emerging from his job as a tiny programming language. He wants you to implement an interpreter for him. The language maintains a set S, which starts out empty and is modified as specified by the following commands:
Input
The input contains exactly one test case, which consists of between 0 and 65,535 (inclusive) commands of the language. Each command occupies a single line and appears like
X T
where X is one of ‘U’, ‘I’, ‘D’, ‘C’ and ‘S’ and T is an interval in one of the forms (a,b), (a,b], [a,b) and [a,b] (a, b ∈ Z, 0 ≤ a ≤ b ≤ 65,535), which take their usual meanings. The commands are executed in the order they appear in the input.
End of file (EOF) indicates the end of input.
Output
Output the set S as it is after the last command is executed as the union of a minimal collection of disjoint intervals. The intervals should be printed on one line separated by single spaces and appear in increasing order of their endpoints. If S is empty, just print “empty set” and nothing else.
Sample Input
U [1,5]
D [3,3]
S [2,4]
C (1,5)
I (2,3]
Sample Output
(2,3)
大意就是刚开始集合S为空,输出经过一些操作后的集合S。
说实话刚开始看胡浩大牛精炼的解释没看懂。他的代码里都没有建树的过程。不是线段树的题吗?树呢?怎么没有看到Build()函数?慢慢才发现,树就在无形之中啊!先来看怎么处理这些集合操作:
初始时集合S为空,假设所有区间都为0代表不在集合S里面,区间赋值为1代表区间在S里面,区间赋值为-1代表区间有一部分在有一部分不在S里面,
U:并集操作,这个好说,直接把读入的区间[l,r]置为1,表示并入集合S。
I:交集操作,S ∩T,T=[l,r]。这里就需要考虑一下,既然是交集,就是公共部分,容易想直接把[l,r]置成1,但是显然这是不对的,这样就是并的操作了。考虑一个例子帮助理解:S=[2,5],T=[3,6]。所以S ∩T=[3,5]。因为S、T有不相交的部分,所以可以采用类似补集或者对立面的想法,我既然不能直接把T区间赋值,那就看看能不能把T的补集赋值,可以想到,这时应该把[-∞,l),(r,+∞]赋值为0。那么剩下的必然会包括S ∩T。
D:S=S-T。从S中去掉T区间,简单,直接T区间赋值为0。
C:S=T-S。这个和D操作正好相反。是从T中去掉S。根据上面的例子,可以想到:应该把[-∞,l),(r,+∞]赋值为0,[l,r]区间0/1互换。互换后要保证结果正确需要用到下面说到的xor(异或)
S:S=S⊕T。这个相当于C+D。还是用上面的例子,S=[2,5],T=[3,6]。刚开始S区间是赋值1的,T区间是赋值0的。这个操作相当于求S、T并的部分减去交的部分。那么我其实就可以把T与S交的部分变成0,不交的部分置成1.所以可以直接把[l,r]区间0/1互换。
下面来考虑怎样处理区间开闭问题,其实想想要是在每次操作还要考虑区间开闭的话会很麻烦。所以每次读入数据就把区间*2,若左开就左++,右开就右减减。比如区间本来是(2,4]变成[5,8],[2,4)变成[4,7],这样区间的开闭就有端点的奇偶性来表示了,也可以理解为一种映射吧,最后输出结果时只需要按照操作反向输出就好了。
最后,代码需要开一个cover[]数组记录区间状态(1,0,-1),关于异或操作,就可以另开一个Xor[]数组记录。这两个其实都相当于lazy标记,而它们也正是这棵无形的线段树!我觉得这比基础的线段树直接高了一个档次,还需要好多时间去理解线段树!而且正好这道题给定a,b在[0,65535]范围内,那么区间扩倍就是65535*2,所以存储[0,65535]区间最终状态的bo[]数组只需开到65535*2,cover[]数组、Xor[]数组只需开到65536*2*4,竟是如此精确!
记录一下自己一直很迷惑的地方:就是为什么Update()函数中在完全包含区间内有异或操作时(Fxor()函数)只有cover[rt]!=-1时才执行异或操作,否则异或Xor[rt]。cover[rt]!=-1时执行异或很显然,因为这时这段区间不是0就是1,直接异或就可以,而cover[rt]=-1时,首先应该知道-1xor1=-2,这道题cover[]根本不会等于-2,再说这样xor出来的值无法代表下面区间到底是1还是0,所以此时需要的操作是Xor[rt]^=1,举例说明:比如当前rt代表[1,10],且cover[rt]=-1,也就是[1,10]区间有0也有1,如果直接想把[1,10]里面0/1互换,直接cover[rt]^=1根据上面可知是不行的,但是要是Xor[rt]^=1就完美解决了问题。因为此时不管原来[1,10]中Xor[rt]为0还是为1,对它异或一下就相当于互换了所表示区间的0/1值。这样也就可以理解了为什么在PushDown()下方标记时先看cover[rt]是否为-1,再看Xor[rt]是否需要异或。当cover[rt]=-1且Xor[rt]=1时,说明这段区间需要异或且区间内有0也有1,所以再继续看这个区间的左右区间cover[]标记,不为-1直接异或,否则还是异或子区间的Xor[]标记......,这就相当于标记下推了嘛。(其实应该不难理解,就是自己一直没有往深处再想想,而且看别人解释时只看到了表面)
还有其它的一些细节可以参考以下博客:http://blog.csdn.net/harlow_cheng/article/details/52483783,这位博主写的非常详细,无需我多言了。
代码注释好多也是直接用的他的,一小部分是我新加的,在此感谢那位博主~:
1 #include<cstdio> 2 #include<cstring> 3 #define mid int m=(l+r)>>1//宏定义什么的,使程序简练些 4 #define lson l,m,rt<<1 5 #define rson m+1,r,rt<<1|1 6 using namespace std; 7 const int maxn = 65536 * 2;//树的大小,此题真的是无形建树,最为致命! 8 int cover[maxn << 2], Xor[maxn << 2];//两个lazy标签,一个表示当前区间所处状态:全在集合中(1),全不在集合中(0),有的在有的不在(-1);另一个b表示当前区间是否需要异或 9 int bo[maxn+10]; 10 11 void Fxor(int rt)//异或操作 12 { 13 if (cover[rt] != -1)//如果这个区间之前已经被整个覆盖了值。 14 cover[rt] ^= 1;//那么就直接在覆盖值上异或一下就可以了。 15 else//如果之前没有覆盖值。 16 Xor[rt] ^= 1;//那么就在它的异或标记上进行操作。 17 } 18 19 void PushDown(int rt) 20 { 21 if (cover[rt] != -1)//如果这个节点整个被覆盖了某个值 22 { 23 cover[rt << 1] = cover[rt << 1 | 1] = cover[rt];//那么就把覆盖的值整个往儿子们传递。 24 Xor[rt << 1] = Xor[rt << 1 | 1] = 0;//因为覆盖了值。所以之前的异或标记也就没有意义了。直接置为0; 25 cover[rt] = -1;//之后可能会对这个节点所代表的区间进行操作。所以它不再是确定的了。 26 } 27 else if (Xor[rt]>0) {//如果被覆盖了某个值,那么就不可能有异或标记的所以这里写的是else ,如果这个节点所代表的区间需要被异或。 28 if (cover[rt << 1] != -1) {//如果左区间被完全覆盖了某个值 29 cover[rt << 1] ^= 1;//那么就把覆盖的值异或 30 } 31 else 32 Xor[rt << 1] ^= 1;//如果没有被完全覆盖,则把异或标记异或一下。 33 if (cover[rt << 1 | 1] != -1) {//右区间同理。 34 cover[rt << 1 | 1] ^= 1; 35 } 36 else 37 Xor[rt << 1 | 1] ^= 1; 38 Xor[rt] = 0;//然后这个节点的异或标记重置一下。 39 } 40 } 41 42 void Update(char op, int L, int R, int l, int r, int rt)//操作符是op,当前节点rt所代表的区间是L,R。然后 43 {//所要操作的区间是(l,r) 44 if (L <= l&&r <= R) //如果这个节点的区间整个被覆盖在所需要操作的区间内。 45 { 46 if (op == 'U') {//如果是并集操作 47 cover[rt] = 1; Xor[rt] = 0;//直接把这一段覆盖为1 48 } 49 else if (op == 'D') {//如果是D操作,则直接把这段区间覆盖为0.x属于S且x不属于T 50 cover[rt] = 0; Xor[rt] = 0; 51 } 52 else if (op == 'C' || op == 'S') { //这是两个需要把操作区间整个异或的操作。 53 Fxor(rt); 54 } 55 return;//进行标记之后就不要往下走了。直接结束。 56 } 57 PushDown(rt);//处理这个节点的懒惰标记。 58 mid;//取得中点 59 if (L <= m) Update(op, L, R, lson);//往左逼近那个交集区间。 60 else if (op == 'I' || op == 'C') {//如果左儿子所代表的区间完全不在所求的区间内,则按照操作判断是否置0。 61 cover[rt << 1] = Xor[rt << 1] = 0; 62 } 63 if (R>m) Update(op, L, R, rson);//往右逼近交集区间 64 else if (op == 'I' || op == 'C') {//右儿子同理。 65 cover[rt << 1 | 1] = Xor[rt << 1 | 1] = 0; 66 } 67 } 68 69 void Query(int l, int r, int rt) 70 { 71 if (cover[rt] == 1)//如果当前到的这个节点被完全覆盖了 72 { 73 for (int i = l; i <= r; i++)//就标记这个区间都在集合内。 74 bo[i] = true; 75 return; 76 } 77 else if (cover[rt] == 0) return;//如果全部不覆盖则退出 78 //注意!!如果cover[rt]==-1,是不能退出的,还要往下找,找到能够一概而论的节点。 79 if (l == r) return;//如果左右断点都相同了则结束。 80 PushDown(rt);//处理懒惰标记什么的。 81 mid; 82 Query(lson); 83 Query(rson); 84 } 85 86 int main() 87 { 88 char op, l, r;//操作符 左括号 右括号 89 int a, b; 90 cover[1] = Xor[1] = 0;//相当于两个lazy标签,初始时集合为空,且没有标记,所以都设为0 91 while (~scanf(" %c %c%d,%d%c", &op, &l, &a, &b, &r))//读入数据,用空白符去掉回车符 92 { 93 a = a << 1; b = b << 1;//区间扩倍 94 if (l == '(') a++;//处理开区间 95 if (r == ')') b--;//同上 96 if (a>b) {//处理例如(1,1)这样的空集 97 if (op == 'I' || op == 'C')//'I'、'C'操作有处理补集的,空集的补集就是全集 98 cover[1] = Xor[1] = 0;//相当于整棵树被初始化 99 } 100 else Update(op, a, b, 0, maxn, 1);//否则更新树 101 } 102 memset(bo, false, sizeof(bo));//标记某个位置是否在集合内 103 Query(0, maxn, 1);//查询那些点在集合中 104 bool flag = false;//判断是否要输出空格,可能有多个区间 105 int s = -1, e; 106 for (int i = 0; i <= maxn; i++)//扫描整个区间 107 { 108 if (bo[i]) {//如果点在集合内 109 if (s == -1) s = i;//是起点就记录 110 e = i; 111 } 112 else if (s != -1) {//如果遇到了一个不在集合内的点就判断之前是不是找到了连续的点组成了集合 113 if (flag) printf(" ");//如果之前已经输出过答案了则要输出空格 114 flag = true;//记录已经找到一个集合了。 115 printf("%c%d,%d%c", s & 1 ? '(' : '[', s >> 1, (e + 1) >> 1, e & 1 ? ')' : ']'); 116 s = -1;//如果两端的端点某一个是奇数,则就是开区间,然后根据输入时的规则逆向想一下。然后除2就可以了。 117 } 118 } 119 if (!flag)//如果都没输出过集合。那就是空集了。 120 printf("empty set"); 121 return 0; 122 }
这里记录一下那个博主写的题解,万一博客关闭了呢>_<.
【题解】 这题要用线段树来解。具体的解法: U:因为是求并集。所以只要在原来S的基础上把(l,r)区间全部覆盖(置为1)就可以了。 I:求交集,X属于S,且X属于T,那只需要把除了(l,r)之外的所有区间都置为0就可以了。 D:X属于S,且X不属于T,则只要把(l,r)这个区间全部置为0就可以了。 C:X属于T,且X不属于S,这个有点麻烦,首先要把除了(l,r)的全部置为0,然后把(l,r)这段区间的0改为1,1改为0;这样才能满足要求; S:其实S就是C+D的升级版。(X属于T且X不属于S)并上(X属于S且X不属于T),前者和C一样,然后后者和D一样,那么就只要进行C的后半部分操作就可以了。即只要把(l,r)这段区间的0改为1,1改为0就行了。 具体的做法: 【1】 一开始读入数据的时候,不管读入的区间a,b的括号是怎么样的。 都先乘上2 然后如果左括号是开区间 则a++; 如果右括号是开区间。 则b--; 最后输出区间的时候如果端点是奇数则是开区间; 然后对于左端点除2再输出即可,对于右端点则需要先加上1再除2. 【2】 设cover[rt]表示rt这个节点所代表的区间是否在集合中。 如果 cover[rt]==1,表示rt这个节点所代表的区间全部在集合中。 cover[rt] == 0,表示rt这个节点所代表的区间全部都不在集合中。 cover[rt]==-1,表示rt这个节点所代表的区间不能一概而论(有些可能在,有些可能不在)。 设XOR[rt]表示rt这个节点是否要进行异或操作。 【3】 当发现rt这个节点所代表的区间在所需要覆盖的区间范围内的时候。 先查看一下操作是什么。 如果是覆盖操作(即全部置为0或全部置为1),那么异或操作就没有意义了。 因为不管你之前怎么异或。我当前都只要把它改成一个特定的值了。 那么重新记录一下cover[rt]==需要覆盖的值。 然后XOR[rt]置为0,表示不需要再进行异或操作了。 然后如果是异或操作。 则需要看一下cover[rt]是不是-1,如果cover[rt]是-1,则说明这段区间没有被全部覆盖成相同的值。那么就只需要对XOR[rt]进行一下异或就行了。具体的如果XOR[rt]当前是1,就改为0,如果是0就改为1; 可以XOR[rt]^=1,又或者写成XOR[rt] = 1-XOR[rt]; 然后如果cover[rt]不是-1,就说明这段区间被覆盖了相同的值。那么异或一下就可以了。 即cover[rt]^=1 (或者cover[rt]=1-cover[rt]); 然后直接退出当前的递归。 这些数据可以作为懒惰标记使用。 【4】 紧接着我们需要处理懒惰标记。 如果当前这个节点的cover值不为-1,就说明整个区间都会被覆盖成相同的值。那么这个时候异或标记是肯定为0的。因为如果cover标记存在,那么异或操作就不会对XOR数组进行操作了。这样的话,就只需要把两个儿子节点覆盖成和父亲节点一样的值就可以了。 然后把cover[rt]改为-1,表示下面已经不确定了。(因为如果访问了这个节点,我们可能就会对这个节点下面的部分进行修改了,不能够一概而论了。); 然后如果这个节点的cover值为-1,就看一下异或标记是否大于0,如果大于0; 则对儿子节点进行相同的判断(判断是否cover[儿子]为-1....);然后把异或标记置为0; 【5】 还有一个问题就是如何把区间外的部分置为0? 可以这样 在进行成段更新的时候 m=(begin+end)>>1; 正常情况下我们这样写 if ( l <= m) updata(l,r,num,begin,end,rt<<1); if (m <r) updata(l,r,num,m+1,end,rt<<1|1); 我们这样写是为了不断地逼近有交集的那个部分。 但是 if (l >m) 则说明,我们索要求的l,r区间完全在左儿子所代表的区间的右边。 那么我们就可以在特定需要的情况下进行一个操作即 cover[rt<<1] == 0,XOR[rt<<1] =0; 这样就完成了对不在所操作的区间内的区间的覆盖0问题;右儿子也同理。所以代码就变成这样了。 int m = (begin + end) >> 1; if (l <= m) updata(op, l, r, begin, m, rt << 1); else if (op == 'I' || op == 'C') cover[rt << 1] = XOR[rt << 1] = 0; if (m < r) updata(op, l, r, m + 1, end, rt << 1 | 1); else if (op == 'I' || op == 'C') cover[rt << 1 | 1] = XOR[rt << 1 | 1] = 0;