浅谈莫队
借用题目: bzoj 2038 2009 国家集训队 小Z的袜子http://www.lydsy.com/JudgeOnline/problem.php?id=2038
[2009国家集训队]小Z的袜子(hose) http://www.lydsy.com/JudgeOnline/problem.php?id=2038 Time Limit: 20 Sec Memory Limit: 259 MB Description 作为一个生活散漫的人,小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿。终于有一天,小Z再也无法忍受这恼人的找袜子过程,于是他决定听天由命…… 具体来说,小Z把这N只袜子从1到N编号,然后从编号L到R(L 尽管小Z并不在意两只袜子是不是完整的一双,甚至不在意两只袜子是否一左一右,他却很在意袜子的颜色,毕竟穿两只不同色的袜子会很尴尬。 你的任务便是告诉小Z,他有多大的概率抽到两只颜色相同的袜子。当然,小Z希望这个概率尽量高,所以他可能会询问多个(L,R)以方便自己选择。 Input 输入文件第一行包含两个正整数N和M。N为袜子的数量,M为小Z所提的询问的数量。接下来一行包含N个正整数Ci,其中Ci表示第i只袜子的颜色,相同的颜色用相同的数字表示。再接下来M行,每行两个正整数L,R表示一个询问。 Output 包含M行,对于每个询问在一行中输出分数A/B表示从该询问的区间[L,R]中随机抽出两只袜子颜色相同的概率。若该概率为0则输出0/1,否则输出的A/B必须为最简分数。(详见样例) Sample Input 6 4 1 2 3 3 3 2 2 6 1 3 3 5 1 6 Sample Output 2/5 0/1 1/1 4/15 【样例解释】 询问1:共C(5,2)=10种可能,其中抽出两个2有1种可能,抽出两个3有3种可能,概率为(1+3)/10=4/10=2/5。 询问2:共C(3,2)=3种可能,无法抽到颜色相同的袜子,概率为0/3=0/1。 询问3:共C(3,2)=3种可能,均为抽出两个3,概率为3/3=1/1。 注:上述C(a, b)表示组合数,组合数C(a, b)等价于在a个不同的物品中选取b个的选取方案数。 【数据规模和约定】 30%的数据中 N,M ≤ 5000; 60%的数据中 N,M ≤ 25000; 100%的数据中 N,M ≤ 50000,1 ≤ L < R ≤ N,Ci ≤ N。
莫队算法
本方法由莫涛提出,故尊称为莫队算法
使用前提:
1、离线操作
2、若已知[l,r]内的答案,可以在O(1)时间内得到[l-1,r],[l+1,r],[l,r-1],[l,r+1]的答案,即可使用莫队算法,时间复杂度O(n^1.5)。
若可在O(logn)内移动区间,时间复杂度则为O(n^1.5*logn)
个人理解:
莫队算法本质是分块
通过左右指针的移动避免了重复状态的计算
就本题来说
,
sum表示区间内数i的出现次数
那么∑sum[i]=r-l+1
2*(r-l+1)!
分母= ----------- = (r-l)*(r-l+1)
2!*(r-l-1) !
可以O(1)解决
那么就差∑sum[i]²
本题满足离线操作,如果我们能证明∑sum[i]²可以O(1)或O(logn)求出来,就可以使用莫队算法
由此图可以看出,满足前提条件2
所以我们可以使用莫队算法
还有,如果先询问[1,n],再问[1,1],再问[n,n],时间复杂度不还是n²吗
所以,为了避免指针在整个序列中移动,我们需要分块
因为分块保证了莫队算法的时间复杂度
如何分块?
令块的大小为根号n
先根据询问区间左端点所在块,从小到大排,这样就将整个操作序列划分为了根号n块
对于每个块内的询问,根据右端点从小到大排
然后我们从左到右顺序计算每个询问的答案
这样可以保证时间复杂度为O(n^1.5)
时间复杂度分析:
A.左端点
1.块内的,由于块的大小为根号n,所以同一块内左端点一次询问最多移动根号n,即n^0.5次,m次询问总移动O(n*n^0.5)=O(n^1.5)
2、不在同一块内的,以为块的大小为n^0.5,所以跨越一次最多加上O(n^0.5),最多能跨越(n^0.5)次,所以跨越块导致左端点最多加上O(n)
所以左端点总的移动次数为O(n^1.5)+O(n)
B.右端点
1、块内的,右端点最多从1移动到n,有根号n个块,所以右端点最多移动O(n^1.5)次
2、跨越块的,最多跨越个根号n次,每次跨越最多移动n次,所以右端点最多移动 O(n^1.5)
所以右端点总移动次数为O(n^1.5)+O(n^1.5)
所以时间复杂度为O(n^1.5)
#include<cstdio> #include<algorithm> #include<cmath> using namespace std; int col[50001]; struct node { int l,r,id,pos; long long a,b; }e[50001]; int n,m,S; long long h,ans,sum[50001]; bool cmp(node p,node q) { if(p.pos!=q.pos) return p.pos<q.pos; return p.r<q.r; } bool id(node p,node q) { return p.id<q.id; } void update(int x,int k) { ans-=sum[col[x]]*sum[col[x]]; sum[col[x]]+=k; ans+=sum[col[x]]*sum[col[x]]; } long long gcd(long long a,long long b) { return b==0 ? a:gcd(b,a%b); } void solve() { int l=1,r=0; for(int i=1;i<=m;i++) { while(l<e[i].l) update(l++,-1); while(l>e[i].l) update(--l,1); while(r<e[i].r) update(++r,1); while(r>e[i].r) update(r--,-1); e[i].a=ans-(r-l+1); e[i].b=1ll*(r-l)*(r-l+1); h=gcd(e[i].a,e[i].b); e[i].a/=h;e[i].b/=h; } } int main() { scanf("%d%d",&n,&m); S=sqrt(n); for(int i=1;i<=n;i++) scanf("%d",&col[i]); for(int i=1;i<=m;i++) { scanf("%d%d",&e[i].l,&e[i].r); e[i].id=i; e[i].pos=(e[i].l-1)/S+1; } sort(e+1,e+m+1,cmp); solve(); sort(e+1,e+m+1,id); for(int i=1;i<=m;i++) printf("%lld/%lld ",e[i].a,e[i].b); }
小细节:l最初从1开始,r从0开始
因为l最开始一定小于e[i].l,这种情况下先计算l,在自加
r最开始一定小于e[i].r,这种情况下先自加,再计算