字符串hash算法
将字符串看成p进制数字,再将结果mod q
例如:abcabcdefg 将字母转换位数字
(1231234567)=(1*p9+2*p8+3*p7+1*p6+2*p5+3*p4+4*p3+5*p2+6*p1+7*p0)%q
=0~q-1
经验值 p=131,1331时,冲突最小
q取2^64(unsigned long long)例如abd
=(124)131
=(1*131^2+2*131^1+4*131^0)
=hash("abd")溢出不用管先预处理出字符串前缀的hash
h[]数组存放字符串的前缀字串
例如 已知hash("abc"),求hash("abcd")
hash("abcd")=hash("abc")*131+4可用h[r] - h[l - 1] * p[r - l + 1]求出【l,r】区间内的任意字串p[]存放q的次方
有N片雪花,每片雪花由六个角组成,每个角都有长度。
第i片雪花六个角的长度从某个角开始顺时针依次记为ai,1,ai,2,…,ai,6ai,1,ai,2,…,ai,6。
因为雪花的形状是封闭的环形,所以从任何一个角开始顺时针或逆时针往后记录长度,得到的六元组都代表形状相同的雪花。
例如ai,1,ai,2,…,ai,6ai,1,ai,2,…,ai,6和ai,2,ai,3,…,ai,6,ai,1ai,2,ai,3,…,ai,6,ai,1就是形状相同的雪花。
ai,1,ai,2,…,ai,6ai,1,ai,2,…,ai,6和ai,6,ai,5,…,ai,1ai,6,ai,5,…,ai,1也是形状相同的雪花。
我们称两片雪花形状相同,当且仅当它们各自从某一角开始顺时针或逆时针记录长度,能得到两个相同的六元组。
求这N片雪花中是否存在两片形状相同的雪花。
输入格式
第一行输入一个整数N,代表雪花的数量。
接下来N行,每行描述一片雪花。
每行包含6个整数,分别代表雪花的六个角的长度(这六个数即为从雪花的随机一个角顺时针或逆时针记录长度得到)。
同行数值之间,用空格隔开。
输出格式
如果不存在两片形状相同的雪花,则输出:
No two snowflakes are alike.
如果存在两片形状相同的雪花,则输出:
Twin snowflakes found.
数据范围
1≤n≤1000001≤n≤100000,
0≤ai,j<100000000≤ai,j<10000000
输入样例:
2
1 2 3 4 5 6
4 3 2 1 6 5
输出样例:
Twin snowflakes found.
#include <iostream> #include<algorithm> #include<cstring> using namespace std; const int maxn = 100000+2; int snows[maxn][6]; int snow[6],isnow[6],indx[maxn]; void get_min(int a[])//字符串的最小表示 { static int b[12]; for(int i=0;i<12;i++) { b[i] = a[i%6]; } int i=0,j=1,k; while(i<6&&j<6) { for(k=0;k<6&&b[i+k]==b[j+k];k++); if(k==6) break; if(b[i+k]>b[j+k]) { i+=k+1; if(i==j) i++; } else { j+=k+1; if(i==j) j++; } } k=min(i,j); for(int i=0;i<6;i++) a[i]=b[i+k]; } bool cmp1(int a[],int b[]) { for(int i=0;i<6;i++) { if(a[i]>b[i]) return false; else if(a[i]<b[i]) return true; } return false; } bool cmp2(int a,int b) { for(int i=0;i<6;i++) { if(snows[a][i]<snows[b][i]) return true; else if(snows[a][i]>snows[b][i]) return false; } return false; } int main() { int n; cin >> n; for(int i=0;i<n;i++) { for(int j=0,k=5;j<6;j++,k--) { scanf("%d",&snow[j]); isnow[k]=snow[j]; } // cout << 1 << endl; get_min(snow); get_min(isnow); if(cmp1(snow,isnow)) memcpy(snows[i],snow,sizeof snow); else memcpy(snows[i],isnow,sizeof isnow); indx[i]=i; } sort(indx,indx+n,cmp2); int flag=0; for(int i=1;i<n;i++) { if(!cmp2(indx[i],indx[i-1])&&!cmp2(indx[i-1],indx[i])) { cout << "Twin snowflakes found." << endl; flag=1; break; } } if(!flag) { cout << "No two snowflakes are alike." << endl; } return 0; }
很久很久以前,森林里住着一群兔子。
有一天,兔子们想要研究自己的 DNA 序列。
我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。
然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。
注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤10000001≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
#include<iostream> #include<string.h> #include<cstdio> using namespace std; const int MAXN = 1000000 + 2; const int base = 131; char str[MAXN]; int p[MAXN];//p[i]存放base的次方 int h[MAXN]; int get1(int x,int y) { return h[y] - h[x - 1] * p[y - x + 1]; } int main() { scanf("%s", str + 1); int num = strlen(str + 1); int m; cin >> m; p[0] = 1; for (int i = 1; i <= num; i++) { h[i] = h[i - 1] * base + str[i] - 'a' + 1; p[i] = p[i - 1] * base; } while (m--) { int l1, l2, r1, r2; cin >> l1 >> r1 >> l2 >> r2; if (get1(l1, r1) == get1(l2, r2)) cout << "Yes" << endl; else cout << "No" << endl; } return 0; }
如果一个字符串正着读和倒着读是一样的,则称它是回文的。
给定一个长度为N的字符串S,求他的最长回文子串的长度是多少。
输入格式
输入将包含最多30个测试用例,每个测试用例占一行,以最多1000000个小写字符的形式给出。
输入以一个以字符串“END”(不包括引号)开头的行表示输入终止。
输出格式
对于输入中的每个测试用例,输出测试用例编号和最大回文子串的长度(参考样例格式)。
每个输出占一行。
输入样例:
abcbabcbabcba
abacacbaaaab
END
输出样例:
Case 1: 13
Case 2: 6
#include <iostream> #include<string.h> #include<cmath> #include<cstdio> #define ull unsigned long long using namespace std; const int maxn = 2000005; const int base = 131; ull p[maxn]; char str[maxn]; ull h1[maxn],h2[maxn]; ull get(ull h[],int l,int r) { return h[r]-h[l-1]*p[r-l+1]; } int main() { int t=1; while(scanf("%s",str+1),strcmp(str+1,"END")) { int n = strlen(str+1); for(int i= n *2 ;i;i-=2) { str[i]=str[i/2]; str[i-1]= 'z' + 1; } n*=2; p[0]=1; for(int i=1,j=n;i<=n;i++,j--) { h1[i] = h1[i-1]*base+str[i]-'a'+1; h2[i] = h2[i-1]*base+str[j]-'a'+1; p[i]=p[i-1]*base; } int res = 0; for(int i=1;i<=n;i++) { int l=0,r=min(i-1,n-i); while(l<r) { int mid=l+r+1>>1; if(get(h1,i-mid,i-1)!=get(h2,n-(i+mid)+1,n-(i+1)+1)) { r=mid-1; } else { l=mid; } } if(str[i-l]<='z') res=max(res,l+1); else res=max(res,l); } printf("Case %d: %d ",t++,res); } return 0; }