真实脑洞题
因为通配符所以导致t串实际有指数级别个,任何字符串相关算法都没有用
考虑一个新的匹配方法:设a串(模板串)长为n,从m串的i位置开始匹配:( sum_{i=0}{n-1}(a[j]-b[i+j])2a[j] )
这个东西只有在从i开始的长为n的a串子串与b串完全匹配的时候才为0,因为首先如果两个字符相同,差的平方和才为0,令t中的'?'值为0,这样某一位为0就是这一位的字符匹配上或者a串的这一位通配
然后考虑优化这个n^2的东西
[c[i]=sum_{i=0}^{n-1}(a[j]-b[i+j])^2a[j]
]
[=sum_{i=0}^{n-1}a[j]^3+a[j]b[i+j]^2-2a[j]^2b[i+j]
]
[=sum_{i=0}^{n-1}a[j]^3+sum_{i=0}^{n-1}a[j]b[i+j]^2-2sum_{i=0}^{n-1}a[j]^2b[i+j]
]
前面的是常数,所以我们只需要考虑快速计算形如( sum_{i=0}^{n-1}a[j]b[i+j] ) 的东西即可,设na nb分别是a b数组倒过来(也就是reverse一下)
[sum_{i=0}^{n-1}a[j]b[i+j]
]
[=sum_{i=0}^{n-i-1}a[j]b[i+j]+sum_{i=n-i}^{n-1}a[j]b[i+j]
]
[=sum_{i=0}^{n-i-1}a[j]nb[n-i-1-j]+sum_{i=0}^{i-1}a[n-i+j]b[n+j]
]
[=sum_{i=0}^{n-i-1}a[j]nb[(n-i-1)-j]+sum_{i=0}^{i-1}na[(i-1)-j]b[n+j]
]
这样就两部分卷积可以用FFT优化了
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
using namespace std;
const int N=500005;
int n,m,bt,lm,re[N],tot;
double ans[N],sm;
char s[N],t[N];
struct cd
{
double a,b;
cd(double A=0,double B=0)
{
a=A,b=B;
}
cd operator + (const cd &x) const
{
return cd(a+x.a,b+x.b);
}
cd operator - (const cd &x) const
{
return cd(a-x.a,b-x.b);
}
cd operator * (const cd &x) const
{
return cd(a*x.a-b*x.b,a*x.b+b*x.a);
}
}a[N],b[N],a2[N],b2[N],na[N],nb[N],na2[N],nb2[N];
void dft(cd a[],int f)
{
for(int i=0;i<lm;i++)
if(i<re[i])
swap(a[i],a[re[i]]);
for(int i=1;i<lm;i<<=1)
{
cd wi=cd(cos(M_PI/i),f*sin(M_PI/i));
for(int k=0;k<lm;k+=(i<<1))
{
cd w=cd(1,0),x,y;
for(int j=0;j<i;j++)
{
x=a[j+k],y=w*a[i+j+k];
a[j+k]=x+y,a[i+j+k]=x-y;
w=w*wi;
}
}
}
if(f==-1)
for(int i=0;i<lm;i++)
a[i].a/=lm;
}
void fft(cd a[],cd b[])
{
dft(a,1);
dft(b,1);
for(int i=0;i<lm;i++)
a[i]=a[i]*b[i];
dft(a,-1);
}
int main()
{
scanf("%s%s",s,t);
m=strlen(s),n=strlen(t);
for(int i=0;i<n;i++)
a[i].a=(t[i]=='?')?0:t[i]-'a'+1,a2[i].a=a[i].a*a[i].a,sm+=a[i].a*a[i].a*a[i].a;
for(int i=0;i<m;i++)
b[i].a=s[i]-'a'+1,b2[i].a=b[i].a*b[i].a;
for(int i=0;i<m;i++)
na[i]=a[m-i-1],nb[i]=b[m-i-1],na2[i]=a2[m-i-1],nb2[i]=b2[m-i-1];
for(bt=0;(1<<bt)<=2*m;bt++);
lm=1<<bt;
for(int i=0;i<lm;i++)
re[i]=(re[i>>1]>>1)|((i&1)<<(bt-1));
fft(a,nb2);
fft(b2,na);
fft(a2,nb);
fft(b,na2);
for(int i=0;i<=m-n;i++)
{
ans[i]=sm+(int)(a[m-i-1].a+0.5)-2*(int)(a2[m-i-1].a+0.5);
if(i>0)
ans[i]+=(int)(b2[i-1].a+0.5)-2*(int)(b[i-1].a+0.5);
tot+=(ans[i]==0);
}
printf("%d
",tot);
for(int i=0;i<=m-n;i++)
if(ans[i]==0)
printf("%d ",i);
return 0;
}