题意:
我们给定一组DNA序列(只含ACGT),其中部分位置用N表示为一个不确定的核苷酸,我们规定范式-X,表示按照字典序下降次数不超过x的DNA序列,给定一个长M的未确定DNA序列,输出将序列确定下来后范式-K中第R大的序列
范围&性质:
(1le Mle 5 imes10^4,1le Kle 10,1le Rle 2 imes 10^{12}),保证未完成序列在范式-K形式下总数不超过(4 imes10^{18})
分析:
记(f[i][j][k])表示从(i)往后划分成(j)段,第(i)个位置是(k)的方案数,从后向前转移统计后缀的影响,然后按位枚举,枚举含(N)的位置填什么,使方案数恰好等于(R)时输出
代码:
#include<bits/stdc++.h>
using namespace std;
namespace zzc
{
typedef long long ll;
const int maxn = 5e4+5;
ll m,k,r;
ll nw[maxn],f[maxn][20][5];
map<char,ll> s;
char ch[maxn];
void work()
{
s['A']=1;s['C']=2;s['G']=3;s['T']=4;s['N']=0;
scanf("%lld%lld%lld",&m,&k,&r);
scanf("%s",ch+1);
for(ll i=1;i<=m;i++) nw[i]=s[ch[i]];
if(nw[m]) f[m][1][nw[m]]=1;
else
{
for(int i=1;i<=4;i++) f[m][1][i]=1;
}
for(int i=m-1;i>=1;i--)
{
for(int x=1;x<=4;x++)
{
if(!nw[i]||nw[i]==x)
{
for(int j=1;j<=k;j++)
{
for(int y=1;y<=4;y++)
{
f[i][j][x]+=f[i+1][j-(x>y)][y];
}
}
}
}
}
for(int i=1;i<=m;i++)
{
for(int j=1;j<=k;j++)
{
for(int x=1;x<=4;x++)
{
f[i][j][x]+=f[i][j-1][x];
}
}
}
int lst=0;
for(int i=1;i<=m;i++)
{
if(nw[i])
{
printf("%c",ch[i]);
k-=(nw[i]<lst);
lst=nw[i];
}
else
{
int now=1;
while(now<=4&&r>f[i][k-(now<lst)][now])
{
r-=f[i][k-(now<lst)][now];
now++;
}
k-=(now<lst);
if(now==1) printf("A");
else if(now==2) printf("C");
else if(now==3) printf("G");
else if(now==4) printf("T");
lst=now;
}
}
}
}
int main()
{
zzc::work();
return 0;
}