数位DP的算法思想
-
数位DP放弃了原来数要从1连续枚举到N逐个检查合法性的思想,而是专注于数本身的字符串构成特性
-
对于每一种限制条件,dp数组都设置了一维表示。比如dp[pos][s1][s2]...[sn].表示在pos位置下,之前限制条件s1 s2 ... sn的状态,当枚举当前pos处的数字i时,状态s1 s2 ... sn 以及 i是否会失去合法性。若该状态不合法,及时剪枝。
-
采用记忆化搜索的方法,从高位向低位搜索,每搜索一步更新当前字串的状态(即与限制条件的关系),直到搜索完最后一位,根据当前状态是否与限制条件相矛盾来决定是否贡献答案。
-
若某种状态已经计算出来,并且是合法的,则无需再搜索,直接返回计算结果
-
算法步骤
typedef long long ll;
int a[20];
ll dp[20][state];//不同题目状态不同
ll dfs(int pos,/*state变量*/,bool lead/*前导零*/,bool limit/*数位上界变量*/)//不是每个题都要判断前导零
{
//递归边界,既然是按位枚举,最低位是0,那么pos==-1说明这个数我枚举完了
if(pos==-1) return 1;/*这里一般返回1,表示你枚举的这个数是合法的,那么这里就需要你在枚举时必须每一位都要满足题目条件,也就是说当前枚举到pos位,一定要保证前面已经枚举的数位是合法的。不过具体题目不同或者写法不同的话不一定要返回1 */
//第二个就是记忆化(在此前可能不同题目还能有一些剪枝)
if(!limit && !lead && dp[pos][state]!=-1) return dp[pos][state];
/*常规写法都是在没有限制的条件记忆化,这里与下面记录状态是对应,具体为什么是有条件的记忆化后面会讲*/
int up=limit?a[pos]:9;//根据limit判断枚举的上界up;这个的例子前面用213讲过了
ll ans=0;
//开始计数
for(int i=0;i<=up;i++)//枚举,然后把不同情况的个数加到ans就可以了
{
if() ...
else if()...
ans+=dfs(pos-1,/*状态转移*/,lead && i==0,limit && i==a[pos]) //最后两个变量传参都是这样写的
}
//计算完,记录状态
if(!limit && !lead) dp[pos][state]=ans;
/*这里对应上面的记忆化,在一定条件下时记录,保证一致性,当然如果约束条件不需要考虑lead,这里就是lead就完全不用考虑了*/
return ans;
}
ll solve(ll x)
{
int pos=0;
while(x)//把数位都分解出来
{
a[pos++]=x%10;
x/=10;
}
return dfs(pos-1/*从最高位开始枚举*/,/*一系列状态 */,true,true);//刚开始最高位都是有限制并且有前导零的,显然比最高位还要高的一位视为0而且是有限制的
}
int main()
{
ll le,ri;
while(~scanf("%lld%lld",&le,&ri))
{
//初始化dp数组为-1,这里还有更加优美的优化,后面讲
printf("%lld
",solve(ri)-solve(le-1));
}
}
入门例题
- HDU 2089 求区间[l,r]内不要62也不要4的数的个数
#include<iostream>
#include<queue>
#include<stack>
#include<list>
#include<vector>
#include<cstring>
#include<set>
using namespace std;
typedef long long ll;
const int maxn = 1e5+10;
ll a[30]; //分解数位
ll dp[30][2]; //dp[pos][status]表示到pos位置,当前状态为status,合法的数有多少个
//记忆化DFS
ll dfs(int pos , bool limit, bool lead, bool status){
//如果枚举完最后一个数都不出错,证明这个数字是合法的,返回1贡献给答案
if(pos == -1) return 1;
//如果没有限制 没有前导0 并且当前DP[pos][status]的值已经被计算过了,则可以直接用不需要再搜索了
if(!limit && !lead && dp[pos][status] != -1) return dp[pos][status];
//当前位的上限是否有限制
int up = limit ? a[pos] : 9;
//累计合法数到ans
ll ans = 0;
//枚举该位所有可能的数字
for(int i=0; i<=up; i++){
if(i == 4) continue; //不合条件的统统continue
if(status && i==2) continue; //之前status为TRUE则表明前的是6,所以这一位不能为2
ans += dfs(pos-1 , limit && i==a[pos] , lead && i==0, i==6);//向前搜索
}
//如果没有限制并且没有前导0 则可以赋值 以便用于记忆化搜索
if(!limit && !lead) dp[pos][status] = ans;
return ans;
}
//SOLVE 表示[0,x]区间内合法的数字 事实上如果对前导0有要求那么就是[1,x]
ll solve(int x){
int pos = -1;
while(x){
pos++;
a[pos] = x % 10;
x /= 10;
}
return dfs(pos , 1 , 1, 0);
}
ll l,r;
int main(){
while(cin>>l>>r){
if(l == 0 && r==0) break;
//初始DP记为-1表示没有计算出来结果
for(int i=0; i<=20; i++){
dp[i][0] = -1;
dp[i][1] = -1;
}
cout<<solve(r) - solve(l-1)<<endl;
}
}
数位DP中limit标记
-
在数位dp中,limit的作用主要有两个。
-
控制枚举的界限,倘若没有界限,每一位的枚举范围都是0-9. 但如果有界限,那么可能不能取到9. 例如求1到311范围内不含有连续两个1的个数。当百位枚举到了3,那么如果你的十位只能枚举0-2.
-
控制剪枝的合法性: 很明显,相比于暴力搜索,数位dp唯一的优势就是剪枝。但剪枝往往会带来一些错误。在数位dp中,我们进行剪枝的一个前提是limit != 0,也就是当前位枚举没有限制时才能进行剪枝。
- 为什么?请先看这个例子:题目依然是求1到321中,不含连续两个1的个数。当百位枚举为0,十位枚举为1时,当枚举个位时,除了个位枚举1不满足题意外,其他9个数都满足,所以dp[0][1]=9。而当百位枚举到3时,十位枚举1,此时我们已经记忆了dp[0][1]=9,但很明显,此时只有310,满足题意,如果还采用之前的9则发生错误。
- 为什么会出现这样的情况? 其实一个明显的原因就是:我们记忆化时的状态,仅仅只记忆了limit = 1的情况,也就是没有限制时的状态。该算法认为,有限制条件的数是很少的,所以对于有限制条件的数,我们都是直接暴力搜索的。
-
Balanced Number HDU - 3709
- 一个数是平衡数,当且仅当能找到一个枢轴使得两边力矩平衡
- 技巧
- 枚举枢轴
- 左边力矩和为正,右边为负,最终为0则合法
#include<cstdio>
#include <iostream>
#include <cstdio>
#include<queue>
#include<algorithm>
#include<stack>
#include<list>
#include<vector>
#include<cstring>
#include<string>
#include<set>
#include<map>
using namespace std;
typedef long long ll;
ll dp[20][20][2100];//dp[i][j][k]表示当前处于第i位,支点是j,力矩和为k 对答案的贡献
int a[30];
ll dfs(int pos , int pivot, int sum, bool limit, bool lead){
if(pos <= 0) return sum == 0;
if(sum < 0) return 0;
if(!limit && !lead && dp[pos][pivot][sum] != -1) return dp[pos][pivot][sum];
ll ans = 0;
int up = limit ? a[pos] : 9;
for(int i=0; i<=up; i++){
int t = sum + (pos - pivot) * i;
ans += dfs(pos-1, pivot, t, limit && i==a[pos], lead && i==0);
}
if(!lead && !limit) dp[pos][pivot][sum] = ans;
return ans;
}
ll solve(ll x){
ll ans = 0;
int pos = 0;
while(x){
pos++;
a[pos] = x % 10;
x /= 10;
//cout<<"???"<<endl;
}
//cout<<"pos = "<<pos<<endl;
for(int i=1; i<=pos; i++){
//枚举支点 从第1位到第pos位
ans += dfs(pos , i, 0, 1, 1)-1;
}
return ans ;
}
int main(){
int t;
cin>>t;
ll x,y;
while(t--){
for(int i=0; i<20; i++){
for(int j=0; j<20; j++){
for(int k=0; k<2100; k++){
dp[i][j][k] = -1;
}
}
}
dp[0][0][0] = 1;
cin>>x>>y;
cout<<solve(y) - solve(x-1)<<endl;
}
return 0;
}
- B-number HDU
- 求[1,n]有多少个能被13整除且包含13的数字
- 维护一个余数mod,模拟整数除法,最后为0合法
- 必须包含13,维护一个has标记,在status为1时,若当前位置为3则has生效
- has = 1 且 mod = 0才能贡献答案
#include<iostream>
#include<queue>
#include<stack>
#include<list>
#include<vector>
#include<cstring>
#include<set>
using namespace std;
typedef long long ll;
const int maxn = 1e5+10;
ll a[30];
ll dp[30][15][2][2];//dp[pos][mod][status][has]
//mod表示当前的余数 status 表示前面一位是不是1 has表示到当前位有没有13
ll dfs(int pos, bool limit, bool lead, int mod, bool status, bool has){
if(pos == -1) return mod == 0 && has;
if(!limit && !lead && dp[pos][mod][status][has] != -1) return dp[pos][mod][status][has];
int up = limit ? a[pos] : 9;
ll ans = 0;
for(int i=0; i<=up; i++){
//注意这里一定要考虑前导0,前导0不算0的个数
ans += dfs(pos-1, limit&&i == a[pos], lead && i==0, (mod*10+i)%13, i==1, has || (status && i==3) );
}
if(!limit && !lead) dp[pos][mod][status][has] = ans;
return ans;
}
ll solve(ll x){
int pos = -1;
while(x){
pos++;
a[pos] = x % 10;
x = x / 10;
}
return dfs(pos, 1, 1, 0, 0, 0);
}
ll l,r;
int main(){
while(cin>>r){
for(int i=0; i<30; i++){
for(int j=0; j<15; j++){
for(int k=0; k<2; k++){
for(int x=0; x<2; x++)
dp[i][j][k][x] = -1;
}
}
}
cout<<solve(r)<<endl;
}
}