摆花解题报告
这是一篇长达三年的解题报告。
update on 2020.10.21:
增加了前缀和优化
update on 2021.03.18:
增加了生成函数做法,修改了部分内容,更正了部分谬误。
(〇)数学符号注释
本文中的某些符号体系并不标准,一些读者会在其他书中学习类似的内容。这里列出了他们可能不熟悉的符号。
符号 | 名称 | 等价形式 |
---|---|---|
(sumlimits_{i=1}^na_i) | 求和(和式) | (a_1+a_2+cdots+a_{n-1}+a_n) |
(prodlimits_{i=1}^na_i) | 求积 | (a_1 imes a_2 imescdots imes a_{n-1} imes a_n) |
([m=n]) | 如果(m=n)值为(1);否则为(0) | (egin{cases}1&m=n\ 0& m ot=nend{cases}) |
(一)题目大意
简化一下题意:
有 (n) 个数((c_1,c_2,...,c_n)), (0leqslant c_ileqslant a_i),求有多少种方案数使(sumlimits_{i=1}^nc_i = m)。
(二)解题思路
乍一看,似乎题目有些复杂,一时找不到思路,肿么办!!!
方法一:搜索
没有思路当然就搜索啦 废话。如何搜索呢?
从 1 到 (n) 考虑每个 (x_i) 的值,和当前前 (i) 个数的总和 (k),然后枚举当前 (c_i) 所有可能的值,再递归求解。
时间复杂度 (O(prodlimits_{i=1}^na_i)),明显超时,但可以拿部分分(30)嘛...
代码:
#include<bits/stdc++.h>
using namespace std;
const int maxn=105, mod = 1000007;
int n, m, a[maxn];
int dfs(int x,int k)
{
if(k > m) return 0;
if(k == m) return 1;
if(x == n+1) return 0;
int ans = 0;
for(int i=0; i<=a[x]; i++) ans = (ans + dfs(x+1, k+i))%mod;
return ans;
}
int main()
{
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
cout<<dfs(1,0)<<endl;
return 0;
}
搜索超时怎么办!!! 别着急...
方法二(搜索优化法宝):记忆化
所谓记忆化,其实就是用一个数组将搜索过的值存起来,避免重复搜索,从而提高效率。(有必要可以上网搜一下,会搜索的应该很容易理解记忆化吧)
时间复杂度大概是:(O(nma_i)) 吧,100%的数据稳过。
代码(其实只是改动了一点点):
#include<bits/stdc++.h>
using namespace std;
const int maxn=105, mod = 1000007;
int n, m, a[maxn], rmb[maxn][maxn];
int dfs(int x,int k)
{
if(k > m) return 0;
if(k == m) return 1;
if(x == n+1) return 0;
if(rmb[x][k]) return rmb[x][k]; //搜过了就返回
int ans = 0;
for(int i=0; i<=a[x]; i++) ans = (ans + dfs(x+1, k+i))%mod;
rmb[x][k] = ans; //记录当前状态的结果
return ans;
}
int main()
{
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
cout<<dfs(1,0)<<endl;
return 0;
}
但是搜索的时间有些不稳定,想要更稳定的算法有木有...
方法三:动态规划
记忆化搜索都可以转成动态规划,但是动态规划却不一定能转成记忆化搜索 ——(by) (clg)
定义状态:(f(i, j)) 表示前 (i) 个数总和为 (j) 的方案数。
那么,易得状态转移方程:(f(i, j) = sumlimits_{k=0}^{a_{i}}f(i-1,j-k))
其中, (k)是枚举当前第 (i) 个数的取值。
时间复杂度:(O(nma_i)),稳得一批。
空间复杂度:(O(nm))
代码:
#include<bits/stdc++.h>
using namespace std;
const int maxn=105, mod = 1000007;
int n, m, a[maxn], f[maxn][maxn];
int main()
{
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
f[0][0] = 1;
for(int i=1; i<=n; i++)
for(int j=0; j<=m; j++)
for(int k=0; k<=min(j, a[i]); k++)
f[i][j] = (f[i][j] + f[i-1][j-k])%mod;
cout<<f[n][m]<<endl;
return 0;
}
仔细观察上述代码,有木有发现什么...
方法四(dp优化法宝):滚动数组
因为我们发现,状态转移方程中,当前状态 (f(i, j))只跟 (f(i-1, j)) 有关系,与 (i-2,i-3...)无关。于是,我们可以利用滚动数组优化dp。
所谓滚动数组,其实就是只保留两个状态(当前状态和前一个状态),算完当前状态后,将当前状态变为前一个状态,再去算下一个状态,看上去就像二维数组的两层不断地迭代。
时间复杂度:(O(nma_i))
空间复杂度:(O(m))
代码:
#include<bits/stdc++.h>
using namespace std;
const int maxn=105, mod = 1000007;
int n, m, a[maxn], f[2][maxn], t;
int main()
{
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
f[0][0] = 1;
for(int i=1; i<=n; i++)
{
t = 1-t; //滚动
for(int j=0; j<=m; j++)
{
f[t][j] = 0; //注意初始化
for(int k=0; k<=min(j, a[i]); k++)
f[t][j] = (f[t][j] + f[1-t][j-k])%mod;
}
}
cout<<f[t][m]<<endl;
return 0;
}
看到上述dp代码,有木有感觉很熟悉...
这熟悉的优化方法... 这TM不就是个背包吗!!!
方法五(背包大法好):一维动态规划
通过观察上面的代码,二维数组,数组滚动优化空间......还有那熟悉的格式...
猛然发现这怎么可能不是背包呢(01背包)?
既然是背包,那么就可以为所欲为啦... [邪恶.jpg]
直接压成一维的01背包,跑一波,搞掂!!!
时间复杂度:(O(nma_i))
空间复杂度:(O(m))
代码:
#include<bits/stdc++.h>
using namespace std;
const int maxn=105, mod = 1000007;
int n, m, a[maxn], f[maxn];
int main()
{
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
f[0] = 1;
for(int i=1; i<=n; i++)
for(int j=m; j>=0; j--) //注意,是01背包
for(int k=1; k<=min(a[i], j); k++)
f[j] = (f[j] + f[j-k])%mod;
cout<<f[m]<<endl;
return 0;
}
方法六:前缀和优化
继续观察方法五的代码,时间复杂度是(Theta(n^3))级别的。与背包有一些差别的是这一句:
for(int k=1; k<=min(a[i], j); k++)
f[j] = (f[j] + f[j-k])%mod;
然而,这一句的作用只不过是将连续的一段(f[j-a[i]])到(f[j-1])累加起来而已。因此,可以用前缀和将这个操作优化(众所周知,前缀和的作用就是(Theta(1))求一段区间的和)。
时间复杂度:(Theta(nm))
顺便卡到了次优解。
#include<bits/stdc++.h>
using namespace std;
const int maxn = 105, mod = 1000007;
int n, m, f[maxn], sum[maxn], a[maxn];
int main(){
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
f[0] = 1;
for(int i=0; i<=m; i++) sum[i] = 1;
for(int i=1; i<=n; i++){
for(int j=m; j>=1; j--) f[j] = (f[j] + sum[j-1] - sum[j - min(a[i], j) - 1] + mod)%mod;
for(int j=1; j<=m; j++) sum[j] = (sum[j-1] + f[j])%mod;
}
cout<<f[m]<<endl;
return 0;
}
提示:上面的程序在计算(f[j])的时候有可能会出现数组越界的情况,但为了代码美观容易理解,没有特判。这一点需要注意,考场上不慎就会抱灵。
下面是加上了特判的代码:
#include<bits/stdc++.h>
using namespace std;
const int maxn = 105, mod = 1000007;
int n, m, f[maxn], sum[maxn], a[maxn];
int main(){
cin>>n>>m;
for(int i=1; i<=n; i++) cin>>a[i];
f[0] = 1;
for(int i=0; i<=m; i++) sum[i] = 1;
for(int i=1; i<=n; i++){
for(int j=m; j>=1; j--){
int t = j - min(a[i], j) - 1;
if(t < 0) f[j] = (f[j] + sum[j-1])%mod;
else f[j] = (f[j] + sum[j-1] - sum[t] + mod)%mod;
}
for(int j=1; j<=m; j++) sum[j] = (sum[j-1] + f[j])%mod;
}
cout<<f[m]<<endl;
return 0;
}
方法七:生成函数
建议初学者跳过此方法,权当提供一种思路。
回到开头,我们需要求的是这样一个式子:
于是我们可以构造这样一个生成函数:
即,
最后所得的多项式中,(x^m)项的系数即为答案。可以做(n)次NTT得到答案。假设(a_i)的值域是(k),那么,
时间复杂度:(Theta(n^2klog nk))
实际上,(m)最大可以取到(nk)。因此如果用(k)来表示,前缀和优化后的复杂度应当是:(Theta(n^2k))
NTT的局限在于要做(n)次。其实只需要取(ln)就能将多项乘法转化为多项式加法,具体参考付公主的背包。
时间复杂度终于降到了(Theta(nklog nk))
(三)总结
总的来说,这道题适合 搜索/动态规划 的初学者练习。
有一点点的思维难度。
这道题的价值在于,它既可以从简单的动态规划开始,一路优化,也可以从生成函数的视角观察,继续优化。这两条道路,竟是殊途同归。或许,这也是数学的魅力吧。