杜教筛
问题一般是求$$sum_{i=1}^{n}f(i)$$这样的式子。
然后我们有一种很妙的想法,那就是构造两个积性函数(h,g),使得(h=f*g)
然后尝试推一下(h)的前缀和,发现:
如果记(S(n)=sum_{i=1}^nf(i)),那么就可以写成:$$sum_{i=1}{n}h(i)=sum_{d=1}{n}g(d)cdot S(lfloorfrac{n}{d} floor)$$
把(d=1)提出来,得到我们想要的式子:$$g(1)S(n)=sum_{i=1}{n}h(i)-sum_{d=2}{n}g(d)cdot S(lfloorfrac{n}{d} floor)$$
那么如果(h)的前缀和我们可以在一个比较优秀的时间复杂度内求出,则后面那一部分的时间复杂度在进行整除分块后,可以达到一个优秀的时间复杂度(O(n^{frac{2}{3}}))。
一些题目
-
题意:
求$$sum _{i=a}^{b} mu(i)(ale ble 10^{10})$$
-
解法一:
直接套用上面的卷积。我们知道$$mu * 1=epsilon$$
且(1,epsilon)都是积性函数,所以可以直接得到:$$displaystyle S(n)=1 - sum _{i=2}^{n} S(lfloor frac{n}{i} floor)$$
-
解法二:
还是来推一下式子,其实思路是一样的,都用到了$$sum_{d|n}mu(d)=[n=1]$$这条式子。
提出$j=1$,得到$$sum _{i=1}^{n} mu(i)=1-sum_{i=2}^{n} sum_{j=1}^{lfloor frac{n}{i}
floor}mu(j)$$然后就转化为上面的式子。
-
Trick
这里有几个需要注意的地方。一个是我们可以预处理一些(le sqrt{n})的前缀和来加快速度(事实上,根据唐教的分析,如果不预处理,时间复杂度是(O(n^{frac{3}{4}}))的),另外一个就是hash时候的技巧,与(Min25)筛不同,杜教筛的筛法需要用map记录一些已经算过的前缀和来保证时间复杂度,而这个时候我们其实可以不用map,而是用两个表去处理,按照是否(le sqrt{n})来处理。时间复杂度优秀许多,具体参见代码。
(code_1)(用map储存):
注意map <LL,LL> :: iterator iter
,iter = h.find(x)
,iter->second
的用法
#include <iostream>
#include <cstring>
#include <cstdio>
#include <map>
#define F(i, a, b) for (int i = a; i <= b; i ++)
const int B = 5000000;
typedef long long LL;
using namespace std;
LL a, b, S[B + 1], mu[B]; int z[B];
bool bz[B + 1];
map <LL, LL> H;
map <LL, LL> :: iterator iter;
void Init() {
mu[1] = 1;
F(i, 2, B) {
if (!bz[i])
z[++ z[0]] = i, mu[i] = - 1;
F(j, 1, z[0]) {
LL x = 1ll * z[j] * i;
if (x > B) break;
bz[x] = 1;
if (i % z[j] == 0) {
mu[x] = 0;
break;
}
mu[x] = mu[z[j]] * mu[i];
}
}
F(i, 2, B)
mu[i] += mu[i - 1];
}
LL Solve(LL x) {
if (x <= B) return mu[x];
iter = H.find(x);
LL ans = iter -> second; //我竟然第一次知道要这样用。。。
if (iter == H.end()) {
ans = 0;
for (LL i = 2, j; i <= x; i = j + 1) {
j = x / (x / i);
ans += (j - i + 1) * Solve(x / i);
}
ans = 1 - ans;
H[x] = ans;
}
return ans;
}
int main() {
scanf("%lld%lld", &a, &b);
Init();
printf("%lld
", Solve(b) - Solve(a - 1));
}
(code_2)(推荐储存方式):
#include <iostream>
#include <cstring>
#include <cstdio>
#include <map>
#define F(i, a, b) for (int i = a; i <= b; i ++)
const int B = 5000000;
typedef long long LL;
using namespace std;
LL a, b, n, S[B + 1], vis[B / 100], mu[B];
int z[B]; bool bz[B + 1];
map <LL, LL> H;
map <LL, LL> :: iterator iter;
void Init() {
mu[1] = 1;
F(i, 2, B) {
if (!bz[i])
z[++ z[0]] = i, mu[i] = - 1;
F(j, 1, z[0]) {
LL x = 1ll * z[j] * i;
if (x > B) break;
bz[x] = 1;
if (i % z[j] == 0) {
mu[x] = 0;
break;
}
mu[x] = mu[z[j]] * mu[i];
}
}
F(i, 2, B)
mu[i] += mu[i - 1];
}
LL Solve(LL x) {
if (x <= B) return mu[x];
LL y = n / x;
if (!vis[y]) {
LL ans = 0;
for (LL i = 2, j; i <= x; i = j + 1) {
j = x / (x / i);
ans += (j - i + 1) * Solve(x / i);
}
vis[y] = ans = 1 - ans;
}
return vis[y];
}
LL Doit(LL x) {
memset(vis, 0, sizeof vis), n = x;
return Solve(x);
}
int main() {
scanf("%lld%lld", &a, &b);
Init();
printf("%lld
", Doit(b) - Doit(a - 1));
}
Min25筛
也是一种很优秀的求积性函数前缀和的筛法。据zzq大神说它的时间复杂度是(O(frac{n}{log_nlog_n}))??
为了下面叙述方便,记(P)表示素数集合,记(P_i)表示第(i)个质数,其中(|P|=sqrt{n})。
此类问题的(F(i))一般满足:
则min25筛的想法是把所有的(F(i))的和分成质数和合数去考虑,即总的贡献 = 质数的贡献 + 合数的贡献,下面讲解两种方法:
递归版本
那么先考虑质数的贡献,即(i)为质数,且保证括号内条件成立时的情况下的贡献。
若记(min(p))表示(i)的最小质因子以及$$g(n,j)=sum_{i=1}^n[iin P, min(p)gt P_j]F(i)$$
则由定义,不难推出$$g(n,j)=egin{cases} g(n,j-1)&{P_j}^2gt n g(n,j-1)-F(P_j)[g(frac{n}{P_j},j-1)-sum_{i=1}{j-1}F(P_i)]&{P_j}2le nend{cases}$$
其中(g(n,0))初值比较难理解。事实上,我们观察这整一个递推过程,实际上很类似埃氏筛,每一次都把一个(P_j)的贡献给删去,最终筛到(sqrt{n})时,保证了还没有被质数筛去的数在(n)范围内一定不是合数。
那么继续考虑埃氏筛,实际上一开始我们是把所有数都看成质数的。那么(g(n,0))的初值也就不难想了,可能是某个与(n)有关的多项式,例如在求质数个数中(f(i)=1),那么(g(n,0)=n-1).
现在回到原问题$$sum_{i=1}^nF(i)$$上,我们要求质数的贡献,实质上就是(g(n,|P|)-g(P_{j-1},j-1))
如果记$$S(n,j)=sum_{i=2}^nF(i)[i的最小质因子大于等于P_j]$$
那么可以推出$$S(n,j)=g(n,|P|)-sum_{i=1}^{j-1}f(P_i)+sum_{kge j}{|P|}sum_{e}(f({P_k}e)S(frac{n}{{P_k}e},k+1)+f({P_k}{e+1}))$$
事实上,后面那一部分式子就是合数的贡献,枚举质数(k),次数(e),然后与求(g)的思想是完全类似的,注意要加上一个(f({P_k}^{e+1}))就好了.
注意,这里我们所说的递归版本,实际上指的是(s)的求法是用递归,实际实现中,(g)的求法可以不用递归,具体请看代码,并且求(s)时可以不用记忆化,时间复杂度依旧优秀。
递推版本
实际上递推版本比递归更慢。因为它求的是(sqrt{n})个(frac{n}{i})的前缀和。
具体细节与递归版本类似。我们直接设$$S'(n,i)=sum_{i=2}^nF(i)[i的最小质因子不小于p_i或i是质数]$$.
可以得到:$$S'(n,i)=left{
egin{array}{}
S'(n,i+1)+sum_{egeq 1且 p_i^{e+1} leq n} F(p_ie)[S(lfloorfrac{n}{p_ie}
floor,i+1)-g(p_i,i)]+F(p_i^{e+1})& &{p_i^2leq n}
S'(n,i+1)& &{p_i^2geq n}
end{array}
ight.$$
初值(S'(n,|P|+1)=g(n,|P |))
一些题目
-
事实上就是求(1sim n)素数,这个可以直接通过求的(g)来得到,连(s)都不用求。
注意实现的时候只需要保存(frac{n}{i})的(sqrt{n})个值即可。
#include <bits/stdc++.h>
#define F(i, a, b) for (int i = a; i <= b; i ++)
const int N = 700000;
using namespace std;
long long n, m, id1[N], id2[N], w[N], g[N], z[N], sqr;
bool bz[N];
int main() {
scanf("%lld", &n), sqr = int(sqrt(n));
F(i, 2, sqr) {
if (!bz[i])
z[++ z[0]] = i, bz[i] = 1;
F(j, 1, z[0]) {
if (z[j] * i > sqr) break;
bz[z[j] * i] = 1;
if (i % z[j] == 0) break;
}
}
for (long long i = 1, j; i <= n; i = j + 1) {
j = n / (n / i); w[++ m] = n / i;
if (w[m] <= sqr) id1[w[m]] = m; else id2[n / w[m]] = m;
g[m] = w[m] - 1;
}
F(j, 1, z[0])
for (int i = 1; i <= m && z[j] * z[j] <= w[i]; i ++) {
int k = (w[i] / z[j] <= sqr) ? id1[w[i] / z[j]] : id2[n / (w[i] / z[j])];
g[i] -= g[k] - (j - 1);
}
printf("%lld
", g[1]);
}
注意把(f(p)=p-1)拆成两个函数(g(p)=p,h(p)=1),然后相减.
这样可以保证所求是积性函数.
#include <bits/stdc++.h>
#define F(i, a, b) for (int i = a; i <= b; i ++)
typedef long long LL;
const int N = 3e5;
const LL ny = 5e8 + 4, Mo = 1e9 + 7;
using namespace std;
bool bz[N]; int id1[N], id2[N], sqr;
LL g[N], h[N], z[N], w[N], s[N], n, m;
LL S(LL x, int y) {
LL k = x <= sqr ? id1[x] : id2[n / x];
LL sum = (g[k] - h[k] - (s[y - 1] - (y - 1)) + (y == 1) * 2) % Mo;
for (LL i = y; i <= z[0] && z[i] * z[i] <= x; i ++)
for (LL e = 1, p = z[i]; p * z[i] <= x; e ++, p *= z[i])
sum = (sum + (z[i] ^ e) % Mo * S(x / p, i + 1) + (z[i] ^ (e + 1))) % Mo;
return sum;
}
int main() {
scanf("%lld", &n), sqr = int(sqrt(n));
F(i, 2, sqr) {
if (!bz[i])
z[++ z[0]] = i, s[z[0]] = (s[z[0] - 1] + i) % Mo;
F(j, 1, z[0]) {
if (z[j] * i > sqr) break;
bz[z[j] * i] = 1;
if (i % z[j] == 0) break;
}
}
for (LL i = 1, j; i <= n; i = j + 1) {
j = n / (n / i); w[++ m] = n / i;
if (w[m] <= sqr) id1[w[m]] = m; else id2[n / w[m]] = m;
g[m] = (((w[m] + 2) % Mo * ((w[m] - 1) % Mo)) % Mo * ny) % Mo;
h[m] = (w[m] - 1) % Mo;
}
F(j, 1, z[0])
for (LL i = 1; i <= m && z[j] * z[j] <= w[i]; i ++) {
LL k = (w[i] / z[j] <= sqr) ? id1[w[i] / z[j]] : id2[n / (w[i] / z[j])];
h[i] = (h[i] - (h[k] - (j - 1))) % Mo;
g[i] = (g[i] - z[j] * (g[k] - s[j - 1])) % Mo;
}
printf("%lld
", n == 1 ? 1 : ((S(n, 1) + 1) % Mo + Mo) % Mo);
}
两种版本的时间复杂度都是(O(frac{n^{frac{3}{4}}}{log(sqrt n)}))。经实测,递归版会稍微快一些。
经过一系列的容斥后,可以计算。
比如说,要求(1sim n)中不是(a_i(1le ile m))的倍数,但要是(b)的倍数。
我们就把(n/b)之后进行计算。
再譬如,如果在此基础上,还要求(f(x)=1),我们就要特殊考虑了,必须要考虑的是(b)的质因数情况,因为我们还是在(n/b)的基础上进行计算,经过一番特殊处理后还是可以做出来,只要透彻理解质数和合数的计算即可。
#include <bits/stdc++.h>
#define F(i, a, b) for (LL i = a; i <= b; i ++)
#define mem(a, b) memset(a, b, sizeof a)
#define get getchar()
typedef long long LL;
const LL M = 3e5 + 10;
using namespace std;
LL n, m, b, sqr, MAX, top, L, r[61], vis[M], s[M], S[M];
LL a[M], g[M], w[M], bz[M], z[M], id1[M], id2[M], R[M];
LL S0, S1, S2, S3; bool flag;
void Re(LL &x) {
char c = get; x = 0; LL t = 1;
for (; !isdigit(c); c = get) t = (c == '-' ? - 1 : t);
for (; isdigit(c); x = (x << 3) + (x << 1) + c - '0', c = get); x *= t;
}
void Init() {
Re(n), Re(m), Re(b);
F(i, 1, m) Re(a[i]);
F(i, 1, 60) Re(r[i]);
r[0] = 1;
}
void GetPrime() {
mem(bz, 0), z[0] = 0, mem(vis, 0), top = 0;
F(i, 2, sqr) {
if (!bz[i]) {
z[++ z[0]] = i, s[z[0]] = s[z[0] - 1] + 1;
vis[z[0]] = 1;
while (top < m && a[top] < i) top ++;
if (a[top] == i)
s[z[0]] --, vis[z[0]] = 0;
}
F(j, 1, z[0]) {
if (z[j] * i > sqr) break;
bz[z[j] * i] = 1;
if (i % z[j] == 0) break;
}
}
}
LL dg(LL x, LL y, LL n, LL t) {
if (z[y] > x) return 0;
LL k = (x <= sqr) ? id1[x] : id2[n / x];
LL sum = (g[k] - s[y - 1]) * r[t];
F(k, y, z[0]) {
if (z[k] * z[k] > x) break;
if (vis[k])
for (LL s = z[k], cnt = 1; s * z[k] <= x; s *= z[k], cnt ++)
if (!t) sum += dg(x / s, k + 1, n, t) + 1; else {
if (r[cnt])
sum += dg(x / s, k + 1, n, t);
sum += r[cnt + 1];
}
}
return sum;
}
LL DG(LL x, LL y, LL n, LL res) {
if (z[y] > x) return 0;
LL k = (x <= sqr) ? id1[x] : id2[n / x], sum;
if (res > 1) sum = 0; else
if (res == 1) sum = (x >= MAX); else
sum = (g[k] - s[y - 1]);
F(k, y, z[0]) {
if (z[k] * z[k] > x) break;
if (vis[k]) {
for (LL s = z[k], cnt = 1; s * z[k] <= x; s *= z[k], cnt ++) {
if (r[cnt + R[k]])
sum += DG(x / s, k + 1, n, res - !r[R[k]]);
if ((res - !r[R[k]]) == 0)
sum += r[cnt + R[k] + 1];
}
if (!r[R[k]]) break;
}
}
return sum;
}
LL Solve(LL n, LL q) {
sqr = q < 2 ? LL(sqrt(n)) : LL(sqrt(max(n, b))), L = 0, GetPrime();
for (LL i = 1, j; i <= n; i = j + 1) {
j = n / (n / i); w[++ L] = n / i;
if (w[L] <= sqr) id1[w[L]] = L; else id2[n / w[L]] = L;
g[L] = w[L] - 1;
}
F(j, 1, z[0])
for (LL i = 1; i <= L && z[j] * z[j] <= w[i]; i ++) {
LL k = (w[i] / z[j]) <= sqr ? id1[w[i] / z[j]] : id2[n / (w[i] / z[j])];
g[i] -= (g[k] - (j - 1));
}
LL j = m;
F(i, 1, L) {
while (a[j] > w[i]) j --;
g[i] -= j;
}
if (q <= 1)
return dg(n, 1, n, q);
else {
LL x = b, res = 0;
F(i, 1, z[0]) {
while (x % z[i] == 0)
R[i] ++, x /= z[i];
s[i] = s[i - 1] + r[R[i] + 1] * vis[i];
S[i] = S[i - 1] + vis[i];
if (vis[i] * (!r[R[i]]))
res ++, MAX = z[i];
}
if (x > 1) {
z[++ z[0]] = x, vis[z[0]] = 1;
while (top < m && a[top] < x) top ++;
if (a[top] == x) vis[z[0]] = 0;
s[z[0]] = s[z[0] - 1] + r[2] * vis[z[0]];
S[z[0]] = S[z[0] - 1] + vis[z[0]];
if (vis[z[0]] * (!r[1]))
res ++, MAX = x;
}
LL j = z[0];
F(i, 1, L) {
while (j > 0 && z[j] > w[i]) j --;
g[i] = (g[i] - S[j]) * (r[1] != 0) + s[j];
}
return DG(n, 1, n, res) + (res == 0);
}
}
int main() {
freopen("qiandao.in", "r", stdin);
freopen("qiandao.out", "w", stdout);
Init();
S0 = Solve(n, 0);
flag = 1;
F(i, 1, m)
if (b % a[i] == 0) { flag = 0; break; }
S1 = flag == 0 ? 0 : Solve(n / b, 0) + (b > 1);
// printf("%lld
", S0);
// printf("%lld
", S1);
S2 = Solve(n, 1);
S3 = flag == 0 ? 0 : Solve(n / b, 2);
// printf("%lld
", S2);
// printf("%lld
", S3);
printf("%lld
", n - (n - S0 + S1 + S2 - S3));
}