题意:给定一个长度为 (n) 的序列 (A),(A_i in [0, 2 ^ k))。定义 (f(x)) 为 (A_1) ^
(x),(A_2) ^
(x cdots) (A_n) ^
(x) 这个序列的逆序对数量。现在将 (x in [0, 2 ^ k)) 按照 (f(x)) 为第一关键字,(x) 为第二关键字从小到大排序,求排名为 (p) 的 (f(x)) 及 (x)。
(n le 5 imes 10 ^ 5, 0 le k le 30, 1 le p le 2 ^ k)
简要题解如下:
-
考虑点对 ((i, j)(i < j)) 对每个 (f(x)) 的贡献。
-
不难发现,找到 (a_i, a_j) 最高的不相同的位置 (u) 那么 (a_i, a_j)
^
(x) 后的大小关系只于 (u) 这一位的选择有关。 -
若 (a_i < a_j) 那么当且仅当 (u) 这位为 (1) 会造成贡献;否则 (u) 这位为 (0) 会造成贡献。
-
注意到枚举点对是 (mathcal{O(n ^ 2)}) 级别的,考虑优化这个枚举的过程。
-
可以发现因为本质上是点对对答案造成的贡献,可以使用类似于 ( m CDQ) 分治的做法来优化这个流程。
-
我们将在从高往低 (u) 这个位上不同的数分为两个集合,因为数组是按照排列顺序来的,于是可以 (mathcal{O(n)}) 地计算出这一位的贡献。然后递归处理两个集合,复杂度 (mathcal{O(nk)})。
-
接下来考虑一个经典转化:二分答案,统计小于小于等于 ((f(x), x)) 的数量个数。
-
统计时折半搜索,然后使用双指针优化即可减小一半的指数。
复杂度 (mathcal{O(k2 ^ {k / 2} + nk)})。
#include <bits/stdc++.h>
using namespace std;
#define int long long
#define rep(i, l, r) for (int i = l; i <= r; ++i)
const int N = 5e5 + 5;
const int M = 30 + 5;
struct node { int x, y;} L[(1 << (M / 2))], R[(1 << (M / 2))];
int n, k, p, lx, rx, val, a[N], f[2][M];
int read() {
char c; int x = 0, f = 1;
c = getchar();
while (c > '9' || c < '0') { if(c == '-') f = -1; c = getchar();}
while (c >= '0' && c <= '9') x = x * 10 + c - '0', c = getchar();
return x * f;
}
void solve(vector <int> G, int k) {
if(k < 0 || !G.size()) return ;
vector <int> L, R; int lx = 0, rx = 0;
for (int i = 0; i < G.size(); ++i) {
if((G[i] >> k) & 1) f[1][k] += lx, ++rx, R.push_back(G[i]);
else f[0][k] += rx, ++lx, L.push_back(G[i]);
}
solve(L, k - 1), solve(R, k - 1);
}
bool cmp(node a, node b) { return a.x == b.x ? a.y < b.y : a.x < b.x;}
int check(int val, int x) {
int ans = 0, j = rx;
rep(i, 1, lx) {
for (; R[j].x + L[i].x > val && j; --j) ;
for (; R[j].x + L[i].x == val && R[j].y + L[i].y > x && j; --j) ;
ans += j;
}
return ans;
}
signed main () {
freopen ("f.in", "r", stdin);
freopen ("f.out", "w", stdout);
n = read(), k = read(), p = read();
rep(i, 1, n) a[i] = read();
vector <int> G; rep(i, 1, n) G.push_back(a[i]);
solve(G, k - 1);
lx = (1 << (k / 2)), rx = (1 << (k - k / 2));
rep(i, 0, lx - 1) L[i + 1].y = i * rx;
rep(i, 0, rx - 1) R[i + 1].y = i;
rep(i, 0, lx - 1) rep(j, 0, k / 2 - 1) L[i + 1].x += f[(i >> j) & 1][j + k - k / 2];
rep(i, 0, rx - 1) rep(j, 0, k - k / 2 - 1) R[i + 1].x += f[(i >> j) & 1][j];
sort(L + 1, L + lx + 1, cmp), sort(R + 1, R + rx + 1, cmp);
int l = 0, r = n * n / 2;
while (l < r) {
int Mid = (l + r) / 2;
if(check(Mid, 1 << k) >= p) r = Mid;
else l = Mid + 1;
}
val = r, l = 0, r = (1 << k) - 1;
while (l < r) {
int Mid = (l + r) / 2;
if(check(val, Mid) >= p) r = Mid;
else l = Mid + 1;
}
printf("%lld %lld", val, r);
return 0;
}
首先发现点对对每位之间的贡献是独立的是非常重要的
其次需要意识到本质上是点对的贡献,通常使用分治解决。
注意查排名或字典序的套路:
二分答案转化为查询小于等于答案的数量个数
按位确定答案,同样转化为统计某一个前缀下后缀随意的数量
折半搜索通常解决一类选择没有关联性,两边可合并的问题,数据范围出现 (30, 40) 尤其要注意。