学习笔记：舞蹈链 Dancing Links

这是一种奇妙的算法用来解决两个问题：

精确覆盖问题：给定一个矩阵，每行是一个二进制数，选出尽量少的行，使得每一列恰好有一个 (1)
重复覆盖问题：给定一个矩阵，每行是一个二进制数，选出尽量少的行，使得每列至少有一个 (1)。

模板一般需要有两个：① 数据结构（十字链表）② dfs 框架

其中 ① 对于两个问题都是一样的，而 ② 不同问题不同框架。

精确覆盖问题

1. 如何存储这个矩阵：十字链表

由于 (0) 的信息冗余，我们只存 (1)，不存 (0)，复杂度可以做到和 (1) 的个数相关，这样就处理掉了那种稀疏图（行列很大，但 (1) 的个数很少的情况）。

十字链表 QWQ

对于所有 (1) 的位置建立节点。
看一下每个节点上下左右应该连向谁，这里十字链表是一个循环链表。举个例子，如果 ((x, y)) 上面没有节点，那么循环到最底下，然后再往上走，直到走到第一个 (1)。

实际到代码实现，我们可以按行创建：

预备信息

const int N = 具体问题中 1 最多的点数。
int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];
/* 
n 为行数，m 为列数，U/D/L/R[i] 分别表示 i 节点上下左右的节点。
idx 为当前用了的点数, s[i] 表示第 i 列为 1 的有多少行。
hh, tt 用于加入点时两个端点。
X[i], Y[i] 表示 i 号点的 x, y 坐标
*/

首先第一行是哨兵（全 (1)），并且 ((0, 0)) 加入一个节点以便后续快速找到现在还有多少个 (1)。

void inline init() {
	for (int i = 0; i <= m; i++)
		L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
	L[0] = m, R[m] = 0, idx = m;
}

每一次加入一行。然后考虑左右两个点 (hh, tt)，每次动态把一个 (1) 插入到 (hh, tt) 之间。

void inline add(int x, int y) {
	X[++idx] = x, Y[idx] = y, s[y]++; 
	L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
	U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
	// 注意 U[y] = idx 必须在最后，因为其他东西需要用到之前的 U[y]，即 idx 上面那个店。
	hh = idx;
}

// 读入 n * m 的矩阵并按行加入
for (int i = 1; i <= n; i++) {
	hh = idx + 1, tt = idx + 1; // 可以理解为第一行第一个点左右都是自己。
	for (int j = 1, x; j <= m; j++) {
		scanf("%d", &x);
		if (x) add(i, j); // 如果 i, j 为 1，加入 (i, j)
	}
}

按行插入有趣的是，你只需要把它搞成一个循环链表就行了，甚至你随便左右的顺序也是可以过的，只要保持在同一行循环链表的性质就可以。

for (int i = 1; i <= n; i++) {
	hh = idx + 1, tt = idx + 1;
	len = 0;
	for (int j = 1, x; j <= m; j++) {
        scanf("%d", &x);
        if (x) d[++len] = j;
    }
    random_shuffle(d + 1, d + 1 + len); // 233
    for (int j = 1; j <= len; j++) add(i, d[j]);
}

QAQ

删除第 (p) 列及其关联的所有行。删除列的时候，只需要删除第一行对应的列，原因在于我们 dfs 时找是通过第一行的哨兵找；删除行的时候，只需要把行对应列的位置删掉（这列的 (s) 信息就不管了，反正以后也不用了），行相互作用是不需要删的，原因是不影响，且我们需要用行的信息恢复现场.jpg

void del(int p) {
	L[R[p]] = L[p], R[L[p]] = R[p];
	for (int i = D[p]; i != p; i = D[i]) {
		for (int j = R[i]; j != i; j = R[j]) {
			s[Y[j]]--, U[D[j]] = U[j], D[U[j]] = D[j];
		}
	}
}

按插入顺序撤销第 (p) 列，注意这里按照时间逆序操作即可，相互不影响的时间顺序可以改变。

void resume(int p) {
	L[R[p]] = p, R[L[p]] = p;
	for (int i = U[p]; i != p; i = U[i]) {
		for (int j = L[i]; j != i; j = L[j]) {
			s[Y[j]]++, U[D[j]] = j, D[U[j]] = j;
		}
	}
}

2. dfs 框架：针对精确覆盖问题。

每次任意选择未被选择的一行，判断能不能选。

剪枝：

挑 (1) 的个数最少的列。枚举这一列选哪个行。如果我们选择了这一列，接下来就不需要考虑这一列的影响了，所以我们可以把这一列删掉（十字链表的操作）。
选择一行，实际上是把这行所有 (1) 的列都选了，即删掉这些列，然后这些列关系到的行也都没了，把这些行也干掉，~~禁止套娃~~。有些人可能认为这会造成无休止的删，但实际上只会影响两次，为什么能，即选择一行 (Rightarrow) 删掉对应列 (Rightarrow) 废掉对应列的行，废掉和选择是不一样的，废掉就不会影响其他列了。

经过这两步，我们可以理解为，(dfs) 到当前的数据结构上都是没选的列和行，相当于每次选一行把问题转化成了更小规模，即选择一行，把与这行冲突的行删掉，并且删掉对应列，通过十字链表，我们做到了快速删除/查找。

bool inline dfs() {
	if (!R[0]) return true;
	int p = R[0];
	for (int i = R[0]; i; i = R[i])
		if (s[i] < s[p]) p = i;
	if (!s[p]) return false;
	del(p);
	for (int i = D[p]; i != p; i = D[i]) {
		ans[++top] = X[i];
		for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
		if (dfs()) return true;
		for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
		--top;
	}
	resume(p);
	return false;
}

时间复杂度

约为 (O(c ^ n))，其中 (c) 是一个接近 (1) 的常数，(n) 为矩阵中 (1) 的个数。随机数据的话 (n) 到上万级别也没啥问题。（又是一个玄学复杂度的算法）。

例题

题目 (Rightarrow) 模型的转化，可以把每一个决策当成一行，限制当成一列，如果一个限制恰好一次那么就可以精确覆盖。

模板题

#include <iostream>
#include <cstdio>

using namespace std;

const int N = 5505, M = 505;

int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];

int ans[M], top;

void inline init() {
	for (int i = 0; i <= m; i++)
		L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
	L[0] = m, R[m] = 0, idx = m;
}

void inline add(int x, int y) {
	X[++idx] = x, Y[idx] = y, s[y]++; 
	L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
	U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
	hh = idx;
} 

// 删除第 p 列

void del(int p) {
	L[R[p]] = L[p], R[L[p]] = R[p];
	for (int i = D[p]; i != p; i = D[i]) {
		for (int j = R[i]; j != i; j = R[j]) {
			s[Y[j]]--, U[D[j]] = U[j], D[U[j]] = D[j];
		}
	}
}

void resume(int p) {
	L[R[p]] = p, R[L[p]] = p;
	for (int i = U[p]; i != p; i = U[i]) {
		for (int j = L[i]; j != i; j = L[j]) {
			s[Y[j]]++, U[D[j]] = j, D[U[j]] = j;
		}
	}
}

bool inline dfs() {
	if (!R[0]) return true;
	int p = R[0];
	for (int i = R[0]; i; i = R[i])
		if (s[i] < s[p]) p = i;
	if (!s[p]) return false;
	del(p);
	for (int i = D[p]; i != p; i = D[i]) {
		ans[++top] = X[i];
		for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
		if (dfs()) return true;
		for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
		--top;
	}
	resume(p);
	return false;
}

int main() {
	scanf("%d%d", &n, &m);
	init();
	for (int i = 1; i <= n; i++) {
		hh = idx + 1, tt = idx + 1;
		for (int j = 1, x; j <= m; j++) {
			scanf("%d", &x);
			if (x) add(i, j);
		}
	}
	if (!dfs()) puts("No Solution!");
	else for (int i = 1; i <= top; i++) printf("%d ", ans[i]);
	return 0;
}

16 * 16 数独

行数：设空出的格子有 (n) 个，那么每个格子可以填 (16) 个字母，共 (n * 16) 行（决策）。

列数：即限制，每个格子恰好一个数字 (n+) 每行每列每个十六宫格每个数都出现恰好一次 (3n) (= 4n)

每行恰好 (4) 个 (1)，即格子的位置 (1)，行列十六宫格位置 (1)。

这样总点数是 (n imes 64 le 16384) 个格子，~~这题暴力强剪枝可过，所以 Dacing Links 显然也能过~~。

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;

const int N = 17, S = 4, P = 16385, M = N * N * N;

int n, m, U[P], D[P], L[P], R[P], X[P], Y[P], s[P];
int idx, ans[M], top, tot, hh, tt;
// 各自限制的状态编号

bool st[N];

char a[N][N];

struct Selection{
    int x, y;
    char c;
} e[M];

void inline clear() {
    n = idx = tot = top = 0, m = 1024;
    memset(s, 0, sizeof s);
}

void init() {
    for (int i = 0; i <= m; i++)
        L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
    L[0] = m, R[m] = 0, idx = m;
}

void inline add(int x, int y) {
    X[++idx] = x, Y[idx] = y, s[y]++;
    L[idx] = hh, R[idx] = tt, R[hh] = L[tt] = idx;
    U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
    tt = idx;
}

void del(int p) {
    L[R[p]] = L[p], R[L[p]] = R[p];
    for (int i = U[p]; i != p; i = U[i]) {
        for (int j = R[i]; j != i; j = R[j]) {
            s[Y[j]]--, D[U[j]] = D[j], U[D[j]] = U[j];
        }
    } 
}

void resume(int p) {
    L[R[p]] = p, R[L[p]] = p;
    for (int i = D[p]; i != p; i = D[i]) {
        for (int j = L[i]; j != i; j = L[j]) {
            s[Y[j]]++, D[U[j]] = j, U[D[j]] = j;
        }
    } 
}

bool dfs() {
    if (!R[0]) return true;
    int p = R[0];
    for (int i = R[0]; i; i = R[i]) 
        if (s[i] < s[p]) p = i;
    if (!s[p]) return false;
    del(p);
    for (int i = U[p]; i != p; i = U[i]) {
        ans[++top] = X[i];
        for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
        if (dfs()) return true;
        for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
        top--;
    }
    resume(p);
    return false;
}

int main() {
    while (~scanf("%s", a[0])) {
        clear();
        for (int i = 1; i <= 15; i++) scanf("%s", a[i]);
        // 把限制总状态数抠出来
        init();
        for (int i = 0; i < 16; i++) {
            for (int j = 0; j < 16; j++) {
                int l = 0, r = 15;
                if (a[i][j] != '-') l = r = a[i][j] - 'A';
                for (int k = l; k <= r; k++) {
                    hh = idx + 1, tt = idx + 1;
                    e[++n] = (Selection) { i, j, (char)(k + 'A') } ;
                    add(n, (j + 1) + i * 16), add(n, 16 * 16 + i * 16 + k + 1);
                    add(n, 16 * 32 + j * 16 + k + 1), add(n, 16 * 48 + (i / 4 * 4 + j / 4) * 16 + k + 1);
                } 
            }
        }
        dfs();
        for (int i = 1; i <= top; i++)
            a[e[ans[i]].x][e[ans[i]].y] = e[ans[i]].c;
        for (int i = 0; i < 16; i++) printf("%s
", a[i]);
        puts("");
    }
    return 0;
}

重复覆盖问题

基本搜索框架：IDA*，层数不能太多）

跟精确覆盖问题的区别就是，考虑选择一行，只会把它关联的所有列删掉，并不会套娃删行，这是因为同一列下 (1) 的行同时选并不冲突。

但这样会慢很多，需要加一个 IDA*。

估价函数是：

枚举没选的列，选上所有的行，股价函数 (+1)

这种方法可以看作把这列的所有行并起来算成一个行了，这个东西经过大量经验表明整挺快。

注意，这里删的时候是把对应列在在那些行里删掉。

#include <iostream>
#include <cstdio>
#include <cstring>

using namespace std;

const int N = 10005, M = 505;

int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];

int ans[M], top, dep, d[M];

bool st[N];

void inline init() {
    for (int i = 0; i <= m; i++)
        L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
    L[0] = m, R[m] = 0, idx = m;
}

void inline add(int x, int y) {
    X[++idx] = x, Y[idx] = y, s[y]++; 
    L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
    U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
    hh = idx;
} 

// 删除第 p 列

void inline del(int p) {
    for (int i = D[p]; i != p; i = D[i])
        L[R[i]] = L[i], R[L[i]] = R[i];
}

void resume(int p) {
    for (int i = U[p]; i != p; i = U[i])
        L[R[i]] = i, R[L[i]] = i;
}

int inline h() {
    memset(st, false, sizeof st);
    int cnt = 0;
    for (int i = R[0]; i; i = R[i]) {
        if (st[i]) continue;
        cnt++;
        for (int j = D[i]; j != i; j = D[j])
            for (int k = R[j]; k != j; k = R[k]) st[Y[k]] = true;
    }
    return cnt;
}

bool inline dfs() {
    if (top + h() > dep) return false;
    if (!R[0]) return true;
    int p = R[0];
    for (int i = R[0]; i; i = R[i])
        if (s[i] < s[p]) p = i;
    if (!s[p]) return false;
    for (int i = D[p]; i != p; i = D[i]) {
        ans[++top] = X[i];
        del(i);
        for (int j = R[i]; j != i; j = R[j]) del(j);
        if (dfs()) return true;
        for (int j = L[i]; j != i; j = L[j]) resume(j);
        resume(i);
        --top;
    }
    return false;
}

int main() {
    scanf("%d%d", &n, &m);
    init();
    for (int i = 1; i <= n; i++) {
        hh = idx + 1, tt = idx + 1;
        for (int j = 1, x; j <= m; j++) {
            scanf("%d", &x);
            if (x) add(i, j);
        }
    }
    dep = 1;
    while(!dfs()) dep++;
    printf("%d
", dep);
    for (int i = 1; i <= dep; i++) printf("%d ", ans[i]);
    return 0;
}

相关阅读:
学完自动化测试，用小技能做了点兼职刷弹幕，小赚10W
学会这个，助你升值加薪自动化框架之python+selenium+pytest
我都30岁了，现在做软件测试还来得及吗
 如何从小白成长为技术大牛，阿里测试总监为你梳理成神之路【全套资源分享】
Google公布编程语言排名，第一竟然是他？
程序员改行率竟然高达40%，看完我沉默了
 程序员一定要远离这个万恶之源
 自动化测试框架很难吗？我不觉得，不信你看
 三年经验的程序员，为什么能力要强过80%的人
 实验十团队作业6：团队项目用户验收&Beta冲刺
原文地址：https://www.cnblogs.com/dmoransky/p/13834814.html