Dacing Links (DLX) 算法是Donald Knuth [2]提出,用以解决精确覆盖(exact cover)问题,是X算法在计算机上的优化。
所谓精确覆盖,是指两两不相交的子集的集合,这些子集的并集可以得到全集。完整的定义 [1]如下:
在一个全集X中若干子集的集合为S,精确覆盖是指,S的子集S*,满足X中的每一个元素在S*中恰好出现一次。
举例:令 S = {N, O, E, P} 是集合X = {1, 2, 3, 4}的一个子集,并满足:
N = { }
O = {1, 3}
E = {2, 4}
P = {2, 3}.
其中一个子集 {O, E} 是 X的一个精确覆盖,因为 O = {1, 3} 而 E = {2, 4} 的并集恰好是 X = {1, 2, 3, 4}。同理, {N, O, E} 也是 X 的一个精确覆盖。
用关系矩阵来表示S的每个子集与X的元素之间包含关系,矩阵每行表示S的一个子集,每列表示X中的一个元素。矩阵行列交点元素为1表示对应的元素在对应的集合中,不在则为0。
精确覆盖问题转化成了求矩阵的若干个行的集合,使每列有且仅有一个1。S* = {B, D, F} 便是一个精确覆盖。
实现DLX算法的数据结构是双向十字链表,现在先简单介绍一下双向十字链表。
双向十字链表用LRUD来记录,LR来记录左右方向的双向链表,UD来记录上下方向的双向链表。比如,对6*7矩阵
用双向十字链表可以表示如下:
其中,h代表总的头链表head,ABCDEFG为列的指针头。
双向十字链表可以用数组来加以模拟。对4*4的01矩阵([4]中的一个例子)
1 1 0 0
0 0 0 1
0 1 1 1
1 0 1 0
LRUD的双向十字链表结构如下:
对精确覆盖问题,容易想到一个启发式的递归算法:(1)选中关系矩阵A的列c,则满足A(i, c)=1的行i均不可用,删除列c与所有的行i;(2)对选中的列c,选中行r满足A(r, c)=1;则满足A(r, j)=1的列j也均不可用,删除行与所有的列j;(3)对删除后的A进行递归(1)(2)处理。
上述非确定算法即是X算法,伪代码如下:
如果A是空的,问题解决;成功终止。
否则,选择一个列c(确定的)。
选择一个行r,满足 A[r, c]=1 (不确定的)。
把r包含进部分解。
对于所有满足 A[r,j]=1 的j,
从矩阵A中删除第j列;
对于所有满足 A[i,j]=1 的i,
从矩阵A中删除第i行。
在不断减少的矩阵A上递归地重复上述算法。
对X算法的优化一:在X算法的步骤(2)中选择的行r有可能是错的,为了减少递归次数,则需要回溯。为了便于X算法中有查找、删除等操作以及回溯,可采用双向十字链表。假设x 指向双向链的一个节点;L[x] 和R[x] 分别表示x 的前驱节点和后继节点。每个程序员都知道如下操作:
将x 从链表删除的操作。但是只有少数程序员意识到如下操作:
对X算法的优化二:在选择列c时,应选择的是A中所有列中1元素最少的一列。至于为什么选择最少的一列,不在本文讨论之列。如果去掉优化二,写的代码很有可能TLE。
为建立关系矩阵A的双向十字链表、加快运行速度。对每一个对象,记录如下几个信息:
DLX算法的伪代码如下:
其中,R[h]=h即表示A为空,cover column操作即为X算法中步骤(1),uncover colunm操作即为回溯。关于DLX算法的演示过程请参看[6]。
DLX算法的C代码:
/*remove column c and all row i that A(i,c)==1*/ void re_move(int c) { int i,j; L[R[c]]=L[c]; //remove column c R[L[c]]=R[c]; for(i=D[c];i!=c;i=D[i]) //remove row i that (i,c)==1 for(j=R[i];j!=i;j=R[j]) { U[D[j]]=U[j]; D[U[j]]=D[j]; S[C[j]]--; //decrease the count of column C[j] } } /*backtrack, resume*/ void resume(int c) { int i,j; for(i=U[c];i!=c;i=U[i]) for(j=L[i];j!=i;j=L[j]) { S[C[j]]++; U[D[j]]=j; D[U[j]]=j; } L[R[c]]=c; R[L[c]]=c; } int dfs(int depth) { int i,j,c,min=20; if(R[0]==0) return 1; //the matrix A is empty for(i=R[0];i!=0;i=R[i]) //select the column c which has the fewest number of element if(S[i]<min) { min=S[i]; c=i; } re_move(c); for(i=D[c];i!=c;i=D[i]) { O[depth]=i; //record the result for(j=R[i];j!=i;j=R[j]) re_move(C[j]); if(dfs(depth+1)) return 1; for(j=L[i];j!=i;j=L[j]) //backtrack resume(C[j]); } resume(c); return 0; }
[1] 维基百科,精确覆盖问题.
[2] Donald Knuth, Dancing Links.
[3] 吴豪,隋清宇(sqybi),Dancing Links中文版.
[4] momodi, Dancing Links在搜索中的应用.
[5] mu399,简单易懂的Dancing links讲解(1).
[6] mu399,简单易懂的Dancing links讲解(2).
用到了行指针头H[ ],以建立左右方向的双向链表,采用的是头插法。
O[ ] H[ ]数组开成了16, TLE了3次。O[ ] 应该开成最多列数300,H[ ]应该开成17。
源代码:
3740 | Accepted | 212K | 266MS | C | 1665B | 2013-10-24 22:14:13 |
#include "stdio.h" #include "string.h" #define MAX 5000 int L[MAX],R[MAX],U[MAX],D[MAX],C[MAX],S[300],O[300],H[17]; int m,n; /*remove column c and all row i that A(i,c)==1*/ void re_move(int c) { int i,j; L[R[c]]=L[c]; //remove column c R[L[c]]=R[c]; for(i=D[c];i!=c;i=D[i]) //remove row i that (i,c)==1 for(j=R[i];j!=i;j=R[j]) { U[D[j]]=U[j]; D[U[j]]=D[j]; S[C[j]]--; //decrease the count of column C[j] } } /*backtrack, resume*/ void resume(int c) { int i,j; for(i=U[c];i!=c;i=U[i]) for(j=L[i];j!=i;j=L[j]) { S[C[j]]++; U[D[j]]=j; D[U[j]]=j; } L[R[c]]=c; R[L[c]]=c; } int dfs(int depth) { int i,j,c,min=20; if(R[0]==0) return 1; //the matrix A is empty for(i=R[0];i!=0;i=R[i]) //select the column c which has the fewest number of element if(S[i]<min) { min=S[i]; c=i; } re_move(c); for(i=D[c];i!=c;i=D[i]) { O[depth]=i; //record the result for(j=R[i];j!=i;j=R[j]) re_move(C[j]); if(dfs(depth+1)) return 1; for(j=L[i];j!=i;j=L[j]) //backtrack resume(C[j]); } resume(c); return 0; } void init() { int i,j,temp,count; for(i=1;i<=n;i++) //初始化列的指针头 { L[i]=i-1; R[i]=i+1; U[i]=i; D[i]=i; C[i]=i; } L[0]=n; R[0]=1; R[n]=0; memset(H,-1,sizeof(H)); memset(S,0,sizeof(S)); count=n+1; for(i=1;i<=m;i++) for(j=1;j<=n;j++) { scanf("%d",&temp); if(!temp) continue; if(H[i]==-1) //为行i的第一个非零元素 H[i]=L[count]=R[count]=count; else { L[count]=L[H[i]]; R[count]=H[i]; //连接同一行的左右节点 R[L[H[i]]]=count; L[H[i]]=count; } U[count]=U[j]; D[count]=j; //连接同一列的上下节点 D[U[j]]=count; U[j]=count; C[count]=j; //该节点属于列j S[j]++; count++; } } int main() { while(scanf("%d%d",&m,&n)!=EOF) { init(); if(dfs(0)) printf("Yes, I found it\n"); else printf("It is impossible\n"); } return 0; }