2-SAT问题及其算法

  转自:http://www.cppblog.com/MatoNo1/archive/2011/07/13/150766.html

【2-SAT问题】
现有一个由N个布尔值组成的序列A,给出一些限制关系,比如A[x] AND A[y]=0、A[x] OR A[y] OR A[z]=1等,要确定A[0..N-1]的值,使得其满足所有限制关系。这个称为SAT问题,特别的,若每种限制关系中最多只对两个元素进行限制,则称为2-SAT问题。

由于在2-SAT问题中,最多只对两个元素进行限制,所以可能的限制关系共有11种:
A[x]
NOT A[x]
A[x] AND A[y]
A[x] AND NOT A[y]
A[x] OR A[y]
A[x] OR NOT A[y]
NOT (A[x] AND A[y])
NOT (A[x] OR A[y])
A[x] XOR A[y]
NOT (A[x] XOR A[y])
A[x] XOR NOT A[y]
进一步,A[x] AND A[y]相当于(A[x]) AND (A[y])(也就是可以拆分成A[x]与A[y]两个限制关系),NOT(A[x] OR A[y])相当于NOT A[x] AND NOT A[y](也就是可以拆分成NOT A[x]与NOT A[y]两个限制关系)。因此,可能的限制关系最多只有9种。

在实际问题中,2-SAT问题在大多数时候表现成以下形式:有N对物品,每对物品中必须选取一个,也只能选取一个,并且它们之间存在某些限制关系(如某两个物品不能都选,某两个物品不能都不选,某两个物品必须且只能选一个,某个物品必选)等,这时,可以将每对物品当成一个布尔值(选取第一个物品相当于0,选取第二个相当于1),如果所有的限制关系最多只对两个物品进行限制,则它们都可以转化成9种基本限制关系,从而转化为2-SAT模型。

【建模】
其实2-SAT问题的建模是和实际问题非常相似的。
建立一个2N阶的有向图,其中的点分为N对,每对点表示布尔序列A的一个元素的0、1取值(以下将代表A[i]的0取值的点称为i,代表A[i]的1取值的点称为i')。显然每对点必须且只能选取一个。然后,图中的边具有特定含义。若图中存在边<i, j>,则表示若选了i必须选j。可以发现,上面的9种限制关系中,后7种二元限制关系都可以用连边实现,比如NOT(A[x] AND A[y])需要连两条边<x, y'>和<y, x'>,A[x] OR A[y]需要连两条边<x', y>和<y', x>。而前两种一元关系,对于A[x](即x必选),可以通过连边<x', x>来实现,而NOT A[x](即x不能选),可以通过连边<x, x'>来实现。

【O(NM)算法:求字典序最小的解】
根据2-SAT建成的图中边的定义可以发现,若图中i到j有路径,则若i选,则j也要选;或者说,若j不选,则i也不能选;
因此得到一个很直观的算法:
(1)给每个点设置一个状态V,V=0表示未确定,V=1表示确定选取,V=2表示确定不选取。称一个点是已确定的当且仅当其V值非0。设立两个队列Q1和Q2,分别存放本次尝试选取的点的编号和尝试不选的点的编号。
(2)若图中所有的点均已确定,则找到一组解,结束,否则,将Q1、Q2清空,并任选一个未确定的点i,将i加入队列Q1,将i'加入队列Q2;
(3)找到i的所有后继。对于后继j,若j未确定,则将j加入队列Q1;若j'(这里的j'是指与j在同一对的另一个点)未确定,则将j'加入队列Q2;
(4)遍历Q2中的每个点,找到该点的所有前趋(这里需要先建一个补图),若该前趋未确定,则将其加入队列Q2;
(5)在(3)(4)步操作中,出现以下情况之一,则本次尝试失败,否则本次尝试成功:
<1>某个已被加入队列Q1的点被加入队列Q2;
<2>某个已被加入队列Q2的点被加入队列Q1;
<3>某个j的状态为2;
<4>某个i'或j'的状态为1或某个i'或j'的前趋的状态为1;
(6)若本次尝试成功,则将Q1中的所有点的状态改为1,将Q2中所有点的状态改为2,转(2),否则尝试点i',若仍失败则问题无解。
该算法的时间复杂度为O(NM)(最坏情况下要尝试所有的点,每次尝试要遍历所有的边),但是在多数情况下,远远达不到这个上界。
具体实现时,可以用一个数组vst来表示队列Q1和Q2。设立两个标志变量i1和i2(要求对于不同的i,i1和i2均不同,这样可以避免每次尝试都要初始化一次,节省时间),若vst[i]=i1则表示i已被加入Q1,若vst[i]=i2则表示i已被加入Q2。不过Q1和Q2仍然是要设立的,因为遍历(BFS)的时候需要队列,为了防止重复遍历,加入Q1(或Q2)中的点的vst值必然不等于i1(或i2)。中间一旦发生矛盾,立即中止尝试,宣告失败。

该算法虽然在多数情况下时间复杂度到不了O(NM),但是综合性能仍然不如下面的O(M)算法。不过,该算法有一个很重要的用处:求字典序最小的解!
如果原图中的同一对点编号都是连续的(01、23、45……)则可以依次尝试第0对、第1对……点,每对点中先尝试编号小的,若失败再尝试编号大的。这样一定能求出字典序最小的解(如果有解的话),因为一个点一旦被确定,则不可更改
如果原图中的同一对点编号不连续(比如03、25、14……)则按照该对点中编号小的点的编号递增顺序将每对点排序,然后依次扫描排序后的每对点,先尝试其编号小的点,若成功则将这个点选上,否则尝试编号大的点,若成功则选上,否则(都失败)无解。

【具体题目】HDU1814(求字典序最小的解)

#include <iostream>

#include <stdio.h>

using namespace std;

#define re(i, n) for (int i=0; i<n; i++)

const int MAXN = 20000, MAXM = 100000, INF = ~0U >> 2;

struct node {

    int a, b, pre, next;

} E[MAXM], E2[MAXM];

int _n, n, m, V[MAXN], ST[MAXN][2], Q[MAXN], Q2[MAXN], vst[MAXN];

bool res_ex;

void init_d()

{

    re(i, n) E[i].a = E[i].pre = E[i].next = E2[i].a = E2[i].pre = E2[i].next = i;

    m = n;

}

void add_edge(int a, int b)

{

    E[m].a = a; E[m].b = b; E[m].pre = E[a].pre; E[m].next = a; E[a].pre = m; E[E[m].pre].next = m;

    E2[m].a = b; E2[m].b = a; E2[m].pre = E2[b].pre; E2[m].next = b; E2[b].pre = m; E2[E2[m].pre].next = m++;

}

void solve()

{

    re(i, n) {V[i] = 0; vst[i] = 0;} res_ex = 1;

    int i, i1, i2, j, k, len, front, rear, front2, rear2;

    bool ff;

    re(_i, _n) {

        if (V[_i << 1] == 1 || V[(_i << 1) + 1] == 1) continue;

        i = _i << 1; len = 0;

        if (!V[i]) {

            ST[len][0] = i; ST[len++][1] = 1; if (!V[i ^ 1]) {ST[len][0] = i ^ 1; ST[len++][1] = 2;}

            Q[front = rear = 0] = i; vst[i] = i1 = n + i; Q2[front2 = rear2 = 0] = i ^ 1; vst[i ^ 1] = i2 = (n << 1) + i; ff = 1;

            for (; front<=rear; front++) {

                j = Q[front];

                for (int p = E[j].next; p != j; p=E[p].next) {

                    k = E[p].b;

                    if (V[k] == 2 || vst[k] == i2 || V[k ^ 1] == 1 || vst[k ^ 1] == i1) {ff = 0; break;}

                    if (vst[k] != i1) {

                        Q[++rear] = k; vst[k] = i1;

                        if (!V[k]) {ST[len][0] = k; ST[len++][1] = 1;}

                    }

                    if (vst[k ^ 1] != i2) {

                        Q2[++rear2] = k ^ 1; vst[k ^ 1] = i2;

                        if (!V[k]) {ST[len][0] = k ^ 1; ST[len++][1] = 2;}

                    }

                }

                if (!ff) break;

            }

            if (ff) {

                for (; front2<=rear2; front2++) {

                    j = Q2[front2];

                    for (int p = E2[j].next; p != j; p=E2[p].next) {

                        k = E2[p].b;

                        if (V[k] == 1 || vst[k] == i1) {ff = 0; break;}

                        if (vst[k] != i2) {

                            vst[k] = i2; Q2[++rear] = k;

                            if (!V[k]) {ST[len][0] = k; ST[len++][1] = 2;}

                        }

                    }

                    if (!ff) break;

                }

                if (ff) {

                    re(j, len) V[ST[j][0]] = ST[j][1];

                    continue;

                }

            }

        }

        i = (_i << 1) + 1; len = 0;

        if (!V[i]) {

            ST[len][0] = i; ST[len++][1] = 1; if (!V[i ^ 1]) {ST[len][0] = i ^ 1; ST[len++][1] = 2;}

            Q[front = rear = 0] = i; vst[i] = i1 = n + i; Q2[front2 = rear2 = 0] = i ^ 1; vst[i ^ 1] = i2 = (n << 1) + i; ff = 1;

            for (; front<=rear; front++) {

                j = Q[front];

                for (int p = E[j].next; p != j; p=E[p].next) {

                    k = E[p].b;

                    if (V[k] == 2 || vst[k] == i2 || V[k ^ 1] == 1 || vst[k ^ 1] == i1) {ff = 0; break;}

                    if (vst[k] != i1) {

                        Q[++rear] = k; vst[k] = i1;

                        if (!V[k]) {ST[len][0] = k; ST[len++][1] = 1;}

                    }

                    if (vst[k ^ 1] != i2) {

                        Q2[++rear2] = k ^ 1; vst[k ^ 1] = i2;

                        if (!V[k]) {ST[len][0] = k ^ 1; ST[len++][1] = 2;}

                    }

                }

                if (!ff) break;

            }

            if (ff) {

                for (; front2<=rear2; front2++) {

                    j = Q2[front2];

                    for (int p = E2[j].next; p != j; p=E2[p].next) {

                        k = E2[p].b;

                        if (V[k] == 1 || vst[k] == i1) {ff = 0; break;}

                        if (vst[k] != i2) {

                            vst[k] = i2; Q2[++rear] = k;

                            if (!V[k]) {ST[len][0] = k; ST[len++][1] = 2;}

                        }

                    }

                    if (!ff) break;

                }

                if (ff) {

                    re(j, len) V[ST[j][0]] = ST[j][1];

                    continue;

                }

            }

        }

        if (V[_i << 1] + V[(_i << 1) + 1] != 3) {res_ex = 0; break;}

    }

}

int main()

{

    int _m, a, b;

    while (scanf("%d%d", &_n, &_m) != EOF) {

        n = _n << 1; init_d();

        re(i, _m) {

            scanf("%d%d", &a, &b); a--; b--;

            if (a != (b ^ 1)) {add_edge(a, b ^ 1); add_edge(b, a ^ 1);}

        }

        solve();

        if (res_ex) {re(i, n) if (V[i] == 1) printf("%d\n", i + 1);} else puts("NIE");

    }

    return 0;

}

【O(M)算法】
根据图的对称性,可以将图中所有的强连通分支全部缩成一个点(因为强连通分支中的点要么都选,要么都不选),然后按照拓扑逆序(每次找出度为0的点,具体实现时,在建分支邻接图时将所有边取反)遍历分支邻接图,将这个点(表示的连通分支)选上,并将其所有对立点(注意,连通分支的对立连通分支可能有多个,若对于两个连通分支S1和S2,点i在S1中,点i'在S2中,则S1和S2对立)及这些对立点的前趋全部标记为不选,直到所有点均标记为止。这一过程中必然不会出现矛盾(详细证明过程省略,论文里有)。
无解判定:若求出所有强分支后,存在点i和i'处于同一个分支,则无解,否则必定有解。
时间复杂度:求强分支时间复杂度为O(M),拓扑排序的时间复杂度O(M),总时间复杂度为O(M)。

该算法的时间复杂度低,但是只能求出任意一组解,不能保证求出解的字典序最小。当然,如果原题不需要求出具体的解,只需要判定是否有解(有的题是二分 + 2-SAT判有解的),当然应该采用这种算法,只要求强连通分支(Kosaraju、Tarjan均可,推荐后者)即可。

【具体题目】PKU3648(本题的特殊情况非常多,具体见Discuss)

#include <iostream>

#include <stdio.h>

using namespace std;

#define re(i, n) for (int i=0; i<n; i++)

#define re2(i, l, r) for (int i=l; i<r; i++)

#define re3(i, l, r) for (int i=l; i<=r; i++)

const int MAXN = 1000, MAXM = 10000, INF = ~0U >> 2;

struct edge {

    int a, b, pre, next;

} E[MAXM], E2[MAXM];

int n, n2, m, m2, stk[MAXN], stk0[MAXN], V[MAXN], w[MAXN], st[MAXN], dfn[MAXN], low[MAXN], sw[MAXN], L[MAXN], R[MAXN];

int V2[MAXN], Q[MAXN], de[MAXN], Q0[MAXN];

bool vst[MAXN], res[MAXN], res_ex;

void init_d()

{

    re(i, n) E[i].a = E[i].pre = E[i].next = i;

    m = n;

}

void init_d2()

{

    re(i, n2) {E2[i].a = E2[i].pre = E2[i].next = i; de[i] = 0;}

    m2 = n2;

}

void add_edge(int a, int b)

{

    E[m].a = a; E[m].b = b; E[m].pre = E[a].pre; E[m].next = a; E[a].pre = m; E[E[m].pre].next = m++;

    de[b]++;

}

void add_edge2(int a, int b)

{

    E2[m2].a = a; E2[m2].b = b; E2[m2].pre = E2[a].pre; E2[m2].next = a; E2[a].pre = m2; E[E[m2].pre].next = m2++;

}

void solve()

{

    int tp, tp0, x0, x, y, ord = 0, ord0 = 0; n2 = 0;

    bool fd;

    res_ex = 1; re(i, n) V[i] = 0;

    re(i, n) if (!V[i]) {

        stk[tp = 0] = stk0[tp0 = 0] = i; V[i] = 1; dfn[i] = low[i] = ++ord; st[i] = E[i].next;

        while (tp0 >= 0) {

            x = stk0[tp0]; fd = 0;

            for (int p=st[x]; p != x; p = E[p].next) {

                y = E[p].b;

                if (!V[y]) {

                    stk[++tp] = stk0[++tp0] = y; V[y] = 1; dfn[y] = low[y] = ++ord; st[y] = E[y].next; st[x] = E[p].next; fd = 1; break;

                } else if (V[y] == 1 && dfn[y] < low[x]) low[x] = dfn[y];

            }

            if (!fd) {

                V[x] = 2;

                if (low[x] == dfn[x]) {

                    L[n2] = ord0;

                    while ((y = stk[tp]) != x) {w[y] = n2; sw[ord0++] = y; tp--;}

                    w[stk[tp--]] = n2; sw[ord0] = x; R[n2++] = ord0++;

                };

                if (tp0) {x0 = stk0[tp0 - 1]; if (low[x] < low[x0]) low[x0] = low[x];} tp0--;

            }

        }

    }

    re(i, n) if (w[i] == w[i ^ 1]) {res_ex = 0; return;}

    init_d2();

    re2(i, n, m) {

        x = w[E[i].a]; y = w[E[i].b];

        if (x != y) add_edge2(y, x);

    }

    int front = 0, rear = -1, front0, rear0; re(i, n2) {if (!de[i]) Q[++rear] = i; V2[i] = 0;}

    for (; front<=rear; front++) {

        int i = Q[front], j, j0;

        if (!V2[i]) {

            V2[i] = 1; front0 = 0; rear0 = -1;

            re(k, n2) vst[k] = 0;

            re3(x, L[i], R[i]) {

                j = w[sw[x] ^ 1]; Q0[++rear0] = j; vst[j] = 1;

            }

            for (; front0<=rear0; front0++) {

                j = Q0[front0]; V2[j] = 2;

                for (int p=E2[j].next; p != j; p=E2[p].next) {

                    j0 = E2[p].b;

                    if (!vst[j0]) {Q0[++rear0] = j0; vst[j0] = 1;}

                }

            }

        }

        for (int p=E[i].next; p != i; p=E[p].next) {

            j = E[p].b; de[j]--;

            if (!de[j]) Q[++rear] = j;

        }

    }

    re(i, n) res[i] = 0;

    re(i, n2) if (V2[i] == 1) re3(j, L[i], R[i]) res[sw[j]] = 1;

}

int main()

{

    int n0, m0, x1, x2, N1, N2;

    char c1, c2;

    while (1) {

        scanf("%d%d", &n0, &m0); if (!n0 && !m0) break; else {n = n0 << 1; init_d();}

        re(i, m0) {

            scanf("%d%c%d%c", &x1, &c1, &x2, &c2);

            if (c1 == 'h') N1 = x1 << 1; else N1 = (x1 << 1) + 1;

            if (c2 == 'h') N2 = x2 << 1; else N2 = (x2 << 1) + 1;

            add_edge(N1 ^ 1, N2); add_edge(N2 ^ 1, N1);

        }

        add_edge(0, 1);

        solve();

        if (res_ex) {

            bool spc = 0;

            re(i, n) if (i != 1 && res[i]) {

                if (spc) putchar(' '); else spc = 1;

                printf("%d%c", i >> 1, i & 1 ? 'w' : 'h');

            }

            puts("");

        } else puts("bad luck");

    }

    return 0;

}

你可能感兴趣的:(算法)