算法实践——舞蹈链(Dancing Links)算法求解数独

在“跳跃的舞者,舞蹈链(Dancing Links)算法——求解精确覆盖问题”一文中介绍了舞蹈链(Dancing Links)算法求解精确覆盖问题。

本文介绍该算法的实际运用,利用舞蹈链(Dancing Links)算法求解数独

 

在前文中可知,舞蹈链(Dancing Links)算法在求解精确覆盖问题时效率惊人。

那利用舞蹈链(Dancing Links)算法求解数独问题,实际上就是下面一个流程

1、把数独问题转换为精确覆盖问题

2、设计出数据矩阵

3、用舞蹈链(Dancing Links)算法求解该精确覆盖问题

4、把该精确覆盖问题的解转换为数独的解

 

首先看看数独问题(9*9的方格)的规则

1、每个格子只能填一个数字

2、每行每个数字只能填一遍

3、每列每个数字只能填一遍

4、每宫每个数字只能填一遍(宫的概念,参看“算法实践——数独的基本解法”)

 

那现在就是利用这个规则把数独问题转换为精确覆盖问题

可是,直观上面的规则,发现比较难以转换为精确覆盖问题。因此,把上面的表述换个说法

1、每个格子只能填一个数字

2、每行1-9的这9个数字都得填一遍(也就意味着每个数字只能填一遍)

3、每列1-9的这9个数字都得填一遍

4、每宫1-9的这9个数字都得填一遍

 

这样理解的话,数独问题转换为精确覆盖问题就相对简单多了。关键就是如何构造精确覆盖问题中的矩阵

 

我们把矩阵的每个列都定义成一个约束条件。

 

第1列定义成:(1,1)填了一个数字

第2列定义成:(1,2)填了一个数字

……

第9列定义成:(1,9)填了一个数字

第10列定义成:(2,1)填了一个数字

……

第18列定义成:(2,9)填了一个数字

……

第81列定义成:(9,9)填了一个数字

至此,用第1-81列完成了约束条件1:每个格子只能填一个数字

第N列(1≤N≤81)定义成:(X,Y)填了一个数字。

N、X、Y之间的关系是:X=INT((N-1)/9)+1;Y=((N-1) Mod 9)+1;N=(X-1)×9+Y

 

 

第82列定义成:在第1行填了数字1

第83列定义成:在第1行填了数字2

……

第90列定义成:在第1行填了数字9

第91列定义成:在第2行填了数字1

……

第99列定义成:在第2行填了数字9

……

第162列定义成:在第9行填了数字9

至此,用第82-162列(共81列)完成了约束条件2:每行1-9的这9个数字都得填一遍

第N列(82≤N≤162)定义成:在第X行填了数字Y。

N、X、Y之间的关系是:X=INT((N-81-1)/9)+1;Y=((N-81-1) Mod 9)+1;N=(X-1)×9+Y+81

 

 

第163列定义成:在第1列填了数字1

第164列定义成:在第1列填了数字2

……

第171列定义成:在第1列填了数字9

第172列定义成:在第2列填了数字1

……

第180列定义成:在第2列填了数字9

……

第243列定义成:在第9列填了数字9

至此,用第163-243列(共81列)完成了约束条件3:每列1-9的这9个数字都得填一遍

第N列(163≤N≤243)定义成:在第X列填了数字Y。

N、X、Y之间的关系是:X=INT((N-162-1)/9)+1;Y=((N-162-1) Mod 9)+1;N=(X-1)×9+Y+162

 

 

第244列定义成:在第1宫填了数字1

第245列定义成:在第1宫填了数字2

……

第252列定义成:在第1宫填了数字9

第253列定义成:在第2宫填了数字1

……

第261列定义成:在第2宫填了数字9

……

第324列定义成:在第9宫填了数字9

至此,用第244-324列(共81列)完成了约束条件4:每宫1-9的这9个数字都得填一遍

第N列(244≤N≤324)定义成:在第X宫填了数字Y。

N、X、Y之间的关系是:X=INT((N-243-1)/9)+1;Y=((N-243-1) Mod 9)+1;N=(X-1)×9+Y+243

 

至此,用了324列完成了数独的四个约束条件,矩阵的列定义完成

那接下来,就是把数独转换为矩阵

数独问题中,每个格子分两种情况。有数字的格子、没数字的格子。

 

有数字的格子

以例子来说明,在(4,2)中填的是7

把(4,2)中填的是7,解释成4个约束条件

1、在(4,2)中填了一个数字。

2、在第4行填了数字7

3、在第2列填了数字7

4、在第4宫填了数字7(坐标(X,Y)到宫N的公式为:N=INT((X-1)/3)×3+INT((Y-1)/3)+1)

 

那么这4个条件,分别转换成矩阵对应的列为

1、在(4,2)中填了一个数字。对应的列N=(4-1)×9+2=29

2、在第4行填了数字7。对应的列N=(4-1)×9+7+81=115

3、在第2列填了数字7。对应的列N=(2-1)×9+7+162=178

4、在第4宫填了数字7。对应的列N=(4-1)×9+7+243=277

 

于是,(4,2)中填的是7,转成矩阵的一行就是,第29、115、178、277列是1,其余列是0。把这1行插入到矩阵中去。

 

没数字的格子

还是举例说明,在(5,8)中没有数字

把(5,8)中没有数字转换成

(5,8)中填的是1,转成矩阵的一行就是,第44、118、226、289列是1,其余列是0。

(5,8)中填的是2,转成矩阵的一行就是,第44、119、227、290列是1,其余列是0。

(5,8)中填的是3,转成矩阵的一行就是,第44、120、228、291列是1,其余列是0。

(5,8)中填的是4,转成矩阵的一行就是,第44、121、229、292列是1,其余列是0。

(5,8)中填的是5,转成矩阵的一行就是,第44、122、230、293列是1,其余列是0。

(5,8)中填的是6,转成矩阵的一行就是,第44、123、231、294列是1,其余列是0。

(5,8)中填的是7,转成矩阵的一行就是,第44、124、232、295列是1,其余列是0。

(5,8)中填的是8,转成矩阵的一行就是,第44、125、233、296列是1,其余列是0。

(5,8)中填的是9,转成矩阵的一行就是,第44、126、234、297列是1,其余列是0。

把这9行插入到矩阵中。由于这9行的第44列都是1(不会有其他行的44列会是1),也就是说这9行中必只有1行(有且只有1行)选中(精确覆盖问题的定义,每列只能有1个1),是最后解的一部分。这就保证了最后解在(5,8)中只有1个数字。

 

这样,从数独的格子依次转换成行(1行或者9行)插入到矩阵中。完成了数独问题到精确覆盖问题的转换。

接下来求解精确覆盖问题就交给舞蹈链(Dancing Links)算法,详情参看“跳跃的舞者,舞蹈链(Dancing Links)算法——求解精确覆盖问题”

 


Public  Interface  I_Sudoku
    Function SetLine( ByVal Row As  Integer, ByVal  ParamArray Value() As  Integer) As  Boolean
    Function Calculate() As  String
    Sub Init()
End  Interface

Public  Class  clsSudokuDLX
    Implements  I_Sudoku

    Private _Dance As  clsDancingLinks

    Private _Num(80) As  Integer

    Public  Sub  New()
        Init()
    End  Sub

    Public  Function SetLine(Row As  Integer, ParamArray Value() As  Integer) As  Boolean  Implements  I_Sudoku.SetLine
        Dim I As  Integer
        For I = 0 To IIf(Value.Length < 10, Value.Length - 1, 8)
            _Num(Row * 9 - 9 + I) = Value(I)
        Next
        Return  True
    End  Function

    Public  Function Calculate() As  String  Implements  I_Sudoku.Calculate
        Dim I As  Integer, J As  Integer
        Dim X As  Integer, Y As  Integer
        Dim Index As  New  List( Of  Integer), Value As  New  List( Of  Integer)
        Dim C1 As  Integer, C2 As  Integer, C3 As  Integer, C4 As  Integer
        For I = 0 To 80
            X = Int(I / 9)
            Y = I Mod 9
            If _Num(I) > 0 Then
                C1 = X * 9 + Y + 1
                C2 = X * 9 + _Num(I) + 81
                C3 = Y * 9 + _Num(I) + 162
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + _Num(I) + 243
                _Dance.AppendLineByIndex(C1, C2, C3, C4)
                Index.Add(I)
                Value.Add(_Num(I))
            Else
                C1 = X * 9 + Y + 1
                C2 = X * 9 + 1 + 81
                C3 = Y * 9 + 1 + 162
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + 1 + 243
                _Dance.AppendLineByIndex(C1, C2, C3, C4)
                Index.Add(I)
                Value.Add(1)

                For J = 2 To 9
                    _Dance.AppendLineByIndex(C1, C2 + J - 1, C3 + J - 1, C4 + J - 1)
                    Index.Add(I)
                    Value.Add(J)
                Next
            End  If
        Next

        Dim P() As  Integer = _Dance.Dance

        For I = 0 To 80
            _Num(Index.Item(P(I) - 1)) = Value.Item(P(I) - 1)
        Next

        Dim V As  String = ""
        For I = 0 To 80
            V = V & _Num(I) & "  "
            If I Mod 9 = 8 Then V &= vbNewLine
        Next
        Return V

    End  Function

    Public  Sub Init() Implements  I_Sudoku.Init
        _Dance = New  clsDancingLinks(324)
        Dim I As  Integer
        For I = 0 To 80
            _Num(I) = 0
        Next
    End  Sub
End  Class

上面的代码给出了clsSudokuDLX的代码,通过调用clsDancingLinks类来求解数独。I_Sudoku接口没什么特殊意义,仅仅是为了测试方便而已。clsDancingLinks类的代码这里就不贴了,在“跳跃的舞者,舞蹈链(Dancing Links)算法——求解精确覆盖问题”里有

 

对三个数独问题求解来对比算法的效率

先看看三个数独

数独一:简单的数独

算法实践——舞蹈链(Dancing Links)算法求解数独_第1张图片

 

数独二:有点难度的数独

算法实践——舞蹈链(Dancing Links)算法求解数独_第2张图片

 

数独三:高难度的数独。虽然和数独二比较仅仅差了一个数字的位置,但是求解的难度提高了不止一个等级。

算法实践——舞蹈链(Dancing Links)算法求解数独_第3张图片

 

 

时间效率的对比

 

我们分别对三个数独进行百次的求解,剔除明显异于平均的时间,再取平均值

 

暴力破解法

数独一:0.114毫秒

数独二:0.238毫秒

数独三:15.706毫秒

 

舞蹈链(Dancing Links)算法

数独一:876.161毫秒(这个差距有点大,近乎7700倍,和我的期望值差距比较大)

数独二:775839.5毫秒=775秒840毫秒≈12.93分钟(我只做了三次测试,第一次等了5分钟,没结果,就退出了;第二次777348毫秒;第三次774331毫秒)

数独三:只做了一次测试,时间约40分钟,还没结果,就退出了

 

从上面的测试结果来看,舞蹈链(Dancing Links)算法从时间效率的角度来看,是完败于暴力破解法的

 

空间效率的对比

 

暴力破解法

数独一:在求解的过程中,一路唯一数单元格到底,没有缓存数据。故空间占用81字节。

数独二:在求解的过程中,最多向栈Q缓存了12步的数据。故占用空间81+12*81=972字节

数独三:在求解的过程中,最多向栈Q缓存了21步的数据。故占用空间81+21*81=1782字节

 

舞蹈链(Dancing Links)算法

数独一:题目提供了32个数字,则矩阵一共有32*1+(81-32)*9=473行,每行4个节点,则一共有473*4+324+1=2217个节点。每个节点6个分量,则一共要13302个字节。另程序在每行额外提供2个字节缓存相关信息。故一共要11844+473*2=14248字节

数独二:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。故一共要15414+561*2=16536字节

数独三:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。故一共要15414+561*2=16536字节

 

以上的分析,舞蹈链(Dancing Links)算法从空间效率的角度来看,是完败于暴力破解法的

 

做分析做到这,结果出乎我的意料。虽然我估计舞蹈链(Dancing Links)算法不见得优于暴力破解法,但没想到差距会那么大。不过,也可以理解,舞蹈链(Dancing Links)算法仅仅是利用了十字双向循环链的数据结构解决了缓存和回溯的难题,但本质上还是回溯法,还是暴力破解法。

 

 

针对该数独问题进行优化舞蹈链(Dancing Links)算法

 

回顾前文“跳跃的舞者,舞蹈链(Dancing Links)算法——求解精确覆盖问题”,可以发现,在Dance(K)函数调用的时候,是直接调用_Head.Right来获得未求解列。由于精确覆盖问题是要求每个列都要覆盖到,因此,在算法中调用未求解列的先后顺序那就不是最重要了。假如,现在有两个未求解列C1和C2,C1列有8个元素,C2列有4个元素。最坏的情况,从C1列求解,需要调用8次Dance(K+1),而从C2列求解,需要调用4次Dance(K+1)。感觉上从C2列求解比从C1列求解效率要高些。因此,在Dance(K)函数调用的时候,先找寻列元素最少的未求解列,再依次求解,可能效率会高点。我们把这个称之为改进的舞蹈链(Improve Dancing Links)算法

 

给每个列首元素(除却Head元素)添加一个Count分量,表示这个列首所在列的其他元素的个数。

因此,在原算法的基础上,把C1=Head.Right改成获得Count分量最少的列首元素。代码贴于下方,修改的部分用红色标示


Public  Class  clsDancingLinksImprove
    Private Left() As  Integer, Right() As  Integer, Up() As  Integer, Down() As  Integer
    Private Row() As  Integer, Col() As  Integer

    Private _Head As  Integer

    Private _Rows As  Integer, _Cols As  Integer, _NodeCount As  Integer
    Private Count() As Integer

    Private Ans() As  Integer

    Public  Sub  New( ByVal Cols As  Integer)
        ReDim Left(Cols), Right(Cols), Up(Cols), Down(Cols), Row(Cols), Col(Cols), Ans(Cols)
        ReDim Count(Cols)
        Dim I As  Integer

        Up(0) = 0
        Down(0) = 0
        Right(0) = 1
        Left(0) = Cols

        For I = 1 To Cols
            Up(I) = I
            Down(I) = I
            Left(I) = I - 1
            Right(I) = I + 1
            Col(I) = I
            Row(I) = 0

            Count(I) = 0
        Next

        Right(Cols) = 0

        _Rows = 0
        _Cols = Cols
        _NodeCount = Cols
        _Head = 0
    End  Sub

    Public  Sub AppendLine( ByVal  ParamArray Value() As  Integer)
        _Rows += 1
        If Value.Length = 0 Then  Exit Sub

        Dim I As  Integer, K As  Integer = 0

        For I = 0 To Value.Length - 1
            If Value(I) = 1 Then
                _NodeCount += 1
                ReDim  Preserve Left(_NodeCount)
                ReDim  Preserve Right(_NodeCount)
                ReDim  Preserve Up(_NodeCount)
                ReDim  Preserve Down(_NodeCount)
                ReDim  Preserve Row(_NodeCount)
                ReDim  Preserve Col(_NodeCount)
                ReDim  Preserve Ans(_NodeCount)
                If K = 0 Then
                    Left(_NodeCount) = _NodeCount
                    Right(_NodeCount) = _NodeCount
                    K = 1
                Else
                    Left(_NodeCount) = _NodeCount - 1
                    Right(_NodeCount) = Right(_NodeCount - 1)
                    Left(Right(_NodeCount - 1)) = _NodeCount
                    Right(_NodeCount - 1) = _NodeCount
                End  If

                Down(_NodeCount) = I + 1
                Up(_NodeCount) = Up(I + 1)
                Down(Up(I + 1)) = _NodeCount
                Up(I + 1) = _NodeCount

                Row(_NodeCount) = _Rows
                Col(_NodeCount) = I + 1

                Count(I + 1) += 1
            End  If
        Next

    End  Sub

    Public  Sub AppendLineByIndex( ByVal  ParamArray Index() As  Integer)
        _Rows += 1
        If Index.Length = 0 Then  Exit Sub

        Dim I As  Integer, K As  Integer = 0

        ReDim  Preserve Left(_NodeCount + Index.Length)
        ReDim  Preserve Right(_NodeCount + Index.Length)
        ReDim  Preserve Up(_NodeCount + Index.Length)
        ReDim  Preserve Down(_NodeCount + Index.Length)
        ReDim  Preserve Row(_NodeCount + Index.Length)
        ReDim  Preserve Col(_NodeCount + Index.Length)
        ReDim  Preserve Ans(_NodeCount + Index.Length)

        For I = 0 To Index.Length - 1

            _NodeCount += 1

            If I = 0 Then
                Left(_NodeCount) = _NodeCount
                Right(_NodeCount) = _NodeCount
            Else
                Left(_NodeCount) = _NodeCount - 1
                Right(_NodeCount) = Right(_NodeCount - 1)
                Left(Right(_NodeCount - 1)) = _NodeCount
                Right(_NodeCount - 1) = _NodeCount
            End  If

            Down(_NodeCount) = Index(I)
            Up(_NodeCount) = Up(Index(I))
            Down(Up(Index(I))) = _NodeCount
            Up(Index(I)) = _NodeCount

            Row(_NodeCount) = _Rows
            Col(_NodeCount) = Index(I)

            Count(Index(I)) += 1
        Next
    End  Sub

    Public  Function Dance() As  Integer()
        Return IIf(Dance(0) = True, Ans, Nothing)
    End  Function

    Private  Function Dance( ByVal K As  Integer) As  Boolean
        If (Right(_Head) = _Head) Then
            ReDim  Preserve Ans(K - 1)
            Return  True
        End  If

        Dim P As Integer, C1 As Integer
        P = Right(_Head)
        C1 = P
        Do While P <> _Head
            If Count(P) < Count(C1) Then C1 = P
            P = Right(P)
        Loop

        If Count(C1) < 1 Then Return False

        RemoveCol(C1)

        Dim I As  Integer, J As  Integer

        I = Down(C1)
        Do  While I <> C1
            Ans(K) = Row(I)

            J = Right(I)
            Do  While J <> I
                RemoveCol(Col(J))
                J = Right(J)
            Loop

            If Dance(K + 1) Then  Return  True

            J = Left(I)
            Do  While J <> I
                ResumeCol(Col(J))
                J = Left(J)
            Loop

            I = Down(I)
        Loop

        ResumeCol(C1)
        Return  False
    End  Function

    Public  Sub RemoveCol( ByVal ColIndex As  Integer)

        Left(Right(ColIndex)) = Left(ColIndex)
        Right(Left(ColIndex)) = Right(ColIndex)

        Dim I As  Integer, J As  Integer

        I = Down(ColIndex)
        Do  While I <> ColIndex
            J = Right(I)
            Do  While J <> I
                Up(Down(J)) = Up(J)
                Down(Up(J)) = Down(J)

                Count(Col(J)) -= 1

                J = Right(J)
            Loop

            I = Down(I)
        Loop

    End  Sub

    Public  Sub ResumeCol( ByVal ColIndex As  Integer)

        Left(Right(ColIndex)) = ColIndex
        Right(Left(ColIndex)) = ColIndex

        Dim I As  Integer, J As  Integer

        I = Up(ColIndex)

        Do  While (I <> ColIndex)
            J = Right(I)
            Do  While J <> I
                Up(Down(J)) = J
                Down(Up(J)) = J

                Count(Col(J)) += 1

                J = Right(J)
            Loop
            I = Up(I)
        Loop

    End  Sub
End  Class

这样修改后还有一个好处是,如果Count分量最少的列首元素的Count分量是0的话,那么说明当前无解(说明没有行能覆盖该列首元素所在的列),直接返回False,省掉调用Dance(K+1)的步骤。

 

看看改进的舞蹈链(Improve Dancing Links)算法的效率

 

时间效率

数独一:6.31毫秒

数独二:8.50毫秒

数独三:11.34毫秒

 

空间效率

数独一:题目提供了32个数字,则矩阵一共有32*1+(81-32)*9=473行,每行4个节点,则一共有473*4+324+1=2217个节点。每个节点6个分量,则一共要13302个字节。另程序在每行额外提供2个字节缓存相关信息,每个列要增加Count分量。故一共要13302+473*2+325=14573字节

数独二:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要15414+561*2+325=16861字节

数独三:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要15414+561*2+325=16861字节

 

以上的分析,改进的舞蹈链(Improve Dancing Lonks)算法在空间效率上还是完败。但是时间效率上从看,在低难度的数独问题上,虽然和暴力破解法还是有差距,但是差距比没有优化前要小了很多;在高难度的数度问题上,时间效率比暴力破解法要高。

 

 

舞蹈链(Dancing Links)算法针对数独问题还能再优化。我们来看看第二个优化的方向

 

在求解精确覆盖问题中,返回的答案实际上是行的集合,集合的一个特性是无序性。也就意味着,如果答案是唯一的话,改变行在矩阵中的顺序,不影响最后答案的输出,无论这行换到什么位置,最后的答案始终包含着这行(如果答案不是唯一的,也没啥太大的影响)。也就是说,行的顺序不影响最终答案的求解。

 

我们就从这个方向入手

在构造矩阵的时候,先遍历数独的格子,先把有数字的格子转换为行,插入到矩阵中。很显然,这些行一定会被选中(想想看么,原问题中(4,2)填的是7,如果该行没选中,结果出现了(4,2)填的是9,那不是一件很搞笑的事么)。

 

由于是精确覆盖问题,每列只能有1个1,而上面的插入的几行一定会被选中。那么,在接下来插入的行如果和上面的行相冲的话(两个行有相同的列有1),那么,后插入的行是个无效的行(肯定不会被选中)。这些无效的行插入到矩阵中,虽然不会影响最终的结果,但是肯定影响求解的效率(空间和时间都有所损耗),而这样的无效行其实有不少。

 

我们要采用特殊的手法,来避免这些无效的行插入到矩阵中。分两步走

1、先遍历数独的格子,把那些有数字的格子转换为行,插入到矩阵中。在插入的同时,把包含1的列的列首元素的Count分量设置为-1(起到后面判别的作用)。

由于这些行一定能被选中,是答案的一部分,那么把这些行的行号置入到答案列表中,并把这些列的列首元素从水平双向链中移除(手动移除比调用RemoveCol方法快)

2、在遍历没有数字的格子,转换为若干行(1个格子9行)插入到矩阵中。在插入到矩阵的时候,判断包含1的列的列首元素的Count分量。如果是-1,说明新插入的行和第1步中的某些行相冲,是个无效行,没有必要插入到矩阵中;如果不是-1,说明是个有效行,插入到矩阵中。

经过这个优化,能大大减少矩阵的规模(列不变,行减少了不少),我们称之为数独的舞蹈链(Sudoku Dancing Links)算法

 

 
Public  Class  clsSudokuDLXBySudoku
    Implements  I_Sudoku

    Private _Dance As  clsDancingLinksSudoku

    Private _Num(80) As  Integer

    Public  Sub  New()
        Init()
    End  Sub

    Public  Function SetLine(Row As  Integer, ParamArray Value() As  Integer) As  Boolean  Implements  I_Sudoku.SetLine
        Dim I As  Integer
        For I = 0 To IIf(Value.Length < 10, Value.Length - 1, 8)
            _Num(Row * 9 - 9 + I) = Value(I)
        Next
        Return  True
    End  Function

    Public  Function Calculate() As  String  Implements  I_Sudoku.Calculate
        Dim I As  Integer, J As  Integer
        Dim X As  Integer, Y As  Integer
        Dim Index As  New  List( Of  Integer), Value As  New  List( Of  Integer)
        Dim C1 As  Integer, C2 As  Integer, C3 As  Integer, C4 As  Integer
        For I = 0 To 80
            X = Int(I / 9)
            Y = I Mod 9
            If _Num(I) > 0 Then
                C1 = X * 9 + Y + 1
                C2 = X * 9 + _Num(I) + 81
                C3 = Y * 9 + _Num(I) + 162
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + _Num(I) + 243
                _Dance.AppendLineByIndex(C1, C2, C3, C4)
                Index.Add(I)
                Value.Add(_Num(I))
            End  If
        Next

        _Dance.CompleteInsertMustSelectRow()

        For I = 0 To 80
            X = Int(I / 9)
            Y = I Mod 9
            If _Num(I) = 0 Then
                C1 = X * 9 + Y + 1
                C2 = X * 9 + 1 + 81
                C3 = Y * 9 + 1 + 162
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + 1 + 243
                If _Dance.AppendLineByIndex(C1, C2, C3, C4) = True  Then
                    Index.Add(I)
                    Value.Add(1)
                End  If

                For J = 2 To 9
                    If _Dance.AppendLineByIndex(C1, C2 + J - 1, C3 + J - 1, C4 + J - 1) = True  Then
                        Index.Add(I)
                        Value.Add(J)
                    End  If
                Next
            End  If
        Next

        Dim P() As  Integer = _Dance.Dance

        For I = 0 To 80
            _Num(Index.Item(P(I) - 1)) = Value.Item(P(I) - 1)
        Next

        Dim V As  String = ""
        For I = 0 To 80
            V = V & _Num(I) & "  "
            If I Mod 9 = 8 Then V &= vbNewLine
        Next
        Return V

    End  Function

    Public  Sub Init() Implements  I_Sudoku.Init
        _Dance = New  clsDancingLinksSudoku(324)
        Dim I As  Integer
        For I = 0 To 80
            _Num(I) = 0
        Next
    End  Sub
End  Class

Public  Class  clsDancingLinksSudoku
    Private Left() As  Integer, Right() As  Integer, Up() As  Integer, Down() As  Integer
    Private Row() As  Integer, Col() As  Integer

    Private _Head As  Integer

    Private _Rows As  Integer, _Cols As  Integer, _NodeCount As  Integer
    Private Count() As  Integer

    Private Ans() As  Integer

    Private _HadInsertMustSelectRow As  Integer

    Public  Sub  New( ByVal Cols As  Integer)
        ReDim Left(Cols), Right(Cols), Up(Cols), Down(Cols), Row(Cols), Col(Cols), Ans(Cols)
        ReDim Count(Cols)
        Dim I As  Integer

        Up(0) = 0
        Down(0) = 0
        Right(0) = 1
        Left(0) = Cols

        For I = 1 To Cols
            Up(I) = I
            Down(I) = I
            Left(I) = I - 1
            Right(I) = I + 1
            Col(I) = I
            Row(I) = 0

            Count(I) = 0
        Next

        Right(Cols) = 0

        _Rows = 0
        _Cols = Cols
        _NodeCount = Cols
        _Head = 0

        _HadInsertMustSelectRow = 0
    End  Sub

    Public  Function AppendLine( ByVal  ParamArray Value() As  Integer) As  Boolean
        Dim V As  New  List( Of  Integer)

        Dim I As  Integer
        For I = 0 To Value.Length - 1
            If Value(I) = 1 Then V.Add(I + 1)
        Next

        Return AppendLineByIndex(V.ToArray)
    End  Function

    Public  Function AppendLineByIndex( ByVal  ParamArray Index() As  Integer) As  Boolean
        Dim I As  Integer, K As  Integer = 0

        If _HadInsertMustSelectRow > 0 Then
            If Index.Length = 0 Then
                _Rows += 1
                Return  True
            Else
                For I = 0 To Index.Length - 1
                    If Count(Index(I)) = -1 Then  Return  False
                Next
            End  If
        Else
            If Index.Length = 0 Then  Return  False
        End  If

        _Rows += 1

        ReDim  Preserve Left(_NodeCount + Index.Length)
        ReDim  Preserve Right(_NodeCount + Index.Length)
        ReDim  Preserve Up(_NodeCount + Index.Length)
        ReDim  Preserve Down(_NodeCount + Index.Length)
        ReDim  Preserve Row(_NodeCount + Index.Length)
        ReDim  Preserve Col(_NodeCount + Index.Length)
        ReDim  Preserve Ans(_NodeCount + Index.Length)

        For I = 0 To Index.Length - 1

            _NodeCount += 1

            If I = 0 Then
                Left(_NodeCount) = _NodeCount
                Right(_NodeCount) = _NodeCount
            Else
                Left(_NodeCount) = _NodeCount - 1
                Right(_NodeCount) = Right(_NodeCount - 1)
                Left(Right(_NodeCount - 1)) = _NodeCount
                Right(_NodeCount - 1) = _NodeCount
            End  If

            Down(_NodeCount) = Index(I)
            Up(_NodeCount) = Up(Index(I))
            Down(Up(Index(I))) = _NodeCount
            Up(Index(I)) = _NodeCount

            Row(_NodeCount) = _Rows
            Col(_NodeCount) = Index(I)

            If _HadInsertMustSelectRow > 0 Then
                Count(Index(I)) += 1
            Else
                Count(Index(I)) = -1
            End  If
        Next

        Return  True
    End  Function

    Public  Sub CompleteInsertMustSelectRow()
        Dim I As  Integer

        For I = 1 To _Cols
            If Count(I) = -1 Then
                Left(Right(I)) = Left(I)
                Right(Left(I)) = Right(I)
            End  If
        Next

        For I = 1 To _Rows
            Ans(I - 1) = I
        Next

        _HadInsertMustSelectRow = _Rows
    End  Sub

    Public  Function Dance() As  Integer()
        Return IIf(Dance(_HadInsertMustSelectRow) = True, Ans, Nothing)
    End  Function

    Private  Function Dance( ByVal K As  Integer) As  Boolean

        If (Right(_Head) = _Head) Then
            ReDim  Preserve Ans(K - 1)
            Return  True
        End  If

        Dim P As  Integer, C1 As  Integer
        P = Right(_Head)
        C1 = P
        Do  While P <> _Head
            If Count(P) < Count(C1) Then C1 = P
            P = Right(P)
        Loop

        If Count(C1) < 1 Then  Return  False

        RemoveCol(C1)

        Dim I As  Integer, J As  Integer

        I = Down(C1)
        Do  While I <> C1
            Ans(K) = Row(I)

            J = Right(I)
            Do  While J <> I
                RemoveCol(Col(J))
                J = Right(J)
            Loop

            If Dance(K + 1) Then  Return  True

            J = Left(I)
            Do  While J <> I
                ResumeCol(Col(J))
                J = Left(J)
            Loop

            I = Down(I)
        Loop

        ResumeCol(C1)
        Return  False
    End  Function

    Public  Sub RemoveCol( ByVal ColIndex As  Integer)

        Left(Right(ColIndex)) = Left(ColIndex)
        Right(Left(ColIndex)) = Right(ColIndex)

        Dim I As  Integer, J As  Integer

        I = Down(ColIndex)
        Do  While I <> ColIndex
            J = Right(I)
            Do  While J <> I
                Up(Down(J)) = Up(J)
                Down(Up(J)) = Down(J)

                Count(Col(J)) -= 1

                J = Right(J)
            Loop

            I = Down(I)
        Loop

    End  Sub

    Public  Sub ResumeCol( ByVal ColIndex As  Integer)

        Left(Right(ColIndex)) = ColIndex
        Right(Left(ColIndex)) = ColIndex

        Dim I As  Integer, J As  Integer

        I = Up(ColIndex)

        Do  While (I <> ColIndex)
            J = Right(I)
            Do  While J <> I
                Up(Down(J)) = J
                Down(Up(J)) = J

                Count(Col(J)) += 1

                J = Right(J)
            Loop
            I = Up(I)
        Loop

    End  Sub
End  Class

通过_HadInsertMustSelectRow来决定插入行的数据。如果_HadInsertMustSelectRow=0说明当前插入行为必选行,设置Count(J)的值为-1。如果_HadInsertMustSelectRow>0说明当前行为可选行,判断和之前的必选行是否有冲突,如果有,说明本行必不可选,不比再插入到矩阵里了。通过CompleteInsertMustSelectRow方法来修改_HadInsertMustSelectRow参数,来决定行的性质

 

数独的舞蹈链(Sudoku Dancing Links)算法的效率

 

时间效率

数独一:1.31毫秒

数独二:2.81毫秒

数独三:5.56毫秒

 

空间效率

数独一:矩阵一共有164行,每行4个节点,则一共有164*4+324+1=981个节点。每个节点6个分量,则一共要5886个字节。另程序在每行额外提供2个字节缓存相关信息,每个列要增加Count分量。故一共要5886+164*2+325=6539字节

数独二:矩阵一共有276行,每行4个节点,则一共有276*4+324+1=1429个节点。每个节点6个分量,则一共要8574个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要8574+276*2+325=9451字节

数独三:矩阵一共有275行,每行4个节点,则一共有275*4+324+1=1425个节点。每个节点6个分量,则一共要8550个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要8550+275*2+325=9425字节

 

可以看出,数独的舞蹈链(Sudoku Dancing Links)算法改进的舞蹈链算法(Improve Dancing Links)算法,无论是时间效率上还是空间效率上都有了很大的改进。但是和暴力破解法相比,在简单的数独问题上,时间和空间都不占优势,在高难度的数独问题上,数独的舞蹈链算法还是在时间上占有一点优势的。这还是说明了一点,舞蹈链(Dancing Links)算法本质上也是暴力破解法,只是利用巧妙的数据结构实现了高效的缓存和回溯。

 

以上是我对用舞蹈链(Dancing Links)算法求解数独问题的分析,经过两次优化后,数独的舞蹈链(Sudoku Dancing Links)算法已经达到比较好的效果。但能不能再优化呢?能优化到全面超越暴力破解法?目前我没有看出其他的优化方向,如有,望网友不吝赐教,大家共同进步。

 

最后,给出三个数独的解

数独一:

算法实践——舞蹈链(Dancing Links)算法求解数独_第4张图片

 

数独二:

算法实践——舞蹈链(Dancing Links)算法求解数独_第5张图片

 

数独三:

算法实践——舞蹈链(Dancing Links)算法求解数独_第6张图片

你可能感兴趣的:(算法实践——舞蹈链(Dancing Links)算法求解数独)