八数码问题,也称九宫格问题,是经典的状态空间搜索问题。
因为在生成状态时,可能重复,所以该问题应当用图模型解决,即搜索建立在图上。本实验采用两种实验方法:盲目搜索算法(队列 + BFS)、启发式算法(优先队列 + BFS + 评价函数)即A*算法。
该问题的规模为 9 ! = 362880,即有362880种可能的状态。采用盲目搜索法有的求解过程耗费时间、空间都很多,启发式算法效果比盲目搜索算法效率更高更优。
【思路】
采用BFS搜索,一边搜索结点一边生成新的子结点。将新生成的结点放入队列queue中,将访问过的结点放入集合set中。当某结点与目标状态相同时,那么最短路径长度就是该结点的长度。而最短路径可以通过存储父节点信息已经当前的操作算子得出。
有两个关键点:如何计算bfs中结点的层数(进而得出最短路径长度),如何记录最短路径。
【思路】
启发式算法是在盲目搜索算法的改进,通过评价函数f(n) = g(n) + h(n)为每个状态打分,通过放入优先队列priority_queue中,即得分低的状态结点优先访问。其他地方处理相同。其中g(n)是指到达这一状态的代价(即层数),h(n)是指棋盘上与目标状态不同的棋子数目。
但是有一个难点是如何证明或理解A算法的可行性。只要满足A条件,就能保证得到最优解。【A算法不能保证】
Win10,vs 2019,编程语言:C++
1、在处理状态结点数据结构时,本来只打算简简单单地用一个二维数组来表示棋盘状态,但是在二维数组嵌套队列时,出现了问题,结构体或者类都可以替代二维数组,最终选择了类。
2、集合set嵌套结构体或者类需要重载运算符 < ,因为集合内部是需要排序,正是排序才保证set的去重功能。重载这部分比较生疏,应该多加练习。
3、在代码中,需要多次用到二维数组的比较和拷贝,本来想直接调用cstring 库中的memcpy( )和memcpy( )函数来简化代码。
4、通过代码实现,真正理解了BFS是通过队列queue实现的,而DFS是通过栈stack实现的。之前用DFS来实现回溯树,并没有通过栈来实现,而是类似于先序遍历。不过有一点可以肯定的是都不需要先全部生成树或者图,而是边生成边搜索。
A*算法也有很多改进办法和其他应用。
#define _CRT_SECURE_NO_WARNINGS
#include
using namespace std;
#include
#include
const int N = 20;
//要将其看作图,边生成边搜索,一旦达到最终状态,那么就是结果
//现在有两个关键点:如何计算bfs的层数;如何记录路径
//结点 每个结点都是一个状态
class State
{
//由于无需涉及权限问题,故将所有成员都设为public
public:
int Board[3][3]; //记录每个状态各个位置上的数
int x; //x,y标记空格的位置
int y;
int step; //存储该状态的层数
int op[N][2]; //操作数组
//用二维数组设置棋盘上的数
void setBoard(int board[3][3])
{
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
Board[i][j] = board[i][j];
}
}
}
//set函数,设置Op数组,复制父结点的Op数组,再加上自己这一步的操作
//(i,j)表示新增的一对操作数,n表示第几层
void setOp(int i, int j,int ParentOp[][2],int n)
{
for (int i = 0; i < n; i++)
{
op[i][0] = ParentOp[i][0];
op[i][1] = ParentOp[i][1];
}
op[n][0] = i;
op[n][1] = j;
}
//打印函数
void print_board()
{
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
printf("%d ", Board[i][j]);
}
printf("\n");
}
printf("\n");
}
//因为set是要排序的,那么就要重载运算符
bool operator < (const State b) const {
if (memcmp(Board, b.Board, sizeof(Board)) == -1)
return true;
else
return false;
}
};
State start; //初始状态,全局变量
State over; //最终状态,全局变量
//四个方向向量:上下左右
int dx[4] = { -1,1,0, 0 };
int dy[4] = { 0,0,-1,1 };
queue<State> Q; //用队列存储遍历顺序
set<State> visited; //用集合标记访问过的结点
int stmp[3][3];
//比较两个棋盘是否相同
bool cmp(int board1[3][3], int board2[3][3]);
//State表示当前结点 (x,y)表示空格的位置
void bfs(State s)
{
//将该结点设置为已访问过
visited.insert(s);
Q.pop(); //出队
//递归调用 向四个方向生成子结点
for (int i = 0; i < 4; i++)
{
int nx = s.x + dx[i];
int ny = s.y + dy[i];
//如果结点合法且未被访问过
if (nx >= 0 && nx <= 2 && ny >= 0 && ny <= 2)
{
State tmp;
tmp.setBoard(s.Board); //将当前结点赋给tmp
//生成新的结点
swap(tmp.Board[s.x][s.y], tmp.Board[nx][ny]);
tmp.x = nx; //将空格信息也传递下去
tmp.y = ny;
tmp.step = s.step + 1; //层数加1
tmp.setOp(dx[i],dy[i],s.op,tmp.step);
if (visited.count(tmp) == 0)
{
//将新结点加入队列中
Q.push(tmp);
// tmp.print_board(); //打印出来看看
//到达最终状态
if (cmp(tmp.Board, over.Board) == true)
{
//打印操作数组
// for (int j = 0; j < tmp.step; j++)
// printf("%d %d\n",tmp.op[j][0],tmp.op[j][1]);
int tx = start.x;
int ty = start.y;
start.print_board();
//通过操作数组逆推
for (int j = 1; j < tmp.step; j++)
{
swap(stmp[tx][ty],stmp[tx + tmp.op[j][0]][ty + tmp.op[j][1]]);
tx = tx + tmp.op[j][0];
ty = ty + tmp.op[j][1];
for (int ii = 0; ii < 3; ii++)
{
for (int jj = 0; jj < 3; jj++)
{
printf("%d ", stmp[ii][jj]);
}
printf("\n");
}
printf("\n");
}
over.print_board();
printf("end step: %d\n", tmp.step);
return; //这个return的意义
}
}
}
}
//开始访问下一层,访问的结点是队列的队首
bfs(Q.front());
}
int main()
{
//初始状态
int s0[3][3] = {
{2,8,3},
{1,0,4},
{7,6,5}
};
//最终状态
int sd[3][3] = {
{1,2,3},
{8,0,4},
{7,6,5}
};
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
stmp[i][j] = s0[i][j];
}
}
int spacex = 0, spacey = 0;
//查找并记录初始状态的空格位置
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
if (s0[i][j] == 0)
{
spacex = i;
spacey = j;
break;
}
}
}
//start
start.setBoard(s0); //将s0赋值给初始状态
start.x = spacex;
start.y = spacey;
start.step = 0;
Q.push(start); //将初始结点加入队列中
over.setBoard(sd); //将sd赋值给最终状态
bfs(start);
return 0;
}
bool cmp(int board1[3][3], int board2[3][3])
{
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
if (board1[i][j] != board2[i][j])
{
return false;
}
}
}
return true;
}
2、启发式搜索算法
#define _CRT_SECURE_NO_WARNINGS
#include
using namespace std;
#include
#include
const int N = 20;
//启发式算法
class State
{
public:
int Board[3][3]; //记录每个状态各个位置上的数
int x; //x,y标记空格的位置
int y;
int step; //存储该状态的层数,即g(n)
int h; //即使h(n)
int op[N][2]; //操作数组
//用二维数组设置棋盘上的数
void setBoard(int board[3][3])
{
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
Board[i][j] = board[i][j];
}
}
}
//set函数,设置Op数组,复制父结点的Op数组,再加上自己这一步的操作
//(i,j)表示新增的一对操作数,n表示第几层
void setOp(int i, int j,int ParentOp[][2],int n)
{
for (int i = 0; i < n; i++)
{
op[i][0] = ParentOp[i][0];
op[i][1] = ParentOp[i][1];
}
op[n][0] = i;
op[n][1] = j;
}
//打印函数
void print_board()
{
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
printf("%d ", Board[i][j]);
}
printf("\n");
}
printf("\n");
}
//因为set是要排序的,那么就要重载运算符
bool operator < (const State b) const {
if (memcmp(Board, b.Board, sizeof(Board)) == -1)
return true;
else
return false;
}
};
State start; //初始状态,全局变量
State over; //最终状态,全局变量
//四个方向向量:上下左右
int dx[4] = { -1,1,0, 0 };
int dy[4] = { 0,0,-1,1 };
int cost(State S);
struct cmp_cost
{
bool operator() (State s1, State s2)
{
return cost(s1) > cost(s2);
}
};
priority_queue<State,vector<State>,cmp_cost> Q; //用优先队列存储遍历顺序
set<State> visited; //用集合标记访问过的结点
int stmp[3][3];
//比较两个棋盘是否相同
bool cmp(int board1[3][3], int board2[3][3]);
//State表示当前结点 (x,y)表示空格的位置
void bfs(State s)
{
//将该结点设置为已访问过
visited.insert(s);
Q.pop(); //出队
//递归调用 向四个方向生成子结点
for (int i = 0; i < 4; i++)
{
int nx = s.x + dx[i];
int ny = s.y + dy[i];
//如果结点合法且未被访问过
if (nx >= 0 && nx <= 2 && ny >= 0 && ny <= 2)
{
State tmp;
tmp.setBoard(s.Board); //将当前结点赋给tmp
//生成新的结点
swap(tmp.Board[s.x][s.y], tmp.Board[nx][ny]);
tmp.x = nx; //将空格信息也传递下去
tmp.y = ny;
tmp.step = s.step + 1; //层数加1
tmp.setOp(dx[i],dy[i],s.op,tmp.step);
if (visited.count(tmp) == 0)
{
//将新结点加入队列中
Q.push(tmp);
// tmp.print_board(); //打印出来看看
//到达最终状态
if (cmp(tmp.Board, over.Board) == true)
{
//打印操作数组
// for (int j = 0; j < tmp.step; j++)
// printf("%d %d\n",tmp.op[j][0],tmp.op[j][1]);
int tx = start.x;
int ty = start.y;
start.print_board();
//通过操作数组逆推
for (int j = 1; j < tmp.step; j++)
{
swap(stmp[tx][ty],stmp[tx + tmp.op[j][0]][ty + tmp.op[j][1]]);
tx = tx + tmp.op[j][0];
ty = ty + tmp.op[j][1];
for (int ii = 0; ii < 3; ii++)
{
for (int jj = 0; jj < 3; jj++)
{
printf("%d ", stmp[ii][jj]);
}
printf("\n");
}
printf("\n");
}
over.print_board();
printf("end step: %d\n", tmp.step);
return; //这个return的意义
}
}
}
}
//开始访问下一层,访问的结点是队列的队首
bfs(Q.top());
}
int main()
{
//初始状态
int s0[3][3] = {
{2,8,3},
{1,0,4},
{7,6,5}
};
//最终状态
int sd[3][3] = {
{1,2,3},
{8,0,4},
{7,6,5}
};
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
stmp[i][j] = s0[i][j];
}
}
int spacex = 0, spacey = 0;
//查找并记录初始状态的空格位置
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
if (s0[i][j] == 0)
{
spacex = i;
spacey = j;
break;
}
}
}
//start
start.setBoard(s0); //将s0赋值给初始状态
start.x = spacex;
start.y = spacey;
start.step = 0;
Q.push(start); //将初始结点加入队列中
over.setBoard(sd); //将sd赋值给最终状态
bfs(start);
return 0;
}
bool cmp(int board1[3][3], int board2[3][3])
{
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
if (board1[i][j] != board2[i][j])
{
return false;
}
}
}
return true;
}
//传进来一个状态,将其与目的状态比较
int cost(State S) //评价函数,f(n) = g(n) + h(n)
{
int h = 0;
for (int i = 0; i < 3; i++)
{
for (int j = 0; j < 3; j++)
{
if (S.Board[i][j] != over.Board[i][j])
h++;
}
}
//h的计算,值是与目的状态不同的棋子个数
return S.step + S.h;
}