CSP 2018-03-4 棋评估局 深度搜索+回溯

题目

问题描述
  Alice和Bob正在玩井字棋游戏。
  井字棋游戏的规则很简单:两人轮流往3*3的棋盘中放棋子,Alice放的是“X”,Bob放的是“O”,Alice执先。当同一种棋子占据一行、一列或一条对角线的三个格子时,游戏结束,该种棋子的持有者获胜。当棋盘被填满的时候,游戏结束,双方平手。
  Alice设计了一种对棋局评分的方法:
  - 对于Alice已经获胜的局面,评估得分为(棋盘上的空格子数+1);
  - 对于Bob已经获胜的局面,评估得分为 -(棋盘上的空格子数+1);
  - 对于平局的局面,评估得分为0;
CSP 2018-03-4 棋评估局 深度搜索+回溯_第1张图片

例如上图中的局面,Alice已经获胜,同时棋盘上有2个空格,所以局面得分为2+1=3。
  由于Alice并不喜欢计算,所以他请教擅长编程的你,如果两人都以最优策略行棋,那么当前局面的最终得分会是多少?
输入格式
  输入的第一行包含一个正整数T,表示数据的组数。
  每组数据输入有3行,每行有3个整数,用空格分隔,分别表示棋盘每个格子的状态。0表示格子为空,1表示格子中为“X”,2表示格子中为“O”。保证不会出现其他状态。
  保证输入的局面合法。(即保证输入的局面可以通过行棋到达,且保证没有双方同时获胜的情况)
  保证输入的局面轮到Alice行棋。
输出格式
  对于每组数据,输出一行一个整数,表示当前局面的得分。
样例输入
3
1 2 1
2 1 2
0 0 0
2 1 1
0 2 1
0 0 2
0 0 0
0 0 0
0 0 0
样例输出
3
-4
0
样例说明
  第一组数据:
  Alice将棋子放在左下角(或右下角)后,可以到达问题描述中的局面,得分为3。
  3为Alice行棋后能到达的局面中得分的最大值。
  第二组数据:

Bob已经获胜(如图),此局面得分为-(3+1)=-4。
  第三组数据:
  井字棋中若双方都采用最优策略,游戏平局,最终得分为0。
数据规模和约定
  对于所有评测用例,1 ≤ T ≤ 5。

思路

棋局问题让人想起八皇后,所以尝试回溯法。题目的关键是“两人都以最优策略行棋”,何为最优?就是这么走可以得到的分数最高,用深度搜索让计算机去找,而不是自己写算法(我尝试自己写算法得了35分)
由于棋盘只有3X3,没有进行任何剪枝也能满分,其实可以避免一些无用的递归搜索,可以应用到更大的棋盘中,也能解决“五子棋先手是否更有优势”一类的问题

代码

#include
using namespace std;
int now[3][3],T;
int jud(int who){  //判断获胜 
	int i,j;
	for(i=0; i<3; i++){
		for(j=0; j<3; j++){
			if(now[i][j]==who) continue;
			else break;
		}
		if(j==3) return who;
	}
	for(i=0; i<3; i++){
		for(j=0; j<3; j++){
			if(now[j][i]==who) continue;
			else break;
		}
		if(j==3) return who;
	}
	if(now[0][0]==who&&now[1][1]==who&&now[2][2]==who) return who;
	if(now[0][2]==who&&now[1][1]==who&&now[2][0]==who) return who;
	return 0;
}

int score(int who){//计算分数 
	int tool = 0,i,j;
	for(i=0; i<3; i++)
		for(j=0; j<3; j++)
			if(now[i][j]==0) tool++;
	if(who==1) return tool+1;
	else return -tool-1;
}
int dfs(int who){
	if(jud(1)==1) return score(1);
	if(jud(2)==2) return score(2); //先判断当前局面是否获胜 
	if(score(who)==1||score(who)==-1) return 0;//没人获胜且棋盘已满,返回0 
	int reA = -0x3fffffff, reB = 0x3fffffff;//Alice最好结果和Bob最好结果 
	for(int i=0; i<3; i++){
		for(int j=0; j<3; j++){
			if(now[i][j]==0){
				now[i][j] = who; //为空,执子者落子 
				if(who==1) reA = max(dfs(2),reA); //更新Alice最好分数 
				else reB = min(dfs(1),reB); //更新Bob最好分数 
				now[i][j] = 0; //还原 
			}
		}
	}
	return who==1?reA:reB;
}						
						
int main(){
	scanf("%d",&T);
	while(T--){
		for(int i=0; i<3; i++){
			for(int j=0; j<3; j++){
				scanf("%d",&now[i][j]);
			}
		}
		printf("%d\n",dfs(1));
	}
	return 0;
}

你可能感兴趣的:(dfs,算法)