遗传算法在走迷宫游戏中的应用

我的数据挖掘算法库:https://github.com/linyiqun/DataMiningAlgorithm 
我的算法库:https://github.com/linyiqun/lyq-algorithms-lib

前言

遗传(GA)算法是一个非常有意思的算法,因为他利用了生物进化理论的知识进行问题的求解。算法的核心就是把拥有更好环境适应度的基因遗传给下一代,这就是其中的关键的选择操作,遗传算法整体的阶段分为选择,交叉和变异操作,选择操作和变异操作在其中又是比较重要的步骤。本篇文章不会讲述GA算法的具体细节,之前我曾经写过一篇专门的文章介绍过此算法,链接:http://blog.csdn.net/androidlushangderen/article/details/44041499,里面介绍了一些基本的概念和算法的原理过程,如果你对GA算法掌握的还不错的话,那么对于理解后面遗传算法在走迷宫的应用来说应该不是难事。

算法在迷宫游戏中的应用

先说说走迷宫游戏要解决的问题是什么, 走迷宫游戏说白了就是给定起点,终点,中间设置一堆的障碍,然后要求可达的路径,注意这里指的是可达路径,并没有说一定是最优路径,因为最优路径一定是用步数最少的,这一点还是很不同的。而另一方面,遗传算法也是用来搜索问题最优解的,所以刚刚好可以转移到这个问题上。用一个遗传算法去解决生活中的实际问题最关键的就是如何用遗传算法中的概念表示出来,比如遗传算法中核心的几个概念,基因编码,基因长度的设置,适应度函数的定义,3个概念每个都很重要。好的,目的要求已经慢慢的明确了,下面一个个问题的解决。

为了能让大家更好的理解,下面举出一个例子,如图所示:

遗传算法在走迷宫游戏中的应用_第1张图片

图是自己做的,比较简略,以左边点的形式表示,从图中可以看出,起点位置(4, 4),出口左边为绿色区域位置(1,0),X符号表示的障碍区域,不允许经过,问题就转为搜索出从起点到终点位置的最短路径,因为本身例子构造的不是很复杂,我们按照对角线的方式出发,总共的步数=4-1 + 4-0=7步,只要中间不拐弯,每一步都是靠近目标点方向的移动就是最佳的方式。下面看看如何转化成遗传算法中的概念表示。

个体基因长度

首先是基于长度,因为最后筛选出的是一个个体,就是满足条件的个体,他的基因编码就是问题的最优解,所以就能联想把角色的每一步移动操作看出是一个基因编码,总共7步就需要7个基因值表示,所以基因的长度在本例子中就是7。

基因表示

已经将角色的每一次的移动步骤转化为基因的表示,每次的移动总共有4种可能,上下左右,基因编码是标准的二进制形式,所以可以取值为00代表向上,01向下,10向左,11向右,也就是说,每个基因组用2个编码表示,所以总共的编码数字就是2*7=14个,两两一对。

适应度函数

适应度函数的设置应该是在遗传算法中最重要了吧,以为他的设置好坏直接决定着遗传质量的好坏,基因组表示的移动的操作步骤,给定起点位置,通过基因组的编码组数据,我们可以计算出最终的抵达坐标,这里可以很容易的得出结论,如果最后的抵达坐标越接近出口坐标,就越是我们想要的结果,也就是适应值越高,所以我们可以用下面的公式作为适应度函数:



(x, y)为计算出的适应值的函数值在0到1之间波动,1为最大值,就是抵达的坐标恰好是出口位置的时候,当然适应度函数的表示不是唯一的。

算法的代码实现

算法地图数据的输入mapData.txt:

[java]  view plain copy print ?
  1. 0 0 0 0 0  
  2. 2 0 0 -1 0  
  3. 0 0 0 0 0   
  4. 0 -1 0 0 -1  
  5. 0 0 0 0 1  

就是上面图示的那个例子.

算法的主要实现类GATool.java:

[java]  view plain copy print ?
  1. package GA_Maze;  
  2.   
  3. import java.io.BufferedReader;  
  4. import java.io.File;  
  5. import java.io.FileReader;  
  6. import java.io.IOException;  
  7. import java.text.MessageFormat;  
  8. import java.util.ArrayList;  
  9. import java.util.Random;  
  10.   
  11. /** 
  12.  * 遗传算法在走迷宫游戏的应用-遗传算法工具类 
  13.  *  
  14.  * @author lyq 
  15.  *  
  16.  */  
  17. public class GATool {  
  18.     // 迷宫出入口标记  
  19.     public static final int MAZE_ENTRANCE_POS = 1;  
  20.     public static final int MAZE_EXIT_POS = 2;  
  21.     // 方向对应的编码数组  
  22.     public static final int[][] MAZE_DIRECTION_CODE = new int[][] { { 00 },  
  23.             { 01 }, { 10 }, { 11 }, };  
  24.     // 坐标点方向改变  
  25.     public static final int[][] MAZE_DIRECTION_CHANGE = new int[][] {  
  26.             { -10 }, { 10 }, { 0, -1 }, { 01 }, };  
  27.     // 方向的文字描述  
  28.     public static final String[] MAZE_DIRECTION_LABEL = new String[] { "上",  
  29.             "下""左""右" };  
  30.   
  31.     // 地图数据文件地址  
  32.     private String filePath;  
  33.     // 走迷宫的最短步数  
  34.     private int stepNum;  
  35.     // 初始个体的数量  
  36.     private int initSetsNum;  
  37.     // 迷宫入口位置  
  38.     private int[] startPos;  
  39.     // 迷宫出口位置  
  40.     private int[] endPos;  
  41.     // 迷宫地图数据  
  42.     private int[][] mazeData;  
  43.     // 初始个体集  
  44.     private ArrayList<int[]> initSets;  
  45.     // 随机数产生器  
  46.     private Random random;  
  47.   
  48.     public GATool(String filePath, int initSetsNum) {  
  49.         this.filePath = filePath;  
  50.         this.initSetsNum = initSetsNum;  
  51.   
  52.         readDataFile();  
  53.     }  
  54.   
  55.     /** 
  56.      * 从文件中读取数据 
  57.      */  
  58.     public void readDataFile() {  
  59.         File file = new File(filePath);  
  60.         ArrayList<String[]> dataArray = new ArrayList<String[]>();  
  61.   
  62.         try {  
  63.             BufferedReader in = new BufferedReader(new FileReader(file));  
  64.             String str;  
  65.             String[] tempArray;  
  66.             while ((str = in.readLine()) != null) {  
  67.                 tempArray = str.split(" ");  
  68.                 dataArray.add(tempArray);  
  69.             }  
  70.             in.close();  
  71.         } catch (IOException e) {  
  72.             e.getStackTrace();  
  73.         }  
  74.   
  75.         int rowNum = dataArray.size();  
  76.         mazeData = new int[rowNum][rowNum];  
  77.         for (int i = 0; i < rowNum; i++) {  
  78.             String[] data = dataArray.get(i);  
  79.             for (int j = 0; j < data.length; j++) {  
  80.                 mazeData[i][j] = Integer.parseInt(data[j]);  
  81.   
  82.                 // 赋值入口和出口位置  
  83.                 if (mazeData[i][j] == MAZE_ENTRANCE_POS) {  
  84.                     startPos = new int[2];  
  85.                     startPos[0] = i;  
  86.                     startPos[1] = j;  
  87.                 } else if (mazeData[i][j] == MAZE_EXIT_POS) {  
  88.                     endPos = new int[2];  
  89.                     endPos[0] = i;  
  90.                     endPos[1] = j;  
  91.                 }  
  92.             }  
  93.         }  
  94.   
  95.         // 计算走出迷宫的最短步数  
  96.         stepNum = Math.abs(startPos[0] - endPos[0])  
  97.                 + Math.abs(startPos[1] - endPos[1]);  
  98.     }  
  99.   
  100.     /** 
  101.      * 产生初始数据集 
  102.      */  
  103.     private void produceInitSet() {  
  104.         // 方向编码  
  105.         int directionCode = 0;  
  106.         random = new Random();  
  107.         initSets = new ArrayList<>();  
  108.         // 每个步骤的操作需要用2位数字表示  
  109.         int[] codeNum;  
  110.   
  111.         for (int i = 0; i < initSetsNum; i++) {  
  112.             codeNum = new int[stepNum * 2];  
  113.             for (int j = 0; j < stepNum; j++) {  
  114.                 directionCode = random.nextInt(4);  
  115.                 codeNum[2 * j] = MAZE_DIRECTION_CODE[directionCode][0];  
  116.                 codeNum[2 * j + 1] = MAZE_DIRECTION_CODE[directionCode][1];  
  117.             }  
  118.   
  119.             initSets.add(codeNum);  
  120.         }  
  121.     }  
  122.   
  123.     /** 
  124.      * 选择操作,把适值较高的个体优先遗传到下一代 
  125.      *  
  126.      * @param initCodes 
  127.      *            初始个体编码 
  128.      * @return 
  129.      */  
  130.     private ArrayList<int[]> selectOperate(ArrayList<int[]> initCodes) {  
  131.         double randomNum = 0;  
  132.         double sumFitness = 0;  
  133.         ArrayList<int[]> resultCodes = new ArrayList<>();  
  134.         double[] adaptiveValue = new double[initSetsNum];  
  135.   
  136.         for (int i = 0; i < initSetsNum; i++) {  
  137.             adaptiveValue[i] = calFitness(initCodes.get(i));  
  138.             sumFitness += adaptiveValue[i];  
  139.         }  
  140.   
  141.         // 转成概率的形式,做归一化操作  
  142.         for (int i = 0; i < initSetsNum; i++) {  
  143.             adaptiveValue[i] = adaptiveValue[i] / sumFitness;  
  144.         }  
  145.   
  146.         for (int i = 0; i < initSetsNum; i++) {  
  147.             randomNum = random.nextInt(100) + 1;  
  148.             randomNum = randomNum / 100;  
  149.             //因为1.0是无法判断到的,,总和会无限接近1.0取为0.99做判断  
  150.             if(randomNum == 1){  
  151.                 randomNum = randomNum - 0.01;  
  152.             }  
  153.               
  154.             sumFitness = 0;  
  155.             // 确定区间  
  156.             for (int j = 0; j < initSetsNum; j++) {  
  157.                 if (randomNum > sumFitness  
  158.                         && randomNum <= sumFitness + adaptiveValue[j]) {  
  159.                     // 采用拷贝的方式避免引用重复  
  160.                     resultCodes.add(initCodes.get(j).clone());  
  161.                     break;  
  162.                 } else {  
  163.                     sumFitness += adaptiveValue[j];  
  164.                 }  
  165.             }  
  166.         }  
  167.   
  168.         return resultCodes;  
  169.     }  
  170.   
  171.     /** 
  172.      * 交叉运算 
  173.      *  
  174.      * @param selectedCodes 
  175.      *            上步骤的选择后的编码 
  176.      * @return 
  177.      */  
  178.     private ArrayList<int[]> crossOperate(ArrayList<int[]> selectedCodes) {  
  179.         int randomNum = 0;  
  180.         // 交叉点  
  181.         int crossPoint = 0;  
  182.         ArrayList<int[]> resultCodes = new ArrayList<>();  
  183.         // 随机编码队列,进行随机交叉配对  
  184.         ArrayList<int[]> randomCodeSeqs = new ArrayList<>();  
  185.   
  186.         // 进行随机排序  
  187.         while (selectedCodes.size() > 0) {  
  188.             randomNum = random.nextInt(selectedCodes.size());  
  189.   
  190.             randomCodeSeqs.add(selectedCodes.get(randomNum));  
  191.             selectedCodes.remove(randomNum);  
  192.         }  
  193.   
  194.         int temp = 0;  
  195.         int[] array1;  
  196.         int[] array2;  
  197.         // 进行两两交叉运算  
  198.         for (int i = 1; i < randomCodeSeqs.size(); i++) {  
  199.             if (i % 2 == 1) {  
  200.                 array1 = randomCodeSeqs.get(i - 1);  
  201.                 array2 = randomCodeSeqs.get(i);  
  202.                 crossPoint = random.nextInt(stepNum - 1) + 1;  
  203.   
  204.                 // 进行交叉点位置后的编码调换  
  205.                 for (int j = 0; j < 2 * stepNum; j++) {  
  206.                     if (j >= 2 * crossPoint) {  
  207.                         temp = array1[j];  
  208.                         array1[j] = array2[j];  
  209.                         array2[j] = temp;  
  210.                     }  
  211.                 }  
  212.   
  213.                 // 加入到交叉运算结果中  
  214.                 resultCodes.add(array1);  
  215.                 resultCodes.add(array2);  
  216.             }  
  217.         }  
  218.   
  219.         return resultCodes;  
  220.     }  
  221.   
  222.     /** 
  223.      * 变异操作 
  224.      *  
  225.      * @param crossCodes 
  226.      *            交叉运算后的结果 
  227.      * @return 
  228.      */  
  229.     private ArrayList<int[]> variationOperate(ArrayList<int[]> crossCodes) {  
  230.         // 变异点  
  231.         int variationPoint = 0;  
  232.         ArrayList<int[]> resultCodes = new ArrayList<>();  
  233.   
  234.         for (int[] array : crossCodes) {  
  235.             variationPoint = random.nextInt(stepNum);  
  236.   
  237.             for (int i = 0; i < array.length; i += 2) {  
  238.                 // 变异点进行变异  
  239.                 if (i % 2 == 0 && i / 2 == variationPoint) {  
  240.                     array[i] = (array[i] == 0 ? 1 : 0);  
  241.                     array[i + 1] = (array[i + 1] == 0 ? 1 : 0);  
  242.                     break;  
  243.                 }  
  244.             }  
  245.   
  246.             resultCodes.add(array);  
  247.         }  
  248.   
  249.         return resultCodes;  
  250.     }  
  251.   
  252.     /** 
  253.      * 根据编码计算适值 
  254.      *  
  255.      * @param code 
  256.      *            当前的编码 
  257.      * @return 
  258.      */  
  259.     public double calFitness(int[] code) {  
  260.         double fintness = 0;  
  261.         // 由编码计算所得的终点横坐标  
  262.         int endX = 0;  
  263.         // 由编码计算所得的终点纵坐标  
  264.         int endY = 0;  
  265.         // 基于片段所代表的行走方向  
  266.         int direction = 0;  
  267.         // 临时坐标点横坐标  
  268.         int tempX = 0;  
  269.         // 临时坐标点纵坐标  
  270.         int tempY = 0;  
  271.   
  272.         endX = startPos[0];  
  273.         endY = startPos[1];  
  274.         for (int i = 0; i < stepNum; i++) {  
  275.             direction = binaryArrayToNum(new int[] { code[2 * i],  
  276.                     code[2 * i + 1] });  
  277.   
  278.             // 根据方向改变数组做坐标点的改变  
  279.             tempX = endX + MAZE_DIRECTION_CHANGE[direction][0];  
  280.             tempY = endY + MAZE_DIRECTION_CHANGE[direction][1];  
  281.   
  282.             // 判断坐标点是否越界  
  283.             if (tempX >= 0 && tempX < mazeData.length && tempY >= 0  
  284.                     && tempY < mazeData[0].length) {  
  285.                 // 判断坐标点是否走到阻碍块  
  286.                 if (mazeData[tempX][tempY] != -1) {  
  287.                     endX = tempX;  
  288.                     endY = tempY;  
  289.                 }  
  290.             }  
  291.         }  
  292.   
  293.         // 根据适值函数进行适值的计算  
  294.         fintness = 1.0 / (Math.abs(endX - endPos[0])  
  295.                 + Math.abs(endY - endPos[1]) + 1);  
  296.   
  297.         return fintness;  
  298.     }  
  299.   
  300.     /** 
  301.      * 根据当前编码判断是否已经找到出口位置 
  302.      *  
  303.      * @param code 
  304.      *            经过若干次遗传的编码 
  305.      * @return 
  306.      */  
  307.     private boolean ifArriveEndPos(int[] code) {  
  308.         boolean isArrived = false;  
  309.         // 由编码计算所得的终点横坐标  
  310.         int endX = 0;  
  311.         // 由编码计算所得的终点纵坐标  
  312.         int endY = 0;  
  313.         // 基于片段所代表的行走方向  
  314.         int direction = 0;  
  315.         // 临时坐标点横坐标  
  316.         int tempX = 0;  
  317.         // 临时坐标点纵坐标  
  318.         int tempY = 0;  
  319.   
  320.         endX = startPos[0];  
  321.         endY = startPos[1];  
  322.         for (int i = 0; i < stepNum; i++) {  
  323.             direction = binaryArrayToNum(new int[] { code[2 * i],  
  324.                     code[2 * i + 1] });  
  325.   
  326.             // 根据方向改变数组做坐标点的改变  
  327.             tempX = endX + MAZE_DIRECTION_CHANGE[direction][0];  
  328.             tempY = endY + MAZE_DIRECTION_CHANGE[direction][1];  
  329.   
  330.             // 判断坐标点是否越界  
  331.             if (tempX >= 0 && tempX < mazeData.length && tempY >= 0  
  332.                     && tempY < mazeData[0].length) {  
  333.                 // 判断坐标点是否走到阻碍块  
  334.                 if (mazeData[tempX][tempY] != -1) {  
  335.                     endX = tempX;  
  336.                     endY = tempY;  
  337.                 }  
  338.             }  
  339.         }  
  340.   
  341.         if (endX == endPos[0] && endY == endPos[1]) {  
  342.             isArrived = true;  
  343.         }  
  344.   
  345.         return isArrived;  
  346.     }  
  347.   
  348.     /** 
  349.      * 二进制数组转化为数字 
  350.      *  
  351.      * @param binaryArray 
  352.      *            待转化二进制数组 
  353.      */  
  354.     private int binaryArrayToNum(int[] binaryArray) {  
  355.         int result = 0;  
  356.   
  357.         for (int i = binaryArray.length - 1, k = 0; i >= 0; i--, k++) {  
  358.             if (binaryArray[i] == 1) {  
  359.                 result += Math.pow(2, k);  
  360.             }  
  361.         }  
  362.   
  363.         return result;  
  364.     }  
  365.   
  366.     /** 
  367.      * 进行遗传算法走出迷宫 
  368.      */  
  369.     public void goOutMaze() {  
  370.         // 迭代遗传次数  
  371.         int loopCount = 0;  
  372.         boolean canExit = false;  
  373.         // 结果路径  
  374.         int[] resultCode = null;  
  375.         ArrayList<int[]> initCodes;  
  376.         ArrayList<int[]> selectedCodes;  
  377.         ArrayList<int[]> crossedCodes;  
  378.         ArrayList<int[]> variationCodes;  
  379.   
  380.         // 产生初始数据集  
  381.         produceInitSet();  
  382.         initCodes = initSets;  
  383.   
  384.         while (true) {  
  385.             for (int[] array : initCodes) {  
  386.                 // 遗传迭代的终止条件为是否找到出口位置  
  387.                 if (ifArriveEndPos(array)) {  
  388.                     resultCode = array;  
  389.                     canExit = true;  
  390.                     break;  
  391.                 }  
  392.             }  
  393.   
  394.             if (canExit) {  
  395.                 break;  
  396.             }  
  397.   
  398.             selectedCodes = selectOperate(initCodes);  
  399.             crossedCodes = crossOperate(selectedCodes);  
  400.             variationCodes = variationOperate(crossedCodes);  
  401.             initCodes = variationCodes;  
  402.   
  403.             loopCount++;  
  404.               
  405.             //如果遗传次数超过100次,则退出  
  406.             if(loopCount >= 100){  
  407.                 break;  
  408.             }  
  409.         }  
  410.   
  411.         System.out.println("总共遗传进化了" + loopCount + "次");  
  412.         printFindedRoute(resultCode);  
  413.     }  
  414.   
  415.     /** 
  416.      * 输出找到的路径 
  417.      *  
  418.      * @param code 
  419.      */  
  420.     private void printFindedRoute(int[] code) {  
  421.         if(code == null){  
  422.             System.out.println("在有限的遗传进化次数内,没有找到最优路径");  
  423.             return;  
  424.         }  
  425.           
  426.         int tempX = startPos[0];  
  427.         int tempY = startPos[1];  
  428.         int direction = 0;  
  429.   
  430.         System.out.println(MessageFormat.format(  
  431.                 "起始点位置({0},{1}), 出口点位置({2}, {3})", tempX, tempY, endPos[0],  
  432.                 endPos[1]));  
  433.           
  434.         System.out.print("搜索到的结果编码:");  
  435.         for(int value: code){  
  436.             System.out.print("" + value);  
  437.         }  
  438.         System.out.println();  
  439.           
  440.         for (int i = 0, k = 1; i < code.length; i += 2, k++) {  
  441.             direction = binaryArrayToNum(new int[] { code[i], code[i + 1] });  
  442.   
  443.             tempX += MAZE_DIRECTION_CHANGE[direction][0];  
  444.             tempY += MAZE_DIRECTION_CHANGE[direction][1];  
  445.   
  446.             System.out.println(MessageFormat.format(  
  447.                     "第{0}步,编码为{1}{2},向{3}移动,移动后到达({4},{5})", k, code[i], code[i+1],  
  448.                     MAZE_DIRECTION_LABEL[direction],  tempX, tempY));  
  449.         }  
  450.     }  
  451.   
  452. }  
算法的调用类Client.java:

[java]  view plain copy print ?
  1. package GA_Maze;  
  2.   
  3. /** 
  4.  * 遗传算法在走迷宫游戏的应用 
  5.  * @author lyq 
  6.  * 
  7.  */  
  8. public class Client {  
  9.     public static void main(String[] args) {  
  10.         //迷宫地图文件数据地址  
  11.         String filePath = "C:\\Users\\lyq\\Desktop\\icon\\mapData.txt";  
  12.         //初始个体数量  
  13.         int initSetsNum = 4;  
  14.           
  15.         GATool tool = new GATool(filePath, initSetsNum);  
  16.         tool.goOutMaze();  
  17.     }  
  18.   
  19. }  

算法的输出:

我测了很多次的数据,因为有可能会一时半会搜索不出来,我设置了最大遗传次数100次。

[java]  view plain copy print ?
  1. 总共遗传进化了2次  
  2. 起始点位置(4,4), 出口点位置(10)  
  3. 搜索到的结果编码:10100000100010  
  4. 1步,编码为10,向左移动,移动后到达(4,3)  
  5. 2步,编码为10,向左移动,移动后到达(4,2)  
  6. 3步,编码为00,向上移动,移动后到达(3,2)  
  7. 4步,编码为00,向上移动,移动后到达(2,2)  
  8. 5步,编码为10,向左移动,移动后到达(2,1)  
  9. 6步,编码为00,向上移动,移动后到达(1,1)  
  10. 7步,编码为10,向左移动,移动后到达(1,0)  
  11.   
  12. 总共遗传进化了8次  
  13. 起始点位置(4,4), 出口点位置(10)  
  14. 搜索到的结果编码:10001000101000  
  15. 1步,编码为10,向左移动,移动后到达(4,3)  
  16. 2步,编码为00,向上移动,移动后到达(3,3)  
  17. 3步,编码为10,向左移动,移动后到达(3,2)  
  18. 4步,编码为00,向上移动,移动后到达(2,2)  
  19. 5步,编码为10,向左移动,移动后到达(2,1)  
  20. 6步,编码为10,向左移动,移动后到达(2,0)  
  21. 7步,编码为00,向上移动,移动后到达(1,0)  
  22.   
  23.   
  24. 总共遗传进化了100次  
  25. 在有限的遗传进化次数内,没有找到最优路径  

算法小结

遗传算法在走迷宫中的应用总体而言还是非常有意思的如果你去认真的体会的话,至少让我更加深入的理解了GA算法,如果博友向要亲自实现这算法,我给几点建议,第一是迷宫难度的和初始个体数量的设置,为什么要注意这2点呢,一个是这关系到遗传迭代的次数,在一段时间内有的时候遗传算法是找不出来的,如果找不出来,PC机的CPU会持续高速的计算,所以不要让遗传进行无限制的进行,最好做点次数限制,也可能是我的本本配置太烂了。。在算法的调试中修复了一个之前没发现的bug,就是选择阶段的时候对于随机数的判断少考虑了一种情形,当随机数取到1.0的时候,其实是不能判断到的,因为概念和只会无限接近1,就不知道被划分到哪个区域中了

你可能感兴趣的:(遗传算法在走迷宫游戏中的应用)