LCA最近公共祖先算法

参考链接:http://dongxicheng.org/structure/union-find-set/  作者Dong

算法介绍

LCA(Least Common Ancestors)问题的定义是这样的,给定2个点,求出离他们最近的也也就是深度最深(或者说是离树根最远的)的公共祖先。这个问题如果细细去想,也不算法是特别难的一个问题,最简单的办法就是,依次从2个点开始,往父亲节点上去寻找,如果存在2个父亲节点是一样的,这个父亲就是此2点的最近公共祖先。当然,这是最简单的也是很容易想到的方法。所以本文所描述的算法的执行效率当然是比这个要好很多的。LCA算法分为离线算法和在线算法2种。那么有人一定会想,他们之间的区别是什么呢,在线算法,顾名思义,就是请求数据输入一条,则输出一条结果,然后再输入一次请求查询,在输出结果,在线的意思,很好理解。而离线算法指的是一次性输入所有的请求查询条件,然后需要在算法执行结束的时候输出所有结果。因为平常说的比较多的是LCA的离线算法,所以今天我所写的也是LCA的求解的离线算法。

算法原理

LCA的离线算法采用的是Tarjan算法,Tarjan算法之前我也没有接触过,查了一下,是用来求有向图的强连通分量的。里面用了并查集和DFS深度优先算法的知识。DFS深度优先算法大家都知道是怎么回事,并查集估计听过的人不是很多。好,下面就先来介绍一下并查集的一些概念和操作。

并查集

并查集操作主要有2个,1个是findSet(),用来查找节点的祖先的,祖先的特点是祖先的父亲等于他本身,以这个作为关键的判定条件,图示如下:

LCA最近公共祖先算法_第1张图片

还有一个操作是unionSet(int a, int b),合并集合操作,找出2个节点的祖先,将其中的一个节点的祖先的父亲指向另一个节点。图示如下:

LCA最近公共祖先算法_第2张图片

并查集的相关实现代码在后面的代码实现中会给出,请大家注意观察。

算法过程

算法的执行过程是采用DFS深度优先遍历的方式,每一次遍历完一个节点的时候,会重新将此点与父亲节点合并,这是算法的比较巧妙的操作。算法的执行非常的高,只要遍历过一遍整棵树,就能得到所有的结果,所有他的时间复杂度为O(n + q),n为节点总数,q为查询的数量,为线性级别。算法的伪代码如下:

[java]  view plain copy print ?
  1. LCA(u)      
  2. {            
  3. Make-Set(u)            
  4. ancestor[Find-Set(u)]=u           
  5. 对于u的每一个孩子v           
  6. {                
  7. LCA(v)               
  8. Union(u)                
  9. ancestor[Find-Set(u)]=u           
  10. }            
  11. checked[u]=true           
  12. 对于每个(u,v)属于Q           
  13. {                
  14. if checked[v]=true             
  15. then {                  回答u和v的最近公共祖先为 ancestor[Find-Set(v)]             }           
  16. }      
  17. }  

我在实现的时候略去了union下面的ancestor[Find-Set(u)] = u,这个操作我认为已经包含在union里面了,这点是我感觉比较费解的。下面给出算法的完整实现。

算法的实现

测试点数据dataFile:

[java]  view plain copy print ?
  1. 1 2 3 4 5 6 7 8 9 10  
查询请求数据queryFile:

为了准确测试遍历的整个过程,我列举了所有点构成查询对的可能,也就是是说有9 + 8 + 7 + .... + 1 = 45种可能。

[java]  view plain copy print ?
  1. 1 2  
  2. 1 3  
  3. 1 4  
  4. 1 5  
  5. 1 6  
  6. 1 7  
  7. 1 8  
  8. 1 9  
  9. 1 10  
  10. 2 3  
  11. 2 4  
  12. 2 5  
  13. 2 6  
  14. 2 7  
  15. 2 8  
  16. 2 9  
  17. 2 10  
  18. 3 4  
  19. 3 5  
  20. 3 6  
  21. 3 7  
  22. 3 8  
  23. 3 9  
  24. 3 10  
  25. 4 5  
  26. 4 6  
  27. 4 7  
  28. 4 8  
  29. 4 9  
  30. 4 10  
  31. 5 6  
  32. 5 7  
  33. 5 8  
  34. 5 9  
  35. 5 10  
  36. 6 7  
  37. 6 8  
  38. 6 9  
  39. 6 10  
  40. 7 8  
  41. 7 9  
  42. 7 10  
  43. 8 9  
  44. 8 10  
  45. 9 10  
LCATool.java:

[java]  view plain copy print ?
  1. package LCA;  
  2.   
  3. import java.io.BufferedReader;  
  4. import java.io.File;  
  5. import java.io.FileReader;  
  6. import java.io.IOException;  
  7. import java.text.MessageFormat;  
  8. import java.util.ArrayList;  
  9. import java.util.concurrent.LinkedBlockingQueue;  
  10.   
  11. /** 
  12.  * LCA最近公共祖先算法 
  13.  *  
  14.  * @author lyq 
  15.  *  
  16.  */  
  17. public class LCATool {  
  18.     // 节点数据文件  
  19.     private String dataFilePath;  
  20.     // 查询请求数据文件  
  21.     private String queryFilePath;  
  22.     // 节点祖先集合,数组下标代表所对应的节点,数组组为其祖先值  
  23.     private int[] ancestor;  
  24.     // 标记数组,代表此节点是否已经被访问过  
  25.     private boolean[] checked;  
  26.     // 请求数据组  
  27.     private ArrayList<int[]> querys;  
  28.     // 请求结果值  
  29.     private int[][] resultValues;  
  30.     // 初始数据值  
  31.     private ArrayList<String> totalDatas;  
  32.   
  33.     public LCATool(String dataFilePath, String queryFilePath) {  
  34.         this.dataFilePath = dataFilePath;  
  35.         this.queryFilePath = queryFilePath;  
  36.   
  37.         readDataFile();  
  38.     }  
  39.   
  40.     /** 
  41.      * 从文件中读取数据 
  42.      */  
  43.     private void readDataFile() {  
  44.         File file = new File(dataFilePath);  
  45.         ArrayList<String[]> dataArray = new ArrayList<String[]>();  
  46.   
  47.         try {  
  48.             BufferedReader in = new BufferedReader(new FileReader(file));  
  49.             String str;  
  50.             String[] tempArray;  
  51.             while ((str = in.readLine()) != null) {  
  52.                 tempArray = str.split(" ");  
  53.                 dataArray.add(tempArray);  
  54.             }  
  55.             in.close();  
  56.         } catch (IOException e) {  
  57.             e.getStackTrace();  
  58.         }  
  59.   
  60.         totalDatas = new ArrayList<>();  
  61.         for (String[] array : dataArray) {  
  62.             for (String s : array) {  
  63.                 totalDatas.add(s);  
  64.             }  
  65.         }  
  66.         checked = new boolean[totalDatas.size() + 1];  
  67.         ancestor = new int[totalDatas.size() + 1];  
  68.   
  69.         // 读取查询请求数据  
  70.         file = new File(queryFilePath);  
  71.         dataArray.clear();  
  72.         try {  
  73.             BufferedReader in = new BufferedReader(new FileReader(file));  
  74.             String str;  
  75.             String[] tempArray;  
  76.             while ((str = in.readLine()) != null) {  
  77.                 tempArray = str.split(" ");  
  78.                 dataArray.add(tempArray);  
  79.             }  
  80.             in.close();  
  81.         } catch (IOException e) {  
  82.             e.getStackTrace();  
  83.         }  
  84.   
  85.         int x = 0;  
  86.         int y = 0;  
  87.         querys = new ArrayList<>();  
  88.         resultValues = new int[dataArray.size()][dataArray.size()];  
  89.   
  90.         for (int i = 0; i < dataArray.size(); i++) {  
  91.             for (int j = 0; j < dataArray.size(); j++) {  
  92.                 // 值-1代表还未计算过LCA值  
  93.                 resultValues[i][j] = -1;  
  94.             }  
  95.         }  
  96.   
  97.         for (String[] array : dataArray) {  
  98.             x = Integer.parseInt(array[0]);  
  99.             y = Integer.parseInt(array[1]);  
  100.   
  101.             querys.add(new int[] { x, y });  
  102.         }  
  103.   
  104.     }  
  105.   
  106.     /** 
  107.      * 构建树结构,此处默认构造成二叉树的形式,真实情况根据实际问题需要 
  108.      *  
  109.      * @param rootNode 
  110.      *            根节点参数 
  111.      */  
  112.     private void createTree(TreeNode rootNode) {  
  113.         TreeNode tempNode;  
  114.         TreeNode[] nodeArray;  
  115.         ArrayList<String> dataCopy;  
  116.         LinkedBlockingQueue<TreeNode> nodeSeqs = new LinkedBlockingQueue<>();  
  117.   
  118.         rootNode.setValue(Integer.parseInt(totalDatas.get(0)));  
  119.         dataCopy = (ArrayList<String>) totalDatas.clone();  
  120.         // 移除根节点的首个数据值  
  121.         dataCopy.remove(0);  
  122.         nodeSeqs.add(rootNode);  
  123.   
  124.         while (!nodeSeqs.isEmpty()) {  
  125.             tempNode = nodeSeqs.poll();  
  126.   
  127.             nodeArray = new TreeNode[2];  
  128.             if (dataCopy.size() > 0) {  
  129.                 nodeArray[0] = new TreeNode(dataCopy.get(0));  
  130.                 dataCopy.remove(0);  
  131.                 nodeSeqs.add(nodeArray[0]);  
  132.             } else {  
  133.                 tempNode.setChildNodes(nodeArray);  
  134.                 break;  
  135.             }  
  136.   
  137.             if (dataCopy.size() > 0) {  
  138.                 nodeArray[1] = new TreeNode(dataCopy.get(0));  
  139.                 dataCopy.remove(0);  
  140.                 nodeSeqs.add(nodeArray[1]);  
  141.             } else {  
  142.                 tempNode.setChildNodes(nodeArray);  
  143.                 break;  
  144.             }  
  145.   
  146.             tempNode.setChildNodes(nodeArray);  
  147.         }  
  148.     }  
  149.   
  150.     /** 
  151.      * 进行lca最近公共祖先算法的计算 
  152.      *  
  153.      * @param node 
  154.      *            当前处理的节点 
  155.      */  
  156.     private void lcaCal(TreeNode node) {  
  157.         if (node == null) {  
  158.             return;  
  159.         }  
  160.   
  161.         // 处理过后的待删除请求列表  
  162.         ArrayList<int[]> deleteQuerys = new ArrayList<>();  
  163.         TreeNode[] childNodes;  
  164.         int value = node.value;  
  165.         ancestor[value] = value;  
  166.   
  167.         childNodes = node.getChildNodes();  
  168.         if (childNodes != null) {  
  169.             for (TreeNode n : childNodes) {  
  170.                 lcaCal(n);  
  171.   
  172.                 // 深度优先遍历完成,重新设置祖先值  
  173.                 value = node.value;  
  174.                 //通过树型结构进行祖先的设置方式,易于理解  
  175.                 // setNodeAncestor(n, value);  
  176.                 if(n != null){  
  177.                     //合并2个集合  
  178.                     unionSet(n.value, value);  
  179.                 }  
  180.             }  
  181.         }  
  182.   
  183.         // 标记此点被访问过  
  184.         checked[node.value] = true;  
  185.         int[] queryArray;  
  186.         for (int i = 0; i < querys.size(); i++) {  
  187.             queryArray = querys.get(i);  
  188.   
  189.             if (queryArray[0] == node.value) {  
  190.                 // 如果此时另一点已经被访问过  
  191.                 if (checked[queryArray[1]]) {  
  192.                     resultValues[queryArray[0]][queryArray[1]] = findSet(queryArray[1]);  
  193.   
  194.                     System.out.println(MessageFormat.format(  
  195.                             "节点{0}和{1}的最近公共祖先为{2}", queryArray[0],  
  196.                             queryArray[1],  
  197.                             resultValues[queryArray[0]][queryArray[1]]));  
  198.   
  199.                     deleteQuerys.add(querys.get(i));  
  200.                 }  
  201.             } else if (queryArray[1] == node.value) {  
  202.                 // 如果此时另一点已经被访问过  
  203.                 if (checked[queryArray[0]]) {  
  204.                     resultValues[queryArray[0]][queryArray[1]] = findSet(queryArray[0]);  
  205.   
  206.                     System.out.println(MessageFormat.format(  
  207.                             "节点{0}和{1}的最近公共祖先为{2}", queryArray[0],  
  208.                             queryArray[1],  
  209.                             resultValues[queryArray[0]][queryArray[1]]));  
  210.                     deleteQuerys.add(querys.get(i));  
  211.                 }  
  212.             }  
  213.         }  
  214.   
  215.         querys.removeAll(deleteQuerys);  
  216.     }  
  217.   
  218.     /** 
  219.      * 寻找节点x属于哪个集合,就是寻找x的最早的祖先 
  220.      *  
  221.      * @param x 
  222.      */  
  223.     private int findSet(int x) {  
  224.         // 如果祖先不是自己,则继续往父亲节点寻找  
  225.         if (x != ancestor[x]) {  
  226.             ancestor[x] = findSet(ancestor[x]);  
  227.         }  
  228.   
  229.         return ancestor[x];  
  230.     }  
  231.   
  232.     /** 
  233.      * 将集合x所属集合合并到y集合中 
  234.      *  
  235.      * @param x 
  236.      * @param y 
  237.      */  
  238.     public void unionSet(int x, int y) {  
  239.         // 找到x和y节点的祖先  
  240.         int ax = findSet(x);  
  241.         int ay = findSet(y);  
  242.   
  243.         // 如果2个祖先是同一个,则表示是同一点,直接返回  
  244.         if (ax != ay) {  
  245.             // ax的父亲指向y节点的祖先ay  
  246.             ancestor[ax] = ay;  
  247.         }  
  248.     }  
  249.   
  250.     /** 
  251.      * 设置节点的祖先值 
  252.      *  
  253.      * @param node 
  254.      *            待设置节点 
  255.      * @param value 
  256.      *            目标值 
  257.      */  
  258.     private void setNodeAncestor(TreeNode node, int value) {  
  259.         if (node == null) {  
  260.             return;  
  261.         }  
  262.   
  263.         TreeNode[] childNodes;  
  264.         ancestor[node.value] = value;  
  265.   
  266.         // 递归设置节点的子节点的祖先值  
  267.         childNodes = node.childNodes;  
  268.         if (childNodes != null) {  
  269.             for (TreeNode n : node.childNodes) {  
  270.                 setNodeAncestor(n, value);  
  271.             }  
  272.         }  
  273.   
  274.     }  
  275.   
  276.     /** 
  277.      * 执行离线查询 
  278.      */  
  279.     public void executeOfflineQuery() {  
  280.         TreeNode rootNode = new TreeNode();  
  281.   
  282.         createTree(rootNode);  
  283.         lcaCal(rootNode);  
  284.   
  285.         System.out.println("查询请求数剩余总数" + querys.size() + "条");  
  286.     }  
  287. }  
树节点类TreeNode.java:

[java]  view plain copy print ?
  1. package LCA;  
  2.   
  3. /** 
  4.  * 树结点类 
  5.  * @author lyq 
  6.  * 
  7.  */  
  8. public class TreeNode {  
  9.     //树结点值  
  10.     int value;  
  11.     //孩子节点,不一定只有2个节点  
  12.     TreeNode[] childNodes;  
  13.       
  14.     public TreeNode(){  
  15.           
  16.     }  
  17.       
  18.     public TreeNode(int value){  
  19.         this.value = value;  
  20.     }  
  21.       
  22.     public TreeNode(String value){  
  23.         this.value = Integer.parseInt(value);  
  24.     }  
  25.       
  26.     public int getValue() {  
  27.         return value;  
  28.     }  
  29.   
  30.     public void setValue(int value) {  
  31.         this.value = value;  
  32.     }  
  33.   
  34.     public TreeNode[] getChildNodes() {  
  35.         return childNodes;  
  36.     }  
  37.   
  38.     public void setChildNodes(TreeNode[] childNodes) {  
  39.         this.childNodes = childNodes;  
  40.     }  
  41. }  
算法的测试类Client.java:

[java]  view plain copy print ?
  1. package LCA;  
  2.   
  3. /** 
  4.  * LCA最近公共祖先算法测试类 
  5.  * @author lyq 
  6.  * 
  7.  */  
  8. public class Client {  
  9.     public static void main(String[] args){  
  10.         //节点数据文件  
  11.         String dataFilePath = "C:\\Users\\lyq\\Desktop\\icon\\dataFile.txt";  
  12.         //查询请求数据文件  
  13.         String queryFilePath = "C:\\Users\\lyq\\Desktop\\icon\\queryFile.txt";  
  14.           
  15.         LCATool tool = new LCATool(dataFilePath, queryFilePath);  
  16.         tool.executeOfflineQuery();  
  17.     }  
  18. }  
算法的输出:

[java]  view plain copy print ?
  1. 节点89的最近公共祖先为4  
  2. 节点48的最近公共祖先为4  
  3. 节点49的最近公共祖先为4  
  4. 节点410的最近公共祖先为2  
  5. 节点810的最近公共祖先为2  
  6. 节点910的最近公共祖先为2  
  7. 节点45的最近公共祖先为2  
  8. 节点58的最近公共祖先为2  
  9. 节点59的最近公共祖先为2  
  10. 节点510的最近公共祖先为5  
  11. 节点24的最近公共祖先为2  
  12. 节点25的最近公共祖先为2  
  13. 节点28的最近公共祖先为2  
  14. 节点29的最近公共祖先为2  
  15. 节点210的最近公共祖先为2  
  16. 节点26的最近公共祖先为1  
  17. 节点46的最近公共祖先为1  
  18. 节点56的最近公共祖先为1  
  19. 节点68的最近公共祖先为1  
  20. 节点69的最近公共祖先为1  
  21. 节点610的最近公共祖先为1  
  22. 节点27的最近公共祖先为1  
  23. 节点47的最近公共祖先为1  
  24. 节点57的最近公共祖先为1  
  25. 节点67的最近公共祖先为3  
  26. 节点78的最近公共祖先为1  
  27. 节点79的最近公共祖先为1  
  28. 节点710的最近公共祖先为1  
  29. 节点23的最近公共祖先为1  
  30. 节点34的最近公共祖先为1  
  31. 节点35的最近公共祖先为1  
  32. 节点36的最近公共祖先为3  
  33. 节点37的最近公共祖先为3  
  34. 节点38的最近公共祖先为1  
  35. 节点39的最近公共祖先为1  
  36. 节点310的最近公共祖先为1  
  37. 节点12的最近公共祖先为1  
  38. 节点13的最近公共祖先为1  
  39. 节点14的最近公共祖先为1  
  40. 节点15的最近公共祖先为1  
  41. 节点16的最近公共祖先为1  
  42. 节点17的最近公共祖先为1  
  43. 节点18的最近公共祖先为1  
  44. 节点19的最近公共祖先为1  
  45. 节点110的最近公共祖先为1  
  46. 查询请求数剩余总数0条  
通过输出,我们可以看出算法遍历树的顺序,就是典型的DFS顺序,所以算法执行请求的顺序可不是按照请求列表中的顺序,这点是一个比较大的不同点。

我对算法的理解

LCA离线算法最大的奇妙之处在于,他用了并查集的相关知识,使得算法的时间复杂度优化了很多,但在最开始的时候我用的是通过判断树形结构来设定祖先,这样是比较好理解的,但是效率比较低,要一遍遍的遍历。如果大家暂时不理解并查集的函数操作,可以看看被我注释掉的setNodeAncestor(),,二者所要做的事情是一样的。LCA算法的特点在于并查集,所以我还是用了并查集的方法去实现。

你可能感兴趣的:(LCA最近公共祖先算法)