我是很喜欢算法的,打算写一个数据结构与算法系列的记录,很多都用到了递归,所以这星期打算说说大家都觉得很简单,但是我觉得并不简单的递归,毕竟很多人对递归的认识也就是自己调用自己,但是我觉得这并不深入,或者说这并不是递归的实质,或者说解释递归解释的并不好。
二叉树
二叉树的定义
首先我们准备一颗二叉树:
我们需要定义一些术语,我们所使用的数据结构由结点组成,结点包含的链接可以为空也可以指向其他结点.
在二叉树中,每个结点只能有一个父节点(只有一个例外,也就是根节点,它没有父节点),而且每个结点只有两个链接,
分别指向自己的左子结点和右子结点.尽管链接指向的是结点,但我们可以将每个链接看做指向了另一颗二叉树,
而这棵树的根节点就是被指向的节点.因此,我们可以将二叉树定义为一个空链接
,或者是一个有左右两个链接的结点,每个链接都指向一颗(独立的)二叉树。----《算法》第四版。
前中后序遍历(这是本篇文章的要讨论的核心问题之一,由前中后序遍历来讨论递归,然后再到荷兰国旗问题和快速排序)
结点代码:
public class TreeNode {
int data;
TreeNode leftNode;
TreeNode rightNode;
public TreeNode(int data) {
this.data = data;
}
}
二叉树:
public class BinaryTree {
TreeNode root;
public BinaryTree(TreeNode root) {
this.root = root;
}
/**
* 前序遍历
*/
public void frontShow(){
}
/**
* 中序遍历
*/
public void middleShow(){
}
/**
* 后序遍历
*/
public void afterShow(){
}
}
虽然百度不招人喜欢,但是百度百科的一些词条编辑的还是不错的.
从二叉树的递归定义可知,一棵非空的二叉树由根结点及左、右子树这三个基本部分组成。因此,在任一给定结点上,可以按某种次序执行三个操作:
(1) 访问结点本身(N),
(2) 遍历该结点的左子树(L),
(3) 遍历该结点的右子树(R)。
前序遍历: 根节点 左子树 右子树
中序遍历: 左子树 根节点 右子树
后序遍历: 左子树 右子树 根节点
其实组合的话是有六种的,但是讨论递归的话,前中后序就足够了.
我们现在来任意的给一颗二叉树,不用代码。我们来写出前中后序遍历的结果:
前序遍历: 3 8 5 2 6 1 7
中序遍历: 5 8 2 3 1 6 7
后序遍历: 5 2 8 1 7 6 3
前中后序遍历的进一步解释:
当我到达一个结点,先打印出来,再去访问其他子结点就是前序遍历
当我到达一个结点,不是先打印当前结点,而是接着访问该节点的左子节点,某个节点没有子节点(或者说子结点是null)
我就打印当前节点,这就是中序遍历
以前序遍历为例,我首先打印根节点,然后判断它的左子节点是否为空,如果非空,打印该节点,然后接着进行这样的操作,
翻译成代码就是这样的:
在BinaryTree中的代码:
public void frontShow(){
System.out.println(root.data);
if (root.leftNode != null){
root.leftNode.frontShow();
}
if (root.rightNode != null){
root.rightNode.frontShow();
}
}
结点中的代码也是这样的,
public void frontShow(){
System.out.println(root.data);
if (root.leftNode != null){
root.leftNode.frontShow();
}
if (root.rightNode != null){
root.rightNode.frontShow();
}
}
中后序代码把打印顺序调整一下就可以了,其实这个很好理解,不是多么酷炫的事情.
以下一个问题在我个人看来才是值得值得思考的,就是程序在遍历二叉树的过程,每个节点经过了几次。
其实这个问题,也是十分简单,你按着程序走就可以了.
首先来到3,接着来到8,接着来到5,然后发现5的左右子节点都是空的,然后回到....
这里再介绍另一种在形式上略有不同的前序遍历方式:
public void frontShow(TreeNode root){
if (root == null){
return;
}
System.out.println(data);
frontShow(root.leftNode);
frontShow(root.rightNode);
}
这种形式上的前中后序遍历:
每个节点会到达三次,前序遍历就是第一次碰到的时候打印出来,中序是第二次,后序是第三次
各位有兴致的话可以自己写一写,画一画.
请注意上面那张图,虽然他十分的丑,但是大家不觉得它像一个栈吗? 递归就是程序在帮你压栈.
非递归版
那既然递归是系统在帮你压栈,那非递归版我就自己压栈,不让程序帮我们压栈就可以了吗?
我们先用下图来演示非递归版的遍历:
从荷兰国旗问题到快速排序
许多时候,问题的规模是会影响我们的判断,为了解决问题,我们可以先把问题的规模先降低到看起来容易解决的地步,再试着去解决问题,如果解决了, 我们再逐步的扩大问题的规模
荷兰国旗问题
荷兰国旗问题: 给定一个数组arr和一个数num,请把小于num的数放在num的左边,大于num的数放在num右边。
等于num的数放在中间
例子: 输入: arr [5,7,5,8,1,9,10] ,num =5
输出: [1, 5, 5, 8, 9, 10, 7]]
思路:
> 准备一个变量less和more。
1. less 区域内(即数组下标 <= less)全部是小于num的,
2. more区域内(即数组下标>more)全部是大于num
3. 我们需要一个变量来帮助我们遍历数组。
在一开始的时候,less = -1 , more = 数组的长度。 这代表刚开始这两个区域还不存在
当arr[curr] < num 的时候, less区域的下一个数和arr[curr]交换。然后less右移一个位置,
curr右移一个位置
当arr[curr] > num 的时候, more区域的上一个数和arr[curr]交换。然后more左移一个位置,
此时我们是无法保证从more区域的上一个数,究竟是大于num还是小于num,
因此我们仍然需要将num和这个数进行比较.
以上的思路翻译成代码是用循环来完成的,那么循环结束的条件是什么呢?
curr的左侧是less区域, 当排序完成的时候, (less,curr]区域为等于num的区域,
但是当curr + 1 = more 时,这个时候arr[curr+1]还是未进行判断的,
我们仍然需要对arr[curr+1] 和num进行比较
快速排序
那这跟快速排序有什么问题呢?我们来思考一下快速排序(这里讨论是基础版的快速排序)。快速排序是一种分治的排序算法,它将一个数组分成两个子数组,将两部分独立的排序。荷兰国旗就相当于快速排序中的切分过程。快速排序的关键就在于这个切分过程。
快速排序的思想就是:
首先根据num,将数组切分成两个子数组,然后再对这两个子数组进行切分,当子数组的数量小于2,默认数组即为有序。
理解这个切分过程对快速排序来说十分的重要
如何证明你的算法的正确性
这也是我在写算法的时候考虑的一个问题,
答案有两种:
1. 严谨一点的话就是数学建模,通过数学来证明你算法的正确性。
2. 利用计算机这个工具来印证我们算法的正确性,意思就是试,找到一个虽然是正确的,但是时间复杂度不那么好的正确算法。
通过随机函数产生大量的样本,比较你的算法和时间复杂度不那么好的正确算法所产生的结果。这种方法
比如说对于排序算法,
首先利用随机函数不断的产生各种各样的数组,并且向数组中填充随机数.
然后将数组复制一份,给正确的算法用
然后比较两个算法的结果.