【数据结构(七)】查找算法

文章目录

  • 查找算法介绍
  • 1. 线性查找算法
  • 2. 二分查找算法
    • 2.1. 思路分析
    • 2.2. 代码实现
    • 2.3. 功能拓展
  • 3. 插值查找算法
    • 3.1. 前言
    • 3.2. 相关概念
    • 3.3. 实例应用
  • 4. 斐波那契(黄金分割法)查找算法
    • 4.1. 斐波那契(黄金分割法)原理
    • 4.2. 实例应用


查找算法介绍

在 java 中,我们常用的查找有四种:
    ① 顺序(线性)查找
    ② 二分查找/折半查找
    ③ 插值查找
    ④ 斐波那契查找

1. 线性查找算法

问题:
    数组arr[] = {1, 9, 11, -1, 34, 89},使用线性查找方式,找出11所在的位置。

代码实现:

package search;

public class SeqSearch {
    public static void main(String[] args) {
        int arr[] = { 1, 9, 11, -1, 34, 89 };// 没有顺序的数组
        int index = seqSearch(arr, 11);

        if (index == -1) {
            System.out.println("没有找到");
        } else {
            System.out.println("找到了,下标为:" + index);
        }

    }

    /**
     * 这里实现的线性查找是找到一个满足条件的值,就返回
     * 
     * @param arr
     * @param value
     * @return
     */
    public static int seqSearch(int[] arr, int value) {
        // 线性查找是逐一比对,发现有相同的值,就返回下标
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] == value) {
                return i;
            }
        }
        return -1;
    }

}

运行结果:

在这里插入图片描述

2. 二分查找算法

问题:
    请对一个有序数组进行二分查找 {1,8, 10, 89, 1000, 1234} ,输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有这个数"。

2.1. 思路分析

二分查找的思路分析

  1. 首先,确定该数组的中间的下标: m i d = ( l e f t + r i g h t ) / 2 mid = (left + right) / 2 mid=(left+right)/2

  2. 然后让需要查找的数 findValarr[mid] 比较
    2.1. findVal > arr[mid],说明你要查找的数在mid 的右边, 因此需要递归的向右查找
    2.2. findVal < arr[mid],说明你要查找的数在mid 的左边, 因此需要递归的向左查找
    2.3. findVal == arr[mid],说明找到,就返回

  3. 什么时候需要结束递归:
    ①找到就结束递归
    ②递归完整个数组,仍然没有找到findVal,也需要结束递归 当 left > right 就需要退出

2.2. 代码实现

注意:使用二分查找的前提是 该数组是有序的

package search;

public class BinarySearch {
    public static void main(String[] args) {
        int arr[] = { 1, 8, 10, 89, 1000, 1234 };

        int resIndex = binarySearch(arr, 0, arr.length - 1, 1);

        System.out.println("resIndex= " + resIndex);
    }

    // 二分查找法
    /**
     * 
     * @param arr     数组
     * @param left    左边的索引
     * @param right   右边的索引
     * @param findVal 要查找的值
     * @return 如果找到就返回下标,如果没有找到就返回-1
     */
    public static int binarySearch(int[] arr, int left, int right, int findVal) {

        // 当left > right 时,说明递归整个数组,但是没有找到
        if (left > right) {
            return -1;
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {// 向右递归
            return binarySearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
            return binarySearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }
    }

}

运行结果:

在这里插入图片描述

2.3. 功能拓展

问题:
    数组{1,8, 10, 89, 1000, 1000,1234}, 当一个有序数组中,有多个相同的数值时,如何将所有的数值都查找到,比如这里的 1000。

代码实现:

package search;

import java.util.ArrayList;
import java.util.List;

public class BinarySearch {
    public static void main(String[] args) {
        int arr[] = { 1, 8, 10, 89, 1000, 1000, 1234 };

        List<Integer> resIndexList = binarySearch2(arr, 0, arr.length - 1, 1000);
        
        System.out.println("resIndexList = " + resIndexList);
    }


    /*
     * 思路分析:
     * 1. 在找 mid 的索引值,不要马上返回
     * 2. 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
     * 3. 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
     * 4. 将 ArrayList 返回
     */
    public static List<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {

        // 当left > right 时,说明递归整个数组,但是没有找到
        if (left > right) {
            return new ArrayList<Integer>();
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {// 向右递归
            return binarySearch2(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
            return binarySearch2(arr, left, mid - 1, findVal);
        } else {
            /*
             * 思路分析:
             * 1. 在找 mid 的索引值,不要马上返回
             * 2. 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
             * 3. 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
             * 4. 将 ArrayList 返回
             */
            List<Integer> resIndexlist = new ArrayList<Integer>();
            // 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) {// 退出
                    break;
                }
                // 否则,就将temp放入到resIndexlist
                resIndexlist.add(temp);
                temp -= 1;// temp左移
            }
            resIndexlist.add(mid);

            // 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) {// 退出
                    break;
                }
                // 否则,就将temp放入到resIndexlist
                resIndexlist.add(temp);
                temp += 1;// temp左移
            }
            return resIndexlist;

        }
    }

}

运行结果:

在这里插入图片描述

3. 插值查找算法

3.1. 前言

二分查找算法存在查找效率较慢的情况,因为其中的mid是从中间开始取的。假如对数组{ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 }进行查找,查找 1 所在的位置,实现代码如下:

package search;

import java.util.ArrayList;
import java.util.List;

public class BinarySearch {
    public static void main(String[] args) {

        int arr[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 };

        List<Integer> resIndexList = binarySearch2(arr, 0, arr.length - 1, 1);
        System.out.println("resIndexList = " + resIndexList);
    }


    /*
     * 思路分析:
     * 1. 在找 mid 的索引值,不要马上返回
     * 2. 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
     * 3. 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
     * 4. 将 ArrayList 返回
     */
    public static List<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {

        System.out.println("调用了一次");

        // 当left > right 时,说明递归整个数组,但是没有找到
        if (left > right) {
            return new ArrayList<Integer>();
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {// 向右递归
            return binarySearch2(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
            return binarySearch2(arr, left, mid - 1, findVal);
        } else {
            /*
             * 思路分析:
             * 1. 在找 mid 的索引值,不要马上返回
             * 2. 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
             * 3. 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
             * 4. 将 ArrayList 返回
             */
            List<Integer> resIndexlist = new ArrayList<Integer>();
            // 向 mid 索引值的左边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
            int temp = mid - 1;
            while (true) {
                if (temp < 0 || arr[temp] != findVal) {// 退出
                    break;
                }
                // 否则,就将temp放入到resIndexlist
                resIndexlist.add(temp);
                temp -= 1;// temp左移
            }
            resIndexlist.add(mid);

            // 向 mid 索引值的右边扫描,将所有满足1000的元素的下标,加入到集合ArrayList
            temp = mid + 1;
            while (true) {
                if (temp > arr.length - 1 || arr[temp] != findVal) {// 退出
                    break;
                }
                // 否则,就将temp放入到resIndexlist
                resIndexlist.add(temp);
                temp += 1;// temp左移
            }
            return resIndexlist;

        }
    }

}

运行结果:

在这里插入图片描述

总共调用了4次才查找出1的索引值,效率较慢。通过插值查找可改善上述问题。

3.2. 相关概念

原理介绍:
    插值查找算法类似于二分查找,不同的是插值查找每次从自适应 mid 处开始查找。

mid的计算公式:
    对二分查找中的求 mid 索引的公式进行修改:
在这里插入图片描述

上图公式中:
① low 表示左边索引 left
② high 表示右边索引 right
③ key 就是前面二分查找中讲的 findVal(要查找的值)

即插值查找的 mid计算公式
m i d = l o w + ( h i g h − l o w ) k e y − a r r [ l o w ] a r r [ h i g h ] − a r r [ l o w ] \begin{aligned} &mid = low + (high-low)\frac{key-arr[low]}{arr[high]-arr[low]} \end{aligned} mid=low+(highlow)arr[high]arr[low]keyarr[low]
对应前面的代码公式,即:
m i d = l e f t + ( r i g h t – l e f t ) f i n d V a l – a r r [ l e f t ] a r r [ r i g h t ] – a r r [ l e f t ] \begin{aligned} &mid = left + (right – left)\frac{findVal – arr[left]}{arr[right] – arr[left]} \end{aligned} mid=left+(rightleft)arr[right]arr[left]findValarr[left]

举例说明:
    
    数组 arr = [1, 2, 3, …, 100]
    
①假如需要查找的值是 1
    (使用二分查找的话,需要多次递归,才能找到 1 的下标0)
    使用插值查找算法:
m i d = l e f t + ( r i g h t – l e f t ) f i n d V a l – a r r [ l e f t ] a r r [ r i g h t ] – a r r [ l e f t ] \begin{aligned}&mid = left + (right – left)\frac{findVal – arr[left]}{arr[right] – arr[left]}\end{aligned} mid=left+(rightleft)arr[right]arr[left]findValarr[left]
即:
m i d = 0 + ( 99 − 0 ) 1 − 1 100 − 1 = 0 + 99 ∗ 0 99 = 0     ( 直接定位到下标 0 ) \begin{aligned}&mid = 0+(99-0)\frac{1-1}{100-1} = 0 + 99 * \frac{0}{99} = 0\ \ \ (直接定位到下标0)\end{aligned} mid=0+(990)100111=0+99990=0   (直接定位到下标0)
②假如需要查找的值是 100
m i d = 0 + ( 99 − 0 ) 100 − 1 ( 100 − 1 = 0 + 99 ∗ 99 99 = 0 + 99 = 99     ( 直接定位到下标 99 ) \begin{aligned}&mid =0 + (99 - 0)\frac{100 - 1}{(100 - 1} = 0 + 99 * \frac{99}{99} = 0 + 99 = 99\ \ \ (直接定位到下标99)\end{aligned} mid=0+(990)(10011001=0+999999=0+99=99   (直接定位到下标99)

3.3. 实例应用

问题:
    对数组 arr = [1, 2, 3, …, 100] ,使用插值查找算法,找到 1 的索引值(下标)

代码实现:

package search;

import java.util.Arrays;

public class InsertValueSearch {
    public static void main(String[] args) {
        int[] arr = new int[100];

        for (int i = 0; i < 100; i++) {
            arr[i] = i + 1;
        }

        int index = insertValueSearch(arr, 0, arr.length - 1, 1);
        System.out.println("index = " + index);

        // System.out.println(Arrays.toString(arr));
    }

    // 编写插值查找算法
    // 说明:插值查找算法也要求数组是有序的
    /**
     * 
     * @param arr     数组
     * @param left    左边索引
     * @param right   右边索引
     * @param findVal 要查找的值
     * @return 如果找到,就返回对应的下标;如果没有找到,就返回-1
     */
    public static int insertValueSearch(int[] arr, int left, int right, int findVal) {

        System.out.println("查找了一次");
        // 注意:findVal < arr[0] 和 findVal > arr[arr.length - 1] 必须需要,否则得到的mid可能越界
        if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
            return -1;
        }

        // 求出 mid
        int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];

        if (findVal > midVal) {// 说明应该向右边递归
            return insertValueSearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {// 说明应该向左递归
            return insertValueSearch(arr, left, mid - 1, findVal);
        } else {
            return mid;
        }

    }

}

运行结果:

在这里插入图片描述

注意事项:

  1. 对于数据量较大,关键字分布比较均匀的查找表来说,采用插值查找, 速度较快.
  2. 关键字分布不均匀的情况下,该方法不一定比折半(二分)查找要好

4. 斐波那契(黄金分割法)查找算法

    
    黄金分割点是指把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是 0.618。由于按此比例设计的造型十分美丽,因此称为黄金分割,也称为中外比。这是一个神奇的数字,会带来意想不到的效果。

    斐波那契数列 {1, 1, 2, 3, 5, 8, 13, 21, 34, 55, … … } 发现斐波那契数列的两个相邻数 的比例,无限接近 黄金分割值0.618。

4.1. 斐波那契(黄金分割法)原理

    斐波那契查找原理与前两种相似,仅仅改变了中间结点(mid)的位置,mid 不再是中间或插值得到,而是位于黄金分割点附近,即 m i d = l o w + F [ k − 1 ] − 1 mid=low+F[k-1]-1 mid=low+F[k1]1 F F F 代表斐波那契数列),如下图所示:

【数据结构(七)】查找算法_第1张图片

对 F(k-1)-1 的理解:

  1. 由斐波那契数列 F [ k ] = F [ k − 1 ] + F [ k − 2 ] F[k]=F[k-1]+F[k-2] F[k]=F[k1]+F[k2] 的性质,可以得到 ( F [ k ] − 1 ) = ( F [ k − 1 ] − 1 ) + ( F [ k − 2 ] − 1 ) + 1 (F[k]-1)=(F[k-1]-1)+(F[k-2]-1)+1 (F[k]1)=(F[k1]1)+(F[k2]1)+1 。该式说明:只要顺序表的长度为 F[k]-1,则可以将该表分成长度为 F [ k − 1 ] − 1 F[k-1]-1 F[k1]1 F [ k − 2 ] − 1 F[k-2]-1 F[k2]1 的两段,即如上图所示。从而中间位置为 m i d = l o w + F [ k − 1 ] − 1 mid=low+F[k-1]-1 mid=low+F[k1]1
  2. 类似的,每一子段也可以用相同的方式分割
  3. 但顺序表长度 n n n 不一定刚好等于 F [ k ] − 1 F[k]-1 F[k]1,所以需要将原来的顺序表长度 n n n 增加至 F [ k ] − 1 F[k]-1 F[k]1。这里的 k k k 值只要能使得 F [ k ] − 1 F[k]-1 F[k]1 恰好大于或等于 n n n 即可,由以下代码得到,顺序表长度增加后,新增的位置(从 n + 1 n+1 n+1 F [ k ] − 1 F[k]-1 F[k]1 位置),都赋为 n n n 位置的值即可。

while(n>fib(k)-1)
  k++;

4.2. 实例应用

问题:
    请对一个有序数组进行斐波那契查找 {1,8, 10, 89, 1000, 1234} ,输入一个数看看该数组是否存在此数,并且求出下标,如果没有就提示"没有这个数"(return = -1)。

代码实现:

package search;

import java.util.Arrays;

public class FibonacciSearch {

    public static int maxSize = 20;

    public static void main(String[] args) {
        int[] arr = { 1, 8, 10, 89, 1000, 1234 };

        System.out.println("index = " + fibSearch(arr, 89));
    }

    // 因为后面我们mid=low+F(k-1)-1,需要使用斐波那契数列,因此我们需要先获取到一个斐波那契数列
    // 非递归方法得到一个斐波那契数列
    public static int[] fib() {
        int[] f = new int[maxSize];
        f[0] = 1;
        f[1] = 1;
        for (int i = 2; i < maxSize; i++) {
            f[i] = f[i - 1] + f[i - 2];
        }
        return f;
    }

    // 编写斐波那契查找算法
    // 使用非递归的方式编写算法
    /**
     * 
     * @param a   数组
     * @param key 需要查找的关键字(值)
     * @return 返回对应的下标,如果没有,就返回-1
     */
    public static int fibSearch(int[] a, int key) {
        int low = 0;
        int high = a.length - 1;
        int k = 0;// 表示斐波那契分割数值的下标
        int mid = 0;// 存放mid值
        int f[] = fib();// 获取到斐波那契数列

        // 获取到斐波那契分割数值的下标
        while (high > f[k] - 1) {
            k++;
        }

        // 因为f[k]的值 可能大于a的长度,因此需要使用Arrays类,构造一个新的数组,并指向a[]
        // 不足的部分会使用0填充
        int[] temp = Arrays.copyOf(a, f[k]);
        // 实际上,需要使用a数组的最后的数填充temp
        // 举例:
        // temp = {1,8,10,89,1000,1234,0,0,0} --> {1,8,10,89,1000,1234,1234,1234,1234}
        for (int i = high + 1; i < temp.length; i++) {
            temp[i] = a[high];
        }

        // 使用while循环处理,找到key
        while (low <= high) {// 只要这个条件满足,就可以找
            mid = low + f[k - 1] - 1;
            if (key < temp[mid]) {// 继续向数组的前面查找(左边)
                high = mid - 1;
                // 为什么是k--?
                // 说明:
                // 1. 全部元素=前面的元素+后面的元素
                // 2. f[k] = f[k-1] + f[k-2]
                // 因为 前面有f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
                // 即 在f[k-1]的前面继续查找(k--)
                // 即 下次循环的 mid = f[k-1-1]-1
                k--;
            } else if (key > temp[mid]) {// 继续向数组的后面查找(右边)
                low = mid + 1;
                // 为什么是 k -= 2
                // 说明
                // 1. 全部元素=前面的元素+后面的元素
                // 2. f[k] = f[k-1] + f[k-2]
                // 因为 后面有f[k-2]个元素,所以可以继续拆分 f[k-2] = f[k-3] + f[k-4]
                // 即 在f[k-2]的后面继续查找(k-=2)
                // 即 下次循环的 mid = f[k-1-2]-1
                k -= 2;
            } else {// 找到
                // 需要确定,返回的是哪一个下标
                if (mid <= high) {
                    return mid;
                } else {
                    return high;
                }

            }
        }
        return -1;

    }

}

运行结果:

在这里插入图片描述

你可能感兴趣的:(Java数据结构,算法,数据结构,java)