【数据结构】线段树

目录

  • 1.概述
  • 2.代码实现
    • 2.1.聚合操作——求和
    • 2.2.聚合操作——求和、求最小值、求最大值
  • 3.应用
  • 4.与前缀和之间的区别

更多数据结构与算法的相关知识可以查看数据结构与算法这一专栏。

1.概述

(1)线段树 (Segment Tree) 是一种二叉树形数据结构,经常用于高效地处理一维区间的各种查询和修改问题。

(2)一个线段树通常对应于一个区间,每个节点表示一个区间,具体如下图所示。

  • 对于线段树中的每个节点,它有一个区间范围和一个值。
  • 叶节点表示区间中的单个元素,而非叶子节点表示区间中的所有元素。
  • 线段树的每个节点表示区间的一部分,其左子树表示左半部分区间,右子树表示右半部分区间。因此,线段树的叶节点数总是等于数据元素的个数,而线段树的高度为 ⌈logn⌉ + 1,其中 n 为元素总个数。

【数据结构】线段树_第1张图片

① 上图来自线段树_百度百科。
② 一般来说,在代码中会用数组来存储某个区间内的元素,该数组内的元素可以是无序或者有序的,例如,nums = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 或者 nums = [2, 4, -1, 0, 9] 等。上图中线段树中的区间正好是前一个数组。

(3)线段树的主要优势是能够在 O(logn) 时间复杂度内执行区间查询(如最大值、最小值、区间和等)和区间修改操作(如区间加、区间减等),因此它非常适合解决那些需要频繁区间查询和修改的问题。

2.代码实现

(1)在线段树中,区间的聚合值是指该区间内元素的某种聚合操作的结果。这个聚合操作可以是求和求最小值求最大值等。聚合值的具体含义取决于所解决的问题,本节中分别给出以下两种情况。

(2)线段树的构建过程与 108.将有序数组转换为二叉搜索树这题类似,具体如下:

  • 定义线段树节点:线段树是一种二叉树,每个节点代表一个区间。每个节点包含了该区间的起始点start、结束点end,以及其他你可能需要的附加信息。
  • 定义递归构建函数:创建一个递归函数来构建线段树。该函数接收输入参数为当前节点、当前区间的起始点和结束点。
  • 基本情况处理:对于当前节点,如果起始点和结束点相等,表示当前节点为叶子节点,直接返回。
  • 划分区间:计算当前区间的中点 mid,将区间分割成两个子区间。通常是将区间一分为二,可以选择将 mid 设置为 (start+end)/2。
  • 递归构建左子树和右子树:调用递归函数,传入左子树和右子树的起始点和中点以构建左右子树。
  • 合并信息:在递归回溯时,将左右子树的信息合并到当前节点。这通常取决于你的问题需求,可以是求和、求最大值、求最小值等。
  • 返回根节点:递归构建完成后,返回根节点。

2.1.聚合操作——求和

(1)实现区间求和操作(包括修改区间的某个元素)的代码实现如下:

class SegmentTree {
    //线段树数组,segmentTree[i] 表示线段树的第 i 个节点(区间)的聚合值,本代码中是区间和
    int[] segmentTree;
    //原始数组
    int[] nums;

    public SegmentTree(int[] nums) {
        this.nums = nums;
        int n = nums.length;
        //确定树的高度
        int height = (int) (Math.ceil(Math.log(n) / Math.log(2))) + 1;
        //根据树的高度计算需要的线段树数组大小
        int maxSize = (int) Math.pow(2, height) - 1;
        //创建线段树数组
        segmentTree = new int[maxSize];
        //构建线段树
        buildTree(0, 0, n - 1);
    }

    //构建线段树
    private int buildTree(int index, int start, int end) {
        //叶子节点
        if (start == end) {
            //叶子节点存储对应的原始数组值
            segmentTree[index] = nums[start];
            return segmentTree[index];
        }
        int mid = start + (end - start) / 2; // 计算中间位置
        //分别递归构建左子树和右子树
        segmentTree[index] = buildTree(2 * index + 1, start, mid) +
                buildTree(2 * index + 2, mid + 1, end);
        return segmentTree[index];
    }

    //更新原始数组中的某个元素,并同时更新线段树
    public void update(int i, int val) {
        //计算变化的差值
        int diff = val - nums[i];
        //更新原始数组中的值
        nums[i] = val;
        //更新线段树
        updateTree(0, 0, nums.length - 1, i, diff);
    }

    //更新线段树
    private void updateTree(int index, int start, int end, int i, int diff) {
        if (i < start || i > end) {
            //该节点不包含要更新的元素,直接返回
            return;
        }
        //更新当前节点的值
        segmentTree[index] += diff;
        if (start != end) {
            //计算中间位置
            int mid = start + (end - start) / 2;
            //递归更新左子树
            updateTree(2 * index + 1, start, mid, i, diff);
            //递归更新右子树
            updateTree(2 * index + 2, mid + 1, end, i, diff);
        }
    }

    //查询线段树中某个区间的和
    public int querySum(int left, int right) {
        return queryTree(0, 0, nums.length - 1, left, right);
    }

    // 查询线段树
    private int queryTree(int index, int start, int end, int left, int right) {
        if (left > end || right < start) {
            //区间不相交,返回 0
            return 0;
        }
        if (left <= start && right >= end) {
            //当前节点表示的区间完全被查询区间包含,直接返回当前节点的值
            return segmentTree[index];
        }
        //计算中间位置
        int mid = start + (end - start) / 2;
        //分别递归查询左子树和右子树
        return queryTree(2 * index + 1, start, mid, left, right) +
                queryTree(2 * index + 2, mid + 1, end, left, right);
    }
}

(2)测试代码如下:

class SegmentTreeTest {
    public static void main(String[] args) {
        //原始数组,可以是有序或者无序的
        int[] nums = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
        SegmentTree segmentTree = new SegmentTree(nums);

        //查询区间 [1, 4] 的和,即 nums[1...4] 的和
        int sum = segmentTree.querySum(1, 4);
        System.out.println("Sum of range [1, 4]: " + sum);

        //将数组下标为 2 的元素更新为 6,即更新 nums[2] = 6,同时更新线段树
        segmentTree.update(2, 6);

        //再次查询区间 [1, 4] 的和
        sum = segmentTree.querySum(1, 4);
        System.out.println("Updated sum of range [1, 4]: " + sum);
    }
}

输出结果如下:

Sum of range [1, 4]: 14
Updated sum of range [1, 4]: 17

2.2.聚合操作——求和、求最小值、求最大值

(1)实现区间求和、求最小值、求最大值操作(包括修改区间的某个元素)的代码实现如下:

class SegmentTree {
    private Node root;
	
	//定义节点类,用于表示某个区间
    private class Node {
        int start;
        int end;
        int sum;
        int max;
        int min;
        Node left;
        Node right;

        Node(int start, int end) {
            this.start = start;
            this.end = end;
            this.sum = 0;
            this.max = Integer.MIN_VALUE;
            this.min = Integer.MAX_VALUE;
        }
    }

    public SegmentTree(int[] nums) {
        this.root = build(nums, 0, nums.length - 1);
    }
	
	//构建线段树
    private Node build(int[] nums, int start, int end) {
        if (start > end) {
            return null;
        }

        Node node = new Node(start, end);

        if (start == end) {
            node.sum = nums[start];
            node.max = nums[start];
            node.min = nums[start];
        } else {
            int mid = start + (end - start) / 2;
            node.left = build(nums, start, mid);
            node.right = build(nums, mid + 1, end);
            node.sum = node.left.sum + node.right.sum;
            node.max = Math.max(node.left.max, node.right.max);
            node.min = Math.min(node.left.min, node.right.min);
        }

        return node;
    }
	
	//查询线段树中某个区间的和
    public int queryRangeSum(int start, int end) {
        return queryRangeSum(root, start, end);
    }

    private int queryRangeSum(Node node, int start, int end) {
        if (node.start == start && node.end == end) {
            return node.sum;
        }

        int mid = node.start + (node.end - node.start) / 2;

        if (end <= mid) {
            return queryRangeSum(node.left, start, end);
        } else if (start > mid) {
            return queryRangeSum(node.right, start, end);
        } else {
            return queryRangeSum(node.left, start, mid) + queryRangeSum(node.right, mid + 1, end);
        }
    }
	
	//查询线段树中某个区间的最大值
    public int queryRangeMax(int start, int end) {
        return queryRangeMax(root, start, end);
    }

    private int queryRangeMax(Node node, int start, int end) {
        if (node.start == start && node.end == end) {
            return node.max;
        }

        int mid = node.start + (node.end - node.start) / 2;

        if (end <= mid) {
            return queryRangeMax(node.left, start, end);
        } else if (start > mid) {
            return queryRangeMax(node.right, start, end);
        } else {
            return Math.max(queryRangeMax(node.left, start, mid),
                    queryRangeMax(node.right, mid + 1, end));
        }
    }
	
	//查询线段树中某个区间的最小值
    public int queryRangeMin(int start, int end) {
        return queryRangeMin(root, start, end);
    }

    private int queryRangeMin(Node node, int start, int end) {
        if (node.start == start && node.end == end) {
            return node.min;
        }

        int mid = node.start + (node.end - node.start) / 2;

        if (end <= mid) {
            return queryRangeMin(node.left, start, end);
        } else if (start > mid) {
            return queryRangeMin(node.right, start, end);
        } else {
            return Math.min(queryRangeMin(node.left, start, mid),
                    queryRangeMin(node.right, mid + 1, end));
        }
    }

	//更新原始数组中的某个元素,并同时更新线段树
    public void update(int index, int value) {
        update(root, index, value);
    }

    private void update(Node node, int index, int value) {
        if (node.start == node.end) {
            node.sum = value;
            node.max = value;
            node.min = value;
            return;
        }

        int mid = node.start + (node.end - node.start) / 2;

        if (index <= mid) {
            update(node.left, index, value);
        } else {
            update(node.right, index, value);
        }

        node.sum = node.left.sum + node.right.sum;
        node.max = Math.max(node.left.max, node.right.max);
        node.min = Math.min(node.left.min, node.right.min);
    }
}

(2)测试代码如下:

class SegmentTreeTest {
    public static void main(String[] args) {
        //原始数组,可以是有序或者无序的
        int[] nums = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
        SegmentTree segmentTree = new SegmentTree(nums);

        //查询区间 [1, 4] 的和,即 nums[1...4] 的和
        int sum = segmentTree.queryRangeSum(1, 4);
        System.out.println("Sum of range [1, 4]: " + sum);
        int max = segmentTree.queryRangeMax(1, 4);
        System.out.println("Max of range [1, 4]: " + max);
        int min = segmentTree.queryRangeMin(1, 4);
        System.out.println("Min of range [1, 4]: " + min);

        //将数组下标为 1 的元素更新为 0,即更新 nums[1] = 0,同时更新线段树
        segmentTree.update(1, 0);
        //将数组下标为 2 的元素更新为 6,即更新 nums[2] = 6,同时更新线段树
        segmentTree.update(2, 6);
		
        //再次查询区间 [1, 4] 的和
        sum = segmentTree.queryRangeSum(1, 4);
        System.out.println("Updated sum of range [1, 4]: " + sum);
        max = segmentTree.queryRangeMax(1, 4);
        System.out.println("Updated Sum of range [1, 4]: " + max);
        min = segmentTree.queryRangeMin(1, 4);
        System.out.println("Updated Min of range [1, 4]: " + min);
    }
}

输出结果如下:

Sum of range [1, 4]: 14
Max of range [1, 4]: 5
Min of range [1, 4]: 2
Updated sum of range [1, 4]: 15
Updated Sum of range [1, 4]: 6
Updated Min of range [1, 4]: 0

3.应用

(1)LeetCode 中的 307.区域和检索 - 数组可修改这题便是对线段树的具体应用,其题目如下。显然,使用上面的代码可以直接求解。

【数据结构】线段树_第2张图片

(2)大家可以去 LeetCode 上找相关的线段树的题目来练习,或者也可以直接查看 LeetCode 算法刷题目录 (Java) 这篇文章中的线段树章节。如果大家发现文章中的错误之处,可在评论区中指出。

4.与前缀和之间的区别

(1)线段树和前缀和是两种常见的用于解决区间查询问题的数据结构,它们有一些区别:

  • 数据结构
    • 线段树是一种二叉树结构,用于处理区间查询和更新操作。它将区间划分为不相交的子区间,并将每个子区间的信息存储在相应节点中。
    • 前缀和是一个数组,用于存储前缀和值。它通过计算数组元素累加和的方式存储数据。
  • 功能
    • 线段树可以支持多种区间查询操作,例如区间和、区间最大值、区间最小值等。它可以在 O(logN) 的时间复杂度内完成查询和更新操作。
    • 前缀和主要用于计算数组中特定区间的和。它可以在 O(1) 的时间内计算出给定区间的和,但只能处理区间和的查询。
  • 空间复杂度
    • 线段树的空间复杂度为 O(N),其中 N 是数组的大小。它需要存储整个线段树的节点。
    • 前缀和的空间复杂度为 O(N),其中 N 是数组的大小。它只需要存储一个与数组大小相等的前缀和数组。
  • 应用场景
    • 线段树通常用于解决需要频繁进行区间查询和更新操作的问题,比如计算数组的区间和、区间最大值和最小值等。
    • 前缀和通常用于解决需要频繁计算数组特定区间和的问题,比如计算子数组的和、快速判断数组中是否存在某个区间的和等。

(2)综上所述,线段树和前缀和在功能和应用场景上略有不同,选择使用哪种数据结构取决于具体的问题需求和效率要求。

有关前缀和的相关知识可以参考【数据结构】前缀和数组这篇文章。

你可能感兴趣的:(数据结构与算法,线段树,数据结构)