贪心算法之无重叠区间

一个容易出错的题

贪心算法（英语：greedy algorithm），又称贪婪算法，是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是最好或最优的算法。比如在旅行推销员问题中，如果旅行员每次都选择最近的城市，那这就是一种贪心算法。

描述

给定一个区间的集合，找到需要移除区间的最小数量，使剩余区间互不重叠。

注意:

可以认为区间的终点总是大于它的起点。
区间 [1,2] 和 [2,3] 的边界相互“接触”，但没有相互重叠。

示例 1:

输入: [ [1,2], [2,3], [3,4], [1,3] ]

输出: 1

解释: 移除 [1,3] 后，剩下的区间没有重叠。

输入: [ [1,2], [1,2], [1,2] ]

输出: 2

解释: 你需要移除两个 [1,2] 来使剩下的区间没有重叠。

输入: [ [1,2], [2,3] ]

输出: 0

解释: 你不需要移除任何区间，因为它们已经是无重叠的了。

解题

首先进行排序，排序后的数据更容易比较，不然再无序状态下需要频繁的遍历数组。

image-20190321190337948

排序，首先根据起始点排序，起始位置相同的情况下比较结束位置。
排序之后，可能会出现多种情况。如图下5种情况。
- 情况1，重叠 A1.start < A2.start && A1.end < A2.end
- 情况2，重叠 A1.strat < A2.start && A1.end > A2.end
- 情况3，重叠 A1.strat < A2.start && A1.end = A2.end
- 情况4，不重叠 A2.start >= A1.end
- 情况5，重叠 A1.start=A2.start && A1.end < A2.end，因为已经排好序了，所以不会出现A1.end > A2.end的情况

image-20190321190640037

除了要判断是否重叠，还有一个要考虑的因素。找到需要移除区间的最小数量，那么在上面的5种情况中，要移除哪一个比较合适呢？移除A1，还是A2
- 情况1，移除A2，因为A2更可能与后面的元素重叠
- 情况2，移除A1，因为A1占的空间更大，与A1重叠的可能性大于A2
- 情况3，移除A1，原因同上
- 情况4，不重叠，无需处理
- 情况5，移除A2，A2更容易与后面的元素重叠。

编码

首先排序。

     // 对数组排序，从小到大排序，首先比较start，再比较end
        // 排序前 [ [1,2], [2,3], [3,4], [1,3] ]
        // 排序后 [ [1,2], [1,3]，[2,3], [3,4] ]
        Arrays.sort(intervals, new Comparator() {
            @Override
            public int compare(Interval o1, Interval o2) {
                if (o1.start == o2.start) {
                    return o1.end - o2.end;
                }
                return o1.start - o2.start;
            }
        });

考虑各种情况，与元素的处理。这一步的情况处理，与上面分析的一致，只需要看明白上面的解题思路即可

   // 当前需要被比较的Interval坐标
        int currentIndex = 0;
        // 重复区间的个数
        int count = 0;

        for (int i = 1; i < intervals.length; i++) {
            //    情况1
            //    currentIndex  [=====]
            //    intervals[i]    [=====]
            boolean overLapFlag = false;
            if (intervals[currentIndex].end <= intervals[i].end && intervals[i].start < intervals[currentIndex].end) {

                count++;
                overLapFlag = true;
            }

            //  情况2 && 情况3
            //  currentIndex  [=====]
            //  intervals[i]    [==]
            else if (intervals[currentIndex].end >= intervals[i].end) {
                count++;
                overLapFlag = true;
            }

            //  情况 5 ，因为已经排好序了，所以后续元素肯定大于前一个
            //  currentIndex [====]
            //  intervals[i] [======]
            else if (intervals[currentIndex].start == intervals[i].start) {
                count++;
                overLapFlag = true;
            }



            // 当某个元素占的空间太大的时候，考虑换一下位置
            // 判断条件同条件2
            if (overLapFlag){

                if (intervals[currentIndex].end >= intervals[i].end)
                        {
                    System.out.println("替换元素：currentIndex" + intervals[currentIndex] + "~" + intervals[i]);
                    currentIndex = i;
                }

                continue;
            }

            // 最后一种
            // currentIndex [====]
            // intervals[i]      [===]
            currentIndex = i;

        }

代码汇总

 public static int eraseOverlapIntervals(Interval[] intervals) {

        if (intervals.length == 0 || intervals.length == 1) {
            return 0;
        }

        // 对数组排序，从小到大排序，首先比较start，再比较end
        // 排序前 [ [1,2], [2,3], [3,4], [1,3] ]
        // 排序后 [ [1,2], [1,3]，[2,3], [3,4] ]
        Arrays.sort(intervals, new Comparator() {
            @Override
            public int compare(Interval o1, Interval o2) {
                if (o1.start == o2.start) {
                    return o1.end - o2.end;
                }
                return o1.start - o2.start;
            }
        });

        // 当前需要被比较的Interval坐标
        int currentIndex = 0;
        // 重复区间的个数
        int count = 0;

//        for (int i = 0; i < intervals.length; i++) {
//            System.out.println("[" + intervals[i].start + "," + intervals[i].end + "]");
//        }

        for (int i = 1; i < intervals.length; i++) {
            //    情况1
            //    currentIndex  [=====]
            //    intervals[i]    [=====]
            boolean overLapFlag = false;
            if (intervals[currentIndex].end <= intervals[i].end && intervals[i].start < intervals[currentIndex].end) {

                count++;
                overLapFlag = true;
            }

            //  情况2 && 情况3
            //  currentIndex  [=====]
            //  intervals[i]    [==]
            else if (intervals[currentIndex].end >= intervals[i].end) {
                count++;
                overLapFlag = true;
            }

            //  情况 5 ，因为已经排好序了，所以后续元素肯定大于前一个
            //  currentIndex [====]
            //  intervals[i] [======]
            else if (intervals[currentIndex].start == intervals[i].start) {
                count++;
                overLapFlag = true;
            }



            // 当某个元素占的空间太大的时候，考虑换一下位置
            // 判断条件同条件2
            if (overLapFlag){

                if (intervals[currentIndex].end >= intervals[i].end)
                        {
                    System.out.println("替换元素：currentIndex" + intervals[currentIndex] + "~" + intervals[i]);
                    currentIndex = i;
                }

                continue;
            }

            // 最后一种
            // currentIndex [====]
            // intervals[i]      [===]
            currentIndex = i;

        }

        return count;

    }

执行结果

image-20190321192122723

额外

还有一种用贪心算法，只比较不重复元素的数量，剩下的都是要删除的，只比较了第4种情况

如图：

如果，A1的start很小，但是end很长，那么会错过很多元素。

image-20190321192706042

所以，也要进行判断当前的元素是不是过于长。包含了前一个元素

思路如下：

  public static int eraseOverlapIntervalsV2(Interval[] intervals) {

        if (intervals.length == 0 || intervals.length == 1) {
            return 0;
        }

        // 对数组排序，从小到大排序，首先比较start，再比较end
        // 排序前 [ [1,2], [2,3], [3,4], [1,3] ]
        // 排序后 [ [1,2], [1,3]，[2,3], [3,4] ]
        Arrays.sort(intervals, new Comparator() {
            @Override
            public int compare(Interval o1, Interval o2) {
                if (o1.start == o2.start) {
                    return o1.end - o2.end;
                }
                return o1.start - o2.start;
            }
        });

        // 当前需要被比较的Interval坐标
        int currentIndex = 0;
        // 重复区间的个数
        int count = 1;

        for (int i = 1; i < intervals.length; i++) {

            // 最后一种
            // currentIndex [====]
            // intervals[i]       [===]
            if (intervals[i].start >= intervals[currentIndex].end){
                count++;
                currentIndex = i;
            }
            else {
                if (intervals[i].end <= intervals[currentIndex].end){
                    currentIndex=i;
                }
            }
        }

        return intervals.length - count;

    }

其实和上一步是一样的了。

最后

思路清晰才能写出优雅的代码

参考

435. 无重叠区间

贪心算法之无重叠区间

描述

解题

编码

额外

最后

参考

你可能感兴趣的:(贪心算法之无重叠区间)