插入排序与合并排序原理与分析

一、插入排序

1.1 伪代码实现

插入排序(Insert sort)
for j <- 2 to n
  do key <- A[j]
    i <- j-1
    while i > 0 and A[i] > key
      do A[i+1] <- A[i]
        i <- i-1
    A[i+1] <- key

1.2 影响执行时间的因素

  • 输入序列的次序
  • 输入序列的大小

1.3 一些排序分析方法

  • 最坏情况(常用)
    T(n) = 最大执行时间
  • 平均情况(有时)
    T(n) = 期望执行时间
  • 最好情况 (无用)
    T(n) = 最小执行时间

1.4 渐近分析法(Asymptotic analysis)

  • 忽略常数因子
  • 仅仅关注增长速率(n -> 无穷大)
  • O(n)定义为时间渐近复杂度

1.5 时间复杂度

T(n) = O(n^2)

二、合并排序

2.1 伪代码实现

  合并排序(Merge sort)
  1) if n = 1, done
  2)Recursively sort A[1, ..., [n/2]] and A[[n/2]+1, ..., n]
  3) Merge sorted lists

2.2 递归树

T(n) = 2T(n/2) + cn

2.3 时间复杂度

T(n) = cnlgn + O(n) = O(nlgn)

三、代码实现(python)

3.1 定义类初始化

import numpy as np
import time
import math
import matplotlib.pyplot as plt
class sort_list(object):
    "面向对象编程,定义插入排序和合并排序的实现与分析方法"
    def __init__(self, orig_list, n=20):
    """
    初始化
    :param orig_list:待排序的数组
    """
    self.orig_list = orig_list
    # 存储排序好的数组
    self.sorted_list = None
    # 执行时间
    self.cost_time = None
    # 画图时的点数
    self.n = n

3.2插入排序实现

   def insert_sort(self):
      "对原序列进行插入排序"
      # 计算序列元素量
      num = len(self.orig_list)
      # 赋值,对sorted_list进行操作
      self.sorted_list = self.orig_list
      # 从第二个元素开始遍历
      for i in range(1, num):
          tmp = self.sorted_list[i]
          while i > 0 and self.sorted_list[i - 1] > tmp:
              self.sorted_list[i] = self.sorted_list[i - 1]
              i -= 1
          self.sorted_list[i] = tmp

3.3合并排序实现

def merge_sort_function(self, orig_list):
    "合并排序函数"
    num = len(orig_list)

    if num == 1:
        return orig_list
    # 递归
    list1 = self.merge_sort_function(orig_list[:math.floor(num/2)])
    list2 = self.merge_sort_function(orig_list[math.floor(num/2):])

    # 两个有序序列的排序
    new_list = []
    while list1 and list2:
        if list1[0] < list2[0]:
            new_list.append(list1.pop(0))
        else:
            new_list.append(list2.pop(0))

    if list1 or list2:
        if list1:
            return new_list + list1
        else:
            return new_list + list2

    return new_list

def merge_sort(self):
    "合并排序操作"
    self.sorted_list = self.merge_sort_function(self.orig_list)

3.4 测试执行时间

def test_insert(self, print_cost=True):
    "测试插入排序执行时间"
    start = time.time()
    self.insert_sort()
    end = time.time()

    self.cost_time = end - start
    if print_cost:
        print("Insert sort cost time :", self.cost_time)

def test_merge(self, print_cost=True):
    "测试合并排序执行时间"
    start = time.time()
    self.merge_sort()
    end = time.time()

    self.cost_time = end - start
    if print_cost:
        print("Merge sort cost time :", self.cost_time)

3.5 记录n不同数量级的执行时间

def analysis_insert_and_merge(self):
    "画图来直观的了解插入排序和合并排序的效率"
    insert_times = []
    merge_times = []
    for i in range(self.n):

        self.orig_list = list(np.random.random_integers(1, i*100 + 1, i*100 + 1))
        self.test_insert(print_cost=False)
        insert_times.append(self.cost_time)
        self.test_merge(print_cost=False)
        merge_times.append(self.cost_time)



    plt.plot(insert_times, label="insert")
    plt.plot(merge_times, label="merge")
    plt.title("compare Insert sort and Merge sort")
    plt.xlabel("n-1/100")
    plt.ylabel("seconds")
    plt.legend()
    plt.show()

四、结果与分析

插入排序与合并排序原理与分析_第1张图片
  • 分析:n值在100 以内插入排序与合并排序的执行时间差别并不大,随着n值的不断增大,两种排序方法的效率的差异也随之增大。从上图可以看到当n为2000左右时,插入排序的时间损耗远远大于合并排序。
  • 总结:在序列的数量级较小时,选用插入排序和合并排序差异并不大,可能选用插入排序效果会稍微好点;在序列的数量级较大时,选用合并排序的效率远远高于插入排序。

你可能感兴趣的:(插入排序与合并排序原理与分析)