排序算法总结

http://www.cppblog.com/shongbee2/archive/2009/04/25/81058.html

排序算法总结

花了很长时间终于把排序的基础学了一下,这段时间学了很多东西,总结一下:

学的排序算法有:

  1. 插入排序
  2. 合并排序
  3. 冒泡排序
  4. 选择排序
  5. 希尔排序
  6. 堆排序
  7. 快速排序
  8. 计数排序
  9. 基数排序
  10. 桶排序(没有实现)
比较一下学习后的心得。

我不是很清楚他们的时间复杂度,也真的不知道他们到底谁快谁慢,因为书上的推导我确实只是小小了解,并没有消化。也没有完全理解他们的精髓,所以又什么错误的还需要高手指点。呵呵。

1.普及一下排序稳定,所谓排序稳定就是指:如果两个数相同,对他们进行的排序结果为他们的相对顺序不变。例如A={1,2,1,2,1}这里排序之后是A={1,1,1,2,2}稳定就是排序后第一个1就是排序前的第一个1,第二个1就是排序前第二个1,第三个1就是排序前的第三个1。同理2也是一样。这里用颜色标明了。不稳定呢就是他们的顺序不应和开始顺序一致。也就是可能会是A={1,1,1,2,2}这样的结果。

百度百科上的:

稳定性

  排序前一个序列中,如果出现N个与 关键字 相同的数据,那么排序后仍然按照原先序列的排列顺序排列,就说这个算法是稳定的,反之就是不稳定的。通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。再简单形式化一下,如果Ai = Aj, Ai原来在Aj位置前,排序后Ai还是要在Aj位置前。
 

2.普及一下原地排序:原地排序就是指不申请多余的空间来进行的排序,就是在原来的排序数据中比较和交换的排序。例如快速排序,堆排序等都是原地排序,合并排序,计数排序等不是原地排序。

3.感觉谁最好,在我的印象中快速排序是最好的,时间复杂度:n*log(n),不稳定排序原地排序。他的名字很棒,快速嘛。当然快了。我觉得他的思想很不错,分治,而且还是原地排序,省去和很多的空间浪费。速度也是很快的,n*log(n)。但是有一个软肋就是如果已经是排好的情况下时间复杂度就是n*n,不过在加入随机的情况下这种情况也得以好转,而且他可以做任意的比较,只要你能给出两个元素的大小关系就可以了。适用范围广,速度快。

4.插入排序n*n的时间复杂度,稳定排序,原地排序。插入排序是我学的第一个排序,速度还是很快的,特别是在数组已排好了之后,用它的思想来插入一个数据,效率是很高的。因为不用全部排。他的数据交换也很少,只是数据后移,然后放入要插入的数据。(这里不是指调用插入排序,而是用它的思想)。我觉得,在数据大部分都排好了,用插入排序会给你带来很大的方便。数据的移动和交换都很少。

5.冒泡排序n*n的时间复杂度,稳定排序,原地排序。冒泡排序的思想很不错,一个一个比较,把小的上移,依次确定当前最小元素。因为他简单,稳定排序,而且好实现,所以用处也是比较多的。还有一点就是加上哨兵之后他可以提前退出。

6.选择排序n*n的时间复杂度,稳定排序,原地排序。选择排序就是冒泡的基本思想,从小的定位,一个一个选择,直到选择结束。他和插入排序是一个相反的过程,插入是确定一个元素的位置,而选择是确定这个位置的元素。他的好处就是每次只选择确定的元素,不会对很多数据进行交换。所以在数据交换量上应该比冒泡小。

7.插入排序选择排序,冒泡排序的比较,他们的时间复杂度都是n*n。我觉得他们的效率也是差不多的,我个人喜欢冒泡一些,因为要用它的时候数据多半不多,而且可以提前的返回已经排序好的数组。而其他两个排序就算已经排好了,他也要做全部的扫描。在数据的交换上,冒泡的确比他们都多。呵呵。举例说明插入一个数据在末尾后排序,冒泡只要一次就能搞定,而选择和插入都必须要n*n的复杂度才能搞定。就看你怎么看待咯。

8.合并排序n*log(n)的时间复杂度,稳定排序,非原地排序。他的思想是分治,先分成小的部分,排好部分之后合并,因为我们另外申请的空间,在合并的时候效率是0(n)的。速度很快。貌似他的上限是n*log(n)所以如果说是比较的次数的话,他比快速排序要少一些。对任意的数组都能有效地在n*log(n)排好序。但是因为他是非原地排序,所以虽然他很快,但是貌似他的人气没有快速排序高。

9.堆排序n*log(n)的时间复杂度,非稳定排序,原地排序。他的思想是利用的堆这种数据结构,堆可以看成一个完全二叉树,所以在排序中比较的次数可以做到很少。加上他也是原地排序,不需要申请额外的空间,效率也不错。可是他的思想感觉比快速难掌握一些。还有就是在已经排好序的基础上添加一个数据再排序,他的交换次数和比较次数一点都不会减少。虽然堆排序在使用的中没有快速排序广泛,但是他的数据结构和思想真的很不错,而且用它来实现优先队列,效率没得说。堆,还是要好好学习掌握的。

10.希尔排序n*log(n)的时间复杂度(这里是错误的,应该是n^lamda(1<lamda<2), lamda和每次步长选择有关。),非稳定排序( 希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比o(n^2)好一些。由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的),原地排序。主要思想是分治,不过他的分治和合并排序的分治不一样,他是按步长来分组的,而不是想合并那样左一半右一半。开始步长为整个的长度的一半。分成nLen/2个组,然后每组排序。接个步长减为原来的一半在分组排序,直到步长为1,排序之后希尔排序就完成了。这个思路很好,据说是插入排序的升级版,所以在实现每组排序的时候我故意用了插入排序。我觉得他是一个特别好的排序方法了。他的缺点就是两个数可能比较多次,因为两个数据会多次分不过他们不会出现数据的交换。效率也是很高的。

11.快速排序,堆排序,合并排序,希尔排序的比较,他们的时间复杂的都是n*log(n),我认为在使用上快速排序最广泛,他原地排序,虽然不稳定,可是很多情况下排序根本就不在意他是否稳定。他的比较次数是比较小的,因为他把数据分成了大和小的两部分。每次都确定了一个数的位置,所以理论上说不会出现两个数比较两次的情况,也是在最后在交换数据,说以数据交换上也很少。合并排序和堆排序也有这些优点,但是合并排序要申请额外的空间。堆排序堆已经排好的数据交换上比快速多。所以目前快速排序用的要广泛的多。还有他很容易掌握和实现。

12.计数排序:n的时间复杂度,稳定排序,非原地排序。他的思想比较新颖,就是先约定数据的范围不是很大,而且数据都是整数(或能定位到整数)的情况,然后直接申请一个空间。把要排序的数组A的元素值与申请空间B的下标对应,然后B中存放该下标元素值的个数,从而直接定位A中每个元素的位置。这样效率只为n。因为比较很特殊,虽然很快,但是用的地方并不多。

13.基数排序n的时间复杂度,稳定排序,非原地排序。他的思想是数据比较集中在一个范围,例如都是4位数,都是5位数,或数据有多个关键字,我们先从各位开始排,然后排十位,依次排到最高位,因为我们可以用一个n的方法排一位,所以总的方法为d*n的复杂度。关键字也一样,我们先排第3个关键字,在排第3个关键字,最后排第一个关键字。只有能保证每个关键字在n的时间复杂度完成,那么整个排序就是一个d*n的时间复杂度。所以总的速度是很快的。不过有一点就是要确保关键字能在n的时间复杂度完成。

14.桶排序:n的时间复杂度,稳定排序,非原地排序。主要思路和基数排序一样,也是假设都在一个范围例如概率都在0-1,而且分布还挺均匀,那么我们也是和基数排序一样对一个数把他划分在他指定的区域。然后在连接这些区域就可以了。书上对每个区域使用链表的存储,我认为在寸小区域的时候也会有时间在里面。所以只是理论上的n时间复杂度。这种思路是不错的。呵呵。

15.计数排序,基数排序,桶排序的比较,我觉得他们都很有思想,不过都是在特定情况下才能发挥最大的效果。虽然效率很高,但是用的不会很广泛。他们之间我更喜欢计数排序,来个映射的方式就直接找到了自己的位置,很高明。和基数排序和同排序只是理论上的n时间复杂度,基数排序要确定一个关键字的排序是n复杂度的,桶排序要确定每个区域的排序是n复杂度的。

16.排序算法的最后感悟:黑格尔说过:存在即合理。所以这些排序的算法都是很好的,他确实给了我们思想上的帮助。感谢前人把精华留给了我们。我得到的收获很大,总结一下各自排序的收获:

冒泡:好实现,速度不慢,使用于轻量级的数据排序。

插入排序:也使用于小数据的排序,但是我从他的思想中学到怎么插入一个数据。呵呵,这样就知道在排好的数据里面,不用再排序了,而是直接调用一下插入就可以了。

选择排序:我学会了怎么去获得最大值,最小值等方法。只要选择一下,不就可以了。

合并排序:我学会分而治之的方法,而且在合并两个数组的时候很适用。

堆排序:可以用它来实现优先队列,而且他的思想应该给我加了很多内力。

快速排序:本来就用的最多的排序,对我的帮助大的都不知道怎么说好。

希尔排序:也是分治,让我看到了分治的不同,原来还有这种思想的存在。

计数排序,基数排序,桶排序:特殊情况特殊处理。

附上我学习这里排序的连接

快速排序学习1快速排序学习2(随机化版本)

快速排序学习3(最初版)快速排序学习4(最初版加随机版)

插入排序冒泡排序选择排序

希尔排序合并排序堆排序用堆实现优先队列

基数排序计数排序

posted on 2009-04-25 19:30shongbee2阅读(54812)评论(13)编辑收藏引用所属分类:数据结构和算法

排序算法总结

评论

#re: 排序算法总结[未登录]2009-04-25 22:10R

shell sort 复杂度是n^lamda, lamda是大于1小于2的实数, 并非nlogn. 回复更多评论

#re: 排序算法总结2009-04-26 00:30shongbee2

@R
哦。谢谢,原来跟lamda有关系哈。呵呵,因为我每次都是折半,所以就误认为是nlogn了。嘻嘻,谢谢哈。 回复更多评论

#re: 排序算法总结2009-04-26 12:35xcpp

研究排序算法的可以看看这个:http://www.sorting-algorithms.com/
动画做的很牛逼 回复更多评论

#re: 排序算法总结2009-04-26 21:29shongbee2

@xcpp
谢谢您,我看了,可惜没有怎么看懂。呵呵动画太快乐。我再仔细看看吧。 回复更多评论

#re: 排序算法总结2009-05-05 10:31

谢谢啊,我看了对我今后的学习还是有很大的帮助 回复更多评论

#re: 排序算法总结[未登录]2009-07-14 11:15tao

收藏 回复更多评论

#re: 排序算法总结2010-07-22 14:15salever

我觉得他们的效率也是差不多的,我个人喜欢冒泡一些,因为要用它的时候数据多半不多,而且可以提前的返回已经排序好的数组。而其他两个排序就算已经排好了,他也要做全部的扫描。

这里有点问题吧?选择排序和冒泡的思想是一样的,在已经排序的数组上使用它们仍然要进行o(n*n)的扫描,而插入则不是的。。。

而且在数据量在10000左右时,冒泡是最慢了,因为它还要进行大量的数据移动。 回复更多评论

#re: 排序算法总结2010-07-22 14:22salever

@salever
如果在冒泡里加上一个哨兵,那么在有序时基本不用扫描,这点忘记了哦。。。此时插入需要进行O(n)次扫描。。。 回复更多评论

#re: 排序算法总结2011-04-05 21:59光明顶左使

自从学完了大学数据结构课程之后,要排序时我总是直接去用库函数(比如std::sort, qsort什么的),免得自己实现又麻烦又容易出错...没学那门课程时一直用冒泡...回复更多评论

#re: 排序算法总结2011-08-07 00:23张良

总结的挺好的,正好最近在学习排序算法,帮助很大,谢谢作者,辛苦了……O(∩_∩)O~ 回复更多评论

#re: 排序算法总结2011-08-19 05:49w7619c

简单看了你的技术博克, 感觉很好. 排序法棒极了, 我在里面学会很多东西.
看了你学习openGL的过程, 呵呵, 可怜的家伙, 那东西貌似已经不怎么找人待见了,可以看看Flash+flex, 或者vrml, 也可以实现这些东西, 尤其是VRML可以直接由3DMax等3D渲染软件直接生成, 更简单也更酷了.
加油, 我们共同努力!! 回复更多评论

#re: 排序算法总结2011-08-25 10:00Kenny

选择排序不是稳定排序 回复更多评论

你可能感兴趣的:(数据结构,c,算法,存储,2010)