算法分享(一)

整理材料之前我去百度了一下工作常用算法,以及。。。在工作中算法究竟有没有用。就个人以及前几年师兄身上了解到,在项目过程中,几乎用不到算法。项目中讲究的是实现业务逻辑,如果没有极端的要求,算法也是用不到的。但是算法有没有用这一点是毋庸置疑的。

什么是算法

字面上的扩展就是计算的方法。

举个例子:已知共有鸡和兔15只,共有40只脚,问鸡和兔各有几只。

算法:假设鸡和兔训练有素,吹一声哨,它们抬起一只脚,(40-15=25) 。再吹一声哨,它们又抬起一只脚,(25-15=10) ,这时鸡都一屁股坐地上了,兔子还两只脚立着。所以,兔子有10/2=5只,鸡有15-5=10只。

排序

排序的算法有很多,最基础的冒泡,选择,插入。再到快排,堆排,桶排,基数排序等。这篇文章不是为了详解这些排序算法的,所以只在下文有用时,选择某一排序方法做简单的讲解。

在实际项目中,我们经常对列表页进行筛选并进行排序,实现上前端基本是通过后端接口返回的数据,而后端又是直接操作数据库,只用 order by XX 或者order by XX desc就完成了某条件升序或者降序的要求。

上面这种情况确实不用,那现在考虑一个情景,在项目中现在推出一个与你最相似的好友的功能,我们通过user的某一id(for example 课程id?)来计算相似度,我们需要找出两个user所拥有的相同的id。如何去统计最有效率。数据如下:

A: 5 3 2 1 6 8 7 9 10(A的长度定义为n)
B: 6 5 8 7 11 26 30 (B的长度定义为m)

1 最暴力的解决方法:以A为基础,B中取出,与A的每一个进行对比。当然可以稍微做一点优化,假设已经找到,就可以直接break。(复杂度 O(nm));

2 像题目中这种数据,我们可以用空间换时间的方法。利用数组,将数组对应下标的值设为1 or true(默认 0 or false),在查询时,复杂度为O(1);

3 但是假设id是String类型或者是超大的数字,n和m又非常小,定义一个那么大的数组是非常不划算的(内存都是钱)。也不用担心,在C++中和JAVA中都有map可以用。查询效率为O(log2(n))。

4 具体的情形下当然都有对应的最优处理方案,当然也有折中的,通用的方法。在上面几种方法中,实际就是判断有没有相同的数字,或者字符串,结合排序。

1 我们可以将他们混到一个数组中,然后进行排序,只需判断i+1 是否等于i。
2 再优一步,将两个数组分别进行排序。参考下面伪代码

    sort(a);    
    sort(b);    
    for(i=0;i

在查找的复杂度上 这两种都是O(n+m),接下来的内容比较各种排序算法的复杂度。

再来一个问题,同样是以上AB两列,求A中取一个,B中取一个,和大于12的有多少种组合形式。

以上排序的应用,接下来排序算法的复杂度分析,摘自网络

1.选择排序:不稳定,时间复杂度 O(n^2)
选择排序的基本思想是对待排序的记录序列进行n-1遍的处理,第i遍处理是将L[i..n]中最小者与L[i]交换位置。这样,经过i遍处理之后,前i个记录的位置已经是正确的了。

2.插入排序:稳定,时间复杂度 O(n^2)
插入排序的基本思想是,经过i-1遍处理后,L[1..i-1]己排好序。第i遍处理仅将L[i]插入L[1..i-1]的适当位置,使得L[1..i] 又是排好序的序列。要达到这个目的,我们可以用顺序比较的方法。首先比较L[i]和L[i-1],如果L[i-1]≤ L[i],则L[1..i]已排好序,第i遍处理就结束了;否则交换L[i]与L[i-1]的位置,继续比较L[i-1]和L[i-2],直到找到某一个位置j(1≤j≤i-1),使得L[j] ≤L[j+1]时为止。图1演示了对4个元素进行插入排序的过程,共需要(a),(b),(c)三次插入。

3.冒泡排序:稳定,时间复杂度 O(n^2)
冒泡排序方法是最简单的排序方法。这种方法的基本思想是,将待排序的元素看作是竖着排列的“气泡”,较小的元素比较轻,从而要往上浮。在冒泡排序算法中我们要对这个“气泡”序列处理若干遍。所谓一遍处理,就是自底向上检查一遍这个序列,并时刻注意两个相邻的元素的顺序是否正确。如果发现两个相邻元素的顺序不对,即“轻”的元素在下面,就交换它们的位置。显然,处理一遍之后,“最轻”的元素就浮到了最高位置;处理二遍之后,“次轻”的元素就浮到了次高位置。在作第二遍处理时,由于最高位置上的元素已是“最轻”元素,所以不必检查。一般地,第i遍处理时,不必检查第i高位置以上的元素,因为经过前面i-1遍的处理,它们已正确地排好序。

4.堆排序:不稳定,时间复杂度 O(nlog n)
堆排序是一种树形选择排序,在排序过程中,将A[n]看成是完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系来选择最小的元素。

5.归并排序:稳定,时间复杂度 O(nlog n)
设有两个有序(升序)序列存储在同一数组中相邻的位置上,不妨设为A[l..m],A[m+1..h],将它们归并为一个有序数列,并存储在A[l..h]。

6.快速排序:不稳定,时间复杂度
最理想 O(nlogn) 最差时间O(n^2) 快速排序是对冒泡排序的一种本质改进。它的基本思想是通过一趟扫描后,使得排序序列的长度能大幅度地减少。在冒泡排序中,一次扫描只能确保最大数值的数移到正确位置,而待排序序列的长度可能只减少1。快速排序通过一趟扫描,就能确保某个数(以它为基准点吧)的左边各数都比它小,右边各数都比它大。然后又用同样的方法处理它左右两边的数,直到基准点的左右只有一个元素为止。

点击这里查看排序算法图解

你可能感兴趣的:(算法分享(一))