慕课网 玩转算法与数据结构 笔记
1-1 我们究竟为什么学习算法
计算机专业的同学对算法不陌生,
为什么要学习算法?
很多同学是为了应付面试,大公司都需要
但是我们应该体会到,算法是至关重要的
很多人认为自己工作里,和算法都没有关系
但是编译器里都是算法帮助我们完成的,封装在工具中,我们意识不到他的存在,认为是理所当然的,
搜索引擎:搜索算法+排序算法
1亿个结果用0.67s 排序出有用信息
算法的另一种用途:智能
Siri能够理解人类的语言
推荐算法:amazon,ebay,TouTube
推荐喜欢的东西:机器学习
机器学习的基础也是基本算法的使用
前面的例子都是和数据打交道,
现在的动画制作,也不是一帧一帧画出来的,每个画面都包括了对算法的研究:毛发,运动,灯光,天空,水,全部是算法 - 图形学算法
自动生成迷宫的算法,制作扫雷的算法:flatfill
算法处理三消游戏
AlphaGo:深度学习
计算机视觉:根据图像作为输入来识别出信息
人脸识别,
AR技术,
photoshop抠图
压缩软件
数据库本身就是算法库,他封装的很好,我们使用sql语句就可以使用
学好算法,才能创造出更有意义的东西,
而不是简单的把数据取出来用就完事了
公认的算法的学习曲线非常陡,
算法像数学,无法很快得到成果
要从最基础的开始积累,一点一点的前进
1-2 课程介绍
迫不及待要学习算法了,
语言用C++,因为大家本科都学过C++
算法其实和语言是无关的,算法导论都是伪代码,算法其实是一种思想,想通了,写出来很简单,
根据不同的语言特性,不同的语言有各自巧妙之处
不同语言的算法在:
https://github.com/liuyubobobo/Play-with-Algorithms
--
课程代码更新也在这个github上,
需要掌握基础的语言知识,对数组,链表,堆,栈等线性结构有了解
一般同学对以上这些基础都掌握的很好,所以这里不做介绍
对算法基础知识有了解:递归,遍历,算法复杂度
学习路径:
线性(排序),他是算法领域非常重要的,通过学习可以了解很多思想
树形结构,应用场合,每种树的特点,局限性
图
对算法的学习,编程是次要的,而需要多写写画画,才能更好的学习算法,
想明白了,编码并不难
很多复杂的算法,十几行就可以搞定
白板编程:
不给编译器,直接写代码,要求它可以被直接编译运行
这种编程不可能很长,一般就是10几行
数据结构的重要性:
linus说,好坏programmer的区别,就是他顾虑code还是datastucture,bad programmer worry about code,good programmer worry adbout data structure and their relationships,
Algorithm + Data Structures = Programs
很多大企业的面试题,听起来像算法,本质是数据结构题,
一般不难,考察的都是基础
微软要求白板写堆,能不能写出二叉树反转这么简单的算法
基础打牢,才会有思路,一味追求高端精巧,就是看到一个问题,学到一个想法,而不是系统的把它们整理在一个框架里面。
算法思想?
分支算法 - 归并排序,快速排序
贪心算法 - 最小生成树
动态规划 - 最短路径
递归搜索 - 树形结构
面试问题
会在评论区和github提出一些题目
每个细分领域都是算法
不积跬步无以至千里
图形学,图像学,机器学习,人工智能,数据挖掘,
操作系统,编译原理,网络安全,虚拟现实,高性能计算
很多学习对人工智能感兴趣,但是学一会儿就学不动了,究其根本,是基础太差
要耐心,打牢基础
A programmer who subconsiciously views himself as an artise will enjoy wht he does and will do it better.
2-1 选择排序法 Selection Sort
先接触O(n^2)的排序算法,
对于排序算法,最优的应该是nlogn
那为什么还要学习O(n^2)级别的排序算法?
1,因为很基础,不能小瞧其思路,简单的方法可以加深对问题的理解,增加启发,然后优化
如果对一些面试问题没思路,可以先写出简单的解法,过程中可能就有了优化的思路
,2,编码简单,易于实现,是一些简单场景的首选,
3,特殊情况,简单的排序算法更加有效
4,简单的排序算法可以衍生出复杂的排序算法。如希尔排序,它是对插入排序进行优化,得到的
5,简单的排序,可以作为子过程,改进更加复杂的排序算法
Selection Sort 选择排序
8 6 2 3 1 5 7 4
有一段动画演示,就是每次都找出所有剩余元素里,最小元素,拿出来,这样每次排出来的都是对的结果。
写代码
#include
#include //老版本swap()在algorithm
using namepsace std; //C++ 11的swap()在std
void selectionSort(int arr[], int n){
for(int i=0; i
2-2 使用模板(泛型)编写算法
现在只能对整数排序,
但是实际可能要对浮点数,字符串,自己定义的结构体和类排序,
所以应该使用模板函数,有些语言叫做泛型
再试试使用自定义的类型进行排序
#include
#include
#include
using namespace std;
#include "student.h"
timplate //定义类型为T,然后后面都用类型T
void selectionSort(T arr[], int n){
for(int i = 0; i < n; i ++){
//寻找[i,n)里面的最小值
int minIndex = i;
for(int j=0; j arr[minIndex]){
minIndex = j;
}
}
//把最小值的索引放入minIndex,
swap(arr[i], arr[minIndex]);
}
}
int main(){
String c[4] = {"D", "C", "B", "A"};
slesctionSort(c, 4);
for(int i = 0; i < 4: i++){
cout<
#include
//很多C++从业者认为不该引入std,污染命名空间
using namespace std;
//struct也可以重载?
struct Student{
string name;
int score;
//重载<, 传入另外一个学生的引用,返回bool
bool operator<(const Student &otherStudent){
//return score > otherStudent.score;
//这样会把name也排序,
return score != otherStudent.score?
score>otherStudent.score : name < otherStudent.name;
}
//重载<<,打印用
//为什么用friend?
friend ostream& operator<<(ostream &os, const Student &student){
os<<"Student: "<
更好的方法是把元素的比较写成函数less(),根据具体情况定义什么叫 一个比另一个小
这样会更加灵活
2-3 随机生成算法测试用例
原来的测试用例非常不智能,测试数组是硬编码的,
后面可能用到10万个元素,就应该用程序成员
创建新的SortTestHelper.h
//SortTestHelper.h
#ifndef SELECTIONSORT_SORTTESTHELPER_H
#define SELECTIONSORT_SORTTESTHELPER_H
#include
#include //老版本需要
#include
using namespace std;
//辅助测试的函数放在一个命名空间里面
//这样方便后面调用时了解这些函数都是辅助测试的
namespace SortTestHelper{
//生成有n个元素的随机数组,每个元素的随机范围是[rangeL, rangeR]
//实现就直接写到.h了,这样方便,可以理解为开源工程的项目
//而且SortTestHelper还有很多要用到模板的函数,他们的实现必须在.h,为统一,就这么做了
int* generateRandomArray(int n, int rangeL, int rangeR){
//L应该小于R
assert(rangeL <= rangeR);
int &arr = new int[n];
//c/c++标准的随机种子,根据时间
srand(time(NULL));
for(int i=0; i
void printArray(T arr[], int n){
for(int i = 0; i < n; i++)
count << arr[i] << " ";
count << endl;
return;
}
//测试排序结果的正确性
template
bool isSorted(T arr[], int n){
for(int i=0; i arr[i+1])
return false;
}
return true;
}
template
void testSort(string sortName, void(*sort)(T[], int), T arr[], int n){
//要测试时间,时间差就是消耗的时间,老版本也需要
clock_t startTime = clock();
//回调
sort(arr, n);
clock_t endTime = clock();
assert( isSorted(arr, n));
//打印执行了多少秒
cout << sortName << ":" << double(endTime - startTime) / CLOCKS_PER_SEC << "s" <
===========
2-4 测试算法的性能
写一个很有趣,很重要,辅助研究算法的函数
要对算法的性能有感性的认识,看算法在特定的数据集上的执行时间
int main(){
SortTestHelper::testSort("Selection Sort", selectionSort, arr, n);
}
//10000数据用0.2s,10万用了18s,大概是100倍。所以时间复杂度是n^2级别的,就是数据量和时间的关系
这两节的准备,就是为了后面学习排序算法,后面还会介绍一个o n^2级别的排序:插入排序
通过下节的学习,你会明白,o n^2级别的排序算法也很有用