《吴恩达机器学习》1 绪论:初识机器学习

初识机器学习

  • 前言
    • 一、什么是机器学习
        • 1、预测房价
        • 2、乳腺癌预测
    • 二、监督学习
    • 三、非监督学习
        • 1、google news
        • 2、DNA 个性
  • 总结

前言

机器学习(Machine Learning)这个领域近几年非常火爆,Alpha go、cortana、facenet等产品陈出不穷。特别是看到openai研究的DOTA2对抗机器人和顶级人类玩家打得如火如荼,无不激起我莫大的兴趣。为此为了跟上时代的步伐,希望自己也能成为AI领域的一份子,在此将吴恩达的机器学习课程做下学习笔记,以便交流及查阅。
ps. 本人是一名c++程序员(有空我要吐槽下c++),近年工作涉及很多AI,也为我打开了新世界的大门,我自己也研究了一些小工具,如文档边缘识别(类似扫描王),文档是否填写或是否同一篇文档等(后续会发博客开源出来),一起进步。

一、什么是机器学习

首先看看机器学习的定义:

“A computer program is said to learn from experience E with respect to some class of tasksT and performance measureP if its performance at tasks inT, as measured by P, improves with experience E ”

这段话读起来非常魔性,特别像rap,感觉就是为了押韵而写的。简单来说就是 通过学习一堆数据总结出经验,然后用这个经验得出结论,所以在机器学习中数据是核心,当今机器学习会这么火也得益于目前的大数据时代。你们应该还听过深度学习,其实他也是机器学习的一种,当然还有强化学习等都是机器学习的子领域。以下是几个例子

1、预测房价

这个是最经典也是最入门的例子,大家都知道房价和面积正相关吧(当然还有其他因素先不考虑)那么根据面积(横坐标)和价格(纵坐标)的样本图是这样的
《吴恩达机器学习》1 绪论:初识机器学习_第1张图片
上面我们可以根据数据通过算法(线性回归后续会介绍到)得到预测的直线或曲线,然后根据这条线(上面所说的经验)得出不同面积下的房屋价格。

2、乳腺癌预测

我们都知道癌症和肿瘤大小有关,那么我们根据大小和是否良性肿瘤的样本得出下面的图示
《吴恩达机器学习》1 绪论:初识机器学习_第2张图片
上面我们可以根据数据通过算法(logistics回归后续会介绍到)得到一个模型,根据这个模型输入肿瘤的大小就可以预测是否良性。

二、监督学习

首先是官方的定义:

利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的 过程,也称为监督训练或有教师学习。

比如以上两个例子都是带有标签的,即指示数据的结论值,那么我们就将这些带有标签数据的学习模型称为监督学习。监督学习是我学习那么多算法中最多的一种学习方式,比如knn,svm,pca等,其实记住这个概念即可,后续专项学习某个算法时,是很容易理解这个概念的。

三、非监督学习

首先是官方的定义:

无监督学习的问题是,在未加标签的数据中,试图找到隐藏的结构。因为提供给学习者的实例是未标记的,因此没有错误或报酬信号来评估潜在的解决方案

顾名思义就是不带标签数据的自动化学习模型,也是非常容易理解,常用的我所知的有聚类算法、鸡尾酒算法。下面我们看几个例子吧

1、google news

google news的新闻分类,自动的从非常多的新闻中将石油失事的归为一个大的链接
《吴恩达机器学习》1 绪论:初识机器学习_第3张图片

2、DNA 个性

算法将有DNA的一些序列进行分类,然后得出不同个性的相同簇
《吴恩达机器学习》1 绪论:初识机器学习_第4张图片

总结

以上就是吴恩达机器学习的绪论视频( 绪论:初识机器学习),是对视频的一些总结笔记及个人见解。

你可能感兴趣的:(机器学习,吴恩达,机器学习,笔记)