吴恩达机器学习(第一章)——初识机器学习

第一章 初识机器学习

文章目录

  • 第一章 初识机器学习
      • 前言
      • 机器学习定义
      • 机器学习算法
        • 监督学习
        • 无监督学习
      • 学习工具

前言

Machine Learning:
Grewout of work in AI,newcapability for computers
机器学习
人工智能的伟大成就,计算机的新功能

机器学习的例子
数据挖掘 自动化/网络化发展带来的大数据集
不能用手编写的应用程序 example. 自然语言处理NLP,计算机视觉CV
个人定制程序 example. 亚马逊的产品推荐

机器学习定义

旧定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域

新定义:计算机程序从经验 E 中学习解决某一任务 T 进行某一性能测量 P ,通过 P 测定在 T 上的表现因经验 E 而提高。

机器学习算法

机器学习算法
监督学习 人教会计算机做某些事情
无监督学习 让计算机自己学习划分数据
其他 强化学习、推荐系统等等

监督学习

监督学习(Supervised Learning):给机器一定的训练集,训练集里面每个元素都有相应正确的标签,让机器学习这些训练集,来训练出可以达到预期相应的正确标签的模型

  1. 房价预测
  • 我们可以通过直线拟合来预测房价,也可以通过多项式拟合等其他算法来预测房价
  • 对房价的预测是一个回归问题,对给定值预测实际输出
  • 房价实际上是一系列离散的值,但是通常把房价看作实数,当作标量,所以把它看成一个连续的值,回归的意思是试着推测出这一系列连续值属性
  1. 肿瘤预测
    吴恩达机器学习(第一章)——初识机器学习_第1张图片
  • 估算肿瘤是良性还是恶性的概率,是一个分类问题
  • 分类指的是,我们试着推测出离散的输出值:0或1 。事实上在分类问题中,输出可能不止一个值,可能输出 0、1、2、3 等。
  • 在其他机器学习问题中,可能会遇到多种特征需要表示的情况,以后会学习一个算法,叫支持向量机(Support Vector Machine)简称SVM,即使有无限种特征都能处理

无监督学习

无监督学习(Unsupervised Learning):给机器一定的数据集,每条数据要么没有任何标签,要么是有相同的标签,从中找出数据的某种结构并划分
吴恩达机器学习(第一章)——初识机器学习_第2张图片

聚类算法:对于大量未知标注的数据集,按数据集的内在相似性将数据集划分为多个类别,即划分为不同的簇。聚类算法是无监督学习中最常用的一种

聚类算法的应用:

  • 组织大量的计算机集群
  • 社交网络分析
  • 市场细分的应用
  • 天文数据的分析
  • ······

无监督学习的另一种算法是鸡尾酒算法

在一个鸡尾酒宴会中,两个人在同时说话,用两个不同位置的麦克风记录下他们的话,这听起来像是两份录音被叠加到了一起,产生了我们现在的录音,算法将会这两个音频资源区分开来
吴恩达机器学习(第一章)——初识机器学习_第3张图片

学习工具

吴恩达的机器学习课程的学习工具前几年是用的 Octave 和 Matlab,现在则是推荐使用 Python 进行学习

从2018年开始,Python 变得炙手可热,有必要学习 Python 的一些基础语法,用 Python 进行数据分析并完成作业,更好地掌握机器学习知识的应用

你可能感兴趣的:(#,机器学习-吴恩达)