【机器学习】课程笔记01_引言(Introduction)

引言

  • 前言
  • 什么是机器学习
  • 监督学习(Supervised Learning)
  • 无监督学习(Unsupervised Learning)

前言

  • 机器学习(Machine Learning)
    • 从AI(人工智能)发展出来的一个领域
    • 为计算机开发的一项新功能
  • 应用领域:
    • 数据挖掘(Database mining):自动处理大量数据集(用户点击数据、医疗记录等)。
    • 无法手动编写的程序:例如自动驾驶、手写文字识别、自然语言识别、计算机视觉。
    • 私人定制程序:推荐算法。
    • 理解人类的学习过程和大脑

什么是机器学习

  1. 在没有明确设置的情况下,是计算机具有学习能力的研究领域。
  2. 一个适当的学习问题定义如下:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
  • 学习算法分类:
    • 监督学习(Supervised learning):我们教会计算机做某件事情。
    • 无监督学习(Unsupervised learning):计算机自己学习。
    • 强化学习、推荐系统

监督学习(Supervised Learning)

  • 我们给算法一个数据集,其中包含了正确答案(right answer),算法的目的是给出更多的正确答案。
  • 回归问题(Regression Problem):预测连续值输出(例如预测房价)。

【机器学习】课程笔记01_引言(Introduction)_第1张图片

  • 分类问题(Classification Problem):预测离散值(Discrete)输出(例如判断肿瘤恶性良性)。

【机器学习】课程笔记01_引言(Introduction)_第2张图片

无监督学习(Unsupervised Learning)

  • 所用的数据没有任何标签或都具有相同标签,未被告知数据集用来干什么,从中发现某种结构。
  • 聚类算法(Clustering Algorithm):给定数据集,无监督学习算法可能判定该数据集包含两个不同的簇。(例如谷歌新闻自动分簇,DNA拥有特定基因程度)
  • 应用:
    • 组织大型计算机集群
    • 社交网络的分析
    • 市场细分(区分客户群体)
    • 天文数据分析
  • 鸡尾酒会算法(Cocktail Party Algorithm):分离两个被叠加混合到一起的音频源。

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

你可能感兴趣的:(机器学习,人工智能,python)