10月14日-吴恩达机器学习P1-4

(一)机器学习前言

机器学习例子:

  • 数据库挖掘
    自动化/网络发展带来的大型数据集
    如:网页点击数据、病例、生物、工程
  • 不能手工编程的应用程序
    如:自动直升机、手写识别、大部分自然语言处理(NLP)、计算机视觉
  • 自我定制程序
    如:亚马逊、网飞的产品推荐(根据客户喜好学习推荐相关产品)
  • 理解人类学习(大脑,真实的AI)

(二)机器学习算法分类

1、监督学习(给定一些样本数据计算机由此学习)
例1:房价预测问题(给出一些数据样本(红色叉叉),计算机决定是用直线还是曲线拟合,预测现在750平米的房子售价是多少)
10月14日-吴恩达机器学习P1-4_第1张图片这是一个回归问题(即:想要预测连续的数值输出)
例2:根据肿瘤大小预测该乳腺癌肿瘤是良性(0蓝色叉叉)还是恶性(1红色叉叉),预测粉色箭头所指的size最可能是良性还是恶性的。
10月14日-吴恩达机器学习P1-4_第2张图片这是根据一个特征或属性预测的分类问题(即:通常输出的结果只要是或者否,或者是1类癌症、2类癌症、3类癌症等离散值)
当我们的已知特征或属性不止一个,例如:我们还知道病例的年龄、肿瘤大小,那这时就需要计算机画出一条线,较为精确地将良性和恶性的所有样本隔开。然后根据这个点在的位置(粉色点是我们要预测的)在线的哪一步,来预测它是否为良性。
10月14日-吴恩达机器学习P1-4_第3张图片实际问题中,我们可能还知道肿瘤的厚度、肿瘤的细胞形状等无穷多个属性,那么运用这些已知数据划分就需要设计一种算法来解决,比如:支持向量机算法。
2、无监督学习(事先不知道正确答案,让计算机自己学习分簇)
还是给定上述肿瘤的样本数据,但是不再事先标记哪些是良性哪些是恶性肿瘤了。那么这时无监督学习算法会分别将同类数据标记为一簇,认定当前数据为两簇。 10月14日-吴恩达机器学习P1-4_第4张图片这也是常见的聚类算法。类似的例子还有谷歌新闻(将数以万计的新闻分别按照相同话题分成簇,即按照话题将新闻归类)
同样的例子还有:给定一批基因组数据,无监督学习会将其划分成不同的簇,自动找到这些不同的数据结构。即使事先我们不知道这分别代表第一种人、第二种人…的基因,也不知道正确答案。
10月14日-吴恩达机器学习P1-4_第5张图片例如:找出哪些机器更趋向于协同学习,使得工作更高效;根据每个人与其他人的邮件联系判断哪些人相互认识;根据用户信息库自动将客户划分到不同的细分市场中进行销售(事先不知道市场类型有哪些,也不知道谁属于哪一类市场);甚至用于星系理论。
10月14日-吴恩达机器学习P1-4_第6张图片另一种无监督学习问题以鸡尾酒会问题展开。酒会上很多人在讲话,你甚至听不清你对面的人在说什么。模拟的现实情况就是两个麦克风分别在离两位speaker不同的位置上,收集到speaker1、speaker2同时发出的讲话声。那么麦克风收集到的就是两端重叠在一起的音频。
无监督学习检测到这是两段不同的音频重叠,需要自动将两段音频分开。
10月14日-吴恩达机器学习P1-4_第7张图片
3、其他:强化学习、推荐系统等

你可能感兴趣的:(吴恩达机器学习,机器学习)