从零开始-Machine Learning学习笔记(1)-机器学习概述

​ 机器学习,顾名思义就是机器像人一样进行“学习”,是近两年来最为人津津乐道的名词之一,这一名称的由来却鲜为人所提起。在最近阅读周志华先生的《机器学习》一书之中,在其第一章的小故事中得到这一名词的由来。

​ 1952年,阿瑟·萨缪尔在IBM公司研制了一个具有学习能力的西洋跳棋程序,可以对大量的棋局中分析出当前局面的“好棋”与“坏棋”,不断提高弈棋水平。1956年,约翰·麦卡锡邀请萨缪尔在达特茅斯会议上介绍这一项工作。萨缪尔首次提出了“机器学习”这个词,并解释为“不显式编程地赋予计算机能力的研究领域”。这对于计算机科学的发展产生了重要的影响。因为在此之前的研究认为计算机不可能完成事先没有显示编程好的任务!

​ 目前已经存在很多种不同的学习算法,大部分的算法都可以被分类为两种类型,即:监督学习与非监督学习。所谓监督学习,就是我们给计算机的训练数据都是有标签的,所谓有标签的数据可以简单的理解为一个训练样本中有多个特征X,这些X会导致结果Y,于是我们每个训练样本可以表示为(x1, x2, x3, … , y1, y2,… )。这些数据给计算机,计算机就有一个目标,那就是将自己的模型逐渐的向训练数据靠拢,使得最终我们可以使用这个模型去预测某个非训练样本(x1, x2, …)对应的(y1, y2, …);而非监督学习则是给计算机的数据是没有标签的,计算机不知道什么样的结果是正确的,自己对数据进行一个划分,找到这些数据的共同特征。对数据进行聚类就是一个典型的无监督的学习算法。

​ 监督学习算法主要有k-近邻算法,决策树,朴素贝叶斯,逻辑回归与线性回归,SVM(支持向量机)和树回归等;而无监督学习的典型算法主要有k-均值聚类算法,Apriori算法和FP-growth算法等。有意思的是这些算法并不是最新研究出来的结果,而是很早之前就存在的,受限制于当时计算机的处理速度。近些年来,随着计算机性能的提升,这些算法得到更好的应用,使得人工智能成为热议的焦点,也推动了社会的发展。但是归根结底是因为硬件技术的革命而非机器学习本身的突破,所以机器学习要得到长远的发展,还需自身得到一些创新与突破。这也是同行诸位的共同任务!We can make this world a better place!

你可能感兴趣的:(机器学习,从零开始-Machine,Learning学习笔记)