机器学习笔记一

一、什么是机器学习

(一)机器学习定义一:

  • 计算机通过非显著性编程获得的学习能力。

        非显著性编程指的是:计算机自己从经验中总结出相关的规律。

        显著性编程:需要人为把机器人所处的环境调查清楚。

例如:

        1)让计算机区分菊花与玫瑰花。

        显著性编程:直接给出菊花与玫瑰花的特点

        非显著性编程:通过大量图片,计算机总结两种花的特征规律,进行区分

        2)让机器人冲咖啡

        显著性编程:我们要判断往哪走,什么时候停,什么时候开始冲咖啡等。

        非显著性编程:规定机器人可以采用一系列的动作,规定特定环境下机器人采取相应措施产生的收益,某个行为产生了不好的效果(撞到、摔倒等),收益为负;产生好的效果(取到咖啡)收益为正,规定了行为和收益函数后,让计算机自己最大化收益函数。

(二)机器学习定义二:

        计算机程序可以针对某个任务T和某个性能指标P,从经验E中学习。在任务T上被性能指标P衡量的性能,会随着经验E的增加而提高。机器学习本质就是最优化的过程

例如:

        任务T——编写计算机程序识别菊花与 玫瑰花

        经验E——一大堆菊花和玫瑰花的图片,(训练样本)

        性能指标P——不同算法有不同,这里可以选择识别率

        随着训练样本逐渐加大,识别率越来越大

        任务T——编写程序让机器人冲咖啡

        经验E——机器人多次尝试的行为和这些行为产生的结果

        性能指标P——在规定时间内成功充好咖啡的次数

        随着训练样本逐渐加大,成功充好咖啡的次数越来越多

二、机器学习的分类

(一)有监督学习:

        所有的经验E都是人工采集并输入到计算机

        传统监督学习:每一个数据都有标签。例如:支持向量机,人工神经网络,深度神经网络

        非监督学习:同一类型数据在样本空间中距离更近。例如:聚类,EM算法,主成分分析

        半监督学习:一部分有标签,另一部分没有。

        分类:标签是离散值,如人脸识别

        回归:标签是连续值,如设计算法预测房价走势

(二)强化学习:

        计算机的经验是由计算机与环境互动产生的,计算机产生行为与行为的结果,我们定义行为的收益函数,对行为进行奖励或惩罚,同时要设计算法让计算机自动改变自己的模式去最大化收益函数。

三、机器学习的算法过程

以任务区分红细胞、白细胞为例:

1.观察数据(样本),总结规律:

        根据各样本数据做成相应的曲线图(如下)观察其特征规律,图中可以发现用面积和周长可以区分开红白细胞,而圆形度虽然也有一定规律,但重合点过多,不适合用于作为特征规律。

2.如何基于上述两个特征构建算法

        支持向量机:线性内核、多项式核、高斯径向分布内核

        1)确定特征空间,将样本归一化处理,做出平面图(本实例是二维,有可能是多维空间或超多维空间)

        2)利用上面不同的算法计算相应的分界线

3.哪一种算法更好

由于无法穷尽所有新样本,不能得出绝对意义的好或者不好的机器学习算法。

但可以留一部分样本作为测试集,用于检验算法的优劣。

四、没有免费的午餐定理

任何一个预测函数,如果在一些训练样本上表现好,那么必然在另一些训练样本上表现不好,如果不对数据在特征空间的先验分布有一定的假设,那么表现好与表现不好的情况一样多

机器学习笔记一_第1张图片机器学习笔记一_第2张图片

假设:在特征空间上距离接近的样本,他们属于同一个类别的概率更高,所以一般机器会做出上述预判。当然,上述预判也有可能出错。

机器学习的本质是通过有限已知的数据,预测复杂高维空间的未知样本。因此再好的算法也有可能出错,没有永远最好的算法!

五、机器学习可以用来做什么

1.人脸识别  2.人脸性别、年龄估计  3.五子棋对战  4.水果识别  5.人脸特征点检测  6.语种识别  7.视频行为识别

学习视频:[1.1.1]--机器学习定义_哔哩哔哩_bilibili

你可能感兴趣的:(机器学习,机器学习,笔记,人工智能)