Day02机器学习基础入门

1、机器学习的三大门派

(1)机器学习

        根据数据训练的经验,能得出某种数据模型并利用于此模型来预测未来的一种方法。

(2)深度学习

         就是能实现机器学习技术的神经网络算法。

(3)人工智能

          是机器展现人类智慧并且交叉各类综合技术学科,能适用于各行各业普适性很强的一门新技术。

2、机器学习分类

基于学习方式可分为:

(1)监督学习:目前使用最广的一种学习方式,指模型的训练既有数据也有衡量标准(也称为导师监督),即数据训练有判断依据。

主要应用于分类(不同类别)、回归(连续性)场景中,所谓分类就是健康与否、成绩好坏一些可以有某种特定衡量指标的具有对立面的问题判定;所谓回归就是可以确定多种变量相互依赖的定量(趋近于期望值)检测方法。

(2)无监督学习:只有数据,模型从数据中自己总结规律,没有统一的结果。又可细分为 自监督学习、半监督学习、对比学习等方式。

主要应用与聚类、降维场景中,所谓聚类就是通过观察将不同事物之间的相似特征与联系来进行分类;所谓降维降维可以将多重因素缩至最基本的具有标识性的特征作为选取参照。

(3)强化学习:以奖惩机制作为输入,也是以统计和动态规划技术为指导的非常有趣且具有前瞻性的一种学习方式。(AI)

主要应用于与环境互动场景中,例如著名的阿尔法围棋圈,在人机交互环境中相互博弈,阿尔法狗在不断学习不断胜利得到奖励以求最大奖励值从而不断强化机器的学习。同时该学习方法也流行于游戏圈、医疗圈等。

3、机器学习的步骤

数据搜集--------->数据清洗----------->特征工程----------->数据建模

(1)数据搜集:包含数据集(解决数据不平衡SMOTE算法)、训练集、验证集、测试集

(2)数据清洗:异常检测、图形处理、非法判断等

数据搜集与数据清洗之间有一种交叉验证法可以解决数据集的数据量小或参数调优的问题。

(3)特征选择:从数据集中选取最合适的特征值(深度学习会自动执行特征工程)

(4)数据建模:模型的选取与预测,损失函数、优化算法、评价指标

针对不同问题的特征工程的提取方法就不同数字、图片、文字的提取算法。

你可能感兴趣的:(零基础,学习,人工智能)