机器学习实战(一)-宏观总结


机器学习是时下流行技术,现在项目中的很多模块也开始使用机器相关算法来实现。接下来我会围绕机器学习实战相应算法总结,如存在不足,欢迎大家指出!谢谢!

一、机器学习由来

当下互联网已经得到广泛普及,在方便用户日常生活的同时,也存储了用户行为的海量数据。如何运用已有数据为我们服务,成为当下最为关注的问题。通过机器学习相关算法模型,对数据进行相应的分类和回归,降低了人工成本,同时为我们提供更为精确的预测。
相关概念:
机器学习实战(一)-宏观总结_第1张图片
人工智能(AI):为机器赋予人的智能
机器学习(ML):一种实现人工智能的方法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。
深度学习(DL):一种实现机器学习的技术,通过建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,例如图像,声音和文本。同机器学习一样,深度机器也有监督与无监督学习之分.不同的学习框架下建立的学习模型很是不同.如卷积神经网络是一种深度的监督学习下的机器学习模型。

二、核心算法

机器学习实战(一)-宏观总结_第2张图片
机器学习实战算法分为两大类:监督学习和非监督学习
监督学习:KNN、决策树、贝叶斯、Logic回归、支持向量机、Adaboost元算法
无监督学习:K-均值、Apriori、FP-growth

三、入门须知

机器学习实战(一)-宏观总结_第3张图片
学习机器学习的算法前,大家需要大概了解一下机器学习相关概念。
1、Python语言
优势:语法清晰、易操作、使用广泛
不足:性能低(用C弥补)
2、机器学习步骤
收集数据:待测样本数据
准备输入数据:准备特定格式数据
分析输入数据:是否存在不合理数据
训练算法:使用样本数据,训练算法模型
测试算法:使用测试数据,测试上步得到的算法模型
使用算法:算法通过验证后运用于生产
3、数据类型
标称型:有限目标集中取值,如真与假,动物分类集合{爬行类、哺乳类、……}
数值型:目标变量用于回归分析
4、目标变量
监督学习:存在 无监督学习:不存在

四、相关概念

1、知识表示
在人工智能里,其主要目标为储存知识,让程式能够处理,达到人类的智慧。
知识表示:假定鸟分类,经过测试满足精度要求,机器是否可以区分鸟类这个过程
2、训练数据和测试数据
训练数据目的是训练模型
测试数据是验证训练模型

五、小结

以上是对机器学习较为基础的总结,接下来会对机器学习相关算法进行相应介绍。




你可能感兴趣的:(【机器学习】)