机器学习基础简介

机器学习的概念

什么是机器学习

机器学习(Machine Learning,ML)主要研究计算机系统对于特定任务的性能,逐步进行改善的算法和统计模型。
通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的qian潜在规律,进而对新输入的数据进行准确的分类或预测。

机器学习过程

简单地来说就是通过海量数据训练模型,提炼规律,进行新数据的预测。

机器学习分类

无监督学习

无监督学习算法采用一组仅包含输入的数据,通过寻找数据中的内在结构进行样本点的分组和聚类。
无监督学习的核心应用是统计学中的密度估计和聚类分析。
最常用的例子就是新闻分类。

监督学习

监督学习算法构建了包含输入和所需输出的一组数据的数学模型,这些数据称为训练数据,由一组训练样本组成。
监督学习主要包活分类和回归。
其中,相似度学习是回归/分类密切相关的一类监督学习,它的目标是使用相似性函数从样本中学习,这个函数可以度量两个对象之间的相似度或关联度。它在排名、推荐系统、人脸识别等方面有很好的应用场景。

简单应用:

预测是否看电影

类型 产地 结果
科幻 美国 观看
动作 美国 不观看
动作 中国 观看
爱情 美国 不观看

你可能感兴趣的:(大数据与人工智能,算法,机器学习,hadoop)