机器学习基础

最近为了秋招又重新复习下机器学习的一些基本知识,接下来一段时间将会持续更新自己总结的机器学习中要点,为秋招能去大厂做准备。

机器学习基础

机器学习的基本工作是从收集到的数据中学习规则,利用学习到的规则来预测新的数据。

在机器学习中,根据任务的不同,可以分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)、半监督学习(Semi-Supervised Learning)和增强学习(Reinforcement Learning)。

监督学习

监督学习是机器学习算法中的一种重要的学习方法,在监督学习中,其训练样本中同时包含有特征和标签信息。在监督学习中,分类(Classification)算法和回归(Regression)算法是两类最重要的算法,两者之间最主要的区别是分类算法中的标签是离散的值, 而回归算法中的标签值是连续的值。

典型的算法有Logistic Regression、BP神经网络算法和线性回归算法。

监督学习的流程:

机器学习基础_第1张图片

无监督学习

与监督学习不同的是,在无监督学习中,样本中只含有特征,不包含标签信息。与监督学习(Supervised Learning)不同的是,由于无监督学习不包含标签信息,在学习时并不知道其分类结果是否正确。

无监督学习的流程:
机器学习基础_第2张图片

聚类算法是无监督学习算法中最典型的一种学习算法。聚类算法利用样本的特征,将具有相似特征的样本划分到同一个类别中,而不关心这个类别具体是什么。

除了聚类算法,在无监督学习中,还有一类重要的算法是降维的算法,数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示。

在无监督学习中,其典型的问题为聚类(Clustering)问题,代表算法有K-Means算法、DBSCAN算法等。

半监督学习

半监督学习(Semi-Supervised Learning)的训练数据中有一部分数据包含类别信息,同时有一部分数据不包含类别信息,是监督学习和无监督学习的融合。在半监督学习中,其算法一般是在监督学习的算法上进行扩展,使之可以对未标注数据建模。

参考文献

[1] Python机器学习算法(赵志勇著 电子工业出版社)

你可能感兴趣的:(机器学习)