机器学习小结(论文用)

机器学习是人脸识别的根基,一张图片在计算机中存储首先是通过记录构成它的像素点的信息,包括像素的位置、RGB色彩以及灰度值等。在处理图像的过程中,图像也是通过矩阵的形式存放的,一个矩阵表示一张图片。通过对矩阵的翻转、平滑、膨胀等操作实现边缘检测和特征提取等操作。可以说,机器学习不仅是对于人脸识别,在整个人工智能的地位都是举足轻重的。

机器学习是基于测试集构建的数学模型,我们一般会用概率统计模型作为机器学习常用的模型,如线性回归和逻辑回归。不仅只有线性代数,数理统计与概率分析也是机器学习的基础学科。在人工智能中占主要地位的模型有通过统计学方法搭建的数学模型,还有就是通过人工神经网络训练而来的模型。但是,往往神经网络得到的模型虽然使用起来还不错,但是模型参数难以解释,而不被数学界所认可。

当下,深度学习是人工智能的一个热门话题,包括了输入,清洗数据,训练数据,再到数据的输出,整个过程一气呵成,已经形成了相当完善的生态和生产链,一些方面如:人脸识别、人工语音等,已经达到了足够成熟以投入使用的程度了。机器学习分为监督式学习和非监督式学习,当然也有半监督式学习的概念,不过不太被提及,一般化是认为只有监督式学习和非监督式学习两种。“监督式学习”一般是指根据已有的数据集,建立一个确定的数学模型来预测结果,数据会被划分为训练数据和测试数据,当然必要还会进行更多的划分。最后通过评估预测的结果来逐步人为地调整参数,以获得更好地模型。而“无监督式学习”只有输入数据,通过神经网络确定模型,似乎比一般地监督式模型效果更好,但是难以解释其中的原理。非监督式学习只是通过不断地训练并同时用算法自动调参来使得参数更优,也称“强化学习”,也被为机器学习地第三类。

所谓地第二类,是传统地“聚类”和“降维",聚类是为了将没有标签地数据”分类并贴上标签“,这个称为”聚类“,常见的有K-means算法。要注意分类是按照既定标签而分开,而聚类是直接分开再贴标签。”降维“是为了减少数据运算量,由于高维矩阵运算会带来巨大的运算量,所以我们会选择”降维“。

常见的分类算法有:K近邻法(K-Nearest Neighbor)、支持向量机(Support Vector Machine)、决策树(Decision Tree)、AdaBoost(Adaptive Boosting)等。

 

 

 

 

你可能感兴趣的:(Python机器学习与数据分析)