浅谈人工智能之机器学习,机器学习之监督学习

浅谈机器学习与深度学习的区别

在人类历史发展的这个阶段,我们所谈的AI(artificial intelligence)主要指的是弱人工智能(narrow AI),也就是机器可以实现帮助人类实现一些任务,比如小区入口的业主人脸识别;另外,还有一个强人工智能(General AI)概念,即机器可以拥有人类的感知,像人一样思考,在AlphaGo与李世石的对抗中,AlphaGo就相当于达到了出击的强人工智能概念。

那么,涉及到一个问题,弱人工智能是怎么实现的?而机器学习是一种实现AI的方法。简单地说,机器学习通过算法解析数据,加以学习,然后对预测部分进行预测,下文提到到监督学习和无监督学习均是实现机器执行任务的一种方式。

其实,人工智能领域已经分化为两大领域,一个是rule-based也就是规则式方法,也就是上段提到的机器学习便属于rule-based方法,在这个方法中, 人们通过写好的逻辑规则来教导计算机如何思考,如"若X,则Y";另外一个是神经网络(neural network)方法,人们已经不满足于把人类的逻辑规则传授给计算机,而是干脆在机器上重建大脑。也就是模仿人脑结构,构建类似生物神经元网络的结构来手法信息。**这也就是深度学习是实现机器学习的一种技术。**在深度学习中的人工神经网络(Artificial Neural Networks )中,该算法模拟人类的神经元连接方式,形成独特的人工神经网络。在这个网络里,有独立的层,连结方式还有数据传播方向。比如抽取一张猫的图片,将它剪切成许多块,然后植入神经网络第一层,第一层独立神经元会将数据传输到第二层,第二层神经元完成自己的使命,一直持续下去,直到最后一层,并生成最终结果。

机器学习之监督学习

在Supervised learning 当中,training database 包含了特征和类别信息,如在判断一辆公交车是否准时到站检测系统中,其训练数据包含是否到站的类别:到站和未到站,标签可分别标为{1,0}. 在监督学习中,classification and regression 算法是两类中最重要的算法,其中classification标签是离散的值,而regression标签是连续的值,比如前面提到的公交车是否准时到站,就属于分类算法范畴,而如果通过一个人的职业,学历,公司来预测一个人的收入,因为收入是连续的数字,因此标签可标为y属于【1000,10000000】.在supervisor learning中,主要分为两大部分,一部分是训练部分,一部分是预测部分。其中训练部分包括:获取数据,特征提取,监督学习,最后评价;而预测部分包括模型和预测。

在监督学习中,有别于分类问题,还有一个重要的回归问题,即通过训练数据学习一个从观测样本到连续的标签的映射,在回归问题中的标签是一系列连续的值。典型的有,如前段提到的收入预测,还有根据股票的历史价格预测未来股票的价格,房屋价格预测等等。

机器学习之无监督学习

在unsupervised learning当中,其训练集只有特征,不包含标签信息。其流程较监督学习简单,分为数据获取,特征提取和无监督学习。比如有M个训练数据,首先对m个样本进行处理,得到有用信息,这个过程就成为特征提取,最后利用无监督学习算法处理这些样本。在无监督学习中,一个典型的例子就是通过是否有翅膀和是否能够水下呼吸来区别鱼类和鸟类,也就是聚类算法。在聚类算法中,无需知道该类别具体是什么,而只需要知道其归属于某一个类别,比如鲫鱼鲤鱼都属于鱼类。

你可能感兴趣的:(浅谈人工智能之机器学习,机器学习之监督学习)