机器学习、深度学习、神经网络、目标检测、卷积神经网络等相关名词解释、理解和含义

学习机器学习相关内容也有一段时间了,感觉有些东西一直分不清什么关系,习惯了看事物先定性后定量,先对各种名词加以理解和分类,再深入研究。此文章不对各部分内容深入研究,只为帮助初学者对各部分内容有个大概的了解,分清各种技术的关系。水平有限,欢迎指正。

 

几大名词范围:

机器学习、深度学习、神经网络、目标检测、卷积神经网络等相关名词解释、理解和含义_第1张图片

人工智能:

简单理解,就是让机器实现人的一些功能,替人决策某些事情,是一个大的宽泛的概念,是个大的集合,内部包含机器学习和深度学习

机器学习

机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。

深度学习:

是机器学习技术的一种,或者说一个重要的分支。其核心就是自动将简单的特征组合成更加复杂的特征,并用这些特征解决问题。

神经网络

最初是一个生物学的概念,一般是指大脑神经元,触点,细胞等组成的网络,用于产生意识,帮助生物思考和行动,后来人工智能受神经网络的启发,发展出了人工神经网络。

目标检测:

用算法判断图片中出现的目标的种类, 在图片中标记出它的位置, 用边框或方框把目标圈起来, 这就是目标检测问题。

目标分割:

将检测到的目标在图像中分离出来(像素级别),而不是简单框出方框,分清图片哪些区域属于这个目标

目标识别:

既可以理解为在多种物品中找到汽车这种目标,也可以理解为在一堆汽车(各种型号各种样子)中找到你家的汽车,个人理解人脸识别时目标识别的一种,实现目标识别的前提是实现目标检测(如你得先检测到人脸,再去识别这个人脸属于谁)

目标追踪:

在视频流中追踪某一目标移动(动态追踪目标),有时间上的关系,可以记录其轨迹或移动过程

 

下面收录一些常见的行业术语,主要帮助对其进行定性和分类

常用深度学习框架:

TensorFlow、Pytorch、Caffe、Theano、Keras、MXNet、Torch、CNTK、PaddlePaddle等

注:Keras是在TensorFlow基础上构建的高层API,比TF(TensorFlow的缩写)要易用很多,Keras的底层库使用Theano或TensorFlow,这两个库也称为Keras的后端,简单理解,Keras是在Theano或TensorFlow上又封装了一层

机器学习、深度学习、神经网络、目标检测、卷积神经网络等相关名词解释、理解和含义_第2张图片

 

常见目标检测算法

onestage:YOLO系列、SSD、RON等

two stage:R-CNN、Fast R-CNN、Faster R-CNN

机器学习、深度学习、神经网络、目标检测、卷积神经网络等相关名词解释、理解和含义_第3张图片

各种神经网络:

DNN:深度神经网络

从结构上来说,DNN和传统意义上的NN(神经网络)并无太大区别,最大的不同是层数增多了,并解决了模型可训练的问题。简言之,DNN比NN多了一些隐层,但这些隐层的作用是巨大的,带来的效果是非常显著和神奇的。不同问题的解决所需要的隐含层数自然也是不相同的,就大家比较熟识的语音识别来说,解决问题可能4层就够了,但一般图像识别需要达到20多层才能够解决问题。

RNN:递归神经网络

全连接的DNN存在着一个无法解决的问题:无法对时间序列上的变化进行建模。为了应对这种需求,业内提出了上文中提到的递归神经网络RNN。在普通的全连接网络中,DNN的隐层只能够接受到当前时刻上一层的输入,而在RNN中,神经元的输出可以在下一时间段直接作用到本身。换句话说,就是递归神经网络它的隐层不但可以接收到上一层的输入,也可以得到上一时刻当前隐层的输入。这一个变化的重要意义就在于使得神经网络具备了历史记忆的功能,原则上它可以看到无穷长的历史信息,这非常适合于像语音语言这种具有长时相关性的任务。

CNN:卷积神经网络

卷积神经网络主要是模拟人的视觉神经系统提出来的。以CNN做人脸识别任务为例,先得到一些像素信息,再往上层得到一些边界信息,然后再往上提取就是一些人脸的部件信息,包括眼睛、耳朵、眉毛嘴巴等,最后是人脸识别,这整个过程和人的视觉神经系统是非常相似的。卷积神经网络的结构依旧包括输入层、隐藏层和输出层,其中卷积神经网络的隐含层包含卷积层、池化层和全联接层3类常见构筑,接下来我们着重讲解下卷积和池化的相关知识点。

FCN: Fully Convolutional Networks 全卷积神经网络

分类不同的是,语义分割需要判断图像每个像素点的类别,进行精确分割。图像语义分割是像素级别的!但是由于CNN在进行convolution和pooling过程中丢失了图像细节,即feature map size逐渐变小,所以不能很好地指出物体的具体轮廓、指出每个像素具体属于哪个物体,无法做到精确的分割。针对这个问题,Jonathan Long等人提出了Fully Convolutional Networks(FCN)用于图像语义分割。自从提出后,FCN已经成为语义分割的基本框架,后续算法其实都是在这个框架中改进而来。

 

常见卷积神经网络(CNN)

Lenet、AlexNet、VGG、NIN、GoogleNet、ResNet、DenseNet

机器学习、深度学习、神经网络、目标检测、卷积神经网络等相关名词解释、理解和含义_第4张图片

 

机器学习常见算法及工具(目前了解的,后期学到往上添):

knn:又称邻近算法,或者说K最近邻(KNN,K-NearestNeighbor)

k-means:k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法

svm:支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier)

朴素贝叶斯:朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法

决策树(Decision Tree):决策树是一个决策支持工具,它使用树形图或者决策模型以及可能性序列,包括偶然事件的结果、资源成本和效用

逻辑回归(Logistic Regression):Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类

PCA(Principal Component Analysis): 是一种常见的数据分析方式,常用于高维数据的降维,可用于提取数据的主要特征分量。

 

你可能感兴趣的:(机器学习,神经网络,python,机器学习)