菜鸟知识搬运工

人脸检测与对齐之MTCNN网络

本文将对人脸检测MTCNN算法做一个简要介绍。该MTCNN算法出自深圳先进技术研究院乔宇老师组，是今年2016的ECCV。

论文原文：https://kpzhang93.github.io/MTCNN_face_detection_alignment/paper/spl.pdf

论文译文：https://blog.csdn.net/lff1208/article/details/77328357

GitHub tensorflow源码：https://github.com/AITTSMD/MTCNN-Tensorflow

GitHub matlab版本：https://github.com/kpzhang93/MTCNN_face_detection_alignment

GitHub 基于caffe的C++ API 的源码：https://github.com/DaFuCoding/MTCNN_Caffe

这个GitHub上是原始的caffe，再加上了MTCNN的部分（一个源文件+8个训练好的caffemodel以及deploy文件），大家可以clone到本地从头编译。编译完后，生成一个可执行文件，路径为 build/examples/MTSrc/MTMain.bin ，这个可执行文件需要额外的两个参数，第一个是上面的8个文件所在目录(caffe/examples/MTmodel/)，第二参数就是测试图片了。这里我们先运行下demo，将一张图片放到caffe目录下（放哪都行），然后转到caffe根目录下，运行 ./build/examples/MTSrc/MTMain.bin /examples/MTmodel/ 1.jpg 然后很快就出结果了，检测到人脸，以及五个特征点（两只眼睛，鼻子，左嘴角和右嘴角），具体demo展示可看GitHub的步骤。

MTCNN算法有三个阶段组成：第一阶段，浅层的CNN快速产生候选窗体；第二阶段，通过更复杂的CNN精炼候选窗体，丢弃大量的重叠窗体；第三阶段，使用更加强大的CNN，实现候选窗体去留，同时显示五个面部关键点定位。

一、总体架构

本算法的整体流程如下图所示：

①做图片的金字塔：顶端金字塔最小应该大于12 * 12

② 将每个金字塔的图片输入到P网络（在人脸的地方会有大量的框，），进而输出所有框的置信度定义一个置信度：大于此值为人脸（因为是初选，置信度定义不易过大，）：得到5个通道的特征图：第一个通道代表置信度：凡是大于0.7的留下来然后。反算回去：IDX（特征图的索引）*步长=进入P网络图的尺寸，然后除以原图的比例，得到建议框（为正方形），另外四个通道为位置的偏移：(X-X') / W = offset_X，得到原框X。然后通过非大值抑制，将多余的框去掉，（不在建议框做NMS的原因是因为建议框往往是个正方形，框的位置往往会过大，会过滤的不该过滤的信息）

③将PNet的结果，输入到R网络（图片大小固定：24 * 24）：由于得到的原框大小可能为长方形，所以需要在原图上接一个正方形，然后在等比例缩放，保证得到的24×24的人脸不会变形。然后重新确定位置的偏移，得到新的框，再做NMS.

③ 将RNet输出结果，输入ONet网络（图片大小固定为48×48）

如上图所示，该MTCNN由3个网络结构组成（P-Net,R-Net,O-Net）。

Proposal Network (P-Net)：该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归，对候选窗口进行校准，然后通过非极大值抑制（NMS）来合并高度重叠的候选框。
Refine Network (R-Net)：该网络结构还是通过边界框回归和NMS来去掉那些false-positive区域。只是由于该网络结构和P-Net网络结构有差异，多了一个全连接层，所以会取得更好的抑制false-positive的作用。
Output Network (O-Net)：该层比R-Net层又多了一层卷积层，所以处理的结果会更加精细。作用和R-Net层作用一样。但是该层对人脸区域进行了更多的监督，同时还会输出5个地标（landmark）。

先对图像进行多尺度变换，获取图像金字塔，获取图像多尺度信息，金字塔顶端图像尺寸大于12*12。

二、网络架构

1、P-net(Proposal Network)：

主要使用一个全卷积网络，先对图像进行多尺度变换，获取图像金字塔，获取图像多尺度信息。获取候选框和这些候选框的bounding box regression向量组。然后评估这些候选向量，并进行校准。最后使用非极大化抑制来去除大量重复的候选区域。

输入：待检测的图像；

输出：m*n（最终特征图的尺度）个box坐标回归值以及对应的是否为人脸的得分。经过进一步的计算，得到可能为人脸的box集合，如图红色框：

中间过程简述：将原图建立金字塔，得到一系列尺寸的待检测图。对于每一张待检测图（1、一种可以基于滑动框来扫描金字塔中所有的图像，滑动框尺寸为12*12，是P-Net的输入尺寸，2、另一种可以直接将整幅图像输入PNet，因为他是全卷积网络，不限输入尺寸，输出n*n*32的特征图，每个1*1*32对应一个12*12的框的检测结果），输入到PNet，会输出一系列box，去掉那些得分（score）不达标的box，并用非极大值抑制（nms）再去掉一部分box。对于所有尺寸的待检测图，都得到类似的box集合。将所有box集合合并，再用nms去除一部分box，余下的就是第一阶段最终的输出。

训练：

输入是12*12*3的图片，以及标签 = 样本类型0/1/-1 + 四个数字为一组的crop_box与真实box之间的偏差，成为回归框（bounding box regressiom）

P-Net主要用来生成一些候选框（bounding box）以及lable。在训练的时候该网络的顶部有3条支路用来分别做人脸分类、人脸框的回归和人脸关键点定位；在测试的时候这一步的输出只有N个bounding box的4个坐标信息和score，score可以看做是分类的输出（是人脸的概率），源代码中输出就是sigmoid函数值。

PNet训练数据

1、遍历数据集，在每一张照片的基础上：

一张照片可能有多张人脸，所以有boxes。由一张照片裁剪出50张不同的大小为12*12的照片，如果Iou值小于0.3，就写入nagetive样本文件中。具体方法：在一张照片的基础上随机生成crop_box，计算crop_box与boxes的Iou，然后按照crop_box的尺寸剪切原图片并缩放成12*12大小的图片，转换成12*12*3的结构，根据Iou对新生成的照片归类。

2、遍历第一步中的那一张照片的所有boxes，在每个box的基础上：

# generate negative examples that have overlap with gt
加入随机数，随机生成crop_box，根据Iou值，写入pos或part样本文件中；

计算crop_box与box之间的偏差，把这些偏差称为回归框，生成的训练数据的标注lable不仅有positive/part，还要加上回归框信息。计算crop_box与boxes的Iou进行归类。
compute bbox reg label，其中x1,x2,y1,y2为真实的人脸坐标，x_left,x_right,y_top,y_bottom，width,height为预测的人脸坐标，如果是在准备人脸和非人脸样本的时候，x_left,x_right,y_top,y_bottom，width,height就是你的滑动窗与真实人脸的IOU>0.65（根据你的定义）的滑动窗坐标。
# dface代码中box用的是正方形，即size=width=height代表box窗口的边长

offset_x1 = (x1 - x_left) / float(width)
offset_y1 = (y1 - y_top) / float(height)
offset_x2 = (x2 - x_right) / float(width)
offset_y2 = (y2 - y_bottom ) / float(height)

其中x1,x2,y1,y2为真实的人脸坐标，x_left,x_right,y_top,y_bottom，width,height为预测的人脸坐标，

3、最后的输出

negative样本：IOU < 0.3，标签为：0 0 0 0 0
positive样本：IOU > =0.65，标签为：1 0.01 0.02 0.01 0.02
part样本：0.4 <= IOU < 0.65，标签为： -1 0.03 0.04 0.03 0.04

mtcnn的label加了回归框的偏差量，标签的第一个数0,1，-1，代表了三类人脸，后面的四个值，指的是回归框的偏移量，负样本没有偏移量，所以全为0。

乱序合并标注文件,将三个样本文件合并到一个文件 PNET_TRAIN_IMGLIST_FILENAME = "imglist_anno_12.txt"

from：https://blog.csdn.net/A18730290353/article/details/88366573

二、第二阶段：RNet

R-Net，将经过P-Net确定的包含候选窗体的图片在R-Net网络中训练，网络最后选用全连接的方式进行训练，全连接层可以进行更细化的处理，排除掉大量不符合要求的候选区域，通过bounding box regression执行校准微调候选窗体，利用非极大化抑制( NMS)进行合并去除重叠窗体。

输入：R-Net和P-Net类似，输入是前面P-Net生成的边界框，每个边界框的大小都是24*24，可以通过缩放得到。网络的输出和P-Net是一样的。这一步的目的主要是为了去除大量的非人脸框。第一阶段生成的box，在原图中截取对应的区域，将所有截取得到的图像合并到一个四维矩阵中，作为RNet的输入。

输出：对于输入的每个box，输出其对应的坐标回归值以及对应的是否为人脸的得分。将得分不达标的box去掉，得到第二阶段的box集合。也就是说，第二阶段是在第一阶段的基础上对box实现进一步分筛选，同时也会以通过回归将box坐标进行更新，使得其精度更高。如图：

第三阶段：ONet

O-Net网络结构比R-Net多一层卷积，功能与R-Net作用一样，只是在去除重叠候选窗口的同时，显示五个人脸关键点定位。

输入：类似于RNet，但以第二阶段的输出得到的人脸图像。
输出：N*（2*5）个坐标值。其中N是人脸的数目，每个人脸检测5个关键点。

注意点：

CNN输出的不是坐标，而是坐标的回归量（偏移量？？），实际的坐标是要通过进一步计算得到的。可以参考bbreg.m文件
第一阶段生成box的时候，用到了generateBoundingBox函数，是从特征图上映射到原图得到box的。如下
将一张图像输入到PNet，可以输出m*n组box回归值（每组4个数）及其对应的score；而一张图像输入到RNet，仅会得到1组box回归值及其score（这个原因是卷积层和全连接层的区别）。

from：https://blog.csdn.net/wshdkf/article/details/79956976

采用PReLU激活函数：

如果ai=0，那么PReLU退化为ReLU；如果ai是一个很小的固定值(如ai=0.01)，则PReLU退化为Leaky ReLU(LReLU)。有实验证明，与ReLU相比，LReLU对最终的结果几乎没什么影响

三、网络的训练

本算法从三个方面对CNN检测器进行训练：人脸分类、边界框回归、特征点定位（关键点定位）。

3.1、人脸分类

对于每一个输入样本采用交叉熵损失函数：

上述公式中的表示是人脸的概率，其中 $y^{det}_ i\in{0,1}$ ,表示真实标签，在这一步中损失函数的计算，我们只用到正样本和负样本

3.2、边框回归

对于每一个候选框，需要预测它和真实坐标偏移之间的损失。对于每一个样本通过欧式距离进行回归，在这一步中损失函数的计算，我们只用到正样本和part样本：

上式为通过欧氏距离计算的回归损失。其中，带尖的y为通过网络预测得到偏移量，不带尖的y为实际的真实坐标的偏移量。y为一个（offset_x1，offset_y1，offset_x2，offset_y2）组成的四元组，每一个box是一个4维向量。

回归框偏移值计算：考虑到直接采用坐标信息进行回归框的预测，网络收敛比较慢。所以在回归框预测的时候一般采用回归框的坐标偏移进行预测，所以上面的y都是偏差量，而不是实际坐标。

训练样本生成时：生成滑动窗口样本后，对应滑动窗口样本和Guarant True Box的偏移值，即可算出来，如下所示：

offset_x1 = (gx1 - x1) / float(x2-x1)
offset_y1 = (gy1 - y1) / float(y2-y1)
offset_x2 = (gx2 - x2) / float(x2-x1)
offset_y2 = (gy2 - y2) / float(y2-y1)

这样生成滑动窗口的时候，对正样本及中间样本，同时保存相应的offset值，如下所示：

positive/0.jpg 1 0.02 -0.01 -0.20 -0.06
positive/1.jpg 1 0.08 0.04 -0.18 -0.06
positive/2.jpg 1 0.16 0.10 -0.03 0.09
positive/3.jpg 1 0.00 -0.04 0.08 0.28
positive/4.jpg 1 0.08 0.03 -0.12 0.01

3.3、特征坐标定位

与候选框回归类似，还是计算候选特征坐标偏移量和真实坐标的偏移量的欧式距离，并最小化此距离；在这一步中损失函数的计算，我们只用到landmark样本：

上述五点特征包括：左眼、右眼、鼻子、左边嘴角、右边嘴角。每个特征点均有两个偏移量组成，带尖的y为通过网络预测得到，不带尖的y为实际的特征点坐标与人脸框的偏移量，y是一个10维的向量。

面部轮廓关键点回归值：人脸的面部轮廓关键点不采用绝对坐标，同样使用的是回归值，不过该回归值对应的是Bounding Box的相对坐标。生成方法类似于回归框的方式，在guarand true landmark点上加上一个随机偏移量，然后再计算offset值。相应的计算公式如下所示：

offsetX=(lx-x)/bbox_width
offsetY=(ly-y)/bbox_height

对所有的landmark点计算offset后生成如下数据：

train_PNet_landmark/0.jpg -2 0.288961038961 0.204545454545 0.814935064935 0.262987012987 0.535714285714 0.659090909091 0.275974025974 0.853896103896 0.724025974026 0.905844155844
train_PNet_landmark/1.jpg -2 0.42816091954 0.215517241379 0.89367816092 0.26724137931 0.646551724138 0.617816091954 0.416666666667 0.790229885057 0.813218390805 0.836206896552
train_PNet_landmark/2.jpg -2 0.153125 0.271875 0.659375 0.328125 0.390625 0.709375 0.140625 0.896875 0.571875 0.946875
train_PNet_landmark/3.jpg -2 0.174327367914 0.242510936232 0.673748423293 0.342669482766 0.372792971258 0.69904560555 0.10740259497 0.864043175755 0.532653771385 0.95143882472

3.4、多源训练

训练过程中，有人脸非人脸的照片，部分人脸区域。所以上述的三个损失函数可能有的没有必要使用。所以整体的损失函数如下：

在P_Net和R_Net中设置：

在O_net中设置：

其中N是样本集大小，其中 $\alpha _j$ 表示任务的优先级， $\beta ^j_i$ ∈{0,1}表示样本标签，表示上面三步的损失函数。在训练过程中，为了取得更好的效果，作者每次只后向传播前70%样本的梯度，这样来保证传递的都是有效的数字。有点类似latent SVM，只是作者在实现上更加体现了深度学习的端到端。

四、training data的处理：

原始数据

该算法训练数据来源于wider和celeba两个公开的数据库，wider提供人脸检测数据，在图上标注了人脸框groundtruth的坐标信息，celeba提供了5个landmark点的数据。根据参与任务的不同，将训练数据分为四类:

负样本：滑动窗口和Ground True的IOU小于0.3；
正样本：滑动窗口和Ground True的IOU大于0.65；
中间样本：滑动窗口和Ground True的IOU大于0.4小于0.65；
关键点：包含5个关键点坐标的；

上面滑动窗口指的是：通过滑动窗口或者随机采样的方法获取尺寸为12*12的框：

wider数据集，数据可以从http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/地址下载。该数据集有32,203张图片，共有93,703张脸被标记，如下图所示：

人脸数据集widerface，该数据集仅提供了大量的人脸边框定位数据。如果使用wider face的 wider_face_train.mat 注解文件需要转换成txt格式的，在注解文件wider_origin_anno.txt格式如下：

0--Parade/0_Parade_marchingband_1_849.jpg 448 329 570 478
0--Parade/0_Parade_marchingband_1_117.jpg 68 359 118 394 226 382 282 425 295 304 339 330 353 279 393 315 884 377 947 418 818 390 853 434 727 341 764 372 598 246 631 275 740 308 785 341

每四个数字代表该图片中的一个人脸边框定位数据x1, y1, x2, y2（x_left, y_top, x_right, y_bottom），第一张照片有只一个人脸，第二张照片有9个人脸。

celeba（səˈleb）人脸关键点检测的训练数据，数据可从http://mmlab.ie.cuhk.edu.hk/archive/CNN_FacePoint.htm地址下载。该数据集包含5,590张 LFW数据集的图片和7,876张从网站下载的图片。

trainImageList.txt存放的是每个图片中的人脸框坐标和对应的五个特征点坐标，因此我们知道一个完整的人脸有14个参数（2个角点坐标，5个特征点坐标）。例如：

训练采用四种类型的数据：

1、备选区域和目标区域的重叠率（IOU）小于0.3的，全部是非人脸。
2、IOU大于0.65的是人脸。
3、IOU在0.4到0.65之间的是part人脸区域。
4、IOU大于0.65，人脸特征坐标，人脸标注五个位置。

其中1、2数据集主要用来识别人脸与非人脸。 2、3数据集用来做box bounding regression。 4数据集主要用来确定人脸五点特征位置。训练样本的比例，负样本:正样本:part样本:坐标=3:1:1:1

from：https://blog.csdn.net/xygl2009/article/details/77917402

测试过程：

1、PNet过程：

我们输入一张图，首先简历图像金字塔，假设我们得到n张图像，我们一次将每张图像送入PNet，这里就体现了全卷积网络的优点了：对输入图像的尺寸没有要求，这里我们举个实例进行说明：

加入我们输入24*24*3的图像，经过一层3*3卷积，变成22*22*10的特征图，再经过2*2池化，变成11*11*16，再经过2层3*3的卷积层，变成7*7*32的特征图。这个特征图每个1*1*32对应原图像中一个12*12的框。

不信我们可以从滑动窗的角度来解释，加入PNet是全连接，输入尺寸是12*12，南无为了检测24*24的图像，我们就要用滑动框在图像上滑动，stride=2（之所以是2，是为了跟maxpool=2相匹配），这样我们可以计算出，遍历整幅图像需要的滑动窗口数为：((24-12)/2)+1=7,所以我们要将49个12*12的滑动框送入PNet,得到49个1*1*32的结果，这不就和上面输出的结果一模一样了嘛！！！！

这也正是全卷积的优点所在！！

接下来继续：我们得到7*7*32的特征图，对每个1*1*32的向量进行类别判断，我们得到49*2的判别结果，49对应图像上的49的滑动框，2对应每个框是人脸的概率，非人脸的概率。

对于判断是人脸的框，进行边框偏移量预测，边框回归输出4个offset，那么我们就以当前这个滑动窗口的位置为基准，求回归矫正后的人脸边框。

2、RNet

对于PNet得到的检测框，NMS处理，删除一些检测框，将剩余的检测框resize成24*24，送入RNet，之后同第一步，得到矫正回归后的检测框。

3、将检测框进行NMS，删除一些检测框，将剩余的检测框resize成48*48，送入ONet，然后得到矫正回归后的检测框。以求得的这个边框为基准，根据预测出的5个人脸特征点的offset。求取真正的五个人脸特征点坐标。

推荐：https://blog.csdn.net/dapanbest/article/details/79344558

五、OpenCV

调用caffe模型，成功完成人脸识别。

//success
#include 
#include 
#include 
using namespace cv;
using namespace cv::dnn;

#include 
using namespace std;

int main(int argc, char **argv)
{
	CommandLineParser parser(argc, argv,
		"{ h help           | false | print this help message }"
		"{ p proto          |    det1.prototxt   | (required) model configuration, e.g. hand/pose.prototxt }"
		"{ m model          |   det1.caffemodel    | (required) model weights, e.g. hand/pose_iter_102000.caffemodel }"
		"{ i image          |   face.jpg    | (required) path to image file (containing a single person, or hand) }"
		"{ width            |  12  | Preprocess input image by resizing to a specific width. }"
		"{ height           |  12  | Preprocess input image by resizing to a specific height. }"
		"{ t threshold      |  0.1  | threshold or confidence value for the heatmap }"
		);

	String modelTxt = parser.get("proto");
	String modelBin = parser.get("model");
	String imageFile = parser.get("image");
	int W_in = parser.get("width");
	int H_in = parser.get("height");
	float thresh = parser.get("threshold");
	if (parser.get("help") || modelTxt.empty() || modelBin.empty() || imageFile.empty())
	{
		cout << "A sample app to demonstrate human or hand pose detection with a pretrained OpenPose dnn." << endl;
		parser.printMessage();
		return 0;
	}

	// read the network model
	Net net = readNetFromCaffe(modelTxt, modelBin);

	// and the image
	Mat img = imread(imageFile);
	if (img.empty())
	{
		std::cerr << "Can't read image from the file: " << imageFile << std::endl;
		exit(-1);
	}

	// send it through the network
	Mat inputBlob = blobFromImage(img, 1.0, Size(W_in, H_in), Scalar(0, 0, 0), false, false);
	net.setInput(inputBlob,"data");
	Mat result = net.forward("prob1");
	// the result is an array of "heatmaps", the probability of a body part being in location x,y

	Mat probMat = result.reshape(1, 1); //输出2个标签，第一个代表人脸，第二个代表非人脸，经验证：输入face照片，输出[1,0];输入非人脸照片，输出[0,1]
	float a = probMat.at(0, 0);//是人脸的得分
	float b = probMat.at(0, 1);//不是人脸的得分
	namedWindow("facedetect", 0);
	imshow("facedetect", probMat);
	waitKey();

	return 0;
}

from：https://www.cnblogs.com/zyly/p/9703614.html 文中还有人脸识别的损失函数构造

prototxt的更加详细的网络结构参见：https://github.com/DaFuCoding/MTCNN_Caffe/tree/master/examples/MTmodel

分别为det1,det2,det3。

det1.prototxt结构：

det2.prototxt结构：

det3.prototxt结构：

from：https://blog.csdn.net/qq_14845119/article/details/52680940

以det1为例，简要介绍其结构：

name: "PNet"
	input: "data"
	input_dim: 1
	input_dim: 3
	input_dim: 12
	input_dim: 12
	*###卷积层1，输入12123* layer {
	name: "conv1"
	type: "Convolution"
	bottom: "data"
	top: "conv1"
	param {
	lr_mult: 1 #学习率的系数
	decay_mult: 1 #权值衰减，避免over-fitting，需要对cost function加入规范项
	}
	param {
	lr_mult: 2
	decay_mult: 0}
	convolution_param {
	num_output: 10 #卷积核的个数
	kernel_size: 3
	stride: 1
	weight_filler {
	type: "xavier"} #泽维尔
	bias_filler {#偏置项
	type: "constant"
	value: 0}
	}
	}
	####带参数激活函数 layer {
	name: "PReLU1"
	type: "PReLU"
	bottom: "conv1"
	top: "conv1"
	} *#此时12123变成101010*
	*###池化101010变成5510* layer {
	name: "pool1"
	type: "Pooling"
	bottom: "conv1"
	top: "pool1"
	pooling_param {
	pool: MAX
	kernel_size: 2
	stride: 2}
	}
	*###卷积层2，输入5510特征图* layer {
	name: "conv2"
	type: "Convolution"
	bottom: "pool1"
	top: "conv2"
	param {
	lr_mult: 1
	decay_mult: 1
	}
	param {
	lr_mult: 2
	decay_mult: 0
	}
	convolution_param {
	num_output: 16 *#16个卷积核。每个卷积核尺寸5510*
	kernel_size: 3
	stride: 1
	weight_filler {type: "xavier"}
	bias_filler {
	type: "constant"
	value: 0}
	}
	}
	layer {
	name: "PReLU2"
	type: "PReLU"
	bottom: "conv2"
	top: "conv2"
	} *#这一层没有池化层，5510变成3316*
该层输出的conv3会有两个分支，一个用于类别判断，另一个用于边框回归	*#卷积层3，输入3316特征图，输出1132特征图* layer {
	name: "conv3"
	type: "Convolution"
	bottom: "conv2"
	top: "conv3"
	param {
	lr_mult: 1
	decay_mult: 1}
	param {
	lr_mult: 2
	decay_mult: 0}
	convolution_param {
	num_output: 32
	kernel_size: 3
	stride: 1
	weight_filler {type: "xavier"}
	bias_filler {
	type: "constant"
	value: 0}
	}
	}
	layer {
	name: "PReLU3"
	type: "PReLU"
	bottom: "conv3"
	top: "conv3"
	}
*#卷积层4-1，输入1132特征图，输出112，用于判别是否为人脸*	layer {
	name: "conv4-1"
	type: "Convolution"
	bottom: "conv3"
	top: "conv4-1"
	param {
	lr_mult: 1
	decay_mult: 1}
	param {
	lr_mult: 2
	decay_mult: 0}
	convolution_param {
	num_output: 2 *#2个卷积核，每个卷积核尺寸：1132*
	kernel_size: 1
	stride: 1
	weight_filler {type: "xavier"}
	bias_filler {
	type: "constant"
	value: 0}
	}
	}
#卷积层4-2以conv3作为输入（1132），输出114	layer {
	name: "conv4-2"
	type: "Convolution"
	bottom: "conv3"
	top: "conv4-2"
	param {
	lr_mult: 1
	decay_mult: 1}
	param {
	lr_mult: 2
	decay_mult: 0}
	convolution_param {
	num_output: 4 *#4个卷积核，每个卷积核尺寸1132*
	kernel_size: 1
	stride: 1
	weight_filler {
	type: "xavier"}
	bias_filler {
	type: "constant"
	value: 0}
	}
	}
#使用交叉熵softmax函数，用于判断人脸和非人脸	layer {
	name: "prob1"
	type: "Softmax"
	bottom: "conv4-1"
	top: "prob1"
	}

你可能感兴趣的:(MTCNN)

计算机视觉：经典数据格式(VOC、YOLO、COCO)解析与转换(附代码) 全栈你个大西瓜人工智能计算机视觉 YOLO 目标跟踪人工智能数据标注目标检测 COCO
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络(附代码)第五章：计算机视觉：神经网络实战之手势识别(附代码)第六章：计算机视觉：目标检测从简单到容易(附代码)第七章：MTCNN人脸检测技术揭秘：原理、实现与实战(附代码)第八章：探索YOLO技术：目标检测的高
生成对抗网络(GAN)：从概念到代码实践(附代码) 全栈你个大西瓜人工智能计算机视觉人工智能 GAN 网络对抗学习手势识别生成器与鉴别器生成对抗网络
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络(附代码)第五章：计算机视觉：神经网络实战之手势识别(附代码)第六章：计算机视觉：目标检测从简单到容易(附代码)第七章：MTCNN人脸检测技术揭秘：原理、实现与实战(附代码)第八章：探索YOLO技术：目标检测的高
MTCNN 人脸检测技术揭秘：原理、实现与实战(附代码) 全栈你个大西瓜人工智能计算机视觉人工智能 MTCNN 人脸检测卷积神经网络
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络(附代码)第五章：计算机视觉：神经网络实战之手势识别(附代码)第六章：计算机视觉：目标检测从简单到容易(附代码)第七章：MTCNN人脸检测技术揭秘：原理、实现与实战(附代码)第八章：探索YOLO技术：目标检测的高
face-kkk 山山而川_R face 深度学习
目录一、配置环境1、新建虚拟环境2、配置环境安装包3、下载安装使用环境二、注册新人1、采集照片2、注册新人3、测试视频或摄像头三、配置文件config1、项目配置文件configs/configs.py，用于设置人脸检测模型，特征提取模型二、下面是自己测试用（个人的一个记录，不具备参考意义）MTCNN人脸检测参考项目：GitHub-Sierkinhane/mtcnn-pytorch:Afacede
深度学习论文精读（7）：MTCNN hwl19951007 计算机视觉论文精读
深度学习论文精读（7）：MTCNN论文地址：JointFaceDetectionandAlignmentusingMulti-taskCascadedConvolutionalNetworks译文地址：https://zhuanlan.zhihu.com/p/37884254参考博文1：https://zhuanlan.zhihu.com/p/38520597官方地址：https://kpzhan
MTCNN人脸检测算法 samuelwang_ccnu 深度学习
人脸检测是指识别数字图像中的人脸。人脸检测可以视为目标检测的一种特殊情况。在目标检测中，任务是查找图像中特定类的所有对象的位置和大小。例如行人和汽车。在人脸检测中应用较广的算法就是MTCNN（Multi-taskCascadedConvolutionalNetworks的缩写）。MTCNN算法是一种基于深度学习的人脸检测和人脸对齐方法，它可以同时完成人脸检测和人脸对齐的任务，相比于传统的算法，它的
人脸识别算法MTCNN论文解读纸上得来终觉浅～图像处理 paper阅读人脸识别 mtcnn
论文名称：JointFaceDetectionandAlignmentusingMulti-taskCascadedConvolutionalNetworks论文地址：https://www.lao-wang.com/wp-content/uploads/2017/07/1604.02878.pdf1、MTCNN原理MTCNN，Multi-taskconvolutionalneuralnetwor
MTCNN训练迷若烟雨人脸识别 tensorflow 深度学习 caffe
MTCNN是当前效果最好的开源人脸检测算法之一，作者只提供了训练好的模型以及matlab部署代码，其训练和优化却没有放出来，引发了很多好事者复现如果只是要部署的话可以使用MTCNN，其提供了部署全平台实现，包括C++、python、ncnn和tensorflow，还有加速版本和opencv直接加载版本，是所有版本中的集大成者如果想了解算法原理，可以参考MTCNN_Step_by_Step本文的训练
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测模型介绍 Hello_WOAIAI CV 人脸识别目标检测计算机视觉视觉检测图像处理 YOLO opencv
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测器介绍前言DeepFace库人脸检测器OpenCV人脸检测器RetinaFace人脸检测器mtcnn人脸检测器sdd人脸检测器dlib人脸检测器mediapipe人脸检测器yolov8人脸检测器人脸识别系列其他文章【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别—第一部
人脸识别数据集整理想努力的人人脸识别深度学习人工智能计算机视觉
转自：人脸识别数据集整理-陈晓涛-博客园insightface提供整理了mtcnn裁剪112x112，mxnet二进制方式保存的数据集https://github.com/deepinsight/insightface/wiki/Dataset-Zoo人脸识别训练数据集：CASIA-Webface(10Kids/0.5Mimages)CASIAWebFaceDataset是一个大规模人脸数据集，主
人脸识别基于MTCNN网络的人脸检测与对齐算法（MTCNN代码复现）郭庆汝 MTCNN人脸识别
人脸识别基于MTCNN网络的人脸检测与对齐算法（MTCNN代码复现）论文背景人脸检测与人脸对齐意义论文的研究成果人脸检测的研究趋势论文采用的方法思路阶段一阶段二：阶段三卷积网络设计层面Loss损失函数的设定面部分类边界框回归人脸关键点定位L2范数在线困难挖掘论文实验数据集网络模块代码实现激活函数P-Net模块代码R-Net模块代码O-Net图像处理过程中图像金字塔MTCNN项目代码实现关于训练流程
MTCNN理论笔记榴莲薄饼
Multi-taskCascadedConvolutionalNetworks(MTCNN)开源资源：论文链接：https://arxiv.org/ftp/arxiv/papers/1604/1604.02878.pdfGithub链接(tensorflow版本)：https://github.com/AITTSMD/MTCNN-Tensorflow1.MTCNN训练过程1.1datainput：
人脸检测与人脸特征点定位 ※海绵※的笑~ 人脸识别人脸识别
本节内容：▸1.人脸识别发展介绍——从非深度到深度▸2.人脸识别的难点▸3.人脸识别的评测方法▸4.重点几种模型的原理理讲解（MTCNN/FaceNet（OpenFace））▸5.TensorFlow实现的MTCNN+FaceNet的人脸检测▸6.推荐的开源的人脸检测项⽬目非深度检测人脸的原理：用一个固定大小的区域不断的遍历整个画面，每一个框和训练的结果做比对（或者是分类），比对结果（分类结果）若
移动端unet人像分割模型--1 xiexiecn 移动端神经网络深度学习 mxnet ncnn unet
个人对移动端神经网络开发一直饶有兴致。去年腾讯开源了NCNN框架之后，一直都在关注。近期成功利用别人训练好的mtcnn和mobilefacenet模型制作了一个ios版本人脸识别swift版本demo。希望maskrcnn移植到ncnn，在手机端实现一些有趣的应用。因为unet模型比较简单，干脆就从这个入手。基本的网络基于keras版本:https://github.com/TianzhongSo
用mtcnn+keras+facenet实现简易的人脸识别胖头鱼青年人工智能-人脸识别 tensorflow 人脸识别深度学习人工智能
人工智能-人脸识别采用mtcnn+keras+facenet深度学习算法文章目录人工智能-人脸识别采用mtcnn+keras+facenet深度学习算法前言：在前段时间的挑板杯和互联网+的双赛中，我们和校企合作的项目疲劳驾驶检测预警，在经专家点评后发现其中的人脸识别功能算法需要完善，所以经过多方学习，根据哔站大牛[**Bubbliiiing**](https://space.bilibili.co
常见人脸检测器, 调用摄像头检测人脸小啊磊_Vv 深度学习和视觉项目实战 opencv python 人工智能深度学习
常见人脸检测器,调用摄像头检测人脸文章目录常见人脸检测器,调用摄像头检测人脸@[TOC](文章目录)前言一、导入相关包二、Haar检测器三、Hog检测器四、CNN检测器五、SSD检测器六、MTCNN检测器七、Opencv结合检测器检测人脸7.1Hog检测器7.2Haar检测器前言主要介绍几种常见的人脸检测器,并结合opencv调用摄像头进行人脸的实时检测。一、导入相关包importcv2impor
MIGraphX推理框架第八章-动态Shape 染念 #MIGraphX推理框架人工智能深度学习 c++python linux MIGraphX 推理框架
第七章介绍了MIGraphX的性能优化，可以在此跳转进行回顾第八章-动态Shape动态shape动态shape的限制支持动态Shape的模型不支持动态shape的解决方案动态shape在实际业务中，我们会遇到有多种输入shape的模型，比如CV领域的目标检测模型MTCNN，SSD和YOLO，在MIGraphX中实现动态shape主要包含下面几个步骤：设置环境变量：exportMIGRAPHX_DY
基于MTCNN和Arc-Loss的人脸识别（详细版）雨落的太敷衍.. AI 深度学习算法 python 神经网络计算机视觉
文章目录一、人脸识别介绍1.1发展历史1.2什么是人脸识别？二：人脸识别步骤2.1人脸侦测2.2特征提取2.3特征对比三：人脸识别难点四：人脸检测原理五：YOLO和MTCNN的比较六：人脸识别的方法6.1早期的机器学习方法（2012年之前）：6.2现在常用的深度学习方法（2016年之后）：七：人脸特征定位八：人脸识别应用案例九：人脸检测模型MTCNN9.1什么是MTCNN?9.2为什么学习MTCN
canvas+face-api人脸实时检测即将牛逼的蛋蛋
实时检测和拍照检测的区别就在于，识别的准确度实时监测的需要根据视频的帧数（当然没多少帧检测一次完全取决于我们）去检测，面部识别只是静态的照片，所以实时检测只采取了Mtcnn检测和面部识别，速度提升，并且实时检测，缺点就是准确度下降上代码：下一篇文章会结合nodejs完成一个前端识别，后端检测的一个功能。视频识别人脸constcanvas=document.getElementById('overl
facenet 人脸模型训练 reset2021 python 人脸识别 python 人脸识别
人脸检测与特征描述是人脸相关项目应用的基础（包括人脸识别，人脸认证以及人脸聚类等）本文以mtcnn与facent算法为基础，讲述怎样训练自己的人脸模型。主题框架采用的是facenet源码，依据具体需求，对facnet做了一定的修改，facenet源码见https://github.com/davidsandberg/facenet1、数据集收集由于目前开源的数据集中，大多数都是欧美人士的，直接用这
多尺度特征融合总结（金字塔结构） m0_53955985 其他计算机视觉人工智能深度学习
多尺度特征融合参考连接：多尺度融合介绍MTCNN论文解读图像金字塔----高斯和拉普拉斯一、什么是多尺度？所谓多尺度，实际上就是对信号的不同粒度的采样，通常在不同的尺度下我们可以观察到不同的特征，从而完成不同的任务通常来说粒度更小/更密集的采样可以看到更多的细节，粒度更大/更稀疏的采样可以看到整体的趋势二、深浅层蕴含的不同信息深层网络的感受野比较大，语义信息表征能力强，但是特征图的分辨率低，几何信
在 Ubuntu20.02下编译 FaceRecognition_MTCNN_FaceNet Tonyfield neo4j
1.compileFaceRecognition_MTCNN_FaceNet-mastergitclonehttps://github.com/Chanstk/FaceRecognition_MTCNN_FaceNet.gitcdFaceRecognition_MTCNN_FaceNetmkdirbuild&&cdbuildcmake.. &&make+----------------------
2019-09-28 MTCNN 实验部分详解2 sharer7717
image.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.png
【人脸检测】Compact Cascade CNN和MTCNN算法城市中迷途小书童
【文章导读】目前人脸识别技术已经遍地开花，火车站、机场、会议签到等等领域都有应用，人脸识别的过程中有个重要的环节叫做人脸检测，顾名思义就是在一张图片中找出所有的人脸的位置，早期的人脸检测是用人工提取特征的方式，训练分类器，比如opencv中自带的人脸检测器使用了haar特征，早期的这种算法自然是鲁棒性、抗干扰性太差，本文主要来介绍近几年的几种用卷积神经网络做的经典算法。1、CompactCasca
下载安装mtcnn 使用国内镜像源在cmd窗口或pycharm terminal窗口pip install mtcnn报错 weixin_44194001 pycharm python pip
下载安装MTCNNERROR:Couldnotfindaversionthatsatisfiestherequirementmtcnn(fromversions:none)ERROR:NomatchingdistributionfoundformtcnnERROR:Couldnotfindaversionthatsatisfiestherequirementmtcnn(fromversions:n
tensorflow对深度学习生成的pb模型文件的保存与读取及节点和张量的输出 loveliuzz 深度学习
一、pb模型的保存1、MTCNN人脸检测算法中官网训练好的参数保存在三个文件名称分别为：det1.npy、det2.npy、det3.npy的后缀名为.npy文件中（.npy文件也是一种以二进制保存的文件），将.npy文件转换为.pb模型文件的方法通过以下代码实现：importtensorflowastfimportdetect_faceimportosfromtensorflow.python.
conda中配置MTCNN coding_ksy #计算机视觉 conda
尝试下面的2组的命令第一组condainstall-cconda-forgetensorflowondainstall-cconda-forgemtcnn第二组condainstallmtcnncondainstalltensorflow
人脸检测 - mtcnn @kc++ Computer Vision 深度学习人工智能 python
文章目录1.人脸检测2.mtcnn2.1概述2.2网络结构2.2.1构建图像金字塔2.2.2P-Net2.2.3R-Net（RefineNetwork）：2.2.4O-Net（OutputNetwork）:3.总结4.代码示例4.1mtcnn.py4.2detect.py4.3utils.py1.人脸检测人脸检测/人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集
2019-09-28 MTCNN代码讲解3 sharer7717
1、激活函数：preluimage.pngimage.pngimage.png加入了一个平滑层flattenimage.png2、处理图像，生成图像金字塔image.pngimage.pngimage.png边框回归：image.pngimage.pngimage.png
Python实现人脸识别功能 WYKB_Mr_Q 日常记录 python 开发语言深度学习
Python实现人脸识别功能闲来没事，记录一下前几天学习的人脸识别小项目。要想实现人脸识别，我们首先要搞明白，人脸识别主要分为哪些步骤？为了提高人脸识别的准确性，我们首先要把图像或视频中的人脸检测出来，然后使用分类网络，对检测到的人脸进行分类。概括起来，主要包括：人脸检测和人脸分类两个部分。人脸检测人脸检测部分我们直接使用现成的MTCNN，它的模型结构如下图所示，主要由三个级联的简单网络组成。首先
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &