Nine-days

Face alignment

Face alignment 实现方案及实现效果分析

1. Face Alignment 简介

在Face Alignment中，传统方法能够取得不错的效果。但是在大姿态、极端表情上效果并不是很好。人脸对齐可以看作在一张人脸图像搜索人脸预先定义的点（也叫人脸形状），通常从一个粗估计的形状开始，然后通过迭代来细化形状的估计。其实现的大概框架如下：

图1.1

人脸特征点检测问题需要关注两个方面：一是特征点处的局部特征提取方法，二是回归算法。特征点处的局部特征提取也可以看做是人脸的一种特征表示，现在的基于深度学习的方法可以看做是先使用神经网络得到人脸特征表示，然后使用线性回归得到点坐标。

2. 深度学习相关论文

2.1 Deep Convolutional Network Cascade for Facial Point Detection

香港中文大学唐晓鸥教授的课题组在CVPR 2013上提出3级卷积神经网络DCNN来实现人脸对齐的方法。该方法也可以统一在级联形状回归模型的大框架下，和CPR、RCPR、SDM、LBF等方法不一样的是，DCNN使用深度模型-卷积神经网络，来实现。第一级f1使用人脸图像的三块不同区域（整张人脸，眼睛和鼻子区域，鼻子和嘴唇区域）作为输入，分别训练3个卷积神经网络来预测特征点的位置，网络结构包含4个卷积层，3个Pooling层和2个全连接层，并融合三个网络的预测来得到更加稳定的定位结果。后面两级f2, f3在每个特征点附近抽取特征，针对每个特征点单独训练一个卷积神经网络（2个卷积层，2个Pooling层和1个全连接层）来修正定位的结果。该方法在LFPW数据集上取得当时最好的定位结果。

图2.1

2.2 Coarse-to-Fine Auto-Encoder Networks (CFAN) for Real-Time Face Alignment

一种由粗到精的自编码器网络（CFAN）来描述从人脸表观到人脸形状的复杂非线性映射过程。该方法级联了多个栈式自编码器网络，每一个刻画从人脸表观到人脸形状的部分非线性映射。具体来说，输入一个低分辨率的人脸图像I，第一层自编码器网络f1可以快速地估计大致的人脸形状，记作基于全局特征的栈式自编码网络。网络f1包含三个隐层，隐层节点数分别为1600,900,400。然后提高人脸图像的分辨率，并根据f1得到的初始人脸形状θ1，抽取联合局部特征，输入到下一层自编码器网络f2来同时优化、调整所有特征点的位置，记作基于局部特征的栈式自编码网络。该方法级联了3个局部栈式自编码网络{f2 , f3, f4}直到在训练集上收敛。每一个局部栈式自编码网络包含三个隐层，隐层节点数分别为1296,784,400。得益于深度模型强大的非线性刻画能力，该方法在XM2VTS，LFPW，HELEN数据集上取得比DRMF、SDM更好的结果。此外，CFAN可以实时地完成人脸人脸对齐（在I7的台式机上达到23毫秒/张），比DCNN（120毫秒/张）具有更快的处理速度。

图2.2

补充：

惊，刚发现，原来 face++ 跟我想的一样。只是比我早了几年

DCNN(face++)

2013 年，Face++在 DCNN 模型上进行改进，提出从粗到精的人脸关键点检测算法 [6]，实现了 68 个人脸关键点的高精度定位。该算法将人脸关键点分为内部关键点和轮廓关键点，内部关键点包含眉毛、眼睛、鼻子、嘴巴共计 51 个关键点，轮廓关键点包含 17 个关键点。

针对内部关键点和外部关键点，该算法并行的采用两个级联的 CNN 进行关键点检测，网络结构如图所示：

针对内部 51 个关键点，采用四个层级的级联网络进行检测。其中，Level-1 主要作用是获得面部器官的边界框；Level-2 的输出是 51 个关键点预测位置，这里起到一个粗定位作用，目的是为了给 Level-3 进行初始化；Level-3 会依据不同器官进行从粗到精的定位；Level-4 的输入是将 Level-3 的输出进行一定的旋转，最终将 51 个关键点的位置进行输出。针对外部 17 个关键点，仅采用两个层级的级联网络进行检测。Level-1 与内部关键点检测的作用一样，主要是获得轮廓的 bounding box；Level-2 直接预测 17 个关键点，没有从粗到精定位的过程，因为轮廓关键点的区域较大，若加上 Level-3 和 Level-4，会比较耗时间。最终面部 68 个关键点由两个级联 CNN 的输出进行叠加得到。

算法主要创新点由以下三点：（1）把人脸的关键点定位问题，划分为内部关键点和轮廓关键点分开预测，有效的避免了 loss 不均衡问题；（2）在内部关键点检测部分，并未像 DCNN 那样每个关键点采用两个 CNN 进行预测，而是每个器官采用一个 CNN 进行预测，从而减少计算量；（3）相比于 DCNN，没有直接采用人脸检测器返回的结果作为输入，而是增加一个边界框检测层（Level-1），可以大大提高关键点粗定位网络的精度。

Face++版 DCNN 首次利用卷积神经网络进行 68 个人脸关键点检测，针对以往人脸关键点检测受人脸检测器影响的问题，作者设计 Level-1 卷积神经网络进一步提取人脸边界框，为人脸关键点检测获得更为准确的人脸位置信息，最终在当年 300-W 挑战赛上获得领先成绩。

TCNN

2016 年，Wu 等人研究了 CNN 在人脸关键点定位任务中到底学习到的是什么样的特征，在采用 GMM（Gaussian Mixture Model, 混合高斯模型）对不同层的特征进行聚类分析，发现网络进行的是层次的，由粗到精的特征定位，越深层提取到的特征越能反应出人脸关键点的位置。针对这一发现，提出了 TCNN（Tweaked Convolutional Neural Networks）[8]，其网络结构如图所示：

上图为 Vanilla CNN，针对 FC5 得到的特征进行 K 个类别聚类，将训练图像按照所分类别进行划分，用以训练所对应的 FC6K。测试时，图片首先经过 Vanilla CNN 提取特征，即 FC5 的输出。将 FC5 输出的特征与 K 个聚类中心进行比较，将 FC5 输出的特征划分至相应的类别中，然后选择与之相应的 FC6 进行连接，最终得到输出。
作者通过对 Vanilla CNN 中间层特征聚类分析得出的结论是什么呢？又是如何通过中间层聚类分析得出灵感从而设计 TCNN 呢？

作者对 Vanilla CNN 中间各层特征进行聚类分析，并统计出关键点在各层之间的变化程度，如图所示：

从图中可知，越深层提取到的特征越紧密，因此越深层提取到的特征越能反应出人脸关键点的位置。作者在采用 K=64 时，对所划分簇的样本进行平均后绘图如下：

从图上可发现，每一个簇的样本反应了头部的某种姿态，甚至出现了表情和性别的差异。因此可推知，人脸关键点的位置常常和人脸的属性相关联。因此为了得到更准确的关键点定位，作者使用具有相似特征的图片训练对应的回归器，最终在人脸关键点检测数据集 AFLW,AFW 和 300W 上均获得当时最佳效果。

DAN（Deep Alignment Networks）

2017 年，Kowalski 等人提出一种新的级联深度神经网络——DAN（Deep Alignment Network）[10]，以往级联神经网络输入的是图像的某一部分，与以往不同，DAN 各阶段网络的输入均为整张图片。当网络均采用整张图片作为输入时，DAN 可以有效的克服头部姿态以及初始化带来的问题，从而得到更好的检测效果。之所以 DAN 能将整张图片作为输入，是因为其加入了关键点热图（Landmark Heatmaps），关键点热图的使用是本文的主要创新点。DAN 基本框架如图所示：

DAN 包含多个阶段，每一个阶段含三个输入和一个输出，输入分别是被矫正过的图片、关键点热图和由全连接层生成的特征图，输出是面部形状（Face Shape）。其中，CONNECTION LAYER 的作用是将本阶段得输出进行一系列变换，生成下一阶段所需要的三个输入，具体操作如下图所示：

从第一阶段开始讲起，第一阶段的输入仅有原始图片和 S0S0。面部关键点的初始化即为 S0S0，S0S0 是由所有关键点取平均得到，第一阶段输出 S0S0。对于第二阶段，首先，S0S0 经第一阶段的 CONNECTION LAYERS 进行转换，分别得到转换后图片 T2(I)T2(I)、S0S0 所对应的热图 H2H2 和第一阶段 fc1fc1 层输出，这三个正是第二阶段的输入。如此周而复始，直到最后一个阶段输出 SNSN。文中给出在数据集 IBUG 上，经过第一阶段后的T2(I)T2(I) 、T2(S1)T2(S1)和特征图，如图所示：

从图中发现，DAN 要做的「变换」，就是把图片给矫正了，第一行数据尤为明显，那么 DAN 对姿态变换具有很好的适应能力，或许就得益于这个「变换」。至于 DAN 采用何种「变换」，需要到代码中具体探究。

接下来看一看，StSt 是如何由 St−1St−1 以及该阶段 CNN 得到，先看 StSt计算公式：

St=T−1t(T(St−1)+ΔSt)St=Tt−1(T(St−1)+ΔSt)

其中ΔStΔSt是由 CNN 输出的，各阶段 CNN 网络结构如图所示：

该 CNN 的输入均是经过了「变换」——TiTi的操作，因此得到的偏移量ΔStΔSt是在新特征空间下的偏移量，在经过偏移之后应经过一个反变换T−1iTi−1还原到原始空间。而这里提到的新特征空间，或许是将图像进行了「矫正」，使得网络更好的处理图像。

关键点热度图的计算就是一个中心衰减，关键点处值最大，越远则值越小，公式如下：

H(x,y)=11+minsiTt(St−1)∥(x,y)−si∥H(x,y)=11+minsiTt(St−1)‖(x,y)−si‖

为什么需要从fc1fc1 层生成一张特征图？文中提到「Such a connection allows any information learned by the preceding stage to be transferred to the consecutive stage.」其实就是人为给 CNN 增加上一阶段信息。

总而言之，DAN 是一个级联思想的关键点检测方法，通过引入关键点热图作为补充，DAN 可以从整张图片进行提取特征，从而获得更为精确的定位。
代码实现：
Theano：https://github.com/MarekKowalski/DeepAlignmentNetwork
TensorFlow：https://github.com/kpzhang93/MTCNN_face_detection_alignment

3. 目前研究流程

3.1实现方案Pipline:

图3.1

3.2 流程解析

3.2.1 Stage One

a) Resize:将人脸图片resize到32*32的大小，landmark shape的位置同比例变换。

b) landmark选择：挑选出26个人脸的landmark（人脸边缘21个，剩余眼睛2个，鼻子1个，嘴巴两个，将26个位置信息展开就是26*2 = 52维）。其效果图如图所示：

图3.2

c) landmark shape归一化：训练前可以对数据做简单处理，把图像的左上角看成坐标（-1，-1），右下角坐标看作（1，1），以此来重新计算 landmark shape 的位置信息。

注意：可能有些landmark并没有出现在图中，此时的位置信息用（-1，-1）表示，所以在测试阶段，应舍弃左上角的小区域位置信息。

舍弃规则：。

d) 激活函数的选择，为了更好的拟合我们的位置信息，我们采用tanh函数作为激活函数。因为我们的位置信息是[-1,1]，采用tanh更容易收敛。 [当然此处也可使用sigmoid激活函数，那么对应的我们landmark shape 归一化时应将图片左上角看成(0，0)，右下角看成(1，1))舍弃规则：或者是直接使用RELU函数,这样就不用再归一化landmark shape 的位置信息]

e) tanh 函数图像如下图所示：

图3.3

f) Loss 采用的是EuclideanLoss,公式如下。

提示: 如果想提高边缘的精度可以通过给边缘点设置更大的误差比例,如。

其中[0:10]表示的是眼睛鼻子嘴巴5个landmark, [10:52]表示的是人脸的边缘21个landmark

3.2.2 Stage two

a) Resize:将人脸图片resize到96*96的大小，landmark shape的位置同比例变换。

b)训练数据准备，训练数据分为4部分，分别为左眼，右眼，鼻子，嘴吧。第二阶段训练数据准备有以下几个方法。

l 基于第一阶段的5个输出结果作为中心进行区域剪裁，剪裁宽高为[48,36]，剪裁后需要用 stage one 第c步的方式变换 landmark shape 位置信息。

l 基于标注好的数据，根据已经标注的信息进行区域剪裁，及landmark shape 位置信息变换。剪裁中心可做小范围变换以模拟真实的 stage one 结果。

c) landmark 归一化，激活函数，loss函数与 stage one 一致。

d)训练时首先将4个部分的patch图片通道融合，融合后的图片结果为：[48,36, 3*4],此处如果不对图片做通道融合而是分别使用4个CNN网络进行回归，理论上会有更精确的回归效果，但是考虑训练起来较麻烦，所以采用了融合的方法，这样只用训练一个CNN网络进行回归。

3.3检测结果

联合Stage One 和 Stage Two 的检测结果。

图3.4

由图可以看出侧脸人脸边缘检测的效果没有其他的landmark位置准确,主要是因为,为了加快回归,边缘信息只经过一次基于全局图片特征的回归。

4. 训练

4.1.训练配置

base_lr: 0.00001

lr_policy: "inv"

gamma: 0.0001

power: 0.75

regularization_type: "L2"

weight_decay: 0.0005

momentum: 0.9

max_iter: 20000

4.2 模型图

图4.1

5.误差分析

5.1误差loss计算

测试误差评价标准公式如下：

其中l是人脸框的长度,m是landmark的个数。

5.2 Loss函数收敛情况

图5.1

这里 train_loss 加了一个5倍的权重参数,所以最后的值反而比test_loss的值大。

部分代码：

#include 
#include "MCLC.h"
#include 
#include "util/Util.h"

using namespace caffe;
using namespace std;
using namespace cv;
using namespace glasssix;


const int TRAIN_COUNT = 1000;
const int TEST_COUNT = 429;
string base = "C:\\WorkSpace\\Visual_studio\\face_align\\ConsoleApplication2\\ConsoleApplication2\\res\\face_ldmk_devset\\";
string image_path = "C:\\WorkSpace\\Visual_studio\\face_align\\ConsoleApplication2\\ConsoleApplication2\\res\\face_ldmk_devset\\result_img_resize_32\\";


string prototext = "C:\\WorkSpace\\Visual_studio\\caffe\\face_alignment\\regression_26\\test_26_flip.prototxt";
string mode_path = "C:\\WorkSpace\\Visual_studio\\caffe\\face_alignment\\regression_26\\save_path\\_iter_40000.caffemodel";


string prototest_two = "C:\\WorkSpace\\Visual_studio\\caffe\\face_alignment\\regression_stage_two\\test.prototxt";
string mode_path_two = "C:\\WorkSpace\\Visual_studio\\caffe\\face_alignment\\regression_stage_two\\save_path\\_iter_50000.caffemodel";


string image_96 = "C:\\WorkSpace\\Visual_studio\\face_align\\ConsoleApplication2\\ConsoleApplication2\\res\\face_ldmk_devset\\result_img_resize_96\\";

string mark_4_img_dir[] = { "left_eye\\", "right_eye\\", "nose\\", "mouth\\" };
string mark_4_img_txt_test[] = { "test_left_eye.txt", "test_right_eye.txt", "nose_test.txt", "mouth_test.txt" };
int const LEFT_EYE_MARK = 18;
int const RIGHT_EYE_MARK = 18;
int const NOSE_MARK = 10;
int const MOUTH_MASK = 22;
int const IMAGE_SIZE = 32;
int mark_num[] = { LEFT_EYE_MARK, RIGHT_EYE_MARK, NOSE_MARK, MOUTH_MASK };

void mergeImg(Mat & dst, Mat &src1, Mat &src2)
{
	int rows = src1.rows + 5 + src2.rows;
	int cols = src1.cols + 5 + src2.cols;
	CV_Assert(src1.type() == src2.type());
	dst.create(rows, cols, src1.type());
	src1.copyTo(dst(Rect(0, 0, src1.cols, src1.rows)));
	src2.copyTo(dst(Rect(src1.cols + 5, 0, src2.cols, src2.rows)));
}

void checkxy(float &x, float &y)
{
	if (x < 0)
	{
		x = 0;
	}
	if (y < 0)
	{
		y = 0;
	}
	if (x > 48)
	{
		x = 48;
	}
	if (y > 60)
	{
		y = 60;
	}
}


int main() {

	DataPrepareUtil utd;

	//stage one predict.
	vector result_data = utd.readStageOneData(base + "result_img_resize_32\\" + "scale_test_point_32_26_all.txt" /*"result_point_resize_96_68_test.txt"*/, 26, TEST_COUNT);
	vector src_point = utd.readStageOneData(image_96 + "scale_test_point_96.txt", 68, TEST_COUNT);
	int length = result_data.size();
	MCLC mclc;

	int net_id = mclc.AddNet(prototext, mode_path, 0);
	int net_id2 = mclc.AddNet(prototest_two, mode_path_two, 0);
	int i = 0;
	for (int i = 0; i < length; i++)
	{
		vector data;
		Mat srcImage = imread(image_path + result_data[i].fileName);
		data.push_back(srcImage);
		double t0 = (double)cvGetTickCount();
		unordered_map result = mclc.Forward(data, net_id);
		double t1 = (double)cvGetTickCount();
		//cout << "predict has completed, cost " << ((t1 - t0) / ((double)cvGetTickFrequency() * 1000 * 1000)) *1000 << "ms" << endl;
		for (unordered_map::iterator iter = result.begin(); iter != result.end(); iter++) {
			cout << "key value is" << iter->first << " the mapped value is " << " result" << endl;
			string key = iter->first;
			DataBlob result_one = iter->second;
			if (result_one.name == "ip2")
			{
				double t2 = (double)cvGetTickCount();
				float scale = 96 / IMAGE_SIZE;
				LandMark som;
				Mat img = imread(image_96 + result_data[i].fileName);
				som.fileName = result_data[i].fileName;
				for (int j = 0; j < STAGE_ONE_MARK + 21; j++)
				{
					if (j >= 0 && j < 5) {
						float x = *(result_one.data);
						float y = *(++result_one.data);
						som.points[j].x = x;
						som.points[j].y = y;
						(result_one.data)++;
						//circle(srcImage, Point(x, y), 2, Scalar(255, 0, 0));
					}
					else
					{
						float x = *(result_one.data);
						float y = *(++result_one.data);
						circle(img, Point(x*scale, y*scale), 2, Scalar(255, 0, 0));
						circle(img, Point(result_data[i].points[j].x*scale, result_data[i].points[j].y * scale), 2, Scalar(0, 0, 255));
						(result_one.data)++;
						//circle(srcImage, Point(x, y), 2, Scalar(255, 0, 0));
					}
				}
				//imshow("test", srcImage);
				//imwrite(base+"test\\"+"srcImg.jpg", srcImage);
				//waitKey(0);
				Mat mats[4];
				vector rect4;
				for (int k = 0; k < 4; k++)
				{
					float x, y;
					if (k == 3) {
						x = (som.points[k].x + som.points[k + 1].x) / 2.0  * scale;
						y = (som.points[k].y + som.points[k + 1].y) / 2.0  * scale;
					}
					else
					{
						x = som.points[k].x * scale;
						y = som.points[k].y * scale;
					}
					x = x - 24;
					if (k == 2)
					{
						y = y - 12;
					}
					else if (k == 3)
					{
						y = y - 20;
					}
					else
					{
						y = y - 24;
					}
					checkxy(x, y);
					Rect rect(x, y, 48, 36);
					rect4.push_back(rect);
					Mat roi = img(rect);
					//imshow("test", roi);
					//waitKey();
					mats[k] = roi;
				}
				vector dd;
				Mat all_data(36, 48, CV_8UC(12));
				merge(mats, 4, all_data);
				cout << "  width is：  " << all_data.cols << "  image shape is :" << all_data.channels() << endl;
				dd.push_back(all_data);
				double t3 = (double)cvGetTickCount();
				double t4 = (double)cvGetTickCount();
				unordered_map result2 = mclc.Forward(dd, net_id2);
				double t5 = (double)cvGetTickCount();
				for (unordered_map::iterator iter = result2.begin(); iter != result2.end(); iter++)
				{
					cout << "key value is" << iter->first << " the mapped value is " << " result" << endl;
					string key = iter->first;
					DataBlob result_two = iter->second;
					if (result_two.name == "ip2")
					{
						for (int j = 0; j < 68; j++)
						{
							float x = *(result_two.data);
							float y = *(++result_two.data);
							(result_two.data)++;
							if (j >= 0 && j < 18)
							{
								x = x + rect4[0].x;
								y = y + rect4[0].y;
							}
							if (j >= 18 && j < 36)
							{
								x = x + rect4[1].x;
								y = y + rect4[1].y;
							}
							if (j >= 36 && j < 46)
							{
								x = x + rect4[2].x;
								y = y + rect4[2].y;
							}
							if (j >= 46 && j < 68)
							{
								x = x + rect4[3].x;
								y = y + rect4[3].y;
							}
							circle(img, Point(x, y), 2, Scalar(255, 0, 0));
							circle(img, Point(src_point[i].points[j].x, src_point[i].points[j].y), 2, Scalar(0, 0, 255));
						}
					}


				}
				cout << "predict stage one, cost " << ((t1 - t0) / ((double)cvGetTickFrequency() * 1000 * 1000)) * 1000 << "ms" << endl;
				cout << "prepare date for stage two, cost " << ((t3 - t2) / ((double)cvGetTickFrequency() * 1000 * 1000)) * 1000 << "ms" << endl;
				cout << "predict stage two, cost " << ((t5 - t4) / ((double)cvGetTickFrequency() * 1000 * 1000)) * 1000 << "ms" << endl;
				imshow("test", img);
				waitKey(0);
			}
		}
	}


	return 0;
}

版本2.

main.cpp

#include 
#include "MCLC.h"
#include 
#include "../CascadRegression\util/Util.h"
#include 
#include 
#include 

using namespace caffe;
using namespace std;
using namespace cv;
using namespace glasssix;

#define DEVICE 0

const int four[] = { 17,21,22,26, 36,39,42,45, 27,31,33,35, 48,51,54,57 , 0,16,8,9};

const int four_point[] = { 17,22,22,27,  36,42,42,48, 27,36, 48,68 , 0,17};
//size: brow, eye, nose, mouth, face 
const float four_size[] = { 32,16, 24,16, 24,36, 48,32, 64,64};

const int BROW_MARK = 5;
const int EYE_MARK = 6;
const int NOSE_MARK = 9;
const int MOUTH_MARK = 20;
const int FACE_MARK = 17;
int mark_num[] = { BROW_MARK, EYE_MARK, NOSE_MARK, MOUTH_MARK, FACE_MARK};
string mark_4_img_dir[] = { "brow\\", "eye\\", "nose\\", "mouth\\", "face\\"};
string mark_4_img_train[] = { "brow_train.txt", "eye_train.txt", "nose_train.txt", "mouth_train.txt", "face_train.txt"};
string mark_4_img_test[] = { "brow_test.txt", "eye_test.txt", "nose_test.txt", "mouth_test.txt", "face_test.txt" };

double predict(Mat img, MCLC & mclc, int net_id, LandMark & landmark)
{
	double time = 0;
	double t0 = (double)cvGetTickCount();
	vector imgdata;
	imgdata.push_back(img);
	unordered_map result = mclc.Forward(imgdata, net_id);
	
	double t1 = (double)cvGetTickCount();
	time = (t1 - t0) / ((double)cvGetTickFrequency() * 1000);
	//cout << "time is:" << time << " ms" << endl;
	for (unordered_map::iterator iter = result.begin(); iter != result.end(); iter++) {
		string key = iter->first;
		DataBlob result = iter->second;
		vector mt = result.size;
		if (result.name == "ip2")
		{
			for (int i = 0; i < LANDMARK_NUM; i++)
			{
				float x = *(result.data);
				float y = *(++result.data);
				//cout << "x is:" << x << endl;
				landmark.points[i].x = x;
				landmark.points[i].y = y;
				(result.data)++;
			}
		}
	}
	return time;
}
double predict_four(Mat img, MCLC & mclc, int net_id, LandMark & landmark, int mark_num)
{
	double time = 0;
	double t0 = (double)cvGetTickCount();
	vector imgdata;
	imgdata.push_back(img);
	unordered_map result = mclc.Forward(imgdata, net_id);

	double t1 = (double)cvGetTickCount();
	time = (t1 - t0) / ((double)cvGetTickFrequency() * 1000);
	//cout << "time is:" << time << " ms" << endl;
	for (unordered_map::iterator iter = result.begin(); iter != result.end(); iter++) {
		string key = iter->first;
		DataBlob result = iter->second;
		vector mt = result.size;
		if (result.name == "ip2")
		{
			for (int i = 0; i < mark_num; i++)
			{
				float x = *(result.data);
				float y = *(++result.data);
				//cout << "x is:" << x << endl;
				landmark.points[i].x = x;
				landmark.points[i].y = y;
				(result.data)++;
			}
		}
	}
	return time;
}

double predict_1(Mat img, MCLC & mclc, int net_id, LandMark & landmark)
{
	double time = 0;
	double t0 = (double)cvGetTickCount();
	vector imgdata;
	imgdata.push_back(img);
	unordered_map result = mclc.Forward(imgdata, net_id);
	
	double t1 = (double)cvGetTickCount();
	time = (t1 - t0) / ((double)cvGetTickFrequency() * 1000);
	cout << "time is:" << time << " ms" << endl;
	for (unordered_map::iterator iter = result.begin(); iter != result.end(); iter++) {
		string key = iter->first;
		DataBlob result = iter->second;
		vector mt = result.size;
		if (result.name == "ip2")
		{
			cout << "found data." << endl;
			for (int i = 0; i < 1; i++)
			{
				float x = *(result.data);
				cout << "x is:" << x << endl;
				float y = *(++result.data);
				cout << "y is:" << y << endl;
				/*float y = *(++result.data);
				landmark.points[i].x = x;
				landmark.points[i].y = y;
				(result.data)++;
				cout << "x :" << x << "y :" << y << endl;*/
			}
		}
	}
	return time;
}

double predict_33(Mat img, MCLC & mclc, int net_id, LandMark & landmark)
{
	double time = 0;
	double t0 = (double)cvGetTickCount();
	vector imgdata;
	imgdata.push_back(img);
	unordered_map result = mclc.Forward(imgdata, net_id);
	double t1 = (double)cvGetTickCount();
	time = (t1 - t0) / ((double)cvGetTickFrequency() * 1000);
	//cout << "time is:" << time << " ms" << endl;
	float scale = 96 / 48.0;
	for (unordered_map::iterator iter = result.begin(); iter != result.end(); iter++) {
		//cout << "key value is" << iter->first << " the mapped value is " << " result" << endl;
		string key = iter->first;
		DataBlob result = iter->second;
		vector mt = result.size;
		if (result.name == "ip2")
		{
			for (int i = 0; i < STAGE_ONE_MARK - 16; i++)
			{
				float x = *(result.data);
				float y = *(++result.data);
				landmark.points[i].x = x*scale;
				landmark.points[i].y = y*scale;
				//circle(img, Point(x, y), 2, Scalar(255, 0, 0));
				(result.data)++;
			}
		}
	}
	return time;
}

void showError(vector &label, vector & predictRe)
{
	int size = label.size();
	float error1 = 0, error2 = 0, ave_error = 0;
	float left_error = 0, right_error = 0, mouth_error = 0, nose_error = 0, left_e = 0, right_e = 0;
	cout << label.size() << "   " << predictRe.size() << endl;
	for (int i = 0; i < size; i++)
	{
		float sum1 = 0, sum2 = 0, sum3 = 0;
		float left_sum = 0, right_sum = 0, mouth_sum = 0, nose_sum = 0, left = 0, right = 0;
		for (int j = 0; j < 68; j++)
		{
			if (j < 17)
			{
				sum1 += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}
			else
			{
				sum2 += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}

			if ((j >= 17 && j < 22) || (j >= 36 && j < 42))
			{
				left_sum += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}
			if (j >= 36 && j < 42)
			{
				left += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}
			if ((j >= 22 && j < 27) || (j >= 42 && j < 48))
			{
				right_sum += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}
			if (j >= 42 && j < 48)
			{
				right += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}

			if (j >= 27 && j < 36)
			{
				nose_sum += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}

			if (j >= 48 && j < 68)
			{
				mouth_sum += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
			}

			sum3 += pow((label[i].points[j].x - predictRe[i].points[j].x), 2) + pow((label[i].points[j].y - predictRe[i].points[j].y), 2);
		}
		float distance = sqrt(pow((label[i].points[39].x - label[i].points[42].x), 2) + pow((label[i].points[39].y - label[i].points[42].y), 2));
		//cout << "distance :" << distance << endl;
		error2 += sum2;
		ave_error += 1 / distance * sqrt(sum3);
		//cout << "ave_error is :" << 1 / distance * sqrt(sum3) << endl;
		error1 += sum1;
		left_error += left_sum;
		left_e += left;
		right_error += right_sum;
		right_e += right;
		nose_error += nose_sum;
		mouth_error += mouth_sum;
	}

	cout << "sum1        :" << error1 / size << endl;
	cout << "left_error  :" << left_error / size << endl;
	cout << "left_e  :" << left_e / size << endl;
	cout << "right_error :" << right_error / size << endl;
	cout << "right_e :" << right_e / size << endl;
	cout << "nose_error  :" << nose_error / size << endl;
	cout << "mouth_error :" << mouth_error / size << endl;

	//cout << "error1 is:" << error1 / size << endl;
	cout << "error2 is:" << error2 / size << endl;
	cout << "all error is:" << ave_error / size << endl;
}

const int TRAIN = 9000;
const int TEST = 773;
//const int FEATURE_NUM = 8704;
void mat2hdf5(Mat &data, Mat &label, const char * filepath, string dataset1, string dataset2)
{
	int data_cols = data.cols;
	int data_rows = data.rows;
	int label_cols = label.cols;
	int label_rows = label.rows;

	hid_t file_id;
	herr_t status;
	file_id = H5Fcreate(filepath, H5F_ACC_TRUNC, H5P_DEFAULT, H5P_DEFAULT);

	int rank_data = 2, rank_label = 2;
	hsize_t dims_data[2];
	hsize_t dims_label[2];
	dims_data[0] = data_rows;
	dims_data[1] = data_cols;

	dims_label[0] = label_rows;
	dims_label[1] = label_cols;
	hid_t data_id = H5Screate_simple(rank_data, dims_data, NULL);
	hid_t label_id = H5Screate_simple(rank_label, dims_label, NULL);

	hid_t dataset_id = H5Dcreate2(file_id, dataset1.c_str(), H5T_NATIVE_FLOAT, data_id, H5P_DEFAULT, H5P_DEFAULT, H5P_DEFAULT);
	hid_t labelset_id = H5Dcreate(file_id, dataset2.c_str(), H5T_NATIVE_FLOAT, label_id, H5P_DEFAULT, H5P_DEFAULT, H5P_DEFAULT);

	int i, j;
	float* data_mem = new float[data_rows*data_cols];
	float **array_data = new float*[data_rows];
	for (j = 0; j < data_rows; j++) {
		array_data[j] = data_mem + j* data_cols;
		for (i = 0; i < data_cols; i++)
		{
			array_data[j][i] = data.at(j, i);
		}

	}
	float * label_mem = new float[label_rows*label_cols];
	float **array_label = new float*[label_rows];
	for (j = 0; j < label_rows; j++) {
		array_label[j] = label_mem + j*label_cols;
		for (i = 0; i < label_cols; i++)
		{
			array_label[j][i] = label.at(j, i);
		}
	}

	status = H5Dwrite(dataset_id, H5T_NATIVE_FLOAT, H5S_ALL, H5S_ALL, H5P_DEFAULT, array_data[0]);
	status = H5Dwrite(labelset_id, H5T_NATIVE_FLOAT, H5S_ALL, H5S_ALL, H5P_DEFAULT, array_label[0]);

	//关闭

	status = H5Sclose(data_id);
	status = H5Sclose(label_id);

	status = H5Dclose(dataset_id);
	status = H5Dclose(labelset_id);

	status = H5Fclose(file_id);

	delete[] array_data;
	delete[] array_label;
}


void getRect(LandMark landmark, int flag, vector &rects, int cols, int rows)
{
	Rect rect, rect1;
	Point p1(landmark.points[four[4 * flag]]);
	Point p2(landmark.points[four[4 * flag + 1]]);
	Point p3(landmark.points[four[4 * flag + 2]]);
	Point p4(landmark.points[four[4 * flag + 3]]);
	float x, y, width, height;
	if (flag == 0 || 1 == flag)
	{
		x = p1.x;
		y = min(p1.y, p2.y);
		width = abs(p2.x - p1.x);
		height = four_size[2 * flag + 1] / four_size[2 * flag] * width;
		rect.x = max(x - width*0.3, 0.0);
		rect.y = max(y - height*0.6, 0.0);
		rect.width = width * 1.6;
		rect.height = height * 1.6;

		x = p3.x;
		y = min(p3.y, p4.y);
		width = abs(p4.x - p3.x);
		height = four_size[2 * flag + 1] / four_size[2 * flag] * width;
		rect1.x = max(x - width*0.3, 0.0);
		rect1.y = max(y - height*0.6, 0.0);
		rect1.width = width * 1.6;
		rect1.height = height * 1.6;
		
	}
	if (flag == 2)
	{
		x = min(min(p1.x, p2.x), p3.x);
		y = p1.y;

		int h1 = abs(p1.y - p3.y);
		int h2 = abs(p1.y - p2.y);
		int h3 = abs(p1.y - p4.y);
		height = max(max(h1, h2), h3);

		int w1 = abs(p2.x - p4.x);
		int w2 = abs(p2.x - p3.x);
		int w3 = abs(p4.x - p3.x);
		width = max(max(w1, w2), w3);

		rect.x = max(x - width*0.3, 0.0);
		rect.y = max(y - height*0.2, 0.0);
		rect.width = width * 1.6;
		rect.height = height * 1.4;
	}
	if (flag == 3)
	{
		x = p1.x;
		y = min(min(p1.y, p2.y), p3.y);
		width = abs(p3.x - x);
		height = max(max(abs(p4.y - y), abs(p1.y - y)), abs(p2.y-y));

		rect.x = max(x - width*0.3, 0.0);
		rect.y = max(y - height*0.4, 0.0);

		rect.width = max((int)(width*1.6), 18);
		rect.height = max((int)(height*1.8), 12);

		/*x = (p1.x + p3.x)/2.0;
		y = (p1.y + p3.y) / 2.0;
		rect.x = max(x - rect.width*0.5, 0.0);
		rect.y = max(y - rect.height*0.5, 0.0);*/
	}
	if (flag == 4)
	{
		x = p1.x;
		y = min(p1.y, p2.y);
		width = abs(p1.x - p2.x);
		height = abs(p3.y - y);
		rect.x = max(x - width*0.1, 0.0);
		rect.y = max(y - height*0.1, 0.0);
		rect.width = max((int)(width*1.2), 32);
		rect.height = max((int)(height*1.2), 32);
	}
	if (rect.x + rect.width  > cols)
	{
		rect.width = cols - rect.x;
	}
	if (rect.y + rect.height > rows)
	{
		rect.height = rows - rect.y;
	}
	rects.push_back(rect);
	if (flag == 0 || flag == 1)
	{
		if (rect1.x + rect1.width  > cols)
		{
			rect1.width = cols - rect1.x;
		}
		if (rect1.y + rect1.height > rows)
		{
			rect1.height = rows - rect1.y;
		}
		rects.push_back(rect1);
	}
}

void createPatchFile(string base, vector data, DataPrepareUtil &dpu)
{
	vector landmark_four[5][2];
	int istd = 0;
	int length = data.size();
	for (int i = 0; i < length; i++)
	{
		if (i >= 9000)
		{
			istd = 1;
		}
		for (int j = 2; j < 3; j++)
		{
			Mat img = imread(base + data[i].fileName);
			vector rects;
			//Rect rect(0,0, four_size[2*j], four_size[2*j+1]);
			getRect(data[i], j, rects, img.cols, img.rows);
			//cout << rect.x << " " << rect.y << " " << rect.width << " " << rect.height << endl;

			for (int n = 0; n < rects.size(); n++)
			{
				Mat roi = img(rects[n]);
				resize(roi, roi, Size(four_size[2 * j], four_size[2 * j + 1]));

				string dir = base + mark_4_img_dir[j];
				if (_access(dir.c_str(), 0) == -1)
				{
					_mkdir(dir.c_str());
				}
				imwrite(dir + to_string(n)+"_" + data[i].fileName, roi);
				//坐标转换
				LandMark mark;
				mark.fileName = to_string(n) + "_" + data[i].fileName;
				if (0 == j || 1 == j)
				{
					int count = 0;
					for (int k = four_point[4 * j + 2*n]; k < four_point[4 * j + 1 + 2*n]; k++)
					{
						float offsetX = (data[i].points[k].x - rects[n].x) * ((float)four_size[2 * j] / rects[n].width);
						float offsetY = (data[i].points[k].y - rects[n].y) * ((float)four_size[2 * j + 1] / rects[n].height);
						mark.points[count].x = offsetX;
						mark.points[count].y = offsetY;
						++count;
					}
					landmark_four[j][istd].push_back(mark);
				}
				else
				{
					int count = 0;
					for (int k = four_point[8 + 2 * (j - 2)]; k < four_point[8 + 2 * (j - 2) + 1]; k++)
					{
						float offsetX = (data[i].points[k].x - rects[n].x) * four_size[2 * j] / rects[n].width;
						float offsetY = (data[i].points[k].y - rects[n].y) * four_size[2 * j + 1] / rects[n].height;
						mark.points[count].x = offsetX;
						mark.points[count].y = offsetY;
						++count;
					}
					landmark_four[j][istd].push_back(mark);
				}
			}
		}
	}

	for (int j = 2; j < 3; j++)
	{
		dpu.clearFileData(base + mark_4_img_dir[j] + mark_4_img_train[j]);
		dpu.writeDatatoFile(base + mark_4_img_dir[j] + mark_4_img_train[j], landmark_four[j][0], mark_num[j]);

		dpu.clearFileData(base + mark_4_img_dir[j] + mark_4_img_test[j]);
		dpu.writeDatatoFile(base + mark_4_img_dir[j] + mark_4_img_test[j], landmark_four[j][1], mark_num[j]);
	}
}


int main() {
	string base = "E:\\work\\face_alignment\\model\\regression_96_68\\";
	string prototext = base + "test_68.prototxt";
	string mode_path = base + "save_path\\_iter_150000.caffemodel";
	string img_path = "D:\\face\\face_img_96\\img\\";
	string text_label = "D:\\face\\face_img_96\\img\\shutter_68_test.txt";
	/*string base = "E:\\work\\face_alignment\\model\\regression_48_68\\";
	string prototext = base + "test_68.prototxt";
	string mode_path = base + "save_path\\_iter_20000.caffemodel";
	string img_path = "D:\\face_new\\face_img_48\\";
	string text_label = "D:\\face_new\\face_img_48\\shutter_68_test.txt";*/


	/*string base1 = "E:\\work\\face_alignment\\model\\regression_33\\";
	string prototext1 = base1 + "test_33.prototxt";
	string mode_path1 = base1 + "save_path_plan1\\_iter_80000.caffemodel";

	string img_path_48 = "D:\\face\\face_img_48\\img\\";
	string text_label_48 = "D:\\face\\face_img_48\\img\\shutter_33_test.txt";*/


	MCLC mclc;
	int id_68 = mclc.AddNet(prototext, mode_path, DEVICE);
	//int id_33 = mclc.AddNet(prototext1, mode_path1, 0);

	DataPrepareUtil dpu;
	vector data;
	data = dpu.readStageOneData(text_label, LANDMARK_NUM);

	//vector data_33;
	//data_33 = dpu.readStageOneData(text_label_48, 33);
	int length = data.size();
	vector preRe;
	double time1 = 0;
	for (int i = 0; i < length; i++)
	{
		LandMark landmark;
		landmark.fileName = data[i].fileName;
		Mat img = imread(img_path + data[i].fileName);
		time1 += predict(img, mclc, id_68, landmark);
		/*Mat img_48 = imread(img_path_48 + data[i].fileName);
		time2 += predict_33(img_48, mclc, id_33, landmark);*/
		preRe.push_back(landmark);

		/*for (int j = 0; j < LANDMARK_NUM; j++)
		{
			circle(img, Point(landmark.points[j].x, landmark.points[j].y), 2, Scalar(255, 0 ,0));
		}
		imshow("img", img);
		waitKey(0);*/
	}
	cout << "average time1 is:" << time1 / length << " ms" << endl;
	showError(data, preRe);
	

	//createPatchFile(img_path, preRe, dpu);



	/*
	//create sift feateure and label
	Mat data_train, label_train;
	Mat data_test, label_test;
	
	dpu.getData("D:\\face\\face_img_96\\img\\", preRe, data, data_train, label_train, data_test, label_test, TRAIN, TEST, 1);
	Mat out_train, out_test;
	cout << data_train.cols << "   " << data_train.rows << endl;
	cout << data_test.cols << "   " << data_test.rows << endl;
	
	Mat mean, eigenvectors;
	dpu.PCA_Reduce(data_train, data_test, out_train, out_test, mean, eigenvectors);

	string f5_path = "E:\\work\\face_alignment\\model\\stage_three\\hdf5_pca\\";
	string train_data_path = f5_path + "hdf5_train.h5";
	string test_data_path = f5_path + "hdf5_test.h5";
	string mean_eigenv_path = f5_path + "mean_eigenv.h5";

	mat2hdf5(out_train, label_train, train_data_path.c_str(), "data", "label");
	mat2hdf5(out_test, label_test, test_data_path.c_str(), "data", "label");
	
	mat2hdf5(mean, eigenvectors, mean_eigenv_path.c_str(), "mean", "eigenv");

	cout << "mean is:" << mean << endl;
	//cout << "eigenvectors is:" << eigenvectors << endl;
	cout << "mean shape:" << mean.rows << "   " << mean.cols << endl;
	*/

	
	//stage two.
	string base_brow = "E:\\work\\face_alignment\\model\\regression_stage_two\\brow\\";
	string prototext_brow = base_brow + "test_brow.prototxt";
	string mode_path_brow = base_brow + "save_path\\_iter_100000.caffemodel";
	int id_5_brow = mclc.AddNet(prototext_brow, mode_path_brow, DEVICE);

	string base_eye = "E:\\work\\face_alignment\\model\\regression_stage_two\\eye\\";
	string prototext_eye = base_eye + "test_eye.prototxt";
	string mode_path_eye = base_eye + "save_path\\_iter_100000.caffemodel";
	int id_6_eye = mclc.AddNet(prototext_eye, mode_path_eye, DEVICE);

	string base_nose = "E:\\work\\face_alignment\\model\\regression_stage_two\\nose\\";
	string prototext_nose = base_nose + "test_nose.prototxt";
	string mode_path_nose = base_nose + "save_path\\_iter_70000.caffemodel";
	int id_9_nose = mclc.AddNet(prototext_nose, mode_path_nose, DEVICE);

	string base_mouth = "E:\\work\\face_alignment\\model\\regression_stage_two\\mouth\\";
	string prototext_mouth = base_mouth + "test_mouth.prototxt";
	string mode_path_mouth = base_mouth + "save_path\\_iter_100000.caffemodel";
	int id_68_mouth = mclc.AddNet(prototext_mouth, mode_path_mouth, DEVICE);
	

	string base_face = "E:\\work\\face_alignment\\model\\regression_stage_two\\face\\";
	string prototext_face = base_face + "test_face.prototxt";
	string mode_path_face = base_face + "save_path\\_iter_100000.caffemodel";
	int id_17_face = mclc.AddNet(prototext_face, mode_path_face, DEVICE);

	int id_four[] = { id_5_brow, id_6_eye, id_9_nose, id_68_mouth, id_17_face};

	double time_four = 0;
	for (int i = 0; i < length; i++)
	{
		LandMark landmark;
		landmark.fileName = data[i].fileName;
		Mat img = imread(img_path + data[i].fileName);
		for (int j = 0; j < 5; j++)
		{
			//if (j == 2)
			//{
			//	continue;
			//}
			vector rects;
			getRect(data[i], j, rects, img.cols, img.rows);

			for (int n = 0; n < rects.size(); n++)
			{
				Mat roi = img(rects[n]);
				resize(roi, roi, Size(four_size[2 * j], four_size[2 * j + 1]));
				time_four += predict_four(roi, mclc, id_four[j], landmark, mark_num[j]);
				if (j == 0 || j == 1)
				{
					int count = 0;
					for (int k = four_point[4 * j + 2 * n]; k < four_point[4 * j + 1 + 2*n]; k++)
					{
						preRe[i].points[k].x = landmark.points[count].x * (rects[n].width / four_size[2 * j]) + rects[n].x;
						preRe[i].points[k].y = landmark.points[count].y * (rects[n].height / four_size[2 * j + 1]) + rects[n].y;
						++count;
					}
				}
				//for (int k = 0; k < mark_num[j]; k++)
				//{
				//	circle(roi, Point(landmark.points[k]), 2, Scalar(255,0,0));
				//}
				//imshow("roi", roi);
				//waitKey(0);
				if (j == 2 || j == 3 || j == 4)
				{
					int count = 0;
					for (int k = four_point[8 + 2 * (j - 2)]; k < four_point[8 + 2 * (j - 2) + 1]; k++)
					{
						preRe[i].points[k].x = landmark.points[count].x * (rects[n].width / four_size[2 * j]) + rects[n].x;
						preRe[i].points[k].y = landmark.points[count].y * (rects[n].height / four_size[2 * j + 1]) + rects[n].y;
						++count;
					}
				}
			}
			//for (int k = 0; k < LANDMARK_NUM; k++)
			//{
			//	circle(img, Point(preRe[i].points[k]), 2, Scalar(255, 0, 0));
			//}
			//imshow("img", img);
			//waitKey(0);
		}
	}
	cout << "stage two ........................................................." << endl;
	cout << "average time mouth is :" << time_four / length << " ms"<< endl;
	showError(data, preRe);
	
	

	//create sift feateure and label
	/*
	Mat data_train, label_train;
	Mat data_test, label_test;
	dpu.getData(img_path, preRe, data, data_train, label_train, data_test, label_test, 0, 6, 1);
	
	int length_1 = data_test.rows;
	cout << "test count is :" << length_1 << endl;
	
	double time2 = 0;
	for (int i = 0; i < length_1; i++)
	{
		LandMark landmark;
		Rect rect(0, i, data_test.cols, 1);
		Mat feature = data_test(rect);
		//Mat feature(1,2, CV_32FC1);
		//feature.at(0, 0) = 7;
		//feature.at(0, 1) = 8;
		time2 += predict(feature, mclc, id_68_1, landmark);
		
		for (int j = 0; j < LANDMARK_NUM; j++)
		{
			preRe[i].points[j].x = preRe[i].points[j].x + landmark.points[j].x;
			preRe[i].points[j].y = preRe[i].points[j].y + landmark.points[j].y;
		}
		if (i == 0)
		{
			for (int k = 0; k < 68; k++)
			{
				cout << landmark.points[k].x << "  " << landmark.points[k].y << endl;
			}
		}
	}
	cout << "average time2 is:" << time2 / length << " ms" << endl;
	showError(data, preRe);
	*/
	std::system("PAUSE");
	return 0;
}

util.h

#ifndef _UTIL_
#define _UTIL_

#include 
#include 
#include 
#include 

#define LANDMARK_NUM 68
#define STAGE_ONE_MARK 33
using namespace std;

namespace glasssix
{
	struct LandMark
	{
		std::string fileName;
		cv::Point2d points[LANDMARK_NUM];
	};
	struct Label
	{
		std::string fileName;
		std::string label;
	};
	const int HOG_FEATURE = 0;
	const int SIFT_FEATURE = 1;
	const int LBP_FEATURE = 2;

	class DataPrepareUtil
	{
	public:
		DataPrepareUtil() {};
		std::vector readStageOneData(string filePath, int numMark, int count = INT_MAX);
		void readLabelData(string filePath, std::vector &data, int count = INT_MAX);
		void DataPrepareUtil::clearFileData(string filePath);
		void writeDatatoFile(std::string filePath, vector & data, int landmark);
		void writeDatatoFileX_Y(std::string filePath, vector & data, int landmark);
		void writeDatatoFile(std::string filePath, vector & data);
		void writeDatatoFile(std::string filePath, vector & data, int landmark, int start, int end);
		int getImageHogFeature(cv::Mat &img, std::vector & descriptors);
		void PCA_Reduce(cv::Mat & input_train, cv::Mat & input_test, cv::Mat & output_train, cv::Mat & output_test, cv::Mat & mean, cv::Mat & eigenvectors);
		void getData(std::string base, std::vector & really, std::vector & predict, cv::Mat & data, cv::Mat & label, cv::Mat & test_data, cv::Mat & test_label, int train_num, int test_num, int flage = HOG_FEATURE);
		void DataPrepareUtil::getPatchData(std::string base, std::vector & really, vector & predict, std::vector & train_data, cv::Mat & train_label, std::vector & test_data, cv::Mat & test_label, int train_num, int test_num);
		//void libSVM_Train(cv::Mat & data, cv::Mat &label, std::string save_path = "libsvm.xml");
		//void libSVM_Predict(std::string mode, cv::Mat & data, cv::Mat &label);
		~DataPrepareUtil() {};
	};
}

#endif

util.cpp

#include "Util.h"
#include 
#include 
#include 
#include   //使用stringstream需要引入这个头文件  
#include 
#include 

#include 
#include 
#include "../../../../SoftWare/libsvm-3.22/svm.h"

using namespace std;
using namespace glasssix;
using namespace cv;

const int LEFT_EYE = 0;
const int RIGHT_EYE = 9;
const int NOSE = 34;
const int LEFT_MOUTH = 46;
const int RIGHT_MOUTH = 47;
const int ALL = 95;
template 
Type stringToNum(const string& str)
{
	istringstream iss(str);
	Type num;
	iss >> num;
	return num;
}

void  splitString(const string& s, vector& v, const string& c)
{
	string::size_type pos1, pos2;
	pos2 = s.find(c);
	pos1 = 0;
	while (string::npos != pos2)
	{
		v.push_back(s.substr(pos1, pos2 - pos1));
		pos1 = pos2 + c.size();
		pos2 = s.find(c, pos1);
	}
	if (pos1 != s.length()) {
		v.push_back(s.substr(pos1));
	}
}
void parseData_5(string buf, LandMark& mark)
{
	vector result1;
	splitString(buf, result1, "\t");
	mark.fileName = result1[0];
	vector result2;
	splitString(result1[1], result2, ",");
	mark.points[0].x = stringToNum(result2[2 * LEFT_EYE]);
	mark.points[0].y = stringToNum(result2[2 * LEFT_EYE + 1]);
	mark.points[1].x = stringToNum(result2[2 * RIGHT_EYE]);
	mark.points[1].y = stringToNum(result2[2 * RIGHT_EYE + 1]);
	mark.points[2].x = stringToNum(result2[2 * NOSE]);
	mark.points[2].y = stringToNum(result2[2 * NOSE + 1]);
	mark.points[3].x = stringToNum(result2[2 * LEFT_MOUTH]);
	mark.points[3].y = stringToNum(result2[2 * LEFT_MOUTH + 1]);
	mark.points[4].x = stringToNum(result2[2 * RIGHT_MOUTH]);
	mark.points[4].y = stringToNum(result2[2 * RIGHT_MOUTH + 1]);

}
void parseKey_26_Data(string buf, LandMark& mark)
{
	vector result1;
	splitString(buf, result1, "\t");
	mark.fileName = result1[0];
	vector result2;
	splitString(result1[1], result2, ",");

	mark.points[0].x = stringToNum(result2[2 * LEFT_EYE]);
	mark.points[0].y = stringToNum(result2[2 * LEFT_EYE + 1]);
	mark.points[1].x = stringToNum(result2[2 * RIGHT_EYE]);
	mark.points[1].y = stringToNum(result2[2 * RIGHT_EYE + 1]);
	mark.points[2].x = stringToNum(result2[2 * NOSE]);
	mark.points[2].y = stringToNum(result2[2 * NOSE + 1]);
	mark.points[3].x = stringToNum(result2[2 * LEFT_MOUTH]);
	mark.points[3].y = stringToNum(result2[2 * LEFT_MOUTH + 1]);
	mark.points[4].x = stringToNum(result2[2 * RIGHT_MOUTH]);
	mark.points[4].y = stringToNum(result2[2 * RIGHT_MOUTH + 1]);
	int j = 5;
	for (int i = 74; i < ALL; i++)
	{
		if (i >= 74 && i < 95) {
			mark.points[j].x = stringToNum(result2[2 * i]);
			mark.points[j].y = stringToNum(result2[2 * i + 1]);
			j++;
		}
	}
}
void parseKey_68_Data(string buf, LandMark& mark)
{
	vector result1;
	splitString(buf, result1, "\t");
	mark.fileName = result1[0];
	vector result2;
	splitString(result1[1], result2, ",");

	int j = 0;
	//add left eye   18个
	for (int i = 0; i < 37; i++)
	{
		if ((i >= 0 && i < 9) || (i >= 18 && i < 26) || (i == 36)) {
			mark.points[j].x = stringToNum(result2[2 * i]);
			mark.points[j].y = stringToNum(result2[2 * i + 1]);
			j++;
		}
	}
	//add right eye  18个
	for (int i = 9; i < 38; i++)
	{
		if ((i >= 9 && i < 18) || (i >= 26 && i < 34) || (i == 37)) {
			mark.points[j].x = stringToNum(result2[2 * i]);
			mark.points[j].y = stringToNum(result2[2 * i + 1]);
			j++;
		}
	}
	//add nose eye  10个
	for (int i = 34; i < 46; i++)
	{
		if ((i >= 34 && i < 36) || (i >= 38 && i < 46)) {
			mark.points[j].x = stringToNum(result2[2 * i]);
			mark.points[j].y = stringToNum(result2[2 * i + 1]);
			j++;
		}
	}
	//add mouth eye  22个
	for (int i = 46; i < 68; i++)
	{
		if (i >= 46 && i < 68) {
			mark.points[j].x = stringToNum(result2[2 * i]);
			mark.points[j].y = stringToNum(result2[2 * i + 1]);
			j++;
		}
	}
}

void parseData(string buf, LandMark& mark, int num_mark)
{
	vector result1;
	splitString(buf, result1, " ");
	mark.fileName = result1[0];
	for (int i = 0; i < num_mark; i++)
	{
		mark.points[i].x = stringToNum(result1[2 * i + 1]);
		mark.points[i].y = stringToNum(result1[2 * (i + 1)]);
	}
}

void parseData(string buf, LandMark& mark)
{
	vector result1;
	splitString(buf, result1, "\t");
	mark.fileName = result1[0];
	vector result2;
	splitString(result1[1], result2, ",");
	for (int i = 0; i < LANDMARK_NUM; i++)
	{
		mark.points[i].x = stringToNum(result2[2 * i]);
		mark.points[i].y = stringToNum(result2[2 * i + 1]);
	}
}

void DataPrepareUtil::clearFileData(string filePath)
{
	if (filePath == "")
	{
		return;
	}
	ofstream in;
	in.open(filePath, ios::trunc);
	in.close();
}
void DataPrepareUtil::readLabelData(string filePath, std::vector &data, int count)
{
	ifstream fileA(filePath);
	if (!fileA)
	{
		cout << "没有找到需要读取的  " << filePath << " 请将文件放到指定位置再次运行本程序。" << endl << "  按任意键以退出";
		return;
	}
	for (int i = 0; !fileA.eof() && (i < count); i++)
	{
		Label mark;
		string buf;
		getline(fileA, buf, '\n');

		if (buf == "")
		{
			cout << "buf is empty." << endl;
			continue;
		}
		vector resu;
		splitString(buf, resu, " ");
		mark.fileName = resu[0];
		mark.label = resu[1];
		data.push_back(mark);
	}
	fileA.close();
}
vector DataPrepareUtil::readStageOneData(string filePath, int numMark, int count)
{
	vector result;
	ifstream fileA(filePath);
	if (!fileA)
	{
		cout << "没有找到需要读取的  " << filePath << " 请将文件放到指定位置再次运行本程序。" << endl << "  按任意键以退出";
		return result;
	}
	for (int i = 0; !fileA.eof() && (i < count); i++)
	{
		LandMark mark;
		string buf;
		getline(fileA, buf, '\n');

		if (buf == "")
		{
			cout << "buf is empty." << endl;
			continue;
		}
		parseData(buf, mark, numMark);
		//cout.precision(20); // 设置输出精度
		//cout << "mark.fileName is:" << mark.fileName << " mark.Point:" << mark.points[0] << endl;
		result.push_back(mark);
	}
	fileA.close();

	return result;
}
void DataPrepareUtil::writeDatatoFile(std::string filePath, vector & data)
{
	if (filePath == "" || data.size() == 0)
	{
		return;
	}
	ofstream in;
	in.open(filePath, ios::app);   //ios::trunc
	int length = data.size();
	for (int i = 0; i < length; i++)
	{
		string dataline = "H:\\CASIA\\CASIA-WebFace\\" + data[i].fileName;
		dataline.append(" ");
		dataline.append(data[i].label);
		in << dataline << "\n";
	}
	in.close();
}
void DataPrepareUtil::writeDatatoFile(std::string filePath, vector & data, int landmark)
{
	if (filePath == "" || data.size() == 0)
	{
		return;
	}
	ofstream in;
	in.open(filePath, ios::app);
	int length = data.size();
	for (int i = 0; i < length; i++)
	{
		string dataline = data[i].fileName;
		dataline.append(" ");
		for (int j = 0; j < landmark; j++)
		{
			dataline.append(to_string(data[i].points[j].x));
			dataline.append(" ");
			dataline.append(to_string(data[i].points[j].y));
			if (j != (landmark - 1))
			{
				dataline.append(" ");
			}
			//cout.precision(20);
			//cout << "double x:" << data[i].points[j].x << endl;
			//cout.precision(20); // 设置输出精度
			//cout << "to_string():" << doubleToString(data[i].points[j].x)< & data, int landmark)
{
	if (filePath == "" || data.size() == 0)
	{
		return;
	}
	ofstream in;
	in.open(filePath, ios::app);
	int length = data.size();
	for (int i = 0; i < length; i++)
	{
		string dataline = data[i].fileName;
		dataline.append(" ");
		for (int j = 0; j < landmark; j++)
		{
			dataline.append(to_string(data[i].points[j].x));
			dataline.append(" ");
		}
		for (int j = 0; j < landmark; j++)
		{
			dataline.append(to_string(data[i].points[j].y));
			if (j != (landmark - 1))
			{
				dataline.append(" ");
			}
		}
		in << dataline << "\n";
	}
	in.close();
}


void DataPrepareUtil::writeDatatoFile(std::string filePath, vector & data, int landmark, int start, int end)
{
	if (filePath == "" || data.size() == 0)
	{
		return;
	}
	ofstream in;
	in.open(filePath, ios::app);
	int length = data.size();

	if (start < 0 || start > length || end < start || end > length)
	{
		cout << "start or end is error." << endl;
	}

	for (int i = start; i < end; i++)
	{
		string dataline = data[i].fileName;
		dataline.append(" ");
		for (int j = 0; j < landmark; j++)
		{
			dataline.append(to_string(data[i].points[j].x));
			dataline.append(" ");
			dataline.append(to_string(data[i].points[j].y));
			if (j != (landmark - 1))
			{
				dataline.append(" ");
			}
			//cout.precision(20);
			//cout << "double x:" << data[i].points[j].x << endl;
			//cout.precision(20); // 设置输出精度
			//cout << "to_string():" << doubleToString(data[i].points[j].x)< sift = xfeatures2d::SIFT::create(1);
	std::vector keypointsa;
	keypointsa.clear();
	
	KeyPoint keyp;
	keyp.pt.x = point.x;
	keyp.pt.y = point.y;
	keyp.size = 16;
	keypointsa.push_back(keyp);
	
	//sift->detectAndCompute(src, mask, keypointsa, a);//得到特征点和特征点描述
	//drawKeypoints(src, keypointsa, src, Scalar(0,0,255));//画出特征点
	sift->detectAndCompute(img, Mat(), keypointsa, desc, true);
	//drawKeypoints(img, keypointsa, img, Scalar(0, 0, 255));
	/*imshow("src", img);
	waitKey(0);*/
}

int DataPrepareUtil::getImageHogFeature(Mat &img, vector & descriptors)
{
	if (img.data == NULL)
	{
		cout << "No exist" << endl;
		return -1;
	}
	HOGDescriptor *hog = new HOGDescriptor(Size(8, 8), Size(8, 8), Size(8, 8), Size(4, 4), 9);   //Size(4,4) cell 大小
	hog->compute(img, descriptors, Size(1, 1), Size(0, 0));
	return 0;
}

void check_xy(int &x, int &y, int width, int height, int stride)
{
	if (x < 0)
	{
		x = 0;
	}
	if (y < 0)
	{
		y = 0;
	}
	if (x > width - stride)
	{
		x = width - stride;
	}
	if (y > height - stride)
	{
		y = height - stride;
	}
}
void DataPrepareUtil::PCA_Reduce(cv::Mat & input_train, cv::Mat & input_test, cv::Mat & output_train, cv::Mat & output_test, Mat & mean, Mat & eigenvectors)
{
	cout << "start pca" << endl;
	double t0 = (double)cvGetTickCount();
	PCA pca(input_train, Mat(), PCA::DATA_AS_ROW, 1700);
	cout << "end pca" << endl;
	double t1 = (double)cvGetTickCount();
	cout << "cost time is: " << ((t1 - t0) / ((double)cvGetTickFrequency() * 1000 * 1000)) << "s" << endl;
	//cout << pca.eigenvalues << endl;
	//cout << pca.eigenvectors << endl;
	output_train = pca.project(input_train);
	output_test = pca.project(input_test);
	cout << " point size :" << output_train.rows << " " << output_train.cols << endl;
	
	//imwrite("D:\\face\\face_img_96\\img\\feature_sift\\pca\\mean.jpg", pca.mean);
	//imwrite("D:\\face\\face_img_96\\img\\feature_sift\\pca\\engv.jpg", pca.eigenvectors);
	mean = pca.mean;
	eigenvectors = pca.eigenvectors;
}
void DataPrepareUtil::getData(std::string base, std::vector & really, vector & predict, cv::Mat & train_data, cv::Mat & train_label, cv::Mat & test_data, cv::Mat & test_label, int train_num, int test_num, int flage)
{
	int length = predict.size();
	cout << "train image is :" << length << endl;
	int n = 0;
	int featureNum = 0;
	int cols = 68 * 2;
	for (int i = 0; i < length; i++)
	{
		Mat img = imread(base + predict[i].fileName, CV_LOAD_IMAGE_COLOR);
		std::vector descriptors;
		if (flage == HOG_FEATURE)
		{
			for (int j = 0; j < 68; j++)
			{
				std::vector descriptor;

				Rect rect;
				rect.x = predict[i].points[j].x;
				rect.y = predict[i].points[j].y;
				rect.x = rect.x - 4;
				rect.y = rect.y - 4;
				check_xy(rect.x, rect.y, 96, 96, 8);
				rect.width = 8;
				rect.height = 8;
				Mat roi = img(rect);
				getImageHogFeature(roi, descriptor);
				int le = descriptor.size();
				for (int k = 0; k < le; k++)
				{
					descriptors.push_back(descriptor[k]);
				}
			}
		}
		else if (flage == SIFT_FEATURE)
		{
			for (int j = 0; j < LANDMARK_NUM; j++)
			{
				Mat desc;
				sift_feature(Point(predict[i].points[j].x, predict[i].points[j].y), desc, img);
				for (int k = 0; k < desc.cols; k++)
				{
					descriptors.push_back(desc.at(0,k));
				}
				//cout << " value :" << desc << endl;
				//system("PAUSE");
			}
		}
		if (i < train_num)
		{
			if (i == 0)
			{
				featureNum = descriptors.size();
				cout << "featureNum is:" << featureNum << endl;
				train_label = Mat::zeros(train_num, cols, CV_32FC1); //注意其中训练和自动训练的接口，还有labelMat一定要用CV_32SC1的类型
				train_data = Mat::zeros(train_num, descriptors.size(), CV_32FC1);
			}
			for (int j = 0; j < cols / 2; j++)
			{
				train_label.at(i, 2 * j) = really[i].points[j].x - predict[i].points[j].x;
				train_label.at(i, 2 * j + 1) = really[i].points[j].y - predict[i].points[j].y;
				//cout << train_label.at(i, 2 * j) << endl;
			}
			n = 0;
			for (std::vector::iterator iter = descriptors.begin(); iter != descriptors.end(); iter++)
			{
				train_data.at(i, n) = *iter;
				n++;
			}
		}
		else
		{
			if (i == train_num)
			{
				featureNum = descriptors.size();
				cout << "test featureNum is:" << featureNum << endl;
				test_label = Mat::zeros(test_num, cols, CV_32FC1);
				test_data = Mat::zeros(test_num, descriptors.size(), CV_32FC1);
			}
			for (int j = 0; j < cols / 2; j++)
			{
				test_label.at(i - train_num, 2 * j) = really[i - train_num].points[j].x - predict[i - train_num].points[j].x;
				test_label.at(i - train_num, 2 * j + 1) = really[i - train_num].points[j].y - predict[i - train_num].points[j].y;
			}
			n = 0;
			for (std::vector::iterator iter = descriptors.begin(); iter != descriptors.end(); iter++)
			{
				test_data.at(i - train_num, n) = *iter;
				n++;
			}
		}
	}
}

void DataPrepareUtil::getPatchData(std::string base, std::vector & really, vector & predict, std::vector & train_data, cv::Mat & train_label, std::vector & test_data, cv::Mat & test_label, int train_num, int test_num)
{
	int length = predict.size();
	cout << "train image is :" << length << endl;
	int n = 0;
	int featureNum = 0;
	int cols = 68 * 2;
	for (int i = 0; i < length; i++)
	{
		Mat img = imread(base + predict[i].fileName, CV_LOAD_IMAGE_COLOR);
		Mat patch[68];
		vector rect;
 		for (int j = 0; j < 68; j++)
		{
			Rect re;
			re.x = predict[i].points[j].x;
			re.y = predict[i].points[j].y;
			re.x = re.x - 8;
			re.y = re.y - 8;
			check_xy(re.x, re.y, 96, 96, 16);
			re.width = 16;
			re.height = 16;
			Mat roi = img(re);
			patch[j] = roi;
			rect.push_back(re);
		}
		if (i < train_num)
		{
			if (i == 0)
			{
				train_label = Mat::zeros(train_num, cols, CV_32FC1); //注意其中训练和自动训练的接口，还有labelMat一定要用CV_32SC1的类型
			}
			for (int j = 0; j < cols / 2; j++)
			{
				train_label.at(i, 2 * j) = really[i].points[j].x - rect[j].x;//predict[i].points[j].x;
				train_label.at(i, 2 * j + 1) = really[i].points[j].y - rect[j].y;//predict[i].points[j].y;
				//cout << train_label.at(i, 2 * j) << endl;
			}
			/*Mat patch1, patch2;
			for (int i = 0; i < 17; i++)
			{
				for (int j = 0; j < 3; j++)
				{
					if (j == 0)
					{
						hconcat(patch[i][j], patch[i][j + 1], patch1);
					}
					else {
						hconcat(patch1, patch[i][j + 1], patch1);
					}
				}
				if (i == 0)
				{
					patch2 = patch1;
				}
				else if (i > 0)
				{
					vconcat(patch1, patch2, patch2);
				}
			}*/
			Mat dst;
			merge(patch, 68, dst);
			train_data.push_back(dst);
		}
		else
		{
			if (i == train_num)
			{
				test_label = Mat::zeros(test_num, cols, CV_32FC1); //注意其中训练和自动训练的接口，还有labelMat一定要用CV_32SC1的类型
			}
			for (int j = 0; j < cols / 2; j++)
			{
				test_label.at(i - train_num, 2 * j) = really[i - train_num].points[j].x - predict[i - train_num].points[j].x;
				test_label.at(i - train_num, 2 * j + 1) = really[i - train_num].points[j].y - predict[i - train_num].points[j].y;
			}
			Mat dst;
			merge(patch, 68, dst);
			test_data.push_back(dst);
		}
	}
}



svm_parameter param;
void init_param()
{
	param.svm_type = EPSILON_SVR;
	param.kernel_type = RBF;
	param.degree = 3;
	param.gamma = 0.01;
	param.coef0 = 0;
	param.nu = 0.5;
	param.cache_size = 1000;
	param.C = 20;
	param.eps = 1e-6;
	param.shrinking = 1;
	param.probability = 0;
	param.nr_weight = 0;
	param.weight_label = NULL;
	param.weight = NULL;
}
//void DataPrepareUtil::libSVM_Train(cv::Mat & data, cv::Mat &label, string save_path)
//{
//	init_param();
//	int rows = data.rows;
//	int cols = data.cols;
//
//	svm_problem prob;
//	prob.l = rows;
//
//	svm_node *x_space = new svm_node[(cols + 1)*prob.l];//样本特征存储空间
//	prob.x = new svm_node *[prob.l]; //每一个X指向一个样本
//	cout << "size :" << sizeof(x_space) << endl;
//	prob.y = new double[prob.l];
//
//	//libsvm train data prepare.
//	for (int i = 0; i < rows; i++)
//	{
//		for (int j = 0; j < cols + 1; j++)
//		{
//			if (j == cols)
//			{
//				x_space[i*(cols + 1) + j].index = -1;
//				prob.x[i] = &x_space[i * (cols + 1)];
//				prob.y[i] = label.at(i, 0);
//				break;
//			}
//			x_space[i*(cols + 1) + j].index = j + 1;
//			x_space[i*(cols + 1) + j].value = data.at(i, j);
//		}
//	}
//	cout << "start train svm." << endl;
//	svm_model *model = svm_train(&prob, ¶m);
//
//	cout << "save model" << endl;
//	svm_save_model(save_path.c_str(), model);
//	cout << "done!" << endl;
//
//	delete[] x_space;
//	delete[] prob.x;
//	delete[] prob.y;
//}
//void DataPrepareUtil::libSVM_Predict(std::string mode, cv::Mat & data, cv::Mat &label)
//{
//	svm_model* model = svm_load_model(mode.c_str());
//	int test_cols = data.cols;
//	int test_rows = data.rows;
//	svm_node *test_space = new svm_node[test_cols + 1];
//	//svm_problem prob_test;
//	//libsvm test data prepare.
//	int error = 0;
//	double t0 = (double)cvGetTickCount();
//	for (int i = 0; i < test_rows; i++)
//	{
//		for (int j = 0; j < test_cols + 1; j++)
//		{
//			if (j == test_cols)
//			{
//				test_space[j].index = -1;
//				break;
//			}
//			test_space[j].index = j + 1;
//			test_space[j].value = data.at(i, j);
//		}
//		int d = svm_predict(model, test_space);
//		if (d != label.at(i, 0))
//		{
//			cout << "predict is :" << d << " really is :" << label.at(i, 0) << endl;
//			error++;
//		}
//	}
//	double t1 = (double)cvGetTickCount();
//	cout << "average time is: " << ((t1 - t0) / ((double)cvGetTickFrequency() * 1000 * 1000))*1000.0 / test_rows << "ms" << endl;
//	cout << "acurcy is :" << (float)(test_rows - error) / test_rows << endl;
//	delete[] test_space;
//}

如果想使用该方法请联系：[email protected]

关于人脸对齐发展的介绍

https://blog.csdn.net/chaipp0607/article/details/78836640

你可能感兴趣的:(人脸处理,tensorflow,机器学习,深度学习)

DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
分类模型（BERT）训练全流程巴伦是只猫人工智能分类 bert 数据挖掘
使用BERT实现分类模型的完整训练流程BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种强大的预训练语言模型，在各种NLP任务中表现出色。下面我将详细梳理使用BERT实现文本分类模型的完整训练过程。1.准备工作1.1环境配置pipinstalltransformerstorchtensorflowpandassklearn1.2
instantiate 卡顿严重_Unity3D研究院之利用缓存池解决Instantiate慢的问题（七十三）... weixin_39992312 instantiate 卡顿严重
Unity3D做项目有三个地方处理不好游戏整体就会出现卡顿的问题。2.角色放技能的时候卡尤其是放群体攻击技能时，因为每个人身上都要产生一个技能特效。技能都是用粒子特效做的，虽然Unity中粒子特效也是一个GameObject.但是ParticleSystem这个组件太特殊了。Instantiate以后会自动的执行脚本的初始化工作，ParticleSystem组件肯定也是个脚本，虽然我们看不到它实现
instantiate 卡顿严重_利用缓存池解决Instantiate慢的问题 weixin_39958100 instantiate 卡顿严重
Unity3D做项目有三个地方处理不好游戏整体就会出现卡顿的问题。1.NGUI直接打开界面卡，建议看看这一篇文章http://www.xuanyusong.com/archives/2799(本文就不赘述了)2.角色放技能的时候卡尤其是放群体攻击技能时，因为每个人身上都要产生一个技能特效。技能都是用粒子特效做的，虽然Unity中粒子特效也是一个GameObject.但是ParticleSystem
Java学习----NIO模型典孝赢麻崩乐急 java 学习 nio
在Java的I/O模型中，NIO（Non-BlockingI/O，非阻塞I/O）是对BIO的重要改进。它为高并发场景提供了更高效的处理方式，在众多Java应用中发挥着关键作用。NIO模型的核心在于非阻塞和多路复用，其采用“一个线程处理多个连接”的模式，主要依靠通道（Channel）、缓冲区（Buffer）和选择器（Selector）这三个核心组件协同工作，每个核心组件的功能原理和功能如下：（1）通
秒杀模块-业务分析参考菜菜嗯? 笔记秒杀业务分析 java
宝家-秒杀模块-业务分析参考1.秒杀模式介绍秒杀卖场一直是电商项目中最热门的存在，其目的就是以超低价格商品吸引消费者参加活动。这是一种很常见的促销方式。在电商中秒杀的销售模式最大的挑战就是我们需要面临短时间段的恐怖并发流量，因为存在时间和库存的限制，参与秒杀的用户会在固定的时间段访问我们的服务器，突然的高并发流量如果不经过处理很有可能造成系统崩溃。注意，这里需要明白的是，秒杀只是网站营销的一个活动
Android Jetpack Compose + MVI 开发流程深度分析你过来啊你 android compose mvi
MVI架构核心原理MVI（Model-View-Intent）是一种基于单向数据流的架构模式，其核心组件关系如下：[View]--Intents-->[ViewModel]--States-->[View]||用户交互事件处理业务逻辑||[View]=emptyList(),valisLoading:Boolean=false,valerror:String?=null,valnewTodoTit
Haproxy七层代理陈小铃子学习运维 linux
一、负载均衡核心概念它本质上是一种反向代理技术，通过硬件或软件设备，将来自客户端的请求智能地分发到后端的多台服务器上。这样做的主要目的是：提高并发处理能力：避免单台服务器过载，提升整体服务的吞吐量。保证高可用性：当某台后端服务器发生故障时，负载均衡器可以将流量自动切换到健康的机器上，确保服务不中断。便于水平扩展：可以根据业务量增长，方便地增加后端服务器数量，实现弹性伸缩，且对用户透明。二、使用负载
cddlib(用于凸多面体计算和线性不等式系统求解)的开源库 Tipriest_ 数学优化运算 cddlib 优化计算凸多面体 C 线性不等式求解
cddlib是一个用于凸多面体计算和线性不等式系统求解的开源C库，全称为CDD(DoubleDescriptionMethodLibrary)。它基于双描述法（DoubleDescriptionMethod），主要用于处理凸多面体的顶点（V-representation）和不等式（H-representation）之间的转换，以及相关的几何计算。以下是详细介绍：1.核心功能凸多面体表示转换：H-r
okhttp xxx Android10Platform, sslSocketFactory is class com.android.org.conscrypt.OpenSSLSocketFact mmsx Android 常用开发技术 okhttp android
问题分析这个错误通常表示在Android10平台上，OkHttp在处理SSL/TLS连接时，无法正确提取信任管理器（TrustManager）。sslSocketFactory显示为com.android.org.conscrypt.OpenSSLSocketFactoryImpl，这是Android系统默认的SSL套接字工厂。问题可能出在信任管理器的配置或者与Android10的兼容性上。可能原
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
CodeBuild构建文件复制到特定目录处理亚林瓜子 linux 运维服务器
version:0.2phases:install:runtime-versions:java:corretto17pre_build:commands:-mvn--versionbuild:commands:-mvnclean&&mvnpackage-Dmaven.test.skip=truepost_build:commands:-mkdir-ppackaged-artifact/.ebext
Gson、Fastjson 和 Jackson 对比解析小张0.0 JavaWeb json
目录1.Gson(Google)基本介绍：核心功能：特点：使用场景：2.Fastjson(Alibaba)基本介绍：核心功能：特点：使用场景：3.Jackson基本介绍：核心功能：特点：使用场景：4.对比总结5.选择建议Gson、Fastjson和Jackson这三种都是Java生态中广泛使用的JSON处理库，用于实现Java对象与JSON数据之间的相互转换。在项目中使用不同的方法即可调用不同的J
2019-09-28 新明半岛
今日和一个朋友电话聊了一个半小时，哈哈好久没和人煲过电话粥了。主要聊最近各自在干嘛，关键主题是家庭英语启蒙。之前跟这这个朋友学习家庭英语启蒙，这位朋友也是我比较佩服的一个人，比较优秀，通过不断精进自己，学以致用，创造财富。我们都是普通的上班族，过去的我只知道做家务，照顾孩子，很少有时间去自我学习自我提升，很少去复盘我的人生，没有得到家庭的认可，亲子关系和亲密关系都没有处理好。今年七月份，我跟着这位
牛客-倒置字符串小张0.0 OJ算法题题目心得算法 leetcode 动态规划
1.题目描述2.题目链接倒置字符串_牛客题霸_牛客网3.代码解答importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscanner=newScanner(System.in);Strings=scanner.nextLine();//按空格分割单词（处理多个连续空格的情况，split("
安全重于泰山任娟
为了促进我校班主任团队的专业成长，切实提高班主任管理工作的艺术水平，保障学生在校安全。6月11日下午6:20，我校德育处组织小学部全体班主任在阶梯教室召开会议。这次会议的主题是“班主任工作如何做”。各年级根据学段特点确定研讨主题:一年级研讨内容:学生课间玩耍安全。二年级研讨内容:学生离,返校安全。三年级研讨内容:学生发生安全事故应急处理方法。四年级研讨内容:学生就餐安全。五年级研讨内容:学生楼道玩
Git小白的正确使用姿势与最佳实践 -睡到自然醒~ git elasticsearch 大数据 golang 开发语言后端 python
Git是由Linux之父LinusTorvalds在2005年创造的，目的是为了管理Linux内核的开发。Git的设计目标是实现高效的分支和合并，以及对大型项目的快速处理。1.安装Git要开始使用Git，你需要先安装Git的客户端软件。你可以从官方网站下载适合你的操作系统的安装包，或者使用你的包管理器来安装。例如，在Windows系统上，你可以下载并运行GitforWindows的安装程序。安装完
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
十种适合在家做的兼职排行榜，适合在家做的工作推荐！高省爱氧惠
“姐妹，我不想上班了，有没有什么副业给我推荐下”,昨天一个姐妹问到我这个话题。算起来，我已经自主创业4年了，这期间我做过服装工作室、自媒体、直播，一直都是看起来自由自在的状态。我在前面的文章说到我在工作中是个拉磨的驴，一天十几个小时沉浸在工作中都是常有的事，但这样拼尽全力，每个月到手才一万多。我不擅长处理职场那种复杂的人际关系，也无法在工作中给自己争取到相对公平的待遇，有很长一段时间，我在职场中的
时序数据库主流产品概览时序数据说时序数据库数据库物联网 iotdb 大数据
时序数据库(TimeSeriesDatabase,TSDB)是专为处理时间序列数据优化的数据库系统，近年来随着物联网(IoT)、金融科技、工业互联网等领域的快速发展而备受关注。本文将介绍当前主流的时序数据库产品。一、时序数据库概述时序数据是带时间戳记录的数据点序列，具有以下特点：数据时间属性强数据通常为追加写入近期数据访问频率高于历史数据数据量通常非常庞大，需要高效的压缩技术时序数据库针对这些特点
PD分离技术分析老兵发新帖人工智能
PD分离中的“PD”指的是大语言模型（LLM）推理过程中的两个核心阶段：Prefill（预填充）和Decode（解码）。这两个阶段在计算特性和资源需求上存在显著差异，分离部署可优化整体性能。以下是详细解析：一、PD的具体含义Prefill（预填充阶段）任务：处理用户输入的整个提示（Prompt），为所有Token生成初始的键值缓存（KVCache）和隐藏状态（HiddenStates）。特性：计算
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
合成孔径雷达干涉测量InSAR技术流程（星载/地基系统+DEM重建+DInSAR形变监测+时序分析）等 WangYan2022 遥感合成孔径雷达干涉测量 InSAR 形变信息提取地形三维重建
合成孔径雷达干涉测量（InterferometricSyntheticApertureRadar,InSAR）技术作为一种新兴的主动式微波遥感技术，凭借其可以穿过大气层，全天时、全天候获取监测目标的形变信息等特性，已在地表形变监测、DEM生成、滑坡、火山活动、冰川运动、人工建筑物形变信息提取等多种领域展开了成功应用。通过典型案例，熟练掌握InSAR数据处理（包括InSAR高程测量、DInSAR形变
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】迭代器和生成器的区别及其各自实现方式和使用场景 AnAn__kang python 机器学习开发语言
系列文章目录前言小伙伴们，今天我们将进入迭代器和生成器的使用，这俩个呢对我们处理信息的时候帮助是非常大的。对于我们的电脑将减轻负重，不至于内存的损耗过大。未来我们在训练模型处理数据时，会频繁的使用生成器。一，迭代器Iterator迭代器提供了一种惰性（lazyevaluation）获取数据的方法，使得我们能够逐步访问序列中的元素，而无需一次性加载所有数据。其主要优点包括节省内存、提高性能、支持自定
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
数据库和数据仓库区别 hhhecker Hadoop学习数据仓库数据库 hive
HIve与Mysql对比HiveMysql数据存储位置HDFS本地磁盘数据格式用户定义系统决定数据更新不支持（不支持修改和删除）支持（支持增删改查）索引有，但较弱，一般很少用有，经常使用的执行MapReduceExecutor执行延迟高低可扩展性高低数据规模大小数据库与数据仓库对比数据库：传统的关系型数据库主要应用在基本的事务处理，例如银行交易之类的场景数据库支持增删改查这些常见的操作。数据仓库：
草莓叶片病害识别与分类数据集 qq_38220914 分类数据挖掘人工智能
草莓作为一种重要的经济作物，在全球范围内广泛种植。然而，草莓生产过程中常常受到各种病害的困扰，其中叶片病害尤为严重。为了有效识别、检测和分类草莓叶片病害，构建一个高质量的数据集是至关重要的。本文介绍了一个针对草莓叶片病害识别检测与分类的数据集，该数据集涵盖了多种草莓叶片病害类型，包括白粉病、灰霉病、炭疽病、蛇眼病、叶斑病、黄萎病和根腐病。数据集构建过程中，采用了严格的图像采集、标注和预处理流程，确
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数