Jacob.Ge

基于pynq的数字识别神经网络加速器设计

文章目录

基于pynq的数字识别神经网络加速器设计
- 软件部分
- - 1. 全连接神经网络：
  - 2. 卷积神经网络搭建：
  - 3. 文件格式转换：
- 硬件部分
- - 1. MNIST的硬件实现思路
  - 2. 代码编写与硬件综合
  - 3. 硬件平台的搭建
- 软硬件协同部分
- - 1. 硬件驱动的编写：
  - 2. 功能代码编写：

基于pynq的数字识别神经网络加速器设计

本篇为笔者第一次进行神经网络加速器设计的工程开发流程，在此做如下整理。
python环境：python：3.6.13；tensorflow：1.14.0；numpy：1.16.0
硬件环境：vivado2019，vivado_hls2019，pynq-Z1（xc7z020clg400-1）

软件部分

1. 全连接神经网络：

本神经网络主要是进行图像识别，在人眼中图片是带有颜色的，而在电脑中图片的颜色则是使用0-1之间的灰度值表示，最为简单的黑白照片便是使用0表示白色，1表示黑色，中间值表示灰度。彩色图片则是采用红绿蓝（RGB）进行三通道混合表示。传统的数字识别思路为：对于图片中的每个像素点即矩阵中每个位置的点，对应于不同的分类结果（0-9）都一个支持率，之后将图像中对于每个分类的支持率全部加起来，支持率最高的分类就作为这张图片的识别结果，即 y = softmax(wx + b)。（其中softmax对计算结果进行归一化处理方便训练过程中的反向传播计算）
代码部分：

  	from tensorflow.examples.tutorials.mnist import input_data
  	mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
  	import tensorflow as tf
  	x = tf.placeholder(tf.float32, [None, 784])
  	W = tf.Variable(tf.zeros([784, 10]))
  	b = tf.Variable(tf.zeros([10]))
  	y = tf.nn.softmax(tf.matmul(x, W) + b)
  	y_ = tf.placeholder(tf.float32, [None, 10])
  	cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1]))
  	train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
  	sess = tf.InteractiveSession()
  	init = tf.global_variables_initializer()
  	sess.run(init)
  	for _ in range(1000):
  	    batch_xs, batch_ys = mnist.train.next_batch(100)
  	    sess.run(train_step, {x: batch_xs, y_: batch_ys})
  	#print(sess.run(tf.matmul(x, W) + b, {x: mnist.test.images}))
  	correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
  	accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
  	print(sess.run(accuracy, {x: mnist.test.images, y_: mnist.test.labels}))

2. 卷积神经网络搭建：

通过卷积和池化不断地对图片信息进行提取，最后在全连接中实现结果的输出。同时卷积神经网络考虑到具有一定的泛化能力（不同数据集上的准确度应该都较高），会加入dropout以防止过拟合，即会在神经网络的训练过程中随机地打开或关闭一些层。

此处为数据存储代码，进过训练以后的神经网络每一层的代码需要存储下来，方便后续硬件端进行计算，这里需要注意的是为了和后面硬件端C语言的函数读取方式一致，需要根据存储数据的维度进行分类，而不是简单读入。

		def Record_Tensor(tensor,name):
			print ("Recording tensor "+name+" ...")
			f = open('./record/'+name+'.dat', 'w')
			array=tensor.eval();
			#print ("The range: ["+str(np.min(array))+":"+str(np.max(array))+"]")
			if(np.size(np.shape(array))==1):
				Record_Array1D(array,name,f)
			else:
				if(np.size(np.shape(array))==2):
					Record_Array2D(array,name,f)
				else:
					if(np.size(np.shape(array))==3):
						Record_Array3D(array,name,f)
					else:
						Record_Array4D(array,name,f)
			f.close();
		
		def Record_Array1D(array,name,f):
			for i in range(np.shape(array)[0]):
				f.write(str(array[i])+"\n");
		
		def Record_Array2D(array,name,f):
			for i in range(np.shape(array)[0]):
				for j in range(np.shape(array)[1]):
					f.write(str(array[i][j])+"\n");
		
		def Record_Array3D(array,name,f):
			for i in range(np.shape(array)[0]):
				for j in range(np.shape(array)[1]):
					for k in range(np.shape(array)[2]):
						f.write(str(array[i][j][k])+"\n");
		
		def Record_Array4D(array,name,f):
			for i in range(np.shape(array)[0]):
				for j in range(np.shape(array)[1]):
					for k in range(np.shape(array)[2]):
						for l in range(np.shape(array)[3]):
							f.write(str(array[i][j][k][l])+"\n");

之后便是基于tensorflow语法进行神经网络搭建。

		def weight_variable(shape):
			initial = tf.compat.v1.truncated_normal(shape, stddev=0.1);
			return tf.Variable(initial)
		
		def bias_variable(shape):
			initial = tf.constant(0.1, shape=shape)
			return tf.Variable(initial)
		
		def conv2d(x, W):
			return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')
		
		def max_pool_2x2(x):
			return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2,1], padding='SAME')
		
		#First Convolutional Layer
		with tf.name_scope('1st_CNN'): 
			W_conv1 = weight_variable([3, 3, 1, 16])
			b_conv1 = bias_variable([16])
			x_image = tf.reshape(x, [-1,28,28,1])
			h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
			h_pool1 = max_pool_2x2(h_conv1)
		
		#Second Convolutional Layer
		with tf.name_scope('2rd_CNN'): 
			W_conv2 = weight_variable([3, 3, 16, 32])
			b_conv2 = bias_variable([32])
			h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
			h_pool2 = max_pool_2x2(h_conv2)
		
		#Densely Connected Layer
		with tf.name_scope('Densely_NN'): 
			W_fc1 = weight_variable([ 7* 7* 32, 128])
			b_fc1 = bias_variable([128])
			h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*32])
			h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat , W_fc1) + b_fc1)
		
		#Dropout
		with tf.name_scope('Dropout'):
			keep_prob = tf.placeholder("float")
			h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)
		
		#Readout Layer
		with tf.name_scope('Softmax'):
			W_fc2 = weight_variable([128, 10])
			b_fc2 = bias_variable([10])
			y_conv=tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)
		
		with tf.name_scope('Loss'):
			cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))
		
		with tf.name_scope('Train'):
			train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
		
		with tf.name_scope('Accuracy'):
			correct_prediction = tf.equal(tf.argmax(y_conv ,1), tf.argmax(y_,1))
			accuracy = tf.reduce_mean(tf.cast(correct_prediction , "float"))
		
		merged = tf.summary.merge_all()
		writer = tf.summary.FileWriter("logs/",sess.graph) 
		
		tf.initialize_all_variables().run()
		
		for i in range(10000):
			batch = mnist.train.next_batch(50);
			if i%20 == 0:
				train_accuracy = accuracy.eval(feed_dict={x:batch[0], y_: batch[1], keep_prob:1.0});
				print("step %d, training accuracy %g"%(i, train_accuracy));
			train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob:0.5});
		
		print("test accuracy %g"%accuracy.eval(feed_dict={x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))

3. 文件格式转换：

在神经网络中存储的.dat文件并不能被C直接读取，需要进行文件名的转换，此时可以采用如下所示的C代码，也可以使用python中自带的tofile函数实现。

		#include 
		#include 
		#include 
		
		char* filename_to_bin(char *filename_i)
		{
			int filename_length=0;
			while(filename_i[filename_length]!='\0') filename_length++;
			//printf("filename length=%d\n",filename_length);
			char *filename_bin=(char *)malloc(filename_length+1);
			int i=0;
			while(!(filename_i[i]=='.' && filename_i[i+1]=='d'&& filename_i[i+2]=='a' && filename_i[i+3]=='t' && filename_i[i+4]=='\0'))//not '.dat\0'
			{
				if(i==filename_length-1)
				{
					free(filename_bin);
					filename_bin=NULL;
					return filename_bin;
				}
				filename_bin[i]=filename_i[i];
				i++;
			}
			filename_bin[i]='.';filename_bin[i+1]='b';filename_bin[i+2]='i';filename_bin[i+3]='n';
			filename_bin[i+4]='\0';
			return filename_bin;
		}
		
		int main(int argc, char *argv[])
		{
			for(int i=1;i<argc;i++)
			{
				char *filename_i=argv[i];
				char *filename_bin=filename_to_bin(filename_i);
				if(filename_bin==NULL)
				{
					printf("%s is not a dat file\n",filename_i);
					break;
				}
		
				FILE *fp_IN;
				if((fp_IN=fopen(filename_i,"r"))==NULL) 
				{  
					printf("File %s cannot be opened/n",filename_i);   
					break;   
				}
		
				FILE* fp_OUT = fopen(filename_bin,"wb");
				if (fp_OUT == NULL) 
				{
					printf("File %s cannot be created/n",filename_bin);  
					break;
				}
		
				char str[20];
				while(fgets(str,20,fp_IN))
				{
					//printf("%s=%f\n",str,atof(str));
					float tp=atof(str);
					fwrite(&tp,sizeof(float),1,fp_OUT);
				};
		
				fclose(fp_IN);
				fflush(fp_OUT);
				fclose(fp_OUT);
				free(filename_bin);
			}
			return 0;
		}

硬件部分

上述神经网络具有较大的计算量，可以通过硬件端的并行化设计使其更为快速地执行。以下部分便是进行硬件端的代码编写。此处设计可以直接通过verilog进行编写，也可以通过hls进行编写，本工程中采用的为hls。

1. MNIST的硬件实现思路

第一种思路，采用类似于软件端编写函数的方式，将神经网络中的每一层通过函数的方式进行编写并最终实现整个网络，但是该种方法将导致硬件部分的通用性不足，同时硬件部分的执行效率不高，即并行度不高，第一层进行计算的时候后续层都不进行工作，并且对于较为复杂的网络（层数十层及以上的）设计起来将会非常麻烦，生成的电路也会较为臃肿。
第二种思路，提取网络总的特征层，例如该神经网络中主要是conv和pool（还有linear但是由于其为conv的一种特殊形式因此也归为conv），之后在硬件中设计可以通用的conv和pool电路，并采用CPU和存储器对其进行控制和数据存储，将极大地提高设计电路的通用性及其并行度。设计思路如下：
通过CPU对conv和pool进行控制，首先将要读取的图片存储到存储器中，之后CPU控制conv进行第一层卷积运算，并将计算结果存储到存储器中；该步完成后CPU按照神经网络设计控制pool读取上一次conv的计算结果，并将计算得到的结果再次存入存储器中；此后，只需重复上述步骤直至运算全部结束。

C语言实现conv和pool部分的思路：
conv部分：对于卷积部分而言，因为是要设计通用的电路，所以需要确定需要传入的参数，其中有win和hin分别表示输入图层的宽度和高度，x_stride和y_stride用来表示卷积核在X方向和Y方向移动的步幅，Cin和Cout则表示输入的通道数和输出的通道数，kx和ky用于表示卷积核的大小，wout和hout则用来表示输出图层的大小，由于可以算出所以不再进行赘述，除此之外还需要指定Conv是否需要进行padding，以及之后的relu运算，同时还需要必要的输入（其中w表示conv_core中的具体参数）和输出（如红框中所示）。Pool部分则与其基本相同。
注1：本次使用的网络较为简单同时采用的MINIST数据集也较小，所以并没有对数据进行量化操作。
注2：此处出现的ap_uint为hls中特定的数据类型使用时需要引用表示任意精度的整数数据类型，而此处的Dtype_f和Dtype_w则并非hls中固有的数据类型而是笔者typedef重新定义的名称，只是表示float而已

2. 代码编写与硬件综合

之后需要做的便是进行hsl编写。
conv部分的代码如下：

		#include "conv_core.h"
		
		//Feature: [H][W][C]
		//kernel: [Ky][Kx][CHin][CHout]
		
		void Conv(ap_uint<16> CHin,ap_uint<16> Hin,ap_uint<16> Win,ap_uint<16> CHout,
				ap_uint<8> Kx,ap_uint<8> Ky,ap_uint<8> Sx,ap_uint<8> Sy,ap_uint<1> mode,ap_uint<1> relu_en,
				Dtype_f feature_in[],Dtype_w W[],Dtype_w bias[],Dtype_f feature_out[]
			)//mode: 0:VALID, 1:SAME
		{
			ap_uint<8> pad_x,pad_y;
			if(mode==0)
			{
				pad_x=0;pad_y=0;
			}
			else
			{
				pad_x=(Kx-1)/2;pad_y=(Ky-1)/2;
			}
			ap_uint<16> Hout,Wout;
			Wout=(Win+2*pad_x-Kx)/Sx+1;
			Hout=(Hin+2*pad_y-Ky)/Sy+1;
		
			for(int cout=0;cout<CHout;cout++)
				for(int i=0;i<Hout;i++)
					for(int j=0;j<Wout;j++)
					{
						Dtype_acc sum=0;
						for(int ii=0;ii<Ky;ii++)
							for(int jj=0;jj<Kx;jj++)
							{
								ap_int<16> h=i*Sy-pad_y+ii;
								ap_int<16> w=j*Sx-pad_x+jj;
								if(h>=0 && w>=0 && h<Hin && w<Win)
								{
									for(int cin=0;cin<CHin;cin++)
									{
										Dtype_mul tp=feature_in[h*CHin*Win+w*CHin+cin]*W[ii*Kx*CHin*CHout+jj*CHin*CHout+cin*CHout+cout];
										sum+=tp;
									}
								}
							}
		
						sum+=bias[cout];
						if(relu_en & sum<0)
							sum=0;
						feature_out[i*Wout*CHout+j*CHout+cout]=sum;
					}
		}

pool部分的代码：

#include "pool_core.h"

#define max(a,b) ((a>b)?a:b)
#define min(a,b) ((a>b)?b:a)

void Pool(ap_uint<16> CHin,ap_uint<16> Hin,ap_uint<16> Win,
		ap_uint<8> Kx,ap_uint<8> Ky,ap_uint<2> mode,
		Dtype_f feature_in[],Dtype_f feature_out[]
	)//mode: 0:MEAN, 1:MIN, 2:MAX
{
	ap_uint<16> Hout,Wout;
	Wout=Win/Kx;
	Hout=Hin/Ky;

	for(int c=0;c<CHin;c++)
		for(int i=0;i<Hout;i++)
			for(int j=0;j<Wout;j++)
			{
				Dtype_f sum;
				if(mode==0)
					sum=0;
				else
					if(mode==1)
						sum=99999999999999999;
					else
						sum=-99999999999999999;
				for(int ii=0;ii<Ky;ii++)
					for(int jj=0;jj<Kx;jj++)
					{
						ap_int<16> h=i*Ky+ii;
						ap_int<16> w=j*Kx+jj;
						switch(mode)
						{
							case 0:{sum+=feature_in[h*CHin*Win+w*CHin+c];break;}
							case 1:{sum=min(sum,feature_in[h*CHin*Win+w*CHin+c]);break;}
							case 2:{sum=max(sum,feature_in[h*CHin*Win+w*CHin+c]);break;}
							default:break;
						}
					}
				if(mode==0)
					sum=sum/(Kx*Ky);
				feature_out[i*Wout*CHin+j*CHin+c]=sum;
			}
}

此时其实可以直接综合，vivado_hls将根据已有的代码生成电路，不过该电路是由vivado_hls自己生成因此性能上可能并不能达到预期效果，此时便需要添加约束；
以下代码将以一个简单的4x4矩阵为例展示如何给已有的C语言代码添加约束：

打开Directive界面：因为vivado_hls的界面是按照上一次默认的情况打开的，所以一些用户的界面打开后可能并不会直接出现Drictive的界面，此时便需要在window中点击show view便可以打开Directive界面。
将for循环展开：此处的显示为linux系统中的小bug程序界面随着系统界面颜色改变，导致显示字符出错，不过并不影响我们的操作，此时我们在Directive框中选择UNROLL表示将for循环展开，Destination中选择source文件（表示约束将直接添加到原文件中）。

此时对比之前综合结果发现，所用资源变少，电路的性能提高（上图为原来结果，下图为添加约束后的结果）。

在此之后，根据一般思维便会认为如果把三重循环全部展开，电路的运算速度将变得更快，但是经过笔者尝试发现电路综合后的结果变化并不大并不会出现之前发生的巨大变化。此时，根据硬件设计的思路分析便可以知道，限制电路运行速度的并不仅是电路的运算速度，还有数据的传输速度，此处并没有改变电路的传输速度只是一味的增加数据的运算速度电路的整体速度并不会有太大提升。
对函数参数进行约束（约束电路的输入输出端口）Directive选择ARRAY_RESHAPE维度上选择dim = 1（A,C同理）。

但是此时会发现一个更为神奇的现象便是，电路的性能优化仍然不高：

此时便需要考虑到一个更为重要的问题便是solution中我们添加的时钟周期制约。

观察此处可以发现clock采用的默认值10，电路中的延迟将导致电路无法在如此高的频率下按照理论上的结果单周期完成（因此此时实际上已将将三重for循环和所有的输入全部展开，理论上应该是变成了一个组合逻辑电路可以单周期完成）。因此修改此处的值，将其变为更大的值1000在进行仿真。此时可以发现电路速率按照理论减少了近乎100倍，如果再增大时钟周期便可以达到理论上的单周期电路。
函数名约束（较为重要）
下图为不添加约束时，生成的结果在该结果中电路由一个ap_start和ap_done信号控制其开始和结束，ap_idle和ap_ready表示电路的工作状态，ap_clk和ap_rst表示电路的控制时钟和复位信号。电路以这样的方式被控制。（此时并不是完全不能被CPU控制，而是可以采用GPIO对电路进行控制，此方法并不推荐）。
但是根据我们之前的设计思路，我们希望的是电路被CPU所控制，因此需要采用AXI总线控制。

具体的操作流程如下：Directive选择INTERFACE，Options选择s_axilite表示生成电路收到CPU驱动。

此时电路的综合结果为：如需了解AXI总线的具体协议可查看相关资料。

此处除了对函数名进行约束以外，因为要将AXI总线接到CPU上，还需要对函数的参数也就是电路的输入输出结果进行约束。具体操作如下图所示：（此处自己尝试是出现了一个较为神奇的bug，选择m_axi时会报错，但是选择s_axi时并不会报错，但此处正确情况下应该是按照下图所示选择,同时如果采用手动代码输入也不会报错）。

此时综合得出的AXI不仅包含s_axi也包含m_axi。
1. 进过如上操作后的代码：其中因为A,B,C分别对应于总线接口，所以采用m_axi，主要是这些需要其主动地去读入或者写入数据。（对于conv和pool而言，还需要加入depth参数这个参数对于电路并不会产生任何影响给一个较大的值即可，表示为HLS INTERFACE m_axi depth=4759000 port=C）

		void Matrix_mult(float A[4][4],float B[4][4],float C[4][4]){
		#pragma HLS INTERFACE s_axilite port=return
		#pragma HLS INTERFACE m_axi port=C
		#pragma HLS INTERFACE m_axi port=B
		#pragma HLS INTERFACE m_axi port=A
			#pragma HLS INTERFACE s_axilite port=return
			for(int i=0;i<4;i++){
				#pragma HLS UNROLL
				for(int j=0;j<4;j++)
				{
					#pragma HLS UNROLL
					double temp;
					for(int k=0;k<4;k++)
					{
						#pragma HLS UNROLL
						temp += A[i][k]*B[k][i];
					}
					C[i][j] = temp;
				}
			}
		};

conv部分的约束

3. 硬件平台的搭建

生成ip核操作如下：点击橙色十字便会可进行ip核的生成，此时要注意的是进入2022年以后vivado_hls产生一个bug,需要将系统时钟调到小于或者等于2021年才可以成功生成ip核。否则将出现如下图所示的bug;
新建工程后点击Creat Block Design，之后按照下图导入RAM部分，之后点击run block automatic，此时将自动生成DDR接口。并按照下图进行连线，此时可以点击工作台上方的√查看设计是否有问题。
添加之前写入到ip，不同版本的vivado操作并不一致，此处采用2019.1版本的界面进行介绍。
点击setting，点击IP>Repository将之前得到的IP核路径添加进去。
之后需要做的就是通过==+进行ip核的添加即可。

之后需要做的便是点击run block automatic==，将conv和pool的slave端接到ram上。

此时已经完成了conv和pool被控制端口的连接，但是还需要将master接口连接到ram上，此时双击ram，便会弹出如下框图：此时可以选择一个（HP0）也可以选择两个（HP0和HP1）。
注：这一步不能和之前slave端口链接一样通过run block automatic自动完成，因为ram的slave端口是不显示，需要自己手动调节显示。
点击工作台上的√，验证电路是否有误。如显示结果正确则完成电路连接，如下图所示：
生成可以传输到板子的比特流文件：点击Source->Desing_1->Create HDL Wrapper;之后再点击Desing_1->Generate Output Products-> ；最后点击Generate Bitstream便可以生成比特流文件了。（注意该比特流文件存储的位置，位于base->base.runs->impl_1，此处使用的是笔者电脑上的文件命名）同时还需要点击file->export->export block design，生成一个.tcl结尾的文件，之后还需要将这两个文件拷入（此时.tcl和.bit文件都需要拥有同样的命名）到pynq开发板上，如果可以通过网线连接就可以通过网线传输；如果不能通过网线传输就可以采用SD卡进行传输。

软硬件协同部分

此处需要基本的pynq-z1的开发知识，如果不了解可以查看官方文档。

1. 硬件驱动的编写：

pynq的硬件驱动可以由python编写，对于没有任何pynq开发经验的人而言可以先试着调用官方ip进行LED灯点亮来进行熟悉，代码如下：

from pynq import Overlay
import numpy as np
ol = Overlay("testAAA.bit")
# ol.ip_dict 可以用查询导入电路中用到的ip核
ol.download()
gpio = ol.axi_gpio_0
gpio.write(0,15)
gpio.write(0,4)
# 神经网络中设计大量的数组运算，但是虚拟空间连续的数组地址，在真实的物理空间并不一定是连续的，
# 所以这里需要通过Xlnk，来创建数组，xlnk对于pynq就类似于numpy之于python。
from pynq import Xlnk
xlnk = Xlnk()
input_buffer=xlnk.cma_array(shape=(4000,),cacheable=0,dtype=np.int32);
# 通过这种方式在物理空间里开出来的数组地址都是连续的,cacheable表示缓冲也就是说对硬件写数据是否直接写入到ram中。
input_buffer.physical_address

熟悉了基本的pynq-ip调用过程以后就可以进行CPU驱动程序的开发了。
其实经过hls生成ip之后也会相应的生成一份硬件驱动，保存在以下目录中Documents/frb/source2/PYNQ/hls/pool_core/solution1/impl/ip/drivers/Pool_v1_0/src$ （同样这里是以笔者的文件为例）。但是这份驱动对于我们而言并不是十分适用，主要原因在于这份驱动文件是由C语言编写而成，而我们需要的则是一份python版本的代码，因此需要自己根据C语言生成的文件进行转义变成python文件。
以下展示pool部分的驱动头文件：

#ifndef __linux__
#include "xil_types.h"
#include "xil_assert.h"
#include "xstatus.h"
#include "xil_io.h"
#else
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#endif
#include "xpool_hw.h"

/**************************** Type Definitions ******************************/
#ifdef __linux__
typedef uint8_t u8;
typedef uint16_t u16;
typedef uint32_t u32;
#else
typedef struct {
    u16 DeviceId;
    u32 Axilites_BaseAddress;
} XPool_Config;
#endif

typedef struct {
    u32 Axilites_BaseAddress;
    u32 IsReady;
} XPool;

/***************** Macros (Inline Functions) Definitions *********************/
#ifndef __linux__
#define XPool_WriteReg(BaseAddress, RegOffset, Data) \
    Xil_Out32((BaseAddress) + (RegOffset), (u32)(Data))
#define XPool_ReadReg(BaseAddress, RegOffset) \
    Xil_In32((BaseAddress) + (RegOffset))
#else
#define XPool_WriteReg(BaseAddress, RegOffset, Data) \
    *(volatile u32*)((BaseAddress) + (RegOffset)) = (u32)(Data)
#define XPool_ReadReg(BaseAddress, RegOffset) \
    *(volatile u32*)((BaseAddress) + (RegOffset))

#define Xil_AssertVoid(expr)    assert(expr)
#define Xil_AssertNonvoid(expr) assert(expr)

#define XST_SUCCESS             0
#define XST_DEVICE_NOT_FOUND    2
#define XST_OPEN_DEVICE_FAILED  3
#define XIL_COMPONENT_IS_READY  1
#endif

/************************** Function Prototypes *****************************/
#ifndef __linux__
int XPool_Initialize(XPool *InstancePtr, u16 DeviceId);
XPool_Config* XPool_LookupConfig(u16 DeviceId);
int XPool_CfgInitialize(XPool *InstancePtr, XPool_Config *ConfigPtr);
#else
int XPool_Initialize(XPool *InstancePtr, const char* InstanceName);
int XPool_Release(XPool *InstancePtr);
#endif
//控制电路的开关
void XPool_Start(XPool *InstancePtr);
u32 XPool_IsDone(XPool *InstancePtr);
u32 XPool_IsIdle(XPool *InstancePtr);
u32 XPool_IsReady(XPool *InstancePtr);
void XPool_EnableAutoRestart(XPool *InstancePtr);
void XPool_DisableAutoRestart(XPool *InstancePtr);
//这部分都是set和get对应用于数据的读写
void XPool_Set_CHin_V(XPool *InstancePtr, u32 Data);
u32 XPool_Get_CHin_V(XPool *InstancePtr);
void XPool_Set_Hin_V(XPool *InstancePtr, u32 Data);
u32 XPool_Get_Hin_V(XPool *InstancePtr);
void XPool_Set_Win_V(XPool *InstancePtr, u32 Data);
u32 XPool_Get_Win_V(XPool *InstancePtr);
void XPool_Set_Kx_V(XPool *InstancePtr, u32 Data);
u32 XPool_Get_Kx_V(XPool *InstancePtr);
void XPool_Set_Ky_V(XPool *InstancePtr, u32 Data);
u32 XPool_Get_Ky_V(XPool *InstancePtr);
void XPool_Set_mode_V(XPool *InstancePtr, u32 Data);
u32 XPool_Get_mode_V(XPool *InstancePtr);
//这里主要是用于告诉硬件从哪里读取输入图层的基地址，并将运算好的结果存储到哪里。
//这里的基地址可以通过array.physical_address进行读取
void XPool_Set_feature_in(XPool *InstancePtr, u32 Data);
u32 XPool_Get_feature_in(XPool *InstancePtr);
void XPool_Set_feature_out(XPool *InstancePtr, u32 Data);
u32 XPool_Get_feature_out(XPool *InstancePtr);

void XPool_InterruptGlobalEnable(XPool *InstancePtr);
void XPool_InterruptGlobalDisable(XPool *InstancePtr);
void XPool_InterruptEnable(XPool *InstancePtr, u32 Mask);
void XPool_InterruptDisable(XPool *InstancePtr, u32 Mask);
void XPool_InterruptClear(XPool *InstancePtr, u32 Mask);
u32 XPool_InterruptGetEnabled(XPool *InstancePtr);
u32 XPool_InterruptGetStatus(XPool *InstancePtr);

#ifdef __cplusplus
}
#endif

#endif

以上展示的主要是头文件，但是实际要转义的文件为xpool_hw.h里，主要代码如下所示：
此处告知pool中的各个参数分别存储在哪些寄存器中。

#define XPOOL_AXILITES_ADDR_AP_CTRL          0x00
#define XPOOL_AXILITES_ADDR_GIE              0x04
#define XPOOL_AXILITES_ADDR_IER              0x08
#define XPOOL_AXILITES_ADDR_ISR              0x0c
#define XPOOL_AXILITES_ADDR_CHIN_V_DATA      0x10
#define XPOOL_AXILITES_BITS_CHIN_V_DATA      16
#define XPOOL_AXILITES_ADDR_HIN_V_DATA       0x18
#define XPOOL_AXILITES_BITS_HIN_V_DATA       16
#define XPOOL_AXILITES_ADDR_WIN_V_DATA       0x20
#define XPOOL_AXILITES_BITS_WIN_V_DATA       16
#define XPOOL_AXILITES_ADDR_KX_V_DATA        0x28
#define XPOOL_AXILITES_BITS_KX_V_DATA        8
#define XPOOL_AXILITES_ADDR_KY_V_DATA        0x30
#define XPOOL_AXILITES_BITS_KY_V_DATA        8
#define XPOOL_AXILITES_ADDR_MODE_V_DATA      0x38
#define XPOOL_AXILITES_BITS_MODE_V_DATA      2
#define XPOOL_AXILITES_ADDR_FEATURE_IN_DATA  0x40
#define XPOOL_AXILITES_BITS_FEATURE_IN_DATA  32
#define XPOOL_AXILITES_ADDR_FEATURE_OUT_DATA 0x48
#define XPOOL_AXILITES_BITS_FEATURE_OUT_DATA 32

转义的python代码：
注：这一部分还需要参看xpool.c文件，查看原C语言中的函数是如何进行读写操作的

def RunPool(pool,Kx,Ky,mode,feature_in,feature_out):
	#这里[0],[1]分别表示图层大小，[2]表示channel数；
    pool.write(0x10,feature_in.shape[2]);
    pool.write(0x18,feature_in.shape[0]);
    pool.write(0x20,feature_in.shape[1]);
    pool.write(0x28,Kx);
    pool.write(0x30,Ky);
    pool.write(0x38,mode);
    pool.write(0x40,feature_in.physical_address);
    pool.write(0x48,feature_out.physical_address);
    pool.write(0, (pool.read(0)&0x80)|0x01 );

之后就可以在pynq开发板上运行编写好的驱动文件，显示效果如下：
注：运行是需要采用root账户

2. 功能代码编写：

此时便只剩下最后一步，即根据Lenet-5模型编写python代码，并调用之前已经编写的pool和conv部分代码，搭建最后的功能电路。并将之前几页tensorflow搭建的网络的训练参数导入。
演示效果如下：

如上图所示是一张数字2；
之后运行编写好的代码：可以正确识别出数字2，至此工程全部结束。

你可能感兴趣的:(神经网络,tensorflow,python,fpga开发)

第一章什么是JavaScript Sheldon一蓑烟雨任平生开发语言 JavaScript JavaScript基础 ECMAScript 什么是JavaScript
第一章什么是JavaScript1.历史梗概2.JavaScript的实现（ECMAScript、DOM、BOM）2.1ECMAScript2.2DOM（文档对象模型）2.3BOM（浏览器对象模型，在第12章会有详细介绍）3.支持（所有浏览器基本都支持ES5）1.历史梗概（1）初始目的：代替服务器语言，作为脚本语言，在客户端处理输入验证，判断输入值是否填写及其有效性；（2）开发时间：1995年；（
LoongArch32 指令集探索学习1：初入龙芯星林湖月龙芯学习
1.1.发现问题1.1.LoongArch是个啥？龙芯这个名字一听就是咱这龙的传人该用的东西，这是从MIPS指令集中新设计的指令集，官方名字叫LoongArch，简称LA。这个指令集分为开放的LoongArch32精简版和LoongArch64，前者的32位指令集全部开源，后者64位只开放基础指令集，高级部分的二进制翻译暂且没有详细文档，而是由开发者在对GCC、Linux等基础软件贡献中露出。为何
Spring 事务与 MySQL 事务：深度解析与实战指南一叶飘零_sweeeet 果酱紫 spring mysql spring mysql java
一、引言在企业级应用开发中，事务处理是确保数据一致性和完整性的关键环节。Spring框架作为广泛应用的Java开发框架，提供了强大的事务管理功能。而MySQL作为流行的关系型数据库，也具备完善的事务支持。本文将深入探讨Spring事务与MySQL事务的原理、特性、使用方法以及在实际项目中的应用，帮助开发者更好地理解和运用事务处理机制，确保应用的可靠性和数据的准确性。二、事务的基本概念（一）什么是事
python第六次课----异常处理心之所向，随风依旧 python
1.异常简介异常即非正常状态，在Python中使用异常对象来表示异常。若程序在编译或运行过程中发生错误，程序的执行过程就会发生改变，抛出异常对象，程序流进入异常处理。如果异常对象没有被处理或捕捉，程序就会执行回溯(Traceback)来终止程序。异常信息：异常类型：异常类型异常消息NameError: name'num'isnotdefined.Didyoumean:'sum'?FileN
javascrip基础语法大道戏前端前端 javascript 开发语言
为什么学习JavaScript?JavaScript是web开发人员必须学习的3门语言中的一门：HTML定义了网页的内容CSS描述了网页的布局JavaScript控制了网页的行为1.JavaScript输出1.1console.log()：用于将信息输出到浏览器控制台，例如console.log("Hello,World!");，可以输出字符串、变量、表达式等。1.2console.error()
python 抽象类学python的土豆 python 开发语言
1.基本概念抽象类，顾名思义，是包含抽象方法（即没有具体实现的方法）的类。这些抽象方法必须在子类中得以具体实现。Python通过abc（AbstractBaseClasses）模块提供了对抽象类的支持。在Python3中，我们通常会从abc.ABC类继承来创建一个抽象类，并使用@abc.abstractmethod装饰器来标记抽象方法。2.定义抽象类fromabcimportABC,abstrac
python中的时间模块--datetime模块、time模块学python的土豆 python 开发语言
python中的时间模块一.datetime模块二.time模块一.datetime模块引入时间模块fromdatetimeimportdatetime获取当前时间print(datetime.today())#前的日期和时间print(datetime.now())#当前的日期和时间print(datetime.now().year)#当前的年份print(datetime.now().mont
python 函数基础学python的土豆 python 开发语言
python函数基础1.函数的目的2.函数的定义3.函数的声明与调用4.函数的形参与实参5.函数的返回值6.函数的参数类型6.1位置参数：6.2关键字参数：6.3默认参数：6.4可变参数：7.匿名函数8.函数的进阶应用在编程的世界里，函数是构建程序大厦的基石。Python作为一种高级编程语言，提供了强大且灵活的函数定义和调用机制。本文将对python函数基础的相关知识进行讲解。1.函数的目的函
python 函数进阶（迭代器和生成器）学python的土豆 python 开发语言
python函数进阶（迭代器和生成器）1.迭代器1.1迭代器的定义1.2迭代器的使用2.生成器2.1生成器的定义2.2生成器的优势2.3生成器的应用总结在Python的编程世界里，迭代器与生成器是两个很重要的概念，它们不仅简化了数据遍历与处理的过程，还极大地提升了代码的可读性与执行效率。这篇文章就来深入了解一下Python中的迭代器与生成器1.迭代器迭代器是Python中处理序列数据的一种重要方式
python的异常处理--异常引入，异常处理，常见异常，断言，自定义异常学python的土豆 python
python的异常处理一.异常引入二.异常处理三.常见异常四.断言五.自定义异常一.异常引入异常概念:程序在运行过程中发生不可预知的错误，程序员很难堵住所有的漏洞，就需要异常处理二.异常处理异常处理:捕获异常:try-except-else-finally将可能发生异常的代码，放入try-except中else：当代码没有异常就会执行else,如果代码块中有return，else将不执行final
Python+Selenium环境搭建程序媛_ Selenium Python python selenium pycharm
文章目录1安装Python1.1下载1.2安装注意事项1.3验证环境2安装PyCharm2.1下载PyCharm社区版2.2安装注意事项3安装浏览器及驱动3.1下载Chrome浏览器3.2下载Chromedriver3.3关闭浏览器自动更新关闭3.4配置Chromdriver4安装Selenium5调试6异常解决7自动化Edge浏览器1安装Python1.1下载下载网址:https://www.p
Tiff文件解析和PackBits解压缩 vcshcn ui Tiff PackBits
实现了Tiff图片文件格式的解析，对Tiff文件中的PackBits压缩格式进行解压缩，对Tiff文件中每一个Frame转换成BufferedImage显示。Java语言实现，Eclipse下开发，AWT显示图片。publicstaticTIFFParse(finalbyte[]bytes)throwsIllegalAccessException{BinaryBufferis=newBinaryB
C++计算精解【21】 sakura_sea 游戏引擎与高性能计算 c++开发语言
文章目录动手做汇编解释器【4】COCO/R概述变量赋值的ATG生成的代码框架参考文献动手做汇编解释器【4】COCO/R概述Coco/R是一个用于构造词法分析器（LexicalAnalyzers）和语法分析器（SyntaxAnalyzers）的开源工具。它是基于LALR(1)解析技术的，广泛用于编译器设计和软件开发中的语法分析阶段。https://ssw.jku.at/Research/Projec
DAMA-CDGA 练习题 - 第13章数据质量 Jerry76^.^ DAMA 大数据数据仓库数据库架构
1、为确保满足数据消费者的需求，下列关于数据质量的目标描述正确的是？(知识点:第十三章数据质量)A.开发一种让数据符合用途的管理方法B.定义数据质量控制的标准、要求和规范C.识别和提倡提高数据质量的机会D.所有描述都正确参考答案:D题目解析:语境关系图2、数据质量维度是数据的某个可测量的特性，以下哪项不属于客观衡量的特征？(知识点:第十三章数据质量)A.完整性B.可靠性C.有效性D.一致性参考答案
【unstructured】针对unstructured的pdf提取的hi_res策略不能够连接huggingface.co下载模型的问题而选择本地化模型推理部署的方法 phillihp llm python 深度学习 pdf llama langchain
目录unstructuredpdfhi_res策略本地推理部署说明python3.9虚拟环境准备安装miniconda创建一个conda-env环境安装unstructured背景知识安装步骤安装detectron2背景知识安装detectron2及其依赖torch，torchvision和torchaudio部署模型背景知识hi_res策略三种模型本地推理部署layoutmodel(detect
数据资产管理实践白皮书（6.0版）解读 BuckData 数据资产管理实战课程大数据数据资产数据标准数据质量
目录第一章数据资产管理概述(一)数据资产管理和数据要素的关系(二)数据资产与企业数字化转型的关系(三)数据资产管理架构和数据权属第二章数据资产管理活动职能(重点章节)(一)数据模型管理(二)数据标准管理(三)数据质量管理(四)主数据管理(五)数据安全管理(六)元数据管理(七)数据开发管理(八)数据资产流通(九)数据价值评估(十)数据资产运营第三章数据资产管理保障措施（重点章节）(一)战略管理(二)
Python-处理非结构化数据 cunzai1985 python 大数据 linux 人工智能 java
Python-处理非结构化数据(Python-ProcessingUnstructuredData)Thedatathatisalreadypresentinarowandcolumnformatorwhichcanbeeasilyconvertedtorowsandcolumnssothatlateritcanfitnicelyintoadatabaseisknownasstructuredda
[利用Python加载和处理网址内容：从Unstructured到Selenium和Playwright] bhawfgrcbtwny python selenium 开发语言
引言在现代网页数据分析中，加载和处理来自多种网址的内容是一个常见需求。无论是数据挖掘还是网页内容分析，我们常常需要从多个网页中提取HTML文档。本篇文章将介绍如何利用Python中的Unstructured、Selenium和Playwright库来加载这些网页内容，并将其转换为适合后续处理的文档格式。主要内容UnstructuredURLLoaderUnstructuredURLLoader可以
Python unstructured库详解：partition_pdf函数完整参数深度解析 engchina LINUX python pdf 1024程序员节 Unstructured partition_pdf
Pythonunstructured库详解：partition_pdf函数完整参数深度解析1.简介2.基础文件处理参数2.1文件输入参数2.2页面处理参数3.文档解析策略3.1strategy参数详解3.2策略选择建议4.表格处理参数4.1表格结构推断5.语言处理参数5.1语言设置6.图像处理参数6.1图像提取配置6.2图像提取优化7.表单处理参数7.1表单提取配置7.2表单处理场景8.元数据参数
科技早报｜余承东宣布纯血鸿蒙冲刺商用；小米副董事长林斌回应减持股票 | 最新快讯最新科技快讯科技 harmonyos 华为
余承东宣布纯血鸿蒙冲刺商用，5000头部应用已加入鸿蒙生态6月21日，在华为开发者大会2024上，余承东宣布，鸿蒙原生应用已进入全面冲刺阶段。截止目前，5000个头部应用已加入鸿蒙生态，超过1500个应用已完成上架。此外，华为宣布鸿蒙NEXT首次将AI能力融入系统，带来AIGC图像生成、AIGC声音修复、AI图像识别等功能，这也是华为首次纤细介绍其手机端测大模型应用。OpenAI宣布收购Rocks
JavaScript常见事件和修饰符山禾女鬼001 javascript 开发语言 ecmascript
JavaScript作为Web开发的重要语言，处理事件的机制是其中最常见且最重要的部分之一。通过事件，我们可以让用户与页面进行交互，创造出更丰富、更动态的用户体验。在JavaScript中，事件不仅有种类繁多，还可以通过修饰符来进一步控制它们的行为。1.常见的JavaScript事件JavaScript中的事件主要是指浏览器对用户行为的响应。常见的事件包括但不限于以下几类：1.1鼠标事件click
华为余承东鸿蒙系统随时可以上线,华为发布鸿蒙系统，余承东称随时可替换安卓... 温列来华为余承东鸿蒙系统随时可以上线
8月9日，在2019华为全球开发者大会上，备受用户关注的鸿蒙系统正式亮相。鸿蒙有四大特点：分布架构、天生流畅、内核安全、生态共享。华为消费者业务CEO余承东在发布会现场表示，这是基于微内核的全场景分布式OS系统，这也是世界第一个基于微内核的OS。得益于微内核架构，鸿蒙OS可以灵活适配全场景丰富终端形态，涵盖了GB级别、MB级别、KB级别的设备终端。在华为看来，目前在国际上众多巨头企业致力于发展新O
tensorflow和python不兼容_tensorflow与numpy的版本兼容性问题的解决 li旭旭
tensorflow与numpy的版本兼容性问题的解决,版本,站长站,错误,文章,较高tensorflow与numpy的版本兼容性问题的解决易采站长站，站长之家为您整理了tensorflow与numpy的版本兼容性问题的解决的相关内容。在Python交互式窗口导入tensorflow出现了下面的错误：root@ubuntu:~#python3Python3.6.8(default,Oct72019
自然语言编程：用 Cursor 将需求转化为代码 drebander AI 编程 Cursor
引言在传统编程中，开发者需要精确掌握语法规则、API接口和框架特性才能实现功能需求。然而，随着人工智能技术的发展，以自然语言交互为核心的编程方式正在颠覆这一流程。Cursor作为一款智能编程助手，通过其自然语言编程功能，允许开发者直接通过文本描述生成代码，将模糊的需求快速转化为可执行的程序。本文将深入探讨Cursor的自然语言交互能力，并通过实际案例（如生成React组件、Python脚本等），展
大学生HTML期末大作业——HTML+CSS+JavaScript美食网站（西餐）无·糖 Web前端期末大作业 html 课程设计 css 大学生 javascript 美食大作业
HTML+CSS+JS【美食网站】网页设计期末课程大作业web前端开发技术web课程设计网页规划与设计文章目录一、网站题目二、网站描述三、网站介绍四、网站效果五、️网站代码六、️‍如何学习进步七、‍☠️更多干货文章目录一、网站题目美食网站（西餐）精美响应式含JQuery7页二、网站描述总结了一些学生网页制作的经验：一般的网页需要融入以下知识点：div+css布局、浮动、定位、高级css、表格、表单
(04)python-opencv图像处理——图像阈值、平滑图像、形态转换、图像梯度欲游山河十万里 #opencv-python #深度学习 #人工智能 python opencv 图像处理
目录前言一、图像阈值1.1简单的阈值法1.2自适应阈值二、平滑图像2.1二维卷积(图像滤波)2.2图像模糊2.2.1均值模糊2.2.2高斯模糊2.2.3中值滤波2.2.4双边滤波三、形态转换1、腐蚀2、膨胀3、开运算4、闭运算四、图像梯度Sobel和Scharr微分参考文前言在本博文中，进行图像阈值、平滑图像、形态转换、图像梯度的学习以及介绍。一、图像阈值在本部分中，你会学到简单阈值法，自适应阈值
GEE python——gee_pyccd基于连续监测变化检测（Continuous Change Detection and Classification, CCDC）此星光明 GEE-PYTHON python 开发语言 gee ccdc 变化检测 py 连续性
目录简介gee_pyccdPyCCDCCDC算法代码1代码2结果简介gee_pyccd协调在GoogleEarthEngine数据上使用PyCCD的脚本。此存储库与Google或USGS没有正式关联。gee_pyccd是一个基于GoogleEarthEngine平台的Python库，用于对遥感时间序列数据进行变化检测和趋势分析。它实现了基于连续监测变化检测（ContinuousChangeDete
大学生期末大作业|HTML+CSS+JavaScript 登录页面实例：超实用、新手友好、完整源码分享从零开始：用原生 HTML、CSS 和 JS 打造简洁美观的登录页面（附完整代码）新手必看：一南北极之间前端进阶练手实战 html css 大学生期末大作业前端 html5 javascript
效果图：目录一、新建一个HTML项目二、创建基本结构三、使用CSS美化页面四、添加交互功能五、完整代码六、结语步骤在Web开发中，登录页面是常见且重要的组件。一个设计良好的登录页面可以提升用户体验，并为网站留下良好的第一印象。今天，我们将一起学习如何使用HTML、CSS和JavaScript（不使用任何框架）来构建一个响应式的登录页面，实现基本的前端验证功能。一、新建一个HTML项目首先，创建一个
如何在Java中调用Python 梦想画家 #python java8~9核心功能 java python jython
Python语言有丰富的系统管理、数据处理、统计类软件包，因此从java应用中调用Python代码的需求很常见、实用。DataX是阿里开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。Datax也是通过Java调用Python脚本。本文介绍几种方法从java调用Py
模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型实现男女分类 CV视界模式识别机器学习与图像处理机器学习 python 人工智能
模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型和pazen窗方法实现男女分类欢迎大家来到安静到无声的《模式识别与人工智能（程序与算法）》，如果对所写内容感兴趣请看模式识别与人工智能（程序与算法）系列讲解-总目录，同时这也可以作为大家学习的参考。欢迎订阅，优惠价只需9.9元，请多多支持！目录标题模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型和paz
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多