lsec小陆

FFT的并行实现

关键词：快速傅里叶变换高维FFT 并行计算

快速傅里叶变换简介

离散傅里叶变换

离散傅里叶变换（DFT）一般定义为： $F_n \equiv \sum_{k=0}^{N-1}f_ke^{-2\pi ink/N}$
离散傅里叶逆变换可以定义为： $f_k = \frac{1}{N} \sum_{k=0}^{N-1}F_ne^{-2\pi ink/N}$
这里 $e$ 头上的符号不管放在正变换那还是负变换那里都是没有关系的。正负变换前面的系数是什么也都不打紧，只要乘积为 $\frac{1}{N}$ 即可。

按矩阵呈向量的观点来看，简单地说，DFT就是把一个 $N$ 长的向量，通过乘以一个 $\times N$ 的矩阵，变成 $M$ 长的向量（一般情况下 $M = N$ ）。重要的是，这个变换矩阵是什么呢？其实它是一个范德蒙德矩阵，所以DFT其实就可以写为如图所示。

那么这个 $\omega_0,\omega_1...\omega_{M-1}$ 是个什么玩意儿呢？它其实就是复单位圆周上的M个等分点位置。如图所示。

一言以蔽之，要将一个N长的向量变成M长的向量，将复平面的上单元圆分成M分，取第1个等分点，乘方出来N个数，和原来的N长向量做內积，得到傅里叶变换出来的第1个数，依次类推，每个等分点都能出来一个数，那么M个等分点就能出来M个数。

我想到这，我应该把离散傅里叶变换将清楚了。非要用公式来表达的话，同前所写，不过我这里用了不同的符号，如下：

$\hat u_k = \sum\limits_{j=0}^{N-1}{e^{i\frac{2\pi k}{M}\cdot j}\cdot u_j},j=1,2,...,N$

上面提到的都是一维的傅里叶变换，二维傅里叶变换其实就是在两个维度上分别做傅里叶变换。

快速傅里叶变换

在实际计算中，人们不直接采用上述离散傅里叶变换的定义式进行计算，而是使用快速傅里叶变换（Fast Fourier Transform），我们可以简单地先把快速傅里叶变换认为是一种做离散傅里叶变换的快速算法。

快速傅里叶变换被誉为二十世纪最伟大的算法之一。所谓的快速傅里叶变换（Fast Fourier Transform，简称FFT），不过是求解离散傅里叶变换的一个快速算法。它将原本计算量为 $O(N^2)$ 的DFT求和公式，降为了 $\text{log} N)$ 。
但是，为了获得较高的运算速度，待变换序列的元素数量必须是 $2^n$ 形式个。

由上述可知，所谓的DFT，不过是一个以输入向量为系数的多项式，在复单位圆周上取不同等分点得到的值。即寻求 $\omega_i，i=0,1,2,...,n-1$ 在如下多项式上的取值：
$a_0 + a_1(x)+\dots+a_{n-1}x^{n-1}$

那么FFT的精髓就可以写为如下三步：

将多项式按奇偶分为两部分， $p(x) = p_2(x^2)+xp_1(x^2)$ ，这里
$\begin{aligned} p_2(x) &=& a_0 + a_2(x) + a_4(x^2)+\dots a_{n-2}x^{n/2-1} \\ p_1(x) &=& a_1 + a_3x + a_5x^2+\dots + a_{n-1}x^{n/2-1} \end{aligned}$
从上所述，那么，问题就变为了求点 $(\omega_0)^2,(\omega_1)^2\dots(\omega_{n-1})^2$ 在 $p_1(x)$
和 $p_2(x)$ 上的取值。容易看到求 $(\omega_0)^2,(\omega_1)^2\dots(\omega_{n/2-1})^2$
（即 $(\omega_{n/2+1})^2,(\omega_{n/2+2})^2\dots(\omega_{n-1})^2$ ）是两个规模减半的傅里叶变换。求得规模减半的福利变换，根据上述的 $p (x)$ 和 $p_1(x)$ 和 $p_2(x)$ 的关系，可求得原来的傅里叶变换。
求 $p_1(x),p_2(x)$ 的傅里叶变换，又可以拆成规模更小的傅里叶变换，如此层层向下，直到单值的傅里叶变换为其本身。

如上所述，FFT是可以递归实现的，写成伪代码，如图所示。另外，在计算 $p (x)$ 的值时，可以利用到 $e^{i\theta }= - e^{i(\pi+\theta)}$ 的性质，进一步减少重复的计算。如图[FFTS]所示。

写一个简单的cpp脚本如下：

#include 
#include 
#define _USE_MATH_DEFINES//pi使用M_PI表示
#include 

/*fft的一个串行实现，因为c中没有复数（在有的标准下有，但是使用方法不尽相同，还不如自己写一个），
所以我们需要定义复数及其运算，使用结构体。*/


typedef struct Complex
{
	double r=0.0;//初始值设置为0
	double i=0.0;//初始值设置为0
} complex;


/**
函数，复数加和减
**/
void complex_add(complex* result, const complex *c1, const complex *c2)
{
	result->i = c1->i + c2->i;
	result->r = c1->r + c2->r;
}

void complex_sub(complex* result, const complex *c1, const complex *c2)
{
	result->i = c1->i - c2->i;
	result->r = c1->r - c2->r;
}

/**
函数，复数乘
**/
void complex_multiply(complex* result, const complex *c1, const complex *c2)
{
	(result->i) = (c1->r)*(c2->i) + (c1->i)*(c2->r);
	(result->r) = (c1->r)*(c2->r) - (c1->i)*(c2->i);
}

/**
函数，复数赋值
**/
void complex_copy(complex* result, const complex *c1)
{
	result->r = c1->r;
	result->i = c1->i;
}

/**
定义一个求数组长度的运算，包括结构体数组, 尽量少用指针，容易出错
**/

int length(complex a[])
{
	int length = sizeof(a) / sizeof(a[0]);
	return length;
}


void fft(complex a[],complex y[],int n)//因为不能返回数组，所以只能这么干
{
	//int n = length(a);
//	printf("%f", length(a));
//	printf("%f", a[2].r);
//	getchar();
	if (n == 1)
	{
		//A = a;//不知道这样写行不行，先放着
		complex_copy(y, a);
		return;
	}
	complex omega_n;
//	printf("%f", M_PI);
	omega_n.r = cos(2 * M_PI / n);
	omega_n.i = sin(2 * M_PI / n);
	complex omega;
	omega.r = 1;
	int half_n = int(n*0.5);
	complex*  a1 = (complex*)malloc(sizeof(complex)*half_n);
	complex*  a2 = (complex*)malloc(sizeof(complex)*half_n);

	//complex a1[half_n];

	for (int i = 0; i < half_n; i++)
	{
		complex_copy(&a2[i], &a[i * 2]);
		complex_copy(&a1[i], &a[i * 2+1]);//分成奇数和偶数
	//	a2(i) = a(i * 2);
	//  a1(i) = a(i * 2 + 1);
	}
	//complex y2[1];
	//complex y1[];
	complex*  y1 = (complex*)malloc(sizeof(complex)*half_n);
	complex*  y2 = (complex*)malloc(sizeof(complex)*half_n);
	fft(a2,y2,int(n*0.5));
	fft(a1,y1,int(n*0.5));
//	double complex y[n];
//	complex* const y = (complex*)malloc(sizeof(complex)*n);
//	complex omega_n;
//	complex omega;
	for (int k = 0; k <= half_n - 1; k++)
	{
		complex t;
//		t->r = 0;
	//	t->i = 0;
		complex_multiply(&t, &omega, &y1[k]);
	//	complex *t = complex_multiply(&omega, &y1(k));

		complex_add(&y[k], &y2[k],&t);
	//	y(k) = y2(k) + t;
		complex_sub(&y[k + half_n], &y2[k], &t);
	//	y(k + half_n) = y2(k) - t;
	//	omega = omega*omega_n;
		complex omega_temp = omega;
		complex_multiply(&omega, &omega_temp, &omega_n);
	}
	//return y;

}




void main()
{
	complex a[4];
	complex A[4];
	a[0].r = 1;
	a[1].r = 2;
	a[2].r = 3;
	a[3].r = 4;
	fft(a,A,4);
	printf("result is\n");
	for (int i = 0; i < 4; i++)
	{
		printf("%f+%fi\n", A[i].r, A[i].i);
	}
	//for (int i = 0; i < length(a); i++)
	//{
	//	printf('test');
	//}
	// c(1,1);
//	_C_double_complex a;
//	a = 2I;
//	double m = exp(0.1*I);
//	printf("%f", m);
	getchar();


}

如果写成matlab的脚本为：

function y = myfft( a )
%UNTITLED2 此处显示有关此函数的摘要
%   此处显示详细说明
n = length(a);
if n==1
    y = a;
    return;
end
wn = exp(2*pi*i/n);
w = 1;
a2 = a([1:2:n]);
a1 = a([2:2:n]);
y2 = myfft(a2);
y1 = myfft(a1);
for k=1:n/2
    t = w*y1(k);
    y(k)=y2(k)+t;
    y(k+n/2) = y2(k)-t;
    w = w*wn;
end
end

上述为傅里叶变换的递归实现，为了实现并行，我们其实可以将其写为一种迭代（循环）实现。什么叫迭代实现呢？考虑上述递归的FFT，以8点DFT为例，其递归划分过程如图所示。这里因不是本文重点，故不再细述。

要对序列[0 7]{}做一个DFT，根据FFT原理，只需对[0,2,4,6]{}以及[1,3,5,7]{}做DFT。继续划分，则需对[0,4]{}[2,6]{}[1,5]{}[3,7]{}做DFT。最后是对0,4,2,6,1,5,3,7分别作单点DFT。所以，只要我们知道最底层的数字的排序方式，完全可以逐层从下到上开始计算，知道第一层，不需要递归。事实上，我们可以发现，源序列04261537的二进制数分别是000,100, 010, 110, 001, 101, 011, 111，每个数倒置一下得到000, 001, 010, 011,100, 101, 110,111，正好就是01234567。对于其他2的幂也是成立的。那么，就可据此将递归步，通过几层循环来实现，有人将以此设计出来的非递归算法称为“蝶形”（butterfly）迭代算法。如图所示。

离散傅里叶变换的并行分解

并行化策略

我们可以将规模为 $N$ 的傅里叶变换分解成相互独立的规模更小的傅里叶变换以便于并行实现，分解也使得内存管理变得更加灵活。一个简单的想法就是将输入向量看成一个二维的向量（ $\times M$ ），这里， $N, m, M$ 都是2的指数次方量级的。那么， $f$ 的各个成分就可以表示为： $f[Jm+j],0\leq j<m, 0\leq J<M$
可以看到，这里的 $j$ 指标变得更快，而 $J$ 指标变得更慢。用中括号括起来的是向量的下标，下标从 $0$ 开始。

那么，原来的离散傅里叶变换就可以写为： $\sum_{j,J} e^{\frac{2\pi(kM+K)i}{Mm}(Jm+j)}f(Jm+j),0\leq k<m,0\leq K<M$
这里的 $k$ 和 $K$ 决定了结果的下标。 $F$ 中 $K$ 变化得更快一些。从方程([2.6])中,我们可以做一个恒等的变换，得到：

$F[kM+K]=\sum_{j}\{e^{2\pi ijk/m} [e^{2\pi ijK/(Mm)} (\sum_{J}e^{2\pi iJK/M}f(Jm+j)) ]\}$

从这里发现，解读这个分解，我们们可以得到如下的并行实现的步骤：

固定每个 $j$ ，从每一个规模为 $m$ 的小块中，都可以取出一个值，形成一个向量。
我们可以对上述的每一个向量做FFT。当然，做FFT之前的 $J$ 指标，就变成了做FFT
之后的 $K$ 指标。
给每个组份乘上一个 $e^{2\pi ijK/(Mm)}$ 。
重排数据，使得它们是一组中是以 $j(0\leq j<m)$ 为指标变动的向量。
对这些向量组在并行的条件下做FFT。那么这时候 $j$ 指标就变成了 $k$ 指标。
此时就可得到结果以 $F [k M + K]$ 的形式呈现，再做一个反操作，就可以得到我们想要的正确顺序（就是 $k$
变动最快那个顺序））的一个结果。

通过上述，我们虽然把一个FFT操作拆成了两个FFT操作，但是对于每个FFT的计算量上的一个计算方式是不变的：第一步FFT的计算量为 $\text{log} M$ ，第二部FFT的计算量为 $\text{log} m$ ，所以呢，总的计算量为 $\text{log}(Mn)=N \text{log} N$ 是没变的。上述的分解，被称为“zoom transforms”，而上述的FFT的并行方式，在论文中，被叫做是“six-step framework”。

需要注意的话，我这里做的算法有一些假设条件，比如说要求数据长度除以处理机个数的值为2的正整数次方。这样就要求处理的问题规模必须是偶数，最好是2指数次方。

写成的串行c代码如下：

#include
#include
#include
#include

#define N 8192

typedef struct {
	double real;
	double imag;
} Complex;


Complex Input[N];
Complex Result[N];
Complex Euler[N/2];

void computeEulers()
{
	int x = 0;
	float theta;
	float n = (4.0*M_PI)/N;

	for(x = 0; x < (N>>1); x++){
		theta = x*n;
		Euler[x].real = cos(theta);
		Euler[x].imag = -sin(theta);
	}
}

Complex multiply(Complex* a, Complex* b)
{
	Complex c;
	c.real = (a->real * b->real) - (a->imag * b->imag);
	c.imag = (a->real * b->imag) + (b->real * a->imag);
	return c;
}

Complex add(Complex* a, Complex* b)
{
	Complex c;
	c.real = a->real+b->real;
	c.imag = a->imag+b->imag;
	return c;
}

int main(int argc, char** argv)
{
	

//***************************************************************************
//输入向量赋值，也可以从文件读入 
//***************************************************************************
    int NN = N;	
	NN = N;int i;
	for(i=0;i>1); k++)
	{
		even.real = even.imag = odd.real = odd.imag = 0.0;

		diff = (k - 1 +(N>>1)) % (N>>1);
		idx = 0; 

		for(n = 0; n < (N>>1); n++){
			euler = Euler[idx];
			temp = multiply(&Input[n<<1], &euler);         
			even = add(&even, &temp);
			temp = multiply(&Input[(n<<1) +1], &euler);  
			odd = add(&odd, &temp);
			idx = (idx + diff + 1) % (N>>1);
		}

		theta = k*PI2_by_N;
		twiddle.real = cos(theta);
		twiddle.imag = -sin(theta);
		temp = multiply(&odd, &twiddle);
		Result[k] = add(&even, &temp);
		temp.real = -temp.real;
		temp.imag = -temp.imag;
		Result[k+(N>>1)] = add(&even, &temp);
	}

	clock_gettime(CLOCK_REALTIME, &now);
	double seconds = (double)((now.tv_sec+now.tv_nsec*1e-9) - (double)(tmstart.tv_sec+tmstart.tv_nsec*1e-9));
/*	printf("C time: %f seconds\n", seconds);

	printf("TOTAL PROCESSED SAMPLES: %d\n", N);
	printf("============================================\n");
	for(k = 0; k <= 10; k++){
		printf("XR[%d]: %.5f  \t XI[%d]: %.5f\n", k, Result[k].real, k, Result[k].imag);
		printf("============================================\n");
	}*/
	
	printf("PROCESS NUMBER : %d\n\n", N);
	printf("\n\n\nTIME COST EVALUATED BY C: %e secs\n", seconds);
//	printf("TIME COST EVALUATED BY MPI: %e secs\n\n\n", mpiend-mpist);
		
	freopen("outputS", "w", stdout);
	
	for(k = 0; k <= NN-1; k++){
			//printf("XR[%d]: %.5f  \t XI[%d]: %.5f\n", k, ResultR[k], k, ResultI[k]);	
		printf("X[%d]: %.5f + %.5f i\n", k, Result[k], Result[k]);		


}
}

并行化脚本如下：

//**************************************************************
// 一维FFT的MPI并行程序，采用蝶形迭代算法 
//***************************************************************
// 输入的数据的长度（偶数）和所用进程数的比值一定要是2的正指数次方 
// 如 W/p = 2,4,8... 
// 编译: mpicc FFTParallel.c -lm -o FFTParallel
// 运行：mpiexec mpirun qsub 
// 陆嵩 
// 最后一次修改时间：2018.12.20 15:08 
//*****************************************************************

#include
#include
#include
#include
#include
#define N 8



//***************************************************************************
//定义一个复数的结构 
//***************************************************************************
typedef struct {
	double real;
	double imag;
} Complex;

//***************************************************************************
//定义一个从文件读取数据的函数 ，没写 
//***************************************************************************
/*
bool readFromFile()
{
	return true;
}

*/

//***************************************************************************
//定义复数的乘法运算 
//参输入数: a、b两个指向复数结构体的指针 
//返回c，为复数结构体 
//***************************************************************************
Complex multiply(Complex* a, Complex* b)
{
	Complex c;
	c.real = (a->real * b->real) - (a->imag * b->imag);
	c.imag = (a->real * b->imag) + (b->real * a->imag);
	return c;
}

//***************************************************************************
//定义复数的加法 
//参输入数: a、b两个指向复数结构体的指针 
//返回c，为复数结构体 
//***************************************************************************
Complex add(Complex* a, Complex* b)
{
	Complex c;
	c.real = a->real+b->real;
	c.imag = a->imag+b->imag;
	return c;
}

//***************************************************************************
//主函数入口 
//***************************************************************************
int main(int argc, char** argv)
{
	int size, rank;int NN,i;int k;int n;
	Complex Input[N];
	MPI_Init(NULL, NULL);//初始化 
	MPI_Comm_size(MPI_COMM_WORLD, &size);//获取进程数 
	MPI_Comm_rank(MPI_COMM_WORLD, &rank);//获取进程编号 
	int localN = (N/2)/size;//每个节点分配的数目 
	double EulerR[N/2], EulerI[N/2];
	double *ResultR = NULL, *ResultI = NULL;
	double tempEulerI[localN], tempEulerR[localN];
	double tempResultR[localN*2], tempResultI[localN*2];	
	struct timespec now, tmstart;//定义时间结构体，struct timespec精确到微秒级别 
	double mpist, mpiend;
	
//***************************************************************************
//输入向量赋值，也可以从文件读入 
//***************************************************************************	
	NN = N;
	for(i=0;i>1)) % (N>>1);
		idx = 0; 

		for(n = 0; n < (N>>1); n++){
			euler.real = EulerR[idx];
			euler.imag = EulerI[idx];
			temp = multiply(&Input[n<<1], &euler);         
			even = add(&even, &temp);
			temp = multiply(&Input[(n<<1) +1], &euler);  
			odd = add(&odd, &temp);
			idx = (idx + diff + 1) % (N>>1);
		}

		theta = k*PI2_by_N;
		twiddle.real = cos(theta);
		twiddle.imag = -sin(theta);
		temp = multiply(&odd, &twiddle);

		result = add(&even, &temp);
		tempResultR[x] = result.real;
		tempResultI[x] = result.imag;

		temp.real = -temp.real;
		temp.imag = -temp.imag;
		result = add(&even, &temp);
		tempResultR[x+localN] = result.real;
		tempResultI[x+localN] = result.imag;
	}

	
	//通过收集，把结果都收集都进程0上面来 
	MPI_Gather(tempResultR, localN, MPI_DOUBLE, ResultR, localN, MPI_DOUBLE, 0, MPI_COMM_WORLD);
	MPI_Gather(tempResultI, localN, MPI_DOUBLE, ResultI, localN, MPI_DOUBLE, 0, MPI_COMM_WORLD);
	
	MPI_Gather(tempResultR+localN, localN, MPI_DOUBLE, ResultR+(N/2), localN, MPI_DOUBLE, 0, MPI_COMM_WORLD);
	MPI_Gather(tempResultI+localN, localN, MPI_DOUBLE, ResultI+(N/2), localN, MPI_DOUBLE, 0, MPI_COMM_WORLD);

	if(rank == 0)
	{
		mpiend = MPI_Wtime();/////////////////////////////////////////////////////////// 计时终点 
		clock_gettime(CLOCK_REALTIME, &now);///////////////////////////////////////////
		double seconds = (double)((now.tv_sec+now.tv_nsec*1e-9) - (double)(tmstart.tv_sec+tmstart.tv_nsec*1e-9));

		printf("PROCESS NUMBER : %d\n\n", N);
		printf("\n\n\nTIME COST EVALUATED BY C: %e secs\n", seconds);
		printf("TIME COST EVALUATED BY MPI: %e secs\n\n\n", mpiend-mpist);
		
		freopen("output", "w", stdout);
		for(k = 0; k <= NN-1; k++){
			//printf("XR[%d]: %.5f  \t XI[%d]: %.5f\n", k, ResultR[k], k, ResultI[k]);	
			printf("X[%d]: %.5f + %.5f i\n", k, ResultR[k], ResultI[k]);		
		}
		
		

	}
	MPI_Finalize();
}

高维FFT并行分解

对于二维的FFT变换，只不过是在两个不同的方向，比如书在在 $x$ 和 $y$ 方向逐一进行并行的一维FFT变换即可，更高维的情况也是一样。这么干是可以的，但是显得也太蠢了。比如说，在做某个方向的FFT时，把值取出来操作，完了放回去，第二次又将其取出来……这样做无疑增加了不少操作。

所以，在高维情况下做FFT，除了在每个方向都做一次FFT这个蠢办法外，事实上是有一些更高明的方法的。比如基于DSP、FPGA、ARM等的FFT实现等，这里由于篇幅原因，不再赘述，有兴趣的读者可以查看相关文献。

数值实验

计算资源与环境

我用的计算为科学与工程计算国家重点实验室的大规模科学计算四号集群（LSSC-IV）。

它是首次使用纯IntelPurley平台并采用100Gb EDR Infiniband高速网络的千万亿次计算系统。LSSC-IV集群基于联想深腾8810系统构建，包含超算和大数据计算两部分。计算集群主体部分包含408台新一代ThinkSystem SD530模块化刀片（每个刀片包括2 颗主频为2.3GHz 的Intel Xeon Gold 6140 18核Purley处理器和192GB内存），总共拥有14688 个处理器核，理论峰值性能为1081TFlops，实测LINPACK性能703TFlops。系统还包括1台胖结点（Lenovo X3850X6服务器，2颗Intel Xeon E7-8890 V4处理器，4TB 内存，10TB本地存储），4个KNL结点（1颗Intel Xeon Phi KNL 7250处理器，192GB内存）以及管理结点、登陆结点等。

集群系统采用Lenovo DS5760存储系统，磁盘阵列配置双控制器，8GB缓存，主机接口8个16Gbps FC接口，60 块6TB NL_SAS盘作为数据存储，裸容量共计360TB，系统持续读写带宽超过4GB/s，磁盘阵列通过2台I/O结点以GPFS并行文件系统管理，共享输出给计算结点。大数据计算部分包括7 台GPU服务器（分别配置NVIDIA Tesla P40、P100 和 V100计算卡）和由8台Lenovo X3650M5服务器组成的HDFS辅助存储系统。集群系统所有结点同时通过千兆以太网和100Gb EDR Infiniband网络连接。其中千兆以太网用于管理，EDR
Infiniband网络采用星型互联，用于计算通讯。LSSC-IV的操作系统为：Red Hat Enterprise Linux Server 7.3。LSSC-IV 上的编译系统包括Intel C，Fortran编译器，GNU编译器，Intel VTune调试器等。并行环境有MVAPICH2、OpenMPI、Intel MPI，用户可以根据自己的情况选用。LSSC-IV上还安装如下常用数值计算的开源软件：PHG(Parallel Hierarchical Grid)，PETSc，Hypre，SLEPc，Trilinos等。用户也可自行在个人目录下安装需要的软件。LSSC-IV采用LSF作业调度系统，两个登陆结点作为任务提交结点。

LSSC-IV系统2017 年11月成功进入全球HPC TOP500排行榜，位列第382位。

并行性能的主要考察指标

加速比：串行执行时间与并行执行时间的比值。

并行效率：加速比与进程数的比值，即 $\text {E}_{\text {P}}=\frac {\text {T}_{\text {S}}}{\text {P} \times \text {T}_{\text {P}}}$ ，其中， $\text {P}$ 为并行程序执行进程数， $\text {T}_{\text {P}}$ 为并行程序执行时间， $\text {T}_{\text {S}}$ 为串行程序执行时间。

可扩展性：并行效率与问题规模、处理机数量之间的关系。

强可扩展性：保持总体计算规模不变，随着处理器个数的增加，观察并行效率的变化。

弱可扩展性：保持单个节点的计算规模不变，随着处理器个数的增加，观察并行效率的变化。

加速比测试

我们固定核心数为4，改变问题规模，来看看加速比和并行的效率。因为在测量数值比较小时，测量不稳定，我们在程序中计时需要多次计算取平均值。

通过表格，可以观察到看得到，问题规模越大，加速的效果相对就越好。所以说，虽然说问题有其固有的可扩展性限制，可能用到用到没几十个核，加速比就恒定了，但是对于大规模问题来说，因为其加速效率较为可观，其加速效率能够随核心的成倍增长呈现1/2减小，还是很不错的。并行计算很有前景。

强可扩展性测试

固定复向量规模为32768（2e15），依次增加核心数为1、2、4、8、16、32、64、128、256，观察其加速比以及并行效率。因为核心数为1的并行和串行还是不尽相同，所以这里核心数从1开始。

对比两表，可以看得出，问题规模越大，可扩展性越好，也就是说可增加的核心数随问题的规模变大而增加。问题规模越大，可并行性越强。可以观察到并行效率快速下降，可能由每个核的计算粒度的成倍递减造成的。随着核心数的增加，而问题规模不变，通讯开销慢慢占了主导地位。

弱可扩展性测试

可以看得出，在问题规模为4096，核心数为8时，获得了最高的并行效率。

总结

本文介绍了一维快速傅里叶变换的并行化实现，并为高维的并行化实现提供了思路。
在并行化方面，基于分解的思想，在并行性能方面，测试了程序的加速比，并行效率以及可扩展性。

30分钟手把手搭建WordPress网站（有服务器优惠） r***177 服务器运维 Wordpress 搭建教程网站搭建
bro，今天给你来一个超详细的WordPress搭建教程，从装宝塔面板开始，手把手教你。对了，趁现在雨云有新人活动，用我的专属链接注册还能拿5折券，后面我还会在积分商城发免费券，绝对划算！第一步：安装宝塔面板首先你得有个服务器，我推荐用雨云的，性价比高。用我的链接注册还能拿5折券：点击注册雨云账号，注册后绑定微信直接送5折券！优惠码"lxoffice"也可以直接用，但点链接更方便。装宝塔面板很简单
Linux下Redis安装配置全攻略（2024最新版）「已注销」 linux redis 运维
手残党也能搞定的Redis安装指南还在为Linux安装Redis发愁？（别问我怎么知道的）今天这个保姆级教程绝对能让你爽到飞起！从零开始到完全可用只要10分钟，连小白都能轻松上手！（信我，真的）环境准备（超级重要）先确认你的Linux发行版（敲黑板！）：#查看系统信息cat/etc/os-release推荐系统：Ubuntu20.04/22.04LTSCentOS7/8RockyLinux8/9安
STM32-内存运行原理与RAM执行实战东方少爷内存地址单片机嵌入式硬件 arm开发硬件工程 stm32
一、底层原理深度解析（先懂“为什么要拷贝”）1.存储介质本质差异（ROM/FlashvsRAM）ROM（以STM32内部Flash为例）：物理特性：电可擦写非易失性存储（虽叫ROM，实际可通过编程改写），擦写次数有限（一般万次级别），读速度慢（STM32F1系列Flash读取周期约30-50ns）。存储内容：程序代码（指令）、只读常量（const修饰的全局变量、字符串字面量）、初始化的全局变量（R
数据仓库技术及应用（Hive 产生背景与架构设计，存储模型与数据类型）娟恋无暇数据仓库笔记 hive
1.Hive产生背景传统Hadoop架构存在的一些问题：MapReduce编程必须掌握Java，门槛较高传统数据库开发、DBA、运维人员学习门槛高HDFS上没有Schema的概念，仅仅是一个纯文本文件Hive的产生：为了让用户从一个现有数据基础架构转移到Hadoop上现有数据基础架构大多基于关系型数据库和SQL查询Facebook诞生了Hive2.Hive是什么官网：https://hive.ap
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
企业级视频链接的技术实现与安全性策略
前言视频链接作为内容分发的关键入口，其参数设计直接影响系统安全性、用户体验和运营效率。一个标准化的视频链接应包含资源标识、访问控制和播放体验三类核心参数，同时保持结构清晰和可扩展性。视频链接的批量生成与管理策略1.高效批量生成技术针对运营场景的批量链接生成需求，实现高性能的生成方案：importcsvimportconcurrent.futuresfromtqdmimporttqdmclassBa
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
CALayer的异步处理
在iOS开发中，实现**CALayer**的异步处理是优化性能的关键技术，尤其对于复杂绘制或需要高性能渲染的场景。以下是完整实现方案：一、异步绘制核心架构设置异步绘制标志触发display创建异步任务执行绘制生成CGImage设置contents主线程CALayer实现displayLayer:方法全局队列CoreGraphics绘制主线程回调二、完整实现代码1.自定义异步图层//AsyncLay
STM32-架构分层与CMSIS实战指南东方少爷单片机单片机嵌入式硬件架构 stm32 硬件工程
从架构分层逻辑、CMSIS核心价值、内核与CMSIS协作关系三个维度，结合代码示例深度解析，并延伸到工程应用：一、STM32库架构分层解析（从硬件到应用）图中架构分为MCU层、CMSIS层、用户层，每层职责和文件分工明确：1.MCU层（硬件基础）包含内容：Cortex-M内核（如Cortex-M4）、SysTick、NVIC、调试模块、片上外设（GPIO、USART等）。作用：提供物理硬件能力，是
大模型RLHF强化学习笔记（二）：强化学习基础梳理Part2 Gravity! 大模型笔记大模型 LLM 强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.4强化学习分类根据数据来源划分Online：智能体与环境实时交互，如Q-Learning、SARSA、Actor-CriticOffline：智能体使用预先收集的数据集进行学习根据策略更新划分On-Policy：学习和行为策略是相同的，数据是按照当前策略生成的，如SARSAOff-Policy：学习策
【Python】python_jwt 宅男很神经 python 开发语言
1.1传统会话（Session）机制的黄金时代与黄昏在Web应用的黎明时期，身份验证的范式几乎完全由**基于服务器端会话（Session-BasedAuthentication）**的机制所主导。这是一个直观且在单体应用时代极其有效的模型，其工作流程如同一场精密的双人舞：凭证交换与“储物柜钥匙”的签发：用户在登录页面输入用户名和密码。这些凭证被发送到服务器。服务器验证其有效性后，会在自己的“储物间
【Python】simulink与python联合仿真
1.1Simulink的边界：事件驱动、算法复杂性与AI集成瓶颈Simulink的核心优势在于其强大的微分方程求解器和对连续时间系统、离散时间系统的精确描述能力。其基于“信号流”和“框图”的建模范式，使得工程师可以直观地构建与物理现实高度对应的数学模型。然而，这种优势也带来了其天然的局限性：基于时间的驱动核心(Time-BasedCoreEngine):Simulink的“心脏”是一个时间驱动的仿
解锁数据结构“黑科技”：查表法的奇幻冒险大雨淅淅 #数据结构数据结构算法开发语言
目录一、数据结构的“神秘地图”：认识查表法二、揭开查表法的神秘面纱（一）构建查找表（二）在表中进行查找三、实际案例大揭秘（一）案例一：简单数值查找（二）案例二：复杂关系查找四、查表法的优势与局限（一）优势尽显（二）局限剖析五、与其他查找方法的巅峰对决（一）与顺序查找的较量（二）与折半查找的比拼六、查表法的应用领域大赏（一）嵌入式系统中的“得力助手”（二）数据处理中的“高效利器”七、总结与展望一、数
python profile_python程序之profile分析
操作系统：CentOS7.3.1611_x64python版本：2.7.5问题描述1、Python开发的程序在使用过程中很慢，想确定下是哪段代码比较慢；2、Python开发的程序在使用过程中占用内存很大，想确定下是哪段代码引起的；解决方案使用profile分析分析cpu使用情况可以使用profile和cProfile对python程序进行分析，这里主要记录下cProfile的使用，profile参
go-carbon v2.6.10发布，轻量级、语义化、对开发者友好的 golang 时间处理库 gocarbontime
carbon是一个轻量级、语义化、对开发者友好的Golang时间处理库，提供了对时间穿越、时间差值、时间极值、时间判断、星座、星座、农历、儒略日/简化儒略日、波斯历/伊朗历的支持。carbon目前已捐赠给dromara开源组织，已被awesome-go收录，并获得gitee2024年最有价值项目（GVP）和gitcode2024年度G-Star项目，如果您觉得不错，请给个star吧官网:carbo
C#与SQL Server交互的数据库技术实践不教书的塞涅卡
本文还有配套的精品资源，点击获取简介：本课程深入探讨C#与SQLServer数据库的交互技术，包括建立连接、执行SQL语句以及进行CRUD操作。详细介绍使用C#进行数据库操作时的核心概念与高级功能，如参数化查询、存储过程、事务处理、索引、视图和触发器等。旨在教授开发者如何高效、安全地管理和开发SQLServer数据库应用。1.C#与SQLServer的连接建立在现代软件开发中，后端服务经常需要与数
疑问：SSL证书部署后，为什么还是显示不安全？运维教程ssl证书
企业网站需使用HTTPS协议，已经被众多的企业网站认可。从HTTP到HTTPS的转换只需要安装部署SSL证书就能轻易实现。但是也有部分SSL证书用户在安装证书后，网站的地址栏仍然显示的是不安全，并没有起到加密网站的作用。这样的问题为什么会产生，又该如何解决呢？1.域名与证书不匹配部署SSL证书的作用之一就是对网站的真实身份进行验证，倘若用户访问的网站域名和SSL证书中设置的域名不一致时，浏览器就会
【前端工程化】前端组件模版构建那些事前端
在企业级后台系统中，组件是构建页面的基础单元。与C端不同，B端更注重功能完整性、交互一致性与复用效率。因此，我们需要围绕业务场景封装出可复用、易维护、结构清晰的组件模板。本文档主要围绕组件设计原则、分类建议和使用方式展开，适用于Vue或React技术栈下的开发场景。一、组件设计原则职责单一每个组件只负责一个功能或UI元素，不依赖外部状态；示例：按钮组件只处理点击行为，不包含API调用逻辑；高内聚低
了解GC吗？什么是GC？后端java
GC是什么？为什么要GC？GC（GarbageCollection），垃圾回收，是Java与C++的主要区别之一。作为Java开发者，一般不需要专门编写内存回收和垃圾清理代码。这是因为在Java虚拟机中，存在自动内存管理和垃圾清理机制。对JVM中的内存进行标记，并确定哪些内存需要回收，根据一定的回收策略，自动的回收内存，保证JVM中的内存空间，防止出现内存泄露和溢出问题。GC是任意时候都能进行的吗
未来数据库硬件-网络篇数据库云计算架构
本文在绿泡泡“狗哥琐话”首发于2025.2.17<-关注不走丢。最近看到一篇不错的文章，叫做“ModernHardwareforFutureDatabases”，里面从几个方向讲了下现在数据库的硬件发展趋势，今天先来说说网络篇。内容中，一位大佬对（获过图灵奖的大佬）OLTP系统进行了一些基准测试，发现TCP-IP协议栈对于总体CPU使用率是占在47～68%。如果使用的网络带宽增加，这个开销还会提升
数据库的后悔药：Undo Log揭秘你一身傲骨怎能输游戏行业领域知识专栏撤销日志（Undo Log）
文章摘要撤销日志（UndoLog）是数据库的“后悔药”机制，用于保证数据操作的原子性和一致性。其核心原理是修改数据前先记录原始状态到UndoLog，若事务失败则进行回滚恢复。典型应用包括：1）事务回滚（如转账异常时还原数据）；2）并发控制（通过快照读提供多版本视图）。主流数据库如MySQLInnoDB和Oracle均采用该技术，其流程可概括为“先备份后修改，出错即还原”。简言之，UndoLog通过
高效沟通05-FFC赞美法则古城码农工作记实录高效沟通沟通技巧
效沟通专栏–组织运转的命脉与个人成功的基石目录1.概念1.1底层逻辑1.2优势1.3适用场景1.4技巧2.示例1.概念 FFC是由三个英文单词首字母组成的结构化赞美模型，旨在让赞美真实可信、打动人心，避免空洞敷衍。其核心是通过三个层次构建逻辑闭环：要素含义作用关键要点F（Feeling）感受表达主观情感反应用情绪词传递真诚（如“感动”“佩服”）例：“你的方案让我非常惊喜！”F（Fact）事实提供
react组件内点击事件的this的4种指向方法程序员--韩同学 react react.js javascript 前端
目录方法一.通过bind改变点击事件内的this指向外部组件内this方法二.通过在构造函数constructor内使用bind对函数内的this重定向方法三.通过箭头函数在事件内改变this指向方法四.通过使用箭头函数来指向外部组件内this（使用较多）扩展：1.react组件内点击事件传参2.Event事件，获取元素本身总结方法一.通过bind改变点击事件内的this指向外部组件内thison
产品经理高效工作指南，核心能力全拆解！ AI大模型-大飞产品经理人工智能大数据智能体程序员大模型大模型学习
在互联网行业的激烈竞争中，产品经理作为产品的“操盘手”，其工作流程的科学性与专业性直接决定着产品的成败。想要高效推进产品从0到1、实现从1到N的迭代，必须吃透日常工作的每个环节。今天，我们就用思维导图为你拆解产品经理9大核心工作流程，从需求到迭代全链路解析，助力你成为更专业的PM！一、需求分析与市场调研：产品的“方向盘”需求分析是产品工作的起点，决定着产品是否贴合市场。市场调研：定期研究行业动态（
这是gpt o1给出的物联网工程专业的大学规划，有人看看这个合理吗？王倚山 gpt 物联网学习开发语言
下面是一份更为详细、覆盖全年（包括寒暑假）的四阶段学习规划，旨在帮助你在大学剩余时间里持续学习、循序渐进地掌握物联网（IoT）核心技能，打造深厚的技术壁垒。每个阶段都有明确的学习目标与自学内容细节，并在寒暑假安排了“强化期”任务，让你全年不停歇，不断提升。总体思路稳扎稳打：从嵌入式基础到RTOS、传感器驱动、通信协议，再到边缘计算、云平台、工业协议、安全攻防，层层深入。项目驱动：每个阶段至少完成1
养老机构运营实训室建设要点：构建实战化运营管理实训体系凯禾瑞华_实训室建设实训室建设大数据物联网智慧健康养老服务与管理虚拟仿真教学人工智能智慧养老
养老机构运营实训室作为养老服务人才培养的重要载体，其建设质量直接影响专业人才的实践能力与行业适配度。围绕实战化运营管理实训体系的构建目标，需从多维度精准把握建设要点，打造契合行业需求的实训环境。点击获取实训室建设方案一、明确建设目标与定位（一）贴合行业需求养老机构运营实训室建设要点的核心，在于精准对接养老行业发展趋势与实际需求。随着老龄化社会加速，养老服务精细化、智慧化需求激增，实训室应锚定培养具
交换机端口及VLAN转发原理 hao_wujing 网络
交换机端口及VLAN转发原理是数据通信网络的核心基础。理解它们的工作原理对于设计、管理和排错网络至关重要。下面我将详细解释：##一、交换机端口基础交换机端口是物理连接点，用于连接终端设备（如PC、服务器、IP电话）或其他网络设备（如另一台交换机、路由器、防火墙）。端口的主要职责是**在数据链路层（OSI第2层）转发以太网帧**。1.**关键概念：*****MAC地址表：**交换机内部维护一张表，记
卵生兄弟网络工作原理和架构 hao_wujing 安全
大家读完觉得有帮助记得关注和点赞！！！以下从网络安全角度解析**卵生兄弟网络**的深度技术架构与工作原理。该概念通常指**具有冗余唤醒和协同攻击能力的模块化恶意网络**（如APT组织所用），或**防御端的双生活动目录/蜜罐系统**。我们将从攻击与防御两个维度展开：---###一、攻击视角：恶意「卵生兄弟网络」架构（APT高级威胁）####**核心设计目标**-**隐蔽持久化**：主模块被清除时，备
基于虚拟化技术的网闸安全交换：物理隔离时代的智能数据流通引擎 109702008 #linux系统安全安全人工智能网络
摘要：在等保2.0和零信任架构背景下，传统网闸正从“物理断网”向“智能交换”演进。本文将深入解析如何通过硬件虚拟化+策略容器化在网闸内部实现安全数据交换，并提供工业级落地方案。一、痛点：隔离与效率的终极矛盾当企业面临以下场景时，传统网闸力不从心：生产网与办公网需实时同步数据库公有云与私有云间敏感文件传输多租户环境下跨安全域业务协同核心矛盾：物理隔离阻断攻击链的同时，也阻断了业务流！二、技术破局：虚
JavaScript基础语法之运算符和控制流 AA-代码批发V哥 JavaScript javascript
JavaScript基础语法之运算符和控制流一、运算符1.1算术运算符：数值计算的基石1.1.1字符串拼接陷阱1.2比较运算符：条件判断的起点1.2.1严格比较（`===`）vs松散比较（`==`）1.2.2其他比较运算符1.3逻辑运算符：复杂条件的组合1.3.1短路逻辑（重要特性）1.3.2实战：表单验证1.4赋值运算符：数据存储的桥梁1.4.1基础赋值（`=`）1.4.2解构赋值（ES6新增）
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。