zyw2002

基于MPI实现Mandelbrot Set和Julia Set

文章目录

1. Mandelbrot & Julia Set 介绍
2. 初步分析
- 2.1 Mandelbrot 集的理论并行性
- 2.2 Mandelbrot 集和 Julia 集的运行逻辑
- 2.3 探究参数Ｃ对 Julia 集的形状的影响
3. 分区方案设计
- 3.1 基于轮询行分段的分区方案
- 3.2 基于 MPI 的并行计算
4. 图形美化设计
- 4.1 着色方案
- 4.2 其他方案
5. 结果和讨论
6. 总结
7. 附录
- 7.1 其他结果展示
- 7.2 源代码附录
- - 7.2.1 mandelbrot源码
  - 7.2.2 Julia源码
- 7.3 参考

1. Mandelbrot & Julia Set 介绍

Mandelbrot 集合以其发现者数学家 Benoit Mandelbrot命名，它是一个分形集合。在数学中，分形是欧几里得空间的一个子集，它的 Hausdorff 维严格超过了拓扑维数。分形倾向于在不同的层次上保持它们的形式，这导致它们在大自然中无处不在。分形被称为自相似的，这意味着它们在越来越小的尺度上表现出类似的模式，并且与它的一个或多个部分相似。分形的图像通常是由计算机生成的彩色复杂的图案，因为分形是由复数组成的集合，需要一个公式来计算分形集合中的数字。生成了曼德尔勃特集合通过使用复杂的二次多项式C 是一个复杂的参数,从 z = 0 迭代产生的序列值将逐渐发散到正无穷或递归地收敛于一个点根据方程。使用不同的迭代数可以生成不同的函数值。

由于每个点的计算都是独立于其他点的，因此生成 Mandelbrot 集合非常适合并行计算。并行计算是一种使用多个计算资源并发地解决一个问题的过程。换句话说，它是一种提高计算机处理能力和速度的有效方法。消息传递接口(MPI)是一种实用、灵活和高效的标准，用于基于消息传递生成并行程序。Mandelbrot 集的并行化是通过利用 C 编程中的 MPI 库实现的。采用基于轮循行分割的分区方案将行划分为子行，并为子行分配不同的逻辑处理器，以提高子行计算效率。分析结果然后绘制图，观察算法在逻辑处理器数量增加时的可伸缩性。

2. 初步分析

2.1 Mandelbrot 集的理论并行性

检测序列算法并行性的一个可靠方法是找出该算法的方程是否可以相互独立执行。在这里可以使用伯恩斯坦条件（因为可以在不修改程序结果的情况下交换）。构成伯恩斯坦条件构成的三个条件如下:
这表明 S1 和 S2 可以并行地相等, 这些条件以不同的粒度表现出来。只要满足这三个条件，就可以得出过程相互独立的结论，证明其具有极大的并行性。

上式表示 Mandelbrot 集合的两个连续值的函数计算。因此,

然后应用 Bernstein 条件得到以下三个方程:

上述方程表明了伯恩斯坦条件的证明。因此，进程 S1 和 S2 都可以并行执行，即(S1 || S2)。因此，通过证明和证据表明，Mandelbrot 集合在 C 编程中是可使用 MPI 库来进行并行计算的。同理，Julia 集合也具有这种可并行性，在此不与赘述。

2.2 Mandelbrot 集和 Julia 集的运行逻辑

Mandelbrot 集的伪代码如下：

for each pixel (Px, Py) on the screen do
 x0 := scaled x coordinate of pixel (scaled to lie in the Mandelbrot 
X scale (-2.00, 0.47))
 y0 := scaled y coordinate of pixel (scaled to lie in the Mandelbrot 
Y scale (-1.12, 1.12))
 x := 0.0
 y := 0.0
 iteration := 0
 max_iteration := 1000
 while (x*x + y*y ≤ 2*2 AND iteration < max_iteration) do
 xtemp := x*x - y*y + x0
 y := 2*x*y + y0
 x := xtemp
 iteration := iteration + 1
 
 color := palette[iteration]
 plot(Px, Py, color)

Julia 集的伪代码如下：

R = escape radius # choose R > 0 such that R**2 - R >= sqrt(cx**2 + 
cy**2)
for each pixel (x, y) on the screen, do: 
{
 zx = scaled x coordinate of pixel # (scale to be between -R and 
R)
 # zx represents the real part of z.
 zy = scaled y coordinate of pixel # (scale to be between -R and 
R)
 # zy represents the imaginary part of z.
 iteration = 0
 max_iteration = 1000
 
 while (zx * zx + zy * zy < R**2 AND iteration < max_iteration)
 {
 xtemp = zx * zx - zy * zy
 zy = 2 * zx * zy + cy
 zx = xtemp + cx
 
 iteration = iteration + 1
 }
 
 if (iteration == max_iteration)
 return black;
 else
 return iteration;
}

2.3 探究参数Ｃ对 Julia 集的形状的影响

Julia Set 集是 z = z^2+c 迭代生成的图形,固定 c，然后计算发散的 z 的值，得到发散的数列。通过改变复数 c 的值，然后进行迭代，可以生成不同的 Julia 图形。下面的实验主要探究 c 值对 Julia Set 形状的影响，共设计了 7 组实验，每组实验有不同的 c.re和 c.im，分别代表复数 c 的实部和虚部。每组实验设有 3 次实验，从左到右不断的加大迭代的次数，可以观察出迭代的次数越多，得到的分形图案越精细。

3. 分区方案设计

为了并行化顺序算法，我们需要寻找可以彼此独立执行的操作，这就是利用Bernstein 's Conditions 的地方。从 2.2 节 Mandelbrot 集和 Julia 集的运行伪代码可以看出，其中运算量主要集中在 for 循环的迭代上，而每一迭代过程是相互独立的，即可以并行计算。因此可以考虑在多核计算机上使用分区方案并行运行。

3.1 基于轮询行分段的分区方案

在这个方案中，根节点成为主节点并行执行接收和写入操作，同时给所有可用的逻辑处理器提供等量的工作来收集和发送到主节点以生成 Mandelbrot Set。其中每个进程分配的行数为图片像素矩阵的最大行数除以进程数。其数学表达式如下：

在分割完所有行之后,每个进程将它们分别计算生成的子行发送回根节点，在从所有处理器接收到所有子行之后，主节点最终将遵守算法的 Mandelbrot Set映像写入.ppm 文件。

3.2 基于 MPI 的并行计算

基于上述的分区策略，mandelbrot 的计算可以分配到一系列完整独立的任务各自执行，每个节点对应一个任务，即计算其所分配到的行像素的值。采用 MPI 的编程思想进行程序设计，可以按照 master 负责 assign 任务和收集任务，而其他的 slave process 是通过拿到 data partition，对对应的计算工作进行相关操作。其主程序代码的流程图如下：

4. 图形美化设计

4.1 着色方案

一张图像可以看作是像素点构成的矩阵，矩阵上每个值是 rgb，反应了该像素点的颜色状态。因此可以将 Mandelbrot Set 和 Julia Set 中每个点的发散速度映射到一个 rgb 值，因此可以对 Mandelbrot 和 Julia 序列进行可视化的展示，其上色的结果分别如下：

4.2 其他方案

Mandelbrot 集在 z=0 时不断的迭代 c 得到的，因此只能得到一种葫芦状的图片。但是可以对图片进行缩放，平移，增大迭代次数，改变颜色的映射关系得到更加绚丽多彩的图片。基于此，在 mandelbrot 的代码中加入了用户可以自己配置的参数，具体的含义如下表

图片的翻转
执行指令 mpirun -np 4 ./mandelbrot -n 20000 -a -3.5
图片的缩放
执行指令 mpirun -np 4 ./mandelbrot -n 20000 -a 1
改变分区的大小
执行命令 mpirun -np 4 ./mandelbrot -n 5000 -b 8 -a -2
沿 X,Y 轴平移
执行命令 mpirun -np 4 ./mandelbrot -n 20000 -x 0.1 -y -0.8 -a 0.3
改变颜色区间
执行命令 mpirun -np 4 ./mandelbrot -n 10000 -p 0xffffff -q 0x000000
添加掩膜颜色
执行命令 mpirun -np 4 ./mandelbrot -n 10000 -p 0xffffff -q 0x00cccc -m CCFFFF

5. 结果和讨论

实验平台：
硬件：华为鲲鹏 920
软件：Xshell, Xftp

硬件平台参数

Cpu 的信息：
输入命令 ”lscpu” 查看 cpu 的信息，可以看到该模型的名称为
KunPeng-920, 一共有 64 个 cpu，每一个核对应一个线程。
逻辑 cpu 的数量：64

测试方案：每个分形设置 26 组实验，每组实验设有不同的线程，范围是2~250。每组实验重复 5 次测试得到其耗时的平均值（具体数值清参见附录）
可视化分析：分别绘制 Mandelbrot 和 Julia 的线程数和耗时关系的折线图。

由上表可以看出，在线程数的范围在 2~25，随着线程数的增加，耗时下降的速率很快；
当线程数的范围在 25~75 时，随着线程数的增加，耗时下降的速率变缓；当线程数大于 75时，随着线程数的增加耗时反而略有增加。
综上可知，在一定范围内随着线程数的增加，并行计算的效率越高。但是超过一定范围后，由于调用 MPI_Send 函数和 MPI_Recv 函数，通信的时间开销大幅增加，导致整体的耗时
增加。

6. 总结

本报告提出的建议是采用并实现基于轮循行分割的分区方案，将 Mandelbrot
集合算法和 Julia 集合算法并行化。基于分区方案的并行化是利用 C 编程中的消
息传递接口(Message Passing Interface, MPI)库实现的。实验结果表明，使用
MPI 在 C 编程中提出的基于轮循行分割的分区方案的程序显著加速。因此证明了程序的成功并行化

7. 附录

7.1 其他结果展示

Mandelbrot 生成的其他图片展示

Julia Set 生成的其他图片展示:

7.2 源代码附录

7.2.1 mandelbrot源码

#include "mandelbrot.h"

int main(int argc, char **argv) 
{
    int proc_count, proc_id, retval;
    mo_opts_t *opts;

    /* MPI 初始化*/
    if (MPI_Init(&argc, &argv) != MPI_SUCCESS) {
        eprintf("MPI initialization failed.\n");
        exit(EXIT_FAILURE);
    }
    
    /* 得到可用的进程数 */
    MPI_Comm_size(MPI_COMM_WORLD, &proc_count);

    if (proc_count < 2) {  //进程数至少为2
        eprintf("Number of processes must be at least 2.\n");
        finalize_exit(EXIT_FAILURE);
    }

    /* 得到当前进程的ID */
    MPI_Comm_rank(MPI_COMM_WORLD, &proc_id);

    opts = (mo_opts_t *) malloc(sizeof(*opts));// 开辟内存空间

    if (opts == NULL) {
        eprintf("unable to allocate memory for config.\n");
        finalize_exit(EXIT_FAILURE);
    }

    retval = parse_args(argc, argv, opts, proc_id, proc_count);  // 参数的配置信息
    
    if (retval == EXIT_SUCCESS) {
        if (proc_id == 0) {
            retval = master_proc(proc_count - 1, opts); //id=0 是根进程
        } else {
            retval = slave_proc(proc_id, opts);  //其他是从进程
        }
    }

    free(opts);   
    MPI_Finalize(); // 结束

    return retval;
}

/*
 * 参数的配置信息
 */
static int parse_args(int argc, char **argv, mo_opts_t *opts, int proc_id, int proc_count) 
{
    /* 设定默认值 */
    opts->max_iterations = MO_MAXITER;  //最大的迭代次数
    opts->width = MO_SIZE;   	// 图片的宽度
    opts->height = MO_SIZE;		// 图片的高度
    opts->filename = MO_FILENAME;	//存放的文件名
    opts->min_color = MO_COLORMIN;	//颜色的下限
    opts->max_color = MO_COLORMAX;	//颜色的上限
    opts->color_mask = MO_COLORMASK;	//掩膜的颜色
    opts->blocksize = MO_BLOCKSIZE;		//分区的大小
    opts->show_progress = MO_PROGRESS;	//显示进程信息

    double x_offset = 0;
    double y_offset = 0;
    double axis_length = MO_N;

    const char *opt_string = "c:r:n:hb:p:q:m:x:y:a:o:s";

    int optval_int, c, index;
    long optval_long;
    double optval_double;

  
    opterr = 0;

    /* start parsing args */
    while ((c = getopt(argc, argv, opt_string)) != -1) {
        switch (c) {
            case 'b': /* blocksize */
            case 'c': /* width */
            case 'r': /* height */
            case 'n': /* iterations */
                optval_int = atoi(optarg);

                if (optval_int <= 0) {
                    if (proc_id == 0) {
                        print_usage(argv);
                        eprintf("argument of '-%c' has to be greater than zero.\n", c);
                    }
                    return EXIT_FAILURE;
                }

                if (c == 'c') opts->width = optval_int; else
                if (c == 'r') opts->height = optval_int; else
                if (c == 'n') opts->max_iterations = optval_int; else
                if (c == 'b') opts->blocksize = optval_int;
                break;
            case 'p': /* colormin */
            case 'q': /* colormax */
            case 'm': /* colormask */
                optval_long = strtol(optarg, NULL, 16);

                if (c == 'p') opts->min_color = optval_long; else
                if (c == 'q') opts->max_color = optval_long; else
                if (c == 'm') opts->color_mask = optval_long;
                break;
            case 'x': /* xoffset */
            case 'y': /* yoffset */
            case 'a': /* axis-length */
                optval_double = atof(optarg);

                if (c == 'x') x_offset = optval_double; else
                if (c == 'y') y_offset = optval_double; else
                if (c == 'a') { 
                    if (optval_double == 0) {
                        if (proc_id == 0) {
                            print_usage(argv);
                            eprintf("argument of '-%c' cannot be zero.\n", c);
                        }
                        return EXIT_FAILURE;
                    }
                    axis_length = optval_double;
                }
                break;
            case 'o': /* output */
                opts->filename = optarg;
                break;
            case 's': /* progress */
                opts->show_progress = 1;
                break;
            case 'h': /* help */
                if (proc_id == 0) {
                    print_usage(argv);
                }
                free(opts);
                finalize_exit(EXIT_SUCCESS);
                break;
            case '?': /* unknown opt */
                if (proc_id == 0) {
                    /* hacky fix: get correct index if length of invalid option is > 2 */
                    index = (strncmp(argv[0], argv[optind - 1], sizeof(argv)) == 0) 
                        ? optind 
                        : optind-1;

                    print_usage(argv);
                    eprintf("invalid option '%s'.\n", argv[index]);
                }
                return EXIT_FAILURE;
                break;
            default:
                break;
        }
    }
    
    /* blocksize 的大小要可以整除height  */
    if (opts->height % opts->blocksize != 0) {
        if (proc_id == 0) {
            print_usage(argv);
            eprintf("argument of '-b' has to be a divisor of %d.\n", opts->height);
        }
        return EXIT_FAILURE;
    }

    /* 避免出现过大的blocksize  */
    if (opts->blocksize > opts->height/(proc_count - 1)) {
        if (proc_id == 0) {
            print_usage(argv);
            eprintf("argument of '-b' has to be smaller than %d.\n", opts->height/(proc_count-1));
        }
        return EXIT_FAILURE;
    }
    
    /* 计算图片的区间范围 */
    opts->min_re = x_offset - axis_length;
    opts->max_re = x_offset + axis_length;
    opts->min_im = y_offset - axis_length;
    opts->max_im = y_offset + axis_length;

    /* 显示配置信息 */
    if (proc_id == 0) {
        if (argc < 2) {
            printf("Note: Program invoked with default options.\n" \
                "      Run '%s -h' for detailed information on available arguments.\n\n", argv[0]);
        }
        print_params(opts, x_offset, y_offset, axis_length);
    }

    return EXIT_SUCCESS;
}

/*
 * 在计算前显示配置信息
 */
static void print_params(mo_opts_t *opts, double x_off, double y_off, double axis_length)
{
    printf("Computation parameters:\n" \
        "    output file              %s\n" \
        "    maximum iterations       %d\n" \
        "    blocksize                %d\n" \
        "    image width              %d\n" \
        "    image height             %d\n" \
        "    minimum color            0x%06lx\n" \
        "    maximum color            0x%06lx\n" \
        "    color mask               0x%06lx\n" \
        "    x-offset                 %g\n" \
        "    y-offset                 %g\n" \
        "    axis length              %g\n" \
        "    coordinate system range  [%g, %g]\n\n",
        opts->filename, opts->max_iterations, opts->blocksize, opts->width, opts->height, 
        opts->min_color, opts->max_color, opts->color_mask, x_off, y_off, axis_length, 
        opts->min_re, opts->max_re);
}

/*
 * 显示使用说明
 */
static void print_usage(char **argv) 
{
    printf("\nDynamic MPI mandelbrot algorithm\n\n" \
        "usage: %s [options]\n\n" \
        "OPTIONS:\n" \
        "    -h                   Shows this help.\n" \
        "    -c {width}           Width of resulting image. Has to be positive integer.\n" \
        "                         (default: %d)\n" \
        "    -r {height}          Height of resulting image. Has to be positive integer.\n" \
        "                         (default: %d)\n" \
        "    -n {iterations}      Maximum number of iterations for each pixel. Has to be\n" \
        "                         positive integer (default: %d)\n" \
        "    -o {filename}        Filename of resulting bitmap. (default: %s)\n" \
        "    -b {blocksize}       Number of rows to be assigned to a slave at once.\n" \
        "                         Has to be smaller than (height/slave-count).\n" \
        "                         Has to be a divisor of height. (default: %d)\n" \
        "    -x {offset}          X-offset from [0,0]. (default: %g)\n" \
        "    -y {offset}          Y-offset from [0,0]. (default: %g)\n" \
        "    -a {length}          Absolute value range of x/y-axis, e.g. if length was 2, \n" \
        "                         displayed x/y-values would range from -1 to 1. \n" \
        "                         If the x/y-offsets are set, axis shifts by those offsets.\n" \
        "                         Negative value inverts axis.\n" \
        "                         Has to be non-zero double value. (default: %g)\n" \
        "    -p {hexnum}          Minimum color of the resulting image. (default: 0x%06lx)\n" \
        "    -q {hexnum}          Maximum color of the resulting image. (default: 0x%06lx)\n" \
        "    -m {hexnum}          Hex mask to manipulate color ranges. (default: 0x%06lx)\n" \
        "    -s                   Print progress of the computation.\n\n",
        argv[0], MO_SIZE, MO_SIZE, MO_MAXITER, MO_FILENAME, MO_BLOCKSIZE, 0.0f, 0.0f, 
        (double) MO_N, (long) MO_COLORMIN, (long) MO_COLORMAX, (long) MO_COLORMASK);
}

/*
 * 主进程的运行逻辑
 */
static int master_proc(int slave_count, mo_opts_t *opts) 
{
    int *rows = (int *) malloc(opts->blocksize*sizeof(*rows));
    long *data = (long *) malloc((opts->width + 1)*opts->blocksize*sizeof(*data));
    char *rgb = (char *) malloc(3*opts->width*opts->height*sizeof(*rgb));

    if (rows == NULL || data == NULL || rgb == NULL) {
        eprintf("unable to allocate memory for buffers.\n");
        free(rows); free(data); free(rgb);
        return EXIT_FAILURE;
    }
    
    int proc_id, offset; 
    double start_time, end_time;
    long pixel_color, pixel_pos;
    int current_row = 0;
    int running_tasks = 0;
    int retval = EXIT_SUCCESS; 
    
    MPI_Status status;

    printf("Computation started.\n");
    
    /* 记录开始时间 */
    start_time = MPI_Wtime();
    
    /* 为每一个从进程初始化 row(s) */
    for (int p = 0; p < slave_count; ++p) {
        for (int i = 0; i < opts->blocksize; ++i) {
            rows[i] = current_row++;
        }
        MPI_Send(rows, opts->blocksize, MPI_INT, p + 1, MO_CALC, MPI_COMM_WORLD);
        ++running_tasks;
    }

    /* reveice results from slaves until all rows are processed */
    while (running_tasks > 0) {
        MPI_Recv(data, (opts->width + 1)*opts->blocksize, MPI_LONG, MPI_ANY_SOURCE,
                MO_DATA, MPI_COMM_WORLD, &status);

        --running_tasks;
        proc_id = status.MPI_SOURCE;

        /* if there are still rows to be processed, send slave to work again
         * otherwise send him to sleep */
        if (current_row < opts->height) {
            for (int i = 0; i < opts->blocksize; ++i) {
                rows[i] = current_row++;
            }
            MPI_Send(rows, opts->blocksize, MPI_INT, proc_id, MO_CALC, MPI_COMM_WORLD);
            ++running_tasks;
        } else {
            MPI_Send(NULL, 0, MPI_INT, proc_id, MO_STOP, MPI_COMM_WORLD);
        }

        /* store received row(s) in rgb buffer */
        for (int i = 0; i < opts->blocksize; ++i) {
            offset = opts->width*i;

            for (int col = 0; col < opts->width; ++col) {
                pixel_color = data[offset + col + 1] & opts->color_mask;
                pixel_pos = 3*(opts->width*data[offset] + col);

                rgb[pixel_pos] = (char) ((pixel_color >> 16) & 0xFF);
                rgb[pixel_pos + 1] = (char) ((pixel_color >> 8) & 0xFF);
                rgb[pixel_pos + 2] = (char) (pixel_color & 0xFF);
            }
        }

        /* 当配置信息有要求时，显示进度条 */
        if (opts->show_progress) {
            static int rows_processed = 0;
            print_progress(rows_processed += opts->blocksize, opts->height);
        }
    }

    /* 获得结束时间  */
    end_time = MPI_Wtime();

    /* 清空进度条 */
    if (opts->show_progress) printf("\033[K");

    printf("Finished. Computation finished in %g sec.\n\n", end_time - start_time); // 显示时间

    /* 将rgb信息写入到图片中 */
    printf("Creating bitmap image.\n");
    retval = write_bitmap(opts->filename, opts->width, opts->height, rgb);

    if (retval == EXIT_SUCCESS) {
        printf("Finished. Image stored in '%s'.\n", opts->filename);
    } else {
        eprintf("failed to write bitmap to file.\n");
    }
    
	// 释放内存空间
    free(rows);
    free(data);
    free(rgb);

    return retval;
}

/*
 * 从进程的运行逻辑
 */
static int slave_proc(int proc_id, mo_opts_t *opts) 
{
    int *rows = (int *) malloc(opts->blocksize*sizeof(*rows));
    long *data = (long *) malloc((opts->width + 1)*opts->blocksize*sizeof(*data));
    mo_scale_t *scale = (mo_scale_t *) malloc(sizeof(*scale));
    
    if (rows == NULL || data == NULL || scale == NULL) {
        free(rows); free(data); free(scale);
        return EXIT_FAILURE;
    }

    long pixel_color;
    int offset;
    
    MPI_Status status;
    
    /* 计算颜色缩放因子 */
    scale->color = (double) (opts->max_color - opts->min_color) / 
        (double) (opts->max_iterations - 1);

    /* 计算区域的图像大小的缩放因子 */
    scale->re = (double) (opts->max_re - opts->min_re) / (double) opts->width;
    scale->im = (double) (opts->max_im - opts->min_im) / (double) opts->height;
    
    /* 如果状态为MO_CALC，接收行并开始计算 */
    while ((MPI_Recv(rows, opts->blocksize, MPI_INT, 0, MPI_ANY_TAG, MPI_COMM_WORLD,
            &status) == MPI_SUCCESS) && status.MPI_TAG == MO_CALC) {
        for (int i = 0; i < opts->blocksize; ++i) {
            offset = opts->width*i;
            data[offset] = rows[i];

            /* 使用mandelbrot算法计算像素颜色 */
            for (int col = 0; col < opts->width; ++col) {
                pixel_color = mandelbrot(col, rows[i], scale, opts);
                data[offset + col + 1] = pixel_color;
            }
        }

        /* 向主进程发送row(s) */
        MPI_Send(data, (opts->width + 1)*opts->blocksize, MPI_LONG, 0, MO_DATA, MPI_COMM_WORLD);
    }
	
	//释放内存空间
    free(rows);
    free(data);
    free(scale);

    return EXIT_SUCCESS;
}

/*
 * 使用mandelbrot算法计算像素颜色
 */
static long mandelbrot(int col, int row, mo_scale_t *scale, mo_opts_t *opts) 
{
    mo_complex_t a, b;
    a.re = a.im = 0;

    /* 缩放显示坐标到实际区域 */
    b.re = opts->min_re + ((double) col*scale->re);
    b.im = opts->min_im + ((double) (opts->height - 1 - row)*scale->im);

    /* 计算z0, z1，直到发散或最大迭代 */
    int n = 0;
    double r2, tmp;

    do  {
        tmp = a.re*a.re - a.im*a.im + b.re;
        a.im = 2*a.re*a.im + b.im;
        a.re = tmp;
        r2 = a.re*a.re + a.im*a.im;
        ++n;
    } while (r2 < MO_THRESHOLD && n < opts->max_iterations);

    /* 对颜色进行缩放并且返回 */
    return (long) ((n - 1)*scale->color) + opts->min_color;
}

/*
 * 绘制进度条
 */
static inline void print_progress(int rows_processed, int row_count)
{
    int r = row_count/MO_PUPDATE;
    
    /* 只更新MO_PUPDATE次数 */
    if (r == 0 || rows_processed % r != 0) return;

    /* 计算比率和当前位置 */
    float ratio = rows_processed/(float) row_count;
    int pos = ratio*MO_PWIDTH;
 
    /* 绘制进度条 */
    printf("%3d%% [", (int) (ratio*100));
 
    for (int i = 0; i < pos; ++i) printf("=");
    for (int i = pos; i < MO_PWIDTH; ++i) printf(" ");
 
    /* 回车以覆盖下一次进度条更新 */
    printf("]\r");
}

/*
 * 绘制图片
 */
static int write_bitmap(const char *filename, int width, int height, char *rgb)
{
    int i, j, pixel_pos;
    int bytes_per_line;
    unsigned char *line;

    FILE *file;
    mo_bmp_header_t bmph;

    /* 每一行的长度必须是4字节的倍数 */
    bytes_per_line = (3*(width + 1)/4)*4;

    bmph.type[0] = 'B';
    bmph.type[1] = 'M';
    bmph.offbits = 54;
    bmph.fsize = bmph.offbits + bytes_per_line*height;
    bmph.reserved = 0;
    bmph.hsize = 40;
    bmph.width = width;
    bmph.height = height;
    bmph.planes = 1;
    bmph.bit_count = 24;
    bmph.compression = 0;
    bmph.size_image = bytes_per_line*height;
    bmph.x_pels_per_meter = 0;
    bmph.y_pels_per_meter = 0;
    bmph.clr_used = 0;       
    bmph.clr_important = 0; 

    file = fopen(filename, "wb");

    if (file == NULL) { 
        eprintf("unable to open file '%s'.\n", filename);
        return EXIT_FAILURE;
    }
   
    /* write header */
    fwrite(&bmph.type, 2, 1, file);
    fwrite(&bmph.fsize, 4, 1, file);
    fwrite(&bmph.reserved, 4, 1, file);
    fwrite(&bmph.offbits, 4, 1, file);
    fwrite(&bmph.hsize, 4, 1, file);
    fwrite(&bmph.width, 4, 1, file);
    fwrite(&bmph.height, 4, 1, file);
    fwrite(&bmph.planes, 2, 1, file);
    fwrite(&bmph.bit_count, 2, 1, file);
    fwrite(&bmph.compression, 4, 1, file);
    fwrite(&bmph.size_image, 4, 1, file);
    fwrite(&bmph.x_pels_per_meter, 4, 1, file);
    fwrite(&bmph.y_pels_per_meter, 4, 1, file);
    fwrite(&bmph.clr_used, 4, 1, file);
    fwrite(&bmph.clr_important, 4, 1, file);
  
    line = (unsigned char *) malloc(bytes_per_line*sizeof(*line));

    if (line == NULL) {
        eprintf("unable to allocate memory for line buffer.\n");
        fclose(file);
        return EXIT_FAILURE;
    }

    /* 写rgb信息 */
    for (i = height - 1; i >= 0; i--) {
        for (j = 0; j < width; j++) {
            pixel_pos = 3*(width*i + j);
            line[3*j] = rgb[pixel_pos + 2];
            line[3*j + 1] = rgb[pixel_pos + 1];
            line[3*j + 2] = rgb[pixel_pos];
        }
        fwrite(line, bytes_per_line, 1, file);
    }

    free(line);
    fclose(file);

    return EXIT_SUCCESS;
}

7.2.2 Julia源码

#include 
#include 
#include 
#include 
#include "mpi.h"
#include "cmplx.h"

#define FULL_WIDTH 1024
#define CHUNK_WIDTH 32
#define MAX_ITER 1000

void plot(int* image_arr, FILE* img);
long iterator(Complex c, double im, double re);

int main(int argc, char* argv[])
{
    int *image_arr;
    int pixel_YX[3];
    int Y_start, X_start, CUR_CHUNK, disp = 0;
    int i, j;
    Complex c;
    FILE *img;
    int NUM_CHUNKS = (FULL_WIDTH / CHUNK_WIDTH) * (FULL_WIDTH / CHUNK_WIDTH);

    /** 时间相关 **/
    double start, stop;
    float elapsed_time;

    /** MPI相关变量 **/
    MPI_Status status, stat_recv;
    MPI_Request request;
    MPI_Datatype CHUNKxCHUNK, CHUNKxCHUNK_RE;
    int rankID, numProcs, numSlaves;

    /** MPI环境的初始化 **/
    MPI_Init(&argc, &argv);
    MPI_Barrier(MPI_COMM_WORLD);
    MPI_Comm_size(MPI_COMM_WORLD, &numProcs);
    MPI_Comm_rank(MPI_COMM_WORLD, &rankID);
    MPI_Barrier(MPI_COMM_WORLD);

    /** 创建类型 **/
    int full_sizes[2] = {FULL_WIDTH, FULL_WIDTH};
    int sub_sizes[2] = {CHUNK_WIDTH, CHUNK_WIDTH};
    int starting[2] = {0, 0};
    int sendcounts[numProcs];
    int displs[numProcs];

    /** 创建CHUNK */
    MPI_Type_create_subarray(
        2,
        full_sizes,
        sub_sizes,
        starting,
        MPI_ORDER_C,
        MPI_INT,
        &CHUNKxCHUNK
    );
    /** 设置偏移 **/
    MPI_Type_create_resized(
        CHUNKxCHUNK,
        0,
        CHUNK_WIDTH * sizeof(int),
        &CHUNKxCHUNK_RE
    );
    /** 提交要使用的类型 **/
    MPI_Type_commit(&CHUNKxCHUNK_RE);

    /** 从进程的个数 */
    numSlaves = numProcs - 1;

    /** 打印基本信息 */
    if(rankID == 0)
        printf("Runtime Stats:\n\tNum Procs:\t%d\n\tNum Slaves:\t%d\n", numProcs, numSlaves);

    MPI_Barrier(MPI_COMM_WORLD);

    /** 参数C的取值 */
    c.re = -0.4;
    c.im = 0.5;

    /** 主进程 */
    if(rankID == 0) {
        img = fopen("t6.ppm", "w");

        if(img == NULL) {
            printf("Could not open handle to image\n");
            return 1;
        }

        fprintf(img, "P6\n%d %d 255\n", FULL_WIDTH, FULL_WIDTH);

        image_arr = (int  *)malloc(FULL_WIDTH * FULL_WIDTH * sizeof(int));

        /** 开启计时器 */
        start = MPI_Wtime();

        /** 计算X和Y 并分发到各个节点 **/
        for(pixel_YX[2] = 0; pixel_YX[2] < numSlaves; pixel_YX[2]++) {
            pixel_YX[0] = (pixel_YX[2] / (FULL_WIDTH / CHUNK_WIDTH)) * CHUNK_WIDTH; // Y
            pixel_YX[1] = (pixel_YX[2] % (FULL_WIDTH / CHUNK_WIDTH)) * CHUNK_WIDTH; // X

            MPI_Send(
                pixel_YX,
                3,
                MPI_INT,
                pixel_YX[2] + 1,
                0,
                MPI_COMM_WORLD
            );
        }

        /** 更新当前的chunk和pixel */
        pixel_YX[2] = numSlaves;
        pixel_YX[0] = (pixel_YX[2] / (FULL_WIDTH / CHUNK_WIDTH)) * CHUNK_WIDTH; // Y
        pixel_YX[1] = (pixel_YX[2] % (FULL_WIDTH / CHUNK_WIDTH)) * CHUNK_WIDTH; // X

        /** 从X接收当前块并发送下一个块到X */
        while(pixel_YX[2] < NUM_CHUNKS) {
            /** 探测接收缓冲区，计算阵列内的位移，并接收 */
            MPI_Probe(MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &stat_recv);

            disp = ((stat_recv.MPI_TAG * CHUNK_WIDTH) % FULL_WIDTH) +
                   (((stat_recv.MPI_TAG * CHUNK_WIDTH) / FULL_WIDTH) * CHUNK_WIDTH * FULL_WIDTH);

            MPI_Recv(
                image_arr + disp,
                1,
                CHUNKxCHUNK_RE,
                stat_recv.MPI_SOURCE,
                stat_recv.MPI_TAG,
                MPI_COMM_WORLD,
                &status
            );

#ifdef DEBUG
            printf("Proc: MA\tJob: Recieved [# %d]\n", stat_recv.MPI_TAG);
#endif

            MPI_Send(
                pixel_YX,
                3,
                MPI_INT,
                status.MPI_SOURCE,
                0,
                MPI_COMM_WORLD
            );

            /** pixel_YX到下一个块值 */
            pixel_YX[2]++;
            pixel_YX[0] = (pixel_YX[2] / (FULL_WIDTH / CHUNK_WIDTH)) * CHUNK_WIDTH;
            pixel_YX[1] = (pixel_YX[2] % (FULL_WIDTH / CHUNK_WIDTH)) * CHUNK_WIDTH;
        }

        /** 最终接收匹配初始发送 */
        for(i = 0; i < numSlaves; i++) {
            MPI_Probe(MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &stat_recv);

            disp = ((stat_recv.MPI_TAG * CHUNK_WIDTH) % FULL_WIDTH) + (((stat_recv.MPI_TAG * CHUNK_WIDTH) / FULL_WIDTH) * CHUNK_WIDTH * FULL_WIDTH);

            MPI_Recv(
                image_arr + disp,
                1,
                CHUNKxCHUNK_RE,
                stat_recv.MPI_SOURCE,
                stat_recv.MPI_TAG,
                MPI_COMM_WORLD,
                &status
            );
#ifdef DEBUG
            printf("Proc: MA\tJob: Recieved [# %d]\n", stat_recv.MPI_TAG);
#endif
        }

        /** 结束当前进程 **/
        for(i = 0; i < numSlaves; i++)
            MPI_Send(
                0,
                0,
                MPI_INT,
                i + 1,
                0xFFFF,
                MPI_COMM_WORLD
            );

        /** 停止计时器并计算elapsed_time */
        stop = MPI_Wtime();
        elapsed_time = stop - start;

#ifdef DEBUG
        printf("Proc: Ma\tJob: Plotting image\n");
#endif
        plot(image_arr, img);

        printf("Algorithm completed for,\n\t%d * %d pixels\n\t%d maximum iterations\n\t\tin %f seconds.\n", \
               FULL_WIDTH, FULL_WIDTH, \
               MAX_ITER, \
               elapsed_time);

        fclose(img);
    }
    else {
        /** 每个人分配他们的image_arr部分 */
        image_arr = (int *)malloc(CHUNK_WIDTH * CHUNK_WIDTH * sizeof(int));

        /** 无限循环直到' break; ' */
        while(1) {
            MPI_Recv(
                pixel_YX,
                3,
                MPI_INT,
                0,
                MPI_ANY_TAG,
                MPI_COMM_WORLD,
                &status
            );

            /** 检查是否呼叫终止 */
            if(status.MPI_TAG == 0xFFFF) {
                printf("Proc: %d \tJob: Exiting\n", rankID);
                break;
            }

            CUR_CHUNK = pixel_YX[2];

#ifdef DEBUG
            printf("Proc: %d \tChunk %d \tJob: Algorithm\n", rankID, CUR_CHUNK);
#endif

            /** 对于每一个Y值 */
            for(i = 0; i < CHUNK_WIDTH; i++) {
                for(j = 0; j < CHUNK_WIDTH; j++) {
                    image_arr[(i * CHUNK_WIDTH) + j] = iterator(
                                                           c,
                                                           -(((pixel_YX[0] + i) - (FULL_WIDTH / 2)) / (double) FULL_WIDTH) * 2,
                                                           (((pixel_YX[1] + j) - (FULL_WIDTH / 2)) / (double) FULL_WIDTH) * 2
                                                       );
                }
            }

#ifdef DEBUG
            printf("Proc: %d \tJob: Returning [# %d]\n", rankID, CUR_CHUNK);
#endif

            /** 发送部分计算成像到MASTER */
            MPI_Send(
                image_arr,
                CHUNK_WIDTH * CHUNK_WIDTH,
                MPI_INT,
                0,
                CUR_CHUNK,
                MPI_COMM_WORLD
            );
        }
    }

    free(image_arr);

    /** 结束MPI的运行环境 */
    MPI_Type_free(&CHUNKxCHUNK_RE);
    MPI_Finalize();
    fflush(stdout);

    return 0;
}

/**
程序的主迭代函数
*/
long iterator(Complex c, double im, double re)
{
    Complex z;
    long itCount = 0;

    z.re = re;
    z.im = im;

    for(; itCount < MAX_ITER; itCount++) {
        z = cmplx_add(cmplx_squared(z), c);

        if(cmplx_magnitude(z) > 4)
            break;
    }

    return itCount + 1;
}

/**
	绘制图形
*/
void plot(int* image_arr, FILE* img)
{
    int i, j;
    unsigned char line[3 * FULL_WIDTH];

    for(i = 0; i < FULL_WIDTH; i++) {
        for(j = 0; j < FULL_WIDTH; j++) {
            if (*(image_arr + j + (i * FULL_WIDTH)) <= 63) {
                line[3 * j] = 255;
                line[3 * j + 1] = line[3 * j + 2] =
                                      255 - 4 * *(image_arr + j + (i * FULL_WIDTH));
            } else {
                line[3 * j] = 255;
                line[3 * j + 1] = *(image_arr + j + (i * FULL_WIDTH)) - 63;
                line[3 * j + 2] = 0;
            }

            if (*(image_arr + j + (i * FULL_WIDTH)) == 320)
                line[3 * j] = line[3 * j + 1] = line[3 * j + 2] = 255;
        }

        fwrite(line, 1, 3 * FULL_WIDTH, img);
    }
}

7.3 参考

https://github.com/BodneyC/JuliaSet

你可能感兴趣的:(高性能计算,julia,mandelbrot,mpi)

关于java项目中maven的理解
我的理解：maven是java项目的依赖管理工具，通过pom.xml文件配置要下载的依赖，settings.xml配置maven下载的镜像没有就默认在maven中央仓库下载依赖，本地仓库是存储下载好的依赖ai:1.功能定位局限Maven不只是依赖管理工具，更是项目构建管理工具。除依赖管理，还能实现编译（如mvncompile编译源码）、测试（mvntest执行单元测试）、打包（mvnpackage
idea 性能优化
1、cpu占用很高，导致经常卡顿排查：通过IDEAActivityMonitor，可以发现是JITcompiler占用的cpu较高。解决：help->EditCustomVMOptions，增加如下参数。重启IDEA。-XX:TieredStopAtLevel=1或者-XX:Tier4MinInvocationThreshold=100000-XX:Tier4InvocationThreshold
NCCL 核心集体通信操作深度解析：从原理到优化实践清风 001 AI大模型底层建设 gpu算力 ai
目录引言：NCCL——分布式训练的通信引擎一、NCCL基础：GPU通信的“加速器”1.1NCCL与MPI的协同1.2集体通信的价值二、NCCL核心操作深度解析2.1AllGather：全局数据聚合2.1.1定义与目标2.1.2算法原理2.1.3性能影响因素2.1.4测试方法（nccl-tests）2.2AllReduce：梯度聚合的核心2.2.1定义与目标2.2.2算法原理2.2.3性能影响因素2
Svelte滚屏插件：rollup-plugin-svelte完全指南俞兰莎Rosalind
Svelte滚屏插件：rollup-plugin-svelte完全指南rollup-plugin-svelteCompileSveltecomponentswithRollup项目地址:https://gitcode.com/gh_mirrors/ro/rollup-plugin-svelte项目介绍rollup-plugin-svelte是一款专门用于将Svelte组件编译为JavaScript
分布式推客系统架构设计：从微服务到高性能计算的实践路径 wx_ywyy6798 推客系统推客小程序推客分销系统推客系统开发推客小程序开发推客分销系统开发分销系统
一、推客系统概述与市场背景分析推客系统（PromoterSystem）作为一种创新的社交化营销工具，近年来在电商、知识付费、本地生活服务等领域展现出强大的市场渗透力。该系统本质上是一种基于社交关系的分布式营销网络，通过激励用户主动分享商品或服务信息，实现裂变式传播效果。根据2023年数字营销行业白皮书显示，采用推客系统的企业平均获客成本比传统广告渠道降低47%，转化率提升3倍以上。在数字化转型浪潮
华为自研编程语言仓颉（Cangjie）的概述与诞生背景白糖KaSTo 华为 harmonyos
一、语言定位与战略背景核心使命仓颉是华为面向全场景智能终端（HarmonyOS生态）自主研发的新一代编程语言，旨在解决传统语言在跨设备协同、安全可信、高性能计算等场景的局限性。其诞生直接呼应华为构建“端-边-云”一体化技术体系的战略需求。历史契机技术自主可控：2019年美国技术制裁背景下，华为亟需突破底层开发工具链的依赖，仓颉项目应运而生。鸿蒙生态深化：随着HarmonyOS用户量突破8亿（202
Flutter编译安卓应用时遇到的compileDebugJavaWithJavac和compileDebugKotlin版本不匹配的问题悠等生2018 前端 flutter android
记一次flutter应用，编译安卓时，报的一个compileDebugJavaWithJavac和compileDebugKotlin版本本匹配的问题。最终定位的原因是项目一来了audioplayers组件。audioplayers组件有依赖了audioplayers_android，它使用1.8编译的。版本过低。后来更新了audioplayers:^6.5.0(默认以来的audioplayers
网络层：地址解析协议ARP、网际控制报文协议ICMP、虚拟专用网络VPN、网络地址转换NAT
文章目录地址解析协议ARP解决的问题ARP解析流程ARP高速缓存网际控制报文协议ICMPICMP报文的种类ICMP差错报告报文ICMP询问报文ICMP应用举例分组网间探测PING(PacketInterNetGroper)traceroute(tracert)确定路径的MTU虚拟专用网络专用地址虚拟专用网络远程接入VPN(remoteaccessVPN)网络地址转换NAPT(NetworkAddr
springboot日志配置教程代码羊羊 spring boot spring boot java 后端
1spring-boot-starter-logging依赖maven依赖：org.springframework.bootspring-boot-starter-logging2.7.2compile实际使用springboot开发不需要直接添加该依赖，因为在spring-boot-starter里面添加了spring-boot-starter-logging，spring-boot-start
《解决 Idea Gradle Build 中 Build Tools 相关问题》只因在人海中多看了你一眼摸索学习心得 ide android studio
在使用IntelliJIDEA进行Android项目开发时，最近在执行Gradlebuild过程中遇到了一个棘手的问题：问题现象在运行Gradlebuild时，出现了这样的错误提示：Couldnotdeterminethedependenciesoftask‘:app:compileReleaseJavaWithJavac’.InstalledBuildToolsrevision35.0.0isc
探秘Linux进程间通信：ipcdump 工具高慈鹃Faye
探秘Linux进程间通信：ipcdump工具IPCDump项目地址:https://gitcode.com/gh_mirrors/ip/IPCDumpipcdump是一个强大的开源工具，专门用于追踪Linux系统中的进程间通信（IPC）。这个工具涵盖了管道、FIFO、信号、Unix套接字、回环网络和伪终端等多种常见的IPC机制。无论是调试多进程应用程序还是理解系统中各个组件之间的交互方式，ipcd
【解决方案】Building wheel for opencv-python：安装卡顿的原因与解决方案。
当你pipinstallopencv-python或pipinstallopencv-contrib-python时，命令行停在Buildingwheelforopencv-python(PEP517)...-似乎卡住了。其实，这并非程序假死，而是OpenCV这个庞大的C++library在进行compile，这个过程非常耗时。为何安装过程如此漫长？这是因为OpenCV是一个庞大的C++libra
Gradle 与 Maven 的深度对比分析
一、核心架构与设计哲学对比1.依赖管理机制维度GradleMaven声明语法Groovy/KotlinDSL（类型安全）XML（结构严谨，可读性低）动态版本支持2.5.+动态匹配仅支持固定版本（需-U强制更新）依赖作用域implementation/api精细控制compile/provided/test标准隔离冲突解决自动选择最高版本（可覆写）最短路径优先（需手动排除）Gradle优势：避免传递
A 核（应用核）与 R 核（实时核）分享
引言：嵌入式计算的“双核”分工在现代嵌入式系统与集成电路设计中，处理器核的功能分化是应对复杂场景需求的关键趋势。随着终端设备对“高性能计算”与“高可靠实时响应”的双重需求日益凸显，两类核心架构逐渐形成明确分工：A核（应用核，ApplicationCore）与R核（实时核，Real-timeCore）。A核以“高性能、通用性”为核心设计目标，专注于处理复杂多任务、图形渲染、人机交互等非实时性任务，是
Android导入compile 'com.roughike:bottom-bar:2.3.1'会导致V7包报错
出现问题Error:Executionfailedfortask':app:transformDexArchiveWithExternalLibsDexMergerForDebug'.>java.lang.RuntimeException:java.lang.RuntimeException:com.android.builder.dexing.DexArchiveMergerException:
web与Java代码保护：混淆、压缩及反编译工具详解
本文还有配套的精品资源，点击获取简介：为保障代码的安全性和保密性，IT行业中开发者采用代码混淆和压缩技术。本文将深入探讨web代码混淆压缩工具和Java代码反编译工具，解释它们的工作原理及应用。混淆工具如UglifyJS和Terser用于混淆JavaScript代码，使其难以理解；压缩工具如YUICompressor和GoogleClosureCompiler减小JavaScript和CSS文件的
对于报错..\meson.build:1:0: ERROR: Unknown compiler(s): [[‘icl‘], [‘cl‘], [‘cc‘], [‘gcc‘], [‘clang‘]等随风万里无云笔记笔记
解决方案1.安装完整的C/C++编译环境适用于Windows的官方编译器（MSVC）：下载并安装VisualStudio2022安装时勾选“使用C++的桌面开发”工作负载，并确保勾选以下组件：•MSVCv143-VS2022C++生成工具•Windows10/11SDK•C++核心功能完成安装后重启计算机2.验证编译器是否可用打开命令提示符（CMD）或PowerShell。运行以下命令检查cl.e
Python——pyautogui打地鼠游戏自动化脚本（基于图片定位）
以4399小游戏为例：4399游戏网importpyautoguiimportkeyboardimporttimeimportrandomimportloggingfromPILimportImageGrabimportos#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname)s-%(message)
交叉编译Python-3.6.0到aarch64/aarch32 —— 支持sqlite3
参考https://datko.net/2013/05/10/cross-compiling-python-3-3-1-for-beaglebone-arm-angstrom/平台主机：ubuntu14.0464bit开发板：qemu+aarch64（参考：http://www.cnblogs.com/pengdonglin137/p/6442583.html）工具链：aarch64-linux-
ESP32-S3驱动RGB屏幕显示飘移问题
为什么驱动RGBLCD屏幕时出现偏移（显示画面整体漂移）？原因PCLK设置过高，PSRAM带宽跟不上。Listitem受写flash操作影响，期间PSRAM被禁用。配置方面提高PSRAM和flash带宽，设置flash为QIO120M，PSRAM为Octal120M。开启CONFIG_COMPILER_OPTIMIZATION_PERF。降低data_cache_line_size到32Byte。
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
VUE2双向绑定的原理许先森森 VUE2 javascript 前端 vue.js vue双向绑定 vue
文章目录VUE2双向绑定的原理1.什么是双向绑定2.双向绑定的原理2.1ViewModel的重要作用2.2双向绑定的流程3.双向绑定的实现3.1data响应化处理3.2Compile编译3.3依赖收集VUE2双向绑定的原理1.什么是双向绑定讲双向绑定先讲单项绑定，啥叫单项绑定，就是一句话就是通过Model去改变View，再直白点，就是通过js代码把数据改变后，html视图也跟着变化那双项绑定就很好
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
ubuntu安装Pluto Compiler，多面体编译器-1
1）Github上下载-rw-rw-r--1aa19001097月411:52pluto-0.13.0.zip解压cd进去2）/home/a/src/llvm-project/build是我前面自己源码编译llvm的包./configure--with-clang-prefix=/home/a/src/llvm-project/build3)报错了checkingforstdlib.h...(ca
pluto compiler, pet安装报错好好学习啊天天向上 linux 运维服务器
1）./configure--includedir=/home/a/src/llvm-project/build/include--with-clang-prefix=/home/a/src/llvm-project/build2）make报如下的错ake[2]:进入目录“/home/a/src/a2.pluto-all/pluto/pet”CXXclang.loInfileincludedfro
操作系统NUMA架构下的内存一致性优化操作系统内核探秘架构 perl 开发语言 ai
操作系统NUMA架构下的内存一致性优化关键词：NUMA架构、内存一致性、缓存一致性、多核处理器、性能优化、操作系统调度、内存访问延迟摘要：本文深入探讨了NUMA(Non-UniformMemoryAccess)架构下的内存一致性优化问题。我们将从基础概念出发，逐步分析NUMA架构的特点、内存一致性的挑战，以及操作系统层面的优化策略。通过实际代码示例和性能分析，帮助读者理解如何在高性能计算环境中有效
CppCon 2018 学习:TEACHING OLD COMPILERS NEW TRICKS TEACHING OLD COMPILERS NEW TRICKS Transpiling C++17 虾球xz CppCon 学习 c++开发语言
理解问题与解决方案：C++17和编译器兼容性这个问题描述了由于编译器版本差异（特别是GCC4.9与GCC4.8），在不同编译器版本下生成的汇编代码可能会有所不同，尤其是C++17中的某些新特性和语法在老版本的编译器中可能无法正确处理。这种情况通常会导致程序行为不一致，特别是在对性能或低级代码有要求时。具体问题：问题描述：C++17特性与GCC4.9：例如，0b1000'0000是C++17中引入的
CMake学习笔记 Ethan@LM 学习笔记 c++
第1章cmake的基础命令1.1基础命令cmake-S-B-S：指定源码目录(CMakeLists.txt所在目录)。-B：指定构建目录（即输出目录）。1.2指定编译器和编译选项-DCMAKE_C_COMPILER=设置C语言编译器的路径。-DCMAKE_CXX_COMPILER=设置C++编译器的路径。-DCMAKE_C_FLAGS="-g"设置C语言编译标志（例如调试信息）。-DCMAKE_C
人工智能赋能气象气候：从数据智能到预测创新的融合之路慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：气象气候与AI的“天然耦合”气象与气候系统是典型的复杂、多尺度、强非线性的自然系统，其建模、分析与预测依赖庞大观测数据和高性能计算资源。传统方法以数值天气预报（NWP）与物理建模为核心，虽然取得重要成就，但也面临计算代价大、精度不足、长期预测偏差大等瓶颈。与此同时，人工智能（AI），尤其是以深度学习为代表的机器学习方法，近年来在图像识别、自
python 中值滤波 search7 python
中值滤波是数字信号处理和数字图像处理领域使用较多的预处理技术，使用邻域内所有信号的中位数替换中心像素的值，可以在滤除异常值的情况下较好地保留纹理信息。该技术会在一定程度上造成图像模糊和失真，滤波窗口变大时会非常明显。importnumpyasnpfromPILimportImageimportscipy.signalassignalim=Image.open('lena.jpg')data=[]w
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite