qccz123456

实战Intel MKL(Math Kernel Library)

MKL官网所有文档：https://software.intel.com/en-us/articles/intel-math-kernel-library-documentation/
MKL使用详细手册：https://software.intel.com/sites/default/files/mkl-2019-developer-reference-c_0.pdf
MKL中文入门博客：https://blog.csdn.net/zb1165048017/article/category/6857730

LAPACK学习文档：https://software.intel.com/sites/products/documentation/doclib/mkl_sa/11/mkl_lapack_examples/index.htm
查找LAPACK函数工具：https://software.intel.com/en-us/articles/intel-mkl-function-finding-advisor
查找链接库工具：https://software.intel.com/en-us/articles/intel-mkl-link-line-advisor/
intel c++ compiler与GNU c++ compiler对MKL的比较
GNU c++ compiler = gcc，gcc -o dgemm_with_timing_gcc dgemm_with_timing.c -lmkl_rt
intel c++ compiler = icc，icc -o dgemm_with_timing_icc dgemm_with_timing.c -mkl
LOOP_COUNT=220，最终结果是4.50294 vs 4.50688 ms，所以姑且认为编译器对MKL并没有多大的影响。

安装

在intel官网注册并下载mkl：https://software.intel.com/en-us/mkl
Linux下安装：
mklvars.sh说明: https://software.intel.com/en-us/mkl-linux-developer-guide-scripts-to-set-environment-variables

wget http://registrationcenter-download.intel.com/akdlm/irc_nas/tec/14895/l_mkl_2019.1.144.tgz
tar -zxvf l_mkl_2019.1.144.tgz
cd l_mkl_2019.1.144/
./install.sh
sudo vim /etc/ld.so.conf.d/intel-mkl.conf
    /path/intel/mkl/lib/intel64
    /path/intel/lib/intel64
sudo ldconfig
cd /path/intel/mkl/bin
source mklvars.sh intel64
vim dgemm_example.c  # input your code
gcc -o run_dgemm_example dgemm_example.c -lmkl_rt

实例

第一次入门教程：https://software.intel.com/en-us/mkl-tutorial-c-overview
mkl_malloc(), mkl_free(),
cblas_dgemm(), dsecnd(),
mkl_get_max_threads(), mkl_set_num_threads()

所有实例：https://software.intel.com/en-us/product-code-samples

wget https://software.intel.com/sites/default/files/ipsxe2019_samples_lin_20180731.tgz
mkdir ipsxe2019_samples_lin_20180731
tar -zxvf ipsxe2019_samples_lin_20180731.tgz -C ipsxe2019_samples_lin_20180731

（1）源码：dgemm_example.c
介绍mkl_malloc(), mkl_free(), cblas_dgemm()的用法。

#include 
#include 

#include "mkl.h"

#define min(x,y) (((x) < (y)) ? (x) : (y))

int main()
{
    double *A, *B, *C;
    int m, n, k, i, j;
    double alpha, beta;

    printf ("\n This example computes real matrix C=alpha*A*B+beta*C using \n"
            " Intel(R) MKL function dgemm, where A, B, and  C are matrices and \n"
            " alpha and beta are double precision scalars\n\n");

    m = 2000, k = 200, n = 1000;
    printf (" Initializing data for matrix multiplication C=A*B for matrix \n"
            " A(%ix%i) and matrix B(%ix%i)\n\n", m, k, k, n);
    alpha = 1.0; beta = 0.0;

    printf (" Allocating memory for matrices aligned on 64-byte boundary for better \n"
            " performance \n\n");
    A = (double *)mkl_malloc( m*k*sizeof( double ), 64 );
    B = (double *)mkl_malloc( k*n*sizeof( double ), 64 );
    C = (double *)mkl_malloc( m*n*sizeof( double ), 64 );
    if (A == NULL || B == NULL || C == NULL) {
        printf( "\n ERROR: Can't allocate memory for matrices. Aborting... \n\n");
        mkl_free(A);
        mkl_free(B);
        mkl_free(C);
        return 1;
    }

    printf (" Intializing matrix data \n\n");
    for (i = 0; i < (m*k); i++) {
        A[i] = (double)(i+1);
    }

    for (i = 0; i < (k*n); i++) {
        B[i] = (double)(-i-1);
    }

    for (i = 0; i < (m*n); i++) {
        C[i] = 0.0;
    }

    printf (" Computing matrix product using Intel(R) MKL dgemm function via CBLAS interface \n\n");
    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
                m, n, k, alpha, A, k, B, n, beta, C, n);
    printf ("\n Computations completed.\n\n");

    printf (" Top left corner of matrix A: \n");
    for (i=0; i<min(m,6); i++) {
        for (j=0; j<min(k,6); j++) {
            printf ("%12.0f", A[j+i*k]);
        }
        printf ("\n");
    }

    printf ("\n Top left corner of matrix B: \n");
    for (i=0; i<min(k,6); i++) {
        for (j=0; j<min(n,6); j++) {
            printf ("%12.0f", B[j+i*n]);
        }
        printf ("\n");
    }

    printf ("\n Top left corner of matrix C: \n");
    for (i=0; i<min(m,6); i++) {
        for (j=0; j<min(n,6); j++) {
            printf ("%12.5G", C[j+i*n]);
        }
        printf ("\n");
    }

    printf ("\n Deallocating memory \n\n");
    mkl_free(A);
    mkl_free(B);
    mkl_free(C);

    printf (" Example completed. \n\n");
    return 0;
}

cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
                m, n, k, alpha, A, k, B, n, beta, C, n);
                
// C = alpha *A * B + beta * C
// CblasRowMajor：表示矩阵按行主顺序存储，矩阵每行的元素连续存储。
// CblasNoTrans：枚举类型，表示矩阵A和B不应在乘法之前进行转置或共轭转置。
// m, n, k：表示矩阵大小的整数，A：m行乘k列。B：k行乘n列。C：m行n列
// alpha：用于缩放矩阵A和B的乘积的实际值。
// A：用于存储矩阵A的数组。
// k：数组A的前导维度，或内存中连续行（行主存储）之间的元素数量。在本练习的情况下，前导尺寸与列数相同。
// B：用于存储矩阵B的数组。
// n：数组B的前导维度，或内存中连续行（行主存储）之间的元素数量。在本练习的情况下，前导尺寸与列数相同。
// beta：用于缩放矩阵C的实际值。
// C：用于存储矩阵C的数组。
// n：数组C的前导维度，或内存中连续行（行主存储）之间的元素数。在本练习的情况下，前导尺寸与列数相同。

运行结果如下：

$ ./run_dgemm_example

 This example computes real matrix C=alpha*A*B+beta*C using
 Intel(R) MKL function dgemm, where A, B, and  C are matrices and
 alpha and beta are double precision scalars

 Initializing data for matrix multiplication C=A*B for matrix
 A(2000x200) and matrix B(200x1000)

 Allocating memory for matrices aligned on 64-byte boundary for better
 performance

 Intializing matrix data

 Computing matrix product using Intel(R) MKL dgemm function via CBLAS interface


 Computations completed.

 Top left corner of matrix A:
           1           2           3           4           5           6
         201         202         203         204         205         206
         401         402         403         404         405         406
         601         602         603         604         605         606
         801         802         803         804         805         806
        1001        1002        1003        1004        1005        1006

 Top left corner of matrix B:
          -1          -2          -3          -4          -5          -6
       -1001       -1002       -1003       -1004       -1005       -1006
       -2001       -2002       -2003       -2004       -2005       -2006
       -3001       -3002       -3003       -3004       -3005       -3006
       -4001       -4002       -4003       -4004       -4005       -4006
       -5001       -5002       -5003       -5004       -5005       -5006

 Top left corner of matrix C:
 -2.6666E+09 -2.6666E+09 -2.6667E+09 -2.6667E+09 -2.6667E+09 -2.6667E+09
 -6.6467E+09 -6.6467E+09 -6.6468E+09 -6.6468E+09 -6.6469E+09  -6.647E+09
 -1.0627E+10 -1.0627E+10 -1.0627E+10 -1.0627E+10 -1.0627E+10 -1.0627E+10
 -1.4607E+10 -1.4607E+10 -1.4607E+10 -1.4607E+10 -1.4607E+10 -1.4607E+10
 -1.8587E+10 -1.8587E+10 -1.8587E+10 -1.8587E+10 -1.8588E+10 -1.8588E+10
 -2.2567E+10 -2.2567E+10 -2.2567E+10 -2.2567E+10 -2.2568E+10 -2.2568E+10

 Deallocating memory

 Example completed.

（2）源码：dgemm_with_timing.c
介绍dsecnd()用于统计性能情况。

#include 
#include 
#include "mkl.h"

/* Consider adjusting LOOP_COUNT based on the performance of your computer */
/* to make sure that total run time is at least 1 second */
#define LOOP_COUNT 10

int main()
{
    double *A, *B, *C;
    int m, n, p, i, r;
    double alpha, beta;
    double s_initial, s_elapsed;

    printf ("\n This example measures performance of Intel(R) MKL function dgemm \n"
            " computing real matrix C=alpha*A*B+beta*C, where A, B, and C \n"
            " are matrices and alpha and beta are double precision scalars\n\n");

    m = 2000, p = 200, n = 1000;
    printf (" Initializing data for matrix multiplication C=A*B for matrix \n"
            " A(%ix%i) and matrix B(%ix%i)\n\n", m, p, p, n);
    alpha = 1.0; beta = 0.0;

    printf (" Allocating memory for matrices aligned on 64-byte boundary for better \n"
            " performance \n\n");
    A = (double *)mkl_malloc( m*p*sizeof( double ), 64 );
    B = (double *)mkl_malloc( p*n*sizeof( double ), 64 );
    C = (double *)mkl_malloc( m*n*sizeof( double ), 64 );
    if (A == NULL || B == NULL || C == NULL) {
        printf( "\n ERROR: Can't allocate memory for matrices. Aborting... \n\n");
        mkl_free(A);
        mkl_free(B);
        mkl_free(C);
        return 1;
    }

    printf (" Intializing matrix data \n\n");
    for (i = 0; i < (m*p); i++) {
        A[i] = (double)(i+1);
    }

    for (i = 0; i < (p*n); i++) {
        B[i] = (double)(-i-1);
    }

    for (i = 0; i < (m*n); i++) {
        C[i] = 0.0;
    }

    printf (" Making the first run of matrix product using Intel(R) MKL dgemm function \n"
            " via CBLAS interface to get stable run time measurements \n\n");
    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
                m, n, p, alpha, A, p, B, n, beta, C, n);

    printf (" Measuring performance of matrix product using Intel(R) MKL dgemm function \n"
            " via CBLAS interface \n\n");
    s_initial = dsecnd();
    for (r = 0; r < LOOP_COUNT; r++) {
        cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
                    m, n, p, alpha, A, p, B, n, beta, C, n);
    }
    s_elapsed = (dsecnd() - s_initial) / LOOP_COUNT;

    printf (" == Matrix multiplication using Intel(R) MKL dgemm completed == \n"
            " == at %.5f milliseconds == \n\n", (s_elapsed * 1000));

    printf (" Deallocating memory \n\n");
    mkl_free(A);
    mkl_free(B);
    mkl_free(C);

    if (s_elapsed < 0.9/LOOP_COUNT) {
        s_elapsed=1.0/LOOP_COUNT/s_elapsed;
        i=(int)(s_elapsed*LOOP_COUNT)+1;
        printf(" It is highly recommended to define LOOP_COUNT for this example on your \n"
               " computer as %i to have total execution time about 1 second for reliability \n"
               " of measurements\n\n", i);
    }

    printf (" Example completed. \n\n");
    return 0;
}

运行结果如下：

$ ./run_dgemm_with_timing

 This example measures performance of Intel(R) MKL function dgemm
 computing real matrix C=alpha*A*B+beta*C, where A, B, and C
 are matrices and alpha and beta are double precision scalars

 Initializing data for matrix multiplication C=A*B for matrix
 A(2000x200) and matrix B(200x1000)

 Allocating memory for matrices aligned on 64-byte boundary for better
 performance

 Intializing matrix data

 Making the first run of matrix product using Intel(R) MKL dgemm function
 via CBLAS interface to get stable run time measurements

 Measuring performance of matrix product using Intel(R) MKL dgemm function
 via CBLAS interface

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 4.53907 milliseconds ==

 Deallocating memory

 It is highly recommended to define LOOP_COUNT for this example on your
 computer as 221 to have total execution time about 1 second for reliability
 of measurements

 Example completed.

（3）源码：matrix_multiplication.c
用于比较普通CPU计算和MKL的性能差距。

#define min(x,y) (((x) < (y)) ? (x) : (y))

#include 
#include 
#include "mkl.h"

/* Consider adjusting LOOP_COUNT based on the performance of your computer */
/* to make sure that total run time is at least 1 second */
#define LOOP_COUNT 10

int main()
{
    double *A, *B, *C;
    int m, n, p, i, j, k, r;
    double alpha, beta;
    double sum;
    double s_initial, s_elapsed;

    printf ("\n This example measures performance of rcomputing the real matrix product \n"
            " C=alpha*A*B+beta*C using a triple nested loop, where A, B, and C are \n"
            " matrices and alpha and beta are double precision scalars \n\n");

    m = 2000, p = 200, n = 1000;
    printf (" Initializing data for matrix multiplication C=A*B for matrix \n"
            " A(%ix%i) and matrix B(%ix%i)\n\n", m, p, p, n);
    alpha = 1.0; beta = 0.0;

    printf (" Allocating memory for matrices aligned on 64-byte boundary for better \n"
            " performance \n\n");
    A = (double *)mkl_malloc( m*p*sizeof( double ), 64 );
    B = (double *)mkl_malloc( p*n*sizeof( double ), 64 );
    C = (double *)mkl_malloc( m*n*sizeof( double ), 64 );
    if (A == NULL || B == NULL || C == NULL) {
        printf( "\n ERROR: Can't allocate memory for matrices. Aborting... \n\n");
        mkl_free(A);
        mkl_free(B);
        mkl_free(C);
        return 1;
    }

    printf (" Intializing matrix data \n\n");
    for (i = 0; i < (m*p); i++) {
        A[i] = (double)(i+1);
    }

    for (i = 0; i < (p*n); i++) {
        B[i] = (double)(-i-1);
    }

    for (i = 0; i < (m*n); i++) {
        C[i] = 0.0;
    }

    printf (" Making the first run of matrix product using triple nested loop\n"
            " to get stable run time measurements \n\n");
    for (i = 0; i < m; i++) {
        for (j = 0; j < n; j++) {
            sum = 0.0;
            for (k = 0; k < p; k++)
                sum += A[p*i+k] * B[n*k+j];
            C[n*i+j] = sum;
        }
    }

    printf (" Measuring performance of matrix product using triple nested loop \n\n");
    s_initial = dsecnd();
    for (r = 0; r < LOOP_COUNT; r++) {
        for (i = 0; i < m; i++) {
            for (j = 0; j < n; j++) {
                sum = 0.0;
                for (k = 0; k < p; k++)
                    sum += A[p*i+k] * B[n*k+j];
                C[n*i+j] = sum;
            }
        }
    }
    s_elapsed = (dsecnd() - s_initial) / LOOP_COUNT;

    printf (" == Matrix multiplication using triple nested loop completed == \n"
            " == at %.5f milliseconds == \n\n", (s_elapsed * 1000));

    printf (" Deallocating memory \n\n");
    mkl_free(A);
    mkl_free(B);
    mkl_free(C);

    if (s_elapsed < 0.9/LOOP_COUNT) {
        s_elapsed=1.0/LOOP_COUNT/s_elapsed;
        i=(int)(s_elapsed*LOOP_COUNT)+1;
        printf(" It is highly recommended to define LOOP_COUNT for this example on your \n"
               " computer as %i to have total execution time about 1 second for reliability \n"
               " of measurements\n\n", i);
    }

    printf (" Example completed. \n\n");
    return 0;
}

运行结果如下：

$ ./run_matrix_multiplication

 This example measures performance of rcomputing the real matrix product
 C=alpha*A*B+beta*C using a triple nested loop, where A, B, and C are
 matrices and alpha and beta are double precision scalars

 Initializing data for matrix multiplication C=A*B for matrix
 A(2000x200) and matrix B(200x1000)

 Allocating memory for matrices aligned on 64-byte boundary for better
 performance

 Intializing matrix data

 Making the first run of matrix product using triple nested loop
 to get stable run time measurements

 Measuring performance of matrix product using triple nested loop

 == Matrix multiplication using triple nested loop completed ==
 == at 1408.21425 milliseconds ==

 Deallocating memory

 Example completed.

（4）源码：dgemm_threading_effect_example.c
用于设置MKL运行的线程数，mkl_set_num_threads()。

#include 
#include 
#include "mkl.h"

/* Consider adjusting LOOP_COUNT based on the performance of your computer */
/* to make sure that total run time is at least 1 second */
#define LOOP_COUNT 220  // 220 用于更精确的统计

int main()
{
    double *A, *B, *C;
    int m, n, p, i, j, r, max_threads;
    double alpha, beta;
    double s_initial, s_elapsed;

    printf ("\n This example demonstrates threading impact on computing real matrix product \n"
            " C=alpha*A*B+beta*C using Intel(R) MKL function dgemm, where A, B, and C are \n"
            " matrices and alpha and beta are double precision scalars \n\n");

    m = 2000, p = 200, n = 1000;
    printf (" Initializing data for matrix multiplication C=A*B for matrix \n"
            " A(%ix%i) and matrix B(%ix%i)\n\n", m, p, p, n);
    alpha = 1.0; beta = 0.0;

    printf (" Allocating memory for matrices aligned on 64-byte boundary for better \n"
            " performance \n\n");
    A = (double *)mkl_malloc( m*p*sizeof( double ), 64 );
    B = (double *)mkl_malloc( p*n*sizeof( double ), 64 );
    C = (double *)mkl_malloc( m*n*sizeof( double ), 64 );
    if (A == NULL || B == NULL || C == NULL) {
        printf( "\n ERROR: Can't allocate memory for matrices. Aborting... \n\n");
        mkl_free(A);
        mkl_free(B);
        mkl_free(C);
        return 1;
    }

    printf (" Intializing matrix data \n\n");
    for (i = 0; i < (m*p); i++) {
        A[i] = (double)(i+1);
    }

    for (i = 0; i < (p*n); i++) {
        B[i] = (double)(-i-1);
    }

    for (i = 0; i < (m*n); i++) {
        C[i] = 0.0;
    }

    max_threads = mkl_get_max_threads();
    printf (" Finding max number %d of threads Intel(R) MKL can use for parallel runs \n\n", max_threads);

    printf (" Running Intel(R) MKL from 1 to %i threads \n\n", max_threads*2);
    for (i = 1; i <= max_threads*2; i++) {
        for (j = 0; j < (m*n); j++)
            C[j] = 0.0;

        mkl_set_num_threads(i);

        cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
                    m, n, p, alpha, A, p, B, n, beta, C, n);

        s_initial = dsecnd();
        for (r = 0; r < LOOP_COUNT; r++) {
            cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
                        m, n, p, alpha, A, p, B, n, beta, C, n);
        }
        s_elapsed = (dsecnd() - s_initial) / LOOP_COUNT;

        printf (" == Matrix multiplication using Intel(R) MKL dgemm completed ==\n"
                " == at %.5f milliseconds using %d thread(s) ==\n\n", (s_elapsed * 1000), i);
    }

    printf (" Deallocating memory \n\n");
    mkl_free(A);
    mkl_free(B);
    mkl_free(C);

    if (s_elapsed < 0.9/LOOP_COUNT) {
        s_elapsed=1.0/LOOP_COUNT/s_elapsed;
        i=(int)(s_elapsed*LOOP_COUNT)+1;
        printf(" It is highly recommended to define LOOP_COUNT for this example on your \n"
               " computer as %i to have total execution time about 1 second for reliability \n"
               " of measurements\n\n", i);
    }

    printf (" Example completed. \n\n");
    return 0;
}

运行结果如下，当mkl_get_max_threads等于physical cores数时，性能是最佳的，并不是线程数，也就是如下的4，而不是8：

$ lscpu
Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                8
On-line CPU(s) list:   0-7
Thread(s) per core:    2
Core(s) per socket:    4
Socket(s):             1
NUMA node(s):          1
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 94
Model name:            Intel(R) Core(TM) i7-6770HQ CPU @ 2.60GHz
Stepping:              3
CPU MHz:               1100.549
CPU max MHz:           3500.0000
CPU min MHz:           800.0000
BogoMIPS:              5184.00
Virtualization:        VT-x
L1d cache:             32K
L1i cache:             32K
L2 cache:              256K
L3 cache:              6144K
NUMA node0 CPU(s):     0-7

$ ./run_dgemm_threading_effect_example                                        
 This example demonstrates threading impact on computing real matrix product
 C=alpha*A*B+beta*C using Intel(R) MKL function dgemm, where A, B, and C are
 matrices and alpha and beta are double precision scalars

 Initializing data for matrix multiplication C=A*B for matrix
 A(2000x200) and matrix B(200x1000)

 Allocating memory for matrices aligned on 64-byte boundary for better
 performance

 Intializing matrix data

 Finding max number 4 of threads Intel(R) MKL can use for parallel runs

 Running Intel(R) MKL from 1 to 8 threads

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 15.47987 milliseconds using 1 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 8.00033 milliseconds using 2 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 5.51243 milliseconds using 3 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 4.68829 milliseconds using 4 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 4.82797 milliseconds using 5 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 4.83322 milliseconds using 6 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 4.98721 milliseconds using 7 thread(s) ==

 == Matrix multiplication using Intel(R) MKL dgemm completed ==
 == at 4.76135 milliseconds using 8 thread(s) ==

 Deallocating memory

 Example completed.

HDMIheb.dll hpgtg311.dll HPCommon.dll HQTTS.0409.409.dll HpuFunction.dll hpzpe4v3.DLL Hardware a***0738 microsoft visual studio windows
在使用电脑系统时经常会出现丢失找不到某些文件的情况，由于很多常用软件都是采用MicrosoftVisualStudio编写的，所以这类软件的运行需要依赖微软VisualC++运行库，比如像QQ、迅雷、Adobe软件等等，如果没有安装VC++运行库或者安装的版本不完整，就可能会导致这些软件启动时报错，提示缺少库文件。如果我们遇到关于文件在系统使用过程中提示缺少找不到的情况，如果文件是属于运行库文件的
InfiniBand架构规范第一卷：深入解析高性能计算的未来明祯跃
InfiniBand架构规范第一卷：深入解析高性能计算的未来【下载地址】InfiniBand架构规范第一卷探索InfiniBand架构的奥秘，开启高性能计算的新篇章！本资源提供InfiniBand架构规范第一卷1.4版本，深入解析RDMA和RoCE核心协议，助您掌握高速网络通信的精髓。无论是高性能计算还是数据中心领域，这份文档都是您不可或缺的指南。下载、解压、阅读，轻松获取前沿技术知识，提升专业能
《多设备协同训练：HarmonyOS联邦学习驱动Unity游戏AI进化》爱学习的小齐哥哥 HarmonyOS 5 Unity 游戏 HarmonyOS5 unity 游戏引擎 Unity 游戏
随着游戏产业的智能化升级，游戏AI正从传统的规则驱动向数据驱动的“自进化”模式转型。然而，传统游戏AI训练面临数据孤岛、计算资源受限、隐私安全风险三大核心挑战：单设备训练难以处理复杂场景的海量数据，集中式训练需上传用户行为数据（侵犯隐私），且高性能计算依赖云端或专用硬件（成本高、延迟大）。在此背景下，HarmonyOS联邦学习与多设备协同训练的融合，为Unity游戏AI的智能化进化提供了突破性解决
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
探索高性能网络前沿：InfiniBand协议规范深度解读霍列领Hector
探索高性能网络前沿：InfiniBand协议规范深度解读【下载地址】IB协议规范文档下载IB协议规范文档下载项目地址:https://gitcode.com/open-source-toolkit/3c4e6项目介绍在高速数据传输与高性能计算的世界里，InfiniBand协议犹如一盏明灯，照亮了高效数据中心和超级计算的未来之路。今天，我们特别推荐一个宝贵的开源项目——【IB协议规范文档下载】。该项
什么是OpenHPC？ cumj63710 大数据 java python 编程语言 linux
高性能计算（HPC）（将计算机聚合到群集中以提高计算速度和功能）在很大程度上取决于连接和管理群集中各个节点的软件。Linux是主要的HPC操作系统，许多HPC站点使用不同的科学应用程序，库和其他工具扩展了该操作系统的功能。随着HPC开始开发，编译HPC软件的HPC站点之间存在相当多的重复和冗余，并且有时不同软件组件之间的依赖性使安装变得繁琐。针对这些问题创建了OpenHPC项目。OpenHPC是基
rhel.amd64 和 rhel.arm64两个架构的区别 ma451152002 架构 amd64 arm64
指令集与设计哲学的区别rhel.amd64基于x86_64（即AMD64）架构，采用复杂指令集计算（CISC）设计，强调高性能计算能力，适合桌面、服务器等对算力要求高的场景。而rhel.arm64基于ARMv8-A架构，采用精简指令集计算（RISC）设计，注重能效比，适合移动设备、嵌入式系统等低功耗场景。359硬件兼容性与应用领域amd64架构由AMD和Intel共同主导，兼容传统x86软件生态，
什么是RoCE网络技术
RoCE网络技术：高性能计算的网络互联方案一、RoCE的定义与核心定位RoCE（RDMAoverConvergedEthernet）是一种基于以太网的远程直接内存访问（RDMA）技术，旨在通过标准以太网基础设施实现低延迟、高带宽的数据传输。它将RDMA的高效数据传输能力与以太网的兼容性结合，主要用于数据中心高性能计算（HPC）、云计算和大规模存储集群等场景。技术本质：RoCE属于RDMA技术家族的
windows下如何开启HUGE PAGES unavailable 蹦极的考拉 windows HUGEPAGES 启用大页
启用大页（HugePages）是一种优化内存使用和提高性能的方法，尤其适用于需要大量内存的应用程序（如数据库和高性能计算，Tip：现在好多人哇矿要用到这个，否则计算能力直接拦腰）。大页可以显著减少页表项，从而减少TLB（TranslationLookasideBuffer）缓存未命中，提高内存访问效率。下面是具体配置：直接打开控制面板->搜索策略，找到本地策略组计算机配置->windows设置->
内存条能超频吗？我需要超频吗？ RoboWizard 科技
内存条能超频吗？内存条可以超频。超频指的是通过增加内存模块的工作频率，从而达到比默认出厂设置更高的性能水平。许多内存品牌都支持超频功能，金士顿作为业内知名品牌之一，旗下多款内存产品如KingstonFURY系列支持超频。超频可以提高计算机系统的整体性能，尤其是对于游戏玩家和需要高性能计算的专业用户。然而，过度超频带有一定的风险，可能导致系统不稳定甚至损坏，因此超频操作应谨慎进行。1.什么是内存超频
车载诊断架构 --- 基于HPC的诊断思考汽车电子实验室思考汽车行业架构 HPC软件架构 ZEVonUDS-J1979 车载通信网络槪述汽车基于HPC的诊断思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
如何学习C++ 启明源码学习 c++开发语言
学习C++是一个系统而逐步的过程，特别适合希望深入理解编程底层原理、从事系统开发、游戏开发或高性能计算的开发者。以下是一份详细的学习路线图和资源建议，适合初学者逐步深入学习：一、学习前准备1.掌握基础计算机知识操作系统基础（如：内存、进程、文件）编程基础（如果有C、Python经验会更快上手）二、C++学习路线图1.入门阶段：语法和基础目标：掌握基本语法，能写简单程序学习内容：变量、数据类型、输入
ThinkPHP结合使用PHPConsole向Chrome 控制台输出SQL 少湖说编程实践 chrome sql android
在Chrome中安装PHPConsole插件下载PHPConsole服务器端程序包到ThinkPHP的Vendor目录下例如/ThinkPHP/Extend/Vendor/PhpConsole编写Behaviour行为类PhpConsoleBehavior.classfalse,);publicfunctionrun(&$params){if(C('PHP_CONSOLE')){if(APP_DE
编译器优化简介 arong-xu Modern C++c++编译器优化
编译器优化是提升程序性能的关键技术.通过对代码生成过程的优化,编译器能够显著提高程序运行效率,减少内存占用,并缩短执行时间.在本文中,我们将以Clang编译器为例,详细解析常见的优化技术,并展示实际代码的优化效果.一.编译器优化编译器优化在以下场景尤为重要:嵌入式系统:需要最小化内存占用.高性能计算:追求极致的运行速度.实时应用:降低延迟,保证响应时间.编译器优化分类编译器优化主要分为以下几类:代
西南站丨AI驱动仿真未来，2025 Altair区域技术交流会报名开启！
邀请函在AI技术不断演进与应用边界持续拓展的当下，仿真与人工智能、高性能计算的深度融合正在加速推动产品研发模式的智能化变革。从早期设计预测到多物理场优化，从自动化建模到仿真流程智能调度，AI增强仿真正日益成为企业构建核心竞争力的关键引擎。作为“AI驱动，仿真未来”区域巡回系列会议的重要一站，Altair将于6月27日在成都举办西南站“2025Altair区域技术交流会”，汇聚来自制造、汽车、民用航
AMD64 和 ARM64 小玉起起电脑服务器
1.架构基础特性AMD64ARM64全称AMD64（也叫x86_64）ARM64（也叫AArch64或ARMv8）开发者AMD（起源于Intel的x86架构）ARMHoldings指令集类型基于CISC（复杂指令集计算）基于RISC（精简指令集计算）支持位数64位64位适用场景桌面、服务器、高性能计算设备移动设备、嵌入式设备、低功耗服务器典型设备Intel/AMD处理器（如Ryzen、Core系列
PHP技术生态的深度整合与跨领域创新(2) seopthonshentong php wpf 开发语言
PHP技术生态的深度整合与跨领域创新作为本系列的最终扩展篇，我们将探索PHP技术在现代IT生态系统中的深度整合方式，以及如何通过跨领域创新开辟PHP应用的新疆界。本文适合希望将PHP技术栈与前沿领域结合的资深架构师和技术决策者。1.云原生深度集成服务网格适配层phpclassServiceMeshAdapter{private$sidecarProxy;publicfunction__constr
人工智能混合编程实践：C++调用封装好的DLL进行图像超分重建（v2.0） FriendshipT 人工智能混合编程实践人工智能 c++开发语言超分辨率重建图像处理
人工智能混合编程实践：C++调用封装好的DLL进行图像超分重建（v2.0）前言相关介绍C++简介ONNX简介ONNXRuntime简介**核心特点**DLL简介**核心特点****创建与使用****应用场景****优点与挑战**图像异常检测简介应用场景前提条件实验环境项目结构C++调用封装好的DLL进行图像超分重建C++调用dll的相关代码framework.hpch.hcxx_infer_sr.
企业内训｜Nvidia智算中心深度技术研修-某智算厂商研发中心 TsingtaoAI Nvidia 智算集群企业内训智算中心 gpu算力 GPU培训
课程概述此企业内训课程“Nvidia智算中心的深度技术研修”专为某智算厂商研发中心设计，内容涵盖了从基础设施构建到高性能计算优化的全方位技术要点。课程为期七天，分模块详细讲解了NV算力资源的网络架构、存储优化、智算集群的建设与自动化管理、NCCL通信优化及分布式训练进阶等内容，结合大量实际案例，深入探讨各类技术在智算中心中的应用与最佳实践。通过该课程，学员将全面掌握高效构建和管理智算平台的技能，为
CPU虚拟化与主板兼容性详解月末刀戈虚拟化 CPU封装 ZIF机制 LGA PGA
CPU虚拟化与主板兼容性详解背景简介在现代计算机系统中，CPU与主板的兼容性、CPU的虚拟化技术及物理封装，是构建一台高性能计算机所必须考虑的重要因素。本文将深入探讨这些主题，并尝试揭示其背后的原理及其对于硬件配置的意义。第二代虚拟化扩展CPU的第二代虚拟化扩展，例如英特尔的扩展页表（EPT）和AMD的快速虚拟化索引（RVI），主要目的是为了改善虚拟内存的管理。这些技术使得虚拟化软件能够更有效地进
小程序WebAssembly实践：用Rust实现高性能计算模块的完整路径即可皕微信小程序小程序 wasm rust
引言在小程序生态中，JavaScript因其动态类型和解释执行特性，在处理复杂计算时可能成为性能瓶颈。通过WebAssembly（WASM）技术，开发者可将计算密集型逻辑迁移到更高效的底层语言（如Rust），实现性能的跨数量级提升。本文将通过完整实践路径，演示如何用Rust编写高性能计算模块，并集成到微信小程序中。一、技术选型与原理1.1为什么选择Rust+WebAssembly？性能优势：Rus
[paper] Look Into Person AlgoComp paper reading 计算机视觉
(CVPR2017)LookintoPerson:Self-supervisedStructure-sensitiveLearningandANewBenchmarkforHumanParsingPaper:http://www.linliang.net/files/CVPR17_LIP.pdfProject:http://hcp.sysu.edu.cn/lip/index.phpCode:htt
abaqus高性能服务器怎么用,高性能计算平台ABAQUS任务调度使用说明作者陈林E-Mailchenlin.PDF... AI那点事 abaqus高性能服务器怎么用
高性能计算平台ABAQUS任务调度使用说明作者陈林E-Mailchenlin.PDF高性能计算平台ABAQUS任务调度使用说明作者：陈林E-Mail：chenlin@日期：2017-1-101．任务脚本，参考附件例子job#!/bin/sh#PBS-NABAQUS_24cpu#PBS-lnodes=6:ppn=4#PBS-joe#PBS-qfemqueINPUT_FILE="job.inp"OUT
GPU 服务器：高性能计算的强大引擎海域云李潮海服务器运维云计算
一、GPU服务器概述GPU服务器是一种专门为处理复杂计算任务而设计的服务器。它配备了高性能的图形处理单元（GPU），能够在深度学习、科学计算、视频编解码等多个领域发挥强大的作用。据统计，在深度学习领域，GPU服务器能够将模型训练时间缩短数倍甚至数十倍。在科学计算方面，它可以快速处理大规模数据，例如在气象预测中，能够加速复杂的计算过程，提高预测的准确性。同时，GPU服务器具有出色的稳定性，可长时间连
JAX革命性优势解剖：GPU/TPU自动并行计算实战 AI咸鱼保护协会分布式算法人工智能 gpu算力计算机
近年来，大模型训练与科学计算对算力的需求呈现指数级增长。传统框架面临硬件绑定深、并行编码复杂、跨平台迁移成本高三大痛点。Google开源的JAX框架通过函数式编程范式、XLA编译优化与自动并行原语，正在重塑高性能计算的技术栈。一、JAX核心优势：三位一体的技术突破1.1函数式编程+即时编译（JIT）与PyTorch/TensorFlow的面向对象范式不同，JAX强制纯函数设计：#传统PyTorch
自学导航页（待续ing） weixin_30736301
1博客导航1.1linuxlinux全线教程–提供了linux教程，服务器管理教程，BSD教程，还有编程语言（C/Java/Python/Perl），以及网络等全栈学习教程1.2存储技术NoSQLFan–关注NoSQL相关的新闻与技术刘爱贵的专栏–中科院博士，长期从事存储领域研发工作，分式存储资深理论研究与实践者，GlusterFS技术专家，当前专注于ServerSAN。gnuhpc的百草园和三味
集群的种类 Ares-Wang 服务器 linux
集群系统主要分为负载均衡(LoadBalance)集群，简称LB高可用(HighAvailability)集群，简称HA集群高性能计算(HighPerfermanceComputing)集群，简称HPC集群
24核32G，千兆共享：裸金属服务器的技术原理与优势小艺E 服务器运维
在云计算和数据中心领域，裸金属服务器正逐渐成为企业追求高性能计算的热门选择。本文将深入探讨裸金属服务器的技术原理，以及以“24核32G，千兆共享”配置为代表的裸金属服务器所具备的独特优势。一、裸金属服务器的技术原理（一）什么是裸金属服务器？裸金属服务器（BareMetalServer）是一种介于传统物理服务器和虚拟化云服务器之间的计算资源形态。它本质上是一台独立的物理服务器，但通过云平台的管理方式
从【逻辑移位】到循环魔法：一文掌握 x86 移位指令，解锁底层编程的速度与精度南玖yy x86 汇编实战：从实模式到保护模式解锁系统底层密码汇编后端架构 asm
欢迎进入x86移位指令的奇幻世界：操控二进制的终极魔法在计算机的底层世界里，数据以二进制位（0和1）的形式流动，而移位指令就是操控这些二进制位的核心魔法。它们如同数字管道中的“智能搬运工”，能精准移动、旋转、甚至跨寄存器传递数据位，让计算机以近乎原子级的精度处理信息。无论是编写操作系统内核、加密算法，还是优化高性能计算代码，移位指令都是你必须掌握的“汇编必修课”。为什么移位指令如此重要？性能的基石
京东零售招前端·亦庄
京东零售招前端·亦庄国际部门要求熟悉react加分项:next.jsC端业务联系emhpc2hhb2ZlaUBqZC5jb20=(base64)
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

实战Intel MKL(Math Kernel Library)

安装

实例

你可能感兴趣的:(高性能计算HPC)