NEON矩阵乘法

1、原始算法

假设一个矩阵是按列存储,下面是C语言代码:

void matrix_multiply_c(float32_t *A, float32_t *B, float32_t *C, uint32_t n, uint32_t m, uint32_t k) {
   
    for 

你可能感兴趣的:(性能优化,矩阵,算法,人工智能,arm开发)