下载源码并安装使用 cblas+lapack,参考:
https://www.linuxidc.com/Linux/2015-02/113169.htm
https://blog.csdn.net/mlnotes/article/details/9676269
按照上面所说的编译后,可能会出错,
xerbla.f:(.text+0x69): undefined reference to '_gfortran_st_write'
需要修改build命令:(加上 -lgfortran 即可)
g++ main.cpp /home/fang/blas/installs/lib/libcblas.a /home/fang/blas/installs/lib/libblas.a -lgfortran -o main
learn blas:
http://www.netlib.org/blas/index.html#_documentation
https://blog.csdn.net/cocoonyang/article/category/5715477
最重要的一个接口函数 gemm=general matrix*matrix(gemv=general matrix*vector)
void cblas_sgemm( const enum CBLAS_ORDER Order,
const enum CBLAS_TRANSPOSE TransA,
const enum CBLAS_TRANSPOSE TransB,
const int M, const int N, const int K,
const float alpha,
const float *A,const int lda,
const float *B, const int ldb,
const float beta,
float *C, const int ldc)
SGEMM performs one of the matrix-matrix operations
C := alpha*op( A )*op( B ) + beta*C,
where op( X ) is one of
op( X ) = X or op( X ) = X**T,
参数含义
const enum CBLAS_ORDER Order
数据存储形式,在CBLAS的函数中无论一维还是二维数据都是用一维数组存储,这就要涉及是行主序还是列主序,
在C语言中数组是用 行主序,fortran中是列主序。我还是习惯于是用行主序,所以这个参数是用CblasRowMajor,如果是列主序的话就是 CblasColMajor
数组输入为 A[1,2,3,4,5,6,7,8,9]
行主序,则A:
[1,2,3]
[4,5,6]
[7,8,9]
列主序:
[1,4,7]
[2,5,8]
[3,6,9]
TransA , TransB
CblasNoTrans op就是对应的矩阵,没有转置操作
CblasTrans op是对应矩阵的转置
CblasConjTrans op转置应该是以反斜线为轴
矩阵A M*K
矩阵B K*N
矩阵C M*N
const int lda, const int ldb, const int ldc
在BLAS的文档里,这三个参数分别为ABC的行数,但是实际使用发现,在CBLAS里应该是列数。
//因为程序是C++,而CBLAS是C语言写的,所以在此处用extern关键字
extern"C"
{
#include"cblas.h" //由于cblas.h文件已经拷贝到工作目录中,只需用双引号
}
#include
using namespace std;
int main(void) {
const int M=4;
const int N=2;
const int K=3;
const float A[M*K]={1,2,3,4,5,6,7,8,9,8,7,6};
const float B[K*N]={5,4,3,2,1,0};
const enum CBLAS_ORDER Order=CblasRowMajor;
const enum CBLAS_TRANSPOSE TransA=CblasNoTrans;
const enum CBLAS_TRANSPOSE TransB=CblasNoTrans;
const float alpha=1;
const float beta=0;
const int lda=K;//A的列
const int ldb=N;//B的列
const int ldc=N;//C的列
float C[M*N];
cout<<"input <--- A: "< C: "<