测试pytorch 调用gpu 加速矩阵相乘. accelerate matrix multiplication
下面是我机器中的cpu和gpu型号31.4GiBIntel®Core™[email protected]×12GeForceGTX1080Ti/PCIe/SSE264-bit代码会在下面给出先看下整体的输出效果对比了float32float64分别用numpy,torchcpu以及torchgpu运算矩阵相乘运行1000次方阵大小1-500,也就是元素数1-25万1000_1_500cpu与g