笔者最近需要进行LS1046A内存部分的测试,linux相关的资料和方法纷杂繁多,但如鼠饮河,自得其量,还是找了如下软件进行测试,也分享给大家。
嵌入式板卡选择:飞凌嵌入式的OK1046A-C开发板
01、工具简介
Bandwitdh工具简介
Bandwidth是一款内存带宽基准测试程序,通过顺序读写与随机读写不同大小的数据块,测试系统的内存带宽性能。
它提供了一套汇编语言实现的支持库,用来完成体系结构相关的特定操作,可以测量每个内存系统的最大内存带宽,包括主内存,L1和L2缓存,framebuffer内存和寄存器的快速,连续的内存访问。
Bandwidth也包括自动制图的结果,存储到一个BMP图像文件。
Mbw工具简介
Mbw是一个内存带宽测试工具可以测试在字节拷贝,块拷贝,整体拷贝三种不同方式下的内存拷贝速度,程序源码比较简单,便于理解。
▣ 获取方式:git clone http://github.com/raas/mbw
Memtester工具简介
Memtester是一款进行内存压力测试的工具,通过对两块内存里的数据进行一系列的加减乘除亦或位与之类的算法后进行对比,用于检查是否存在内存移位之类的问题出现
▣ 获取方式:wget 点此处获取>>
memtester的使用很简单./memtester [runs]其中:内存大小,单位M,[runs]:运行次数。
02、编译方法
bandwidth来源
▣ 下载并解压bandwidth
源码路径:https://zsmith.co/archives/bandwidth-1.5.1.tar.gz
解压并进入源码目录:
tar xvf bandwidth-1.5.1.tar.gz
cd bandwidth-1.5.1/
▣ 修改makefile文件并进行编译
Vim Makefile
修改如下:
CC=arm-xxx-gcc -Wall
LD=arm-xxx-gcc
ARM_AS=arm-xxx-as
ARM_CC=arm-xxx-gcc
退出并make bandwidth-rpi32即可得到二进制程序(arm-xxx-gcc为交叉编译工具)。
Mbw
▣ 下载并进入源码目录编译
git clone
https://github.com/raas/mbw.git
cd mbw
arm-xxx-gcc mbw.c –o mbw
▣ 在源码目录下得到mbw应用程序。
Memteser
▣ 下载并解压源码
wget 点此处获取>>
tar xvf memtester-4.3.0.tar.gz
cd memtester-4.3.0/
▣ 修改配置文件:
分别把conf-ld和conf-cc文件中的"cc"(一般在文件首行)替换为“arm-xxx-gcc”
在conf-ld的第一行后面加上 -static
修改文件Makefile,更改 INSTALLPATH = pwd
/INSTALL
执行make即可编译成功,在源码目录下得到应用程序。
03使用方法和示例
bandwidth工具的使用
我们将bandwidth移植到开发板上运行(因OK1046A-C gcc版本过高存在兼容性问题未能编译成功,此处以其它板卡数据结果做工具介绍,数据不做 OK1046A-C 的参考)./bandwidth –fastest 得出如下图表:
这部分图表我们可以得到一些cpu与内存之间互相访问的数据传输和命令交互的性能,以及framebuffer的读写速度。
上表可见,内存的读写速度和顺序还是随机还是有很大关系的,在写数据时尤为明显。
其次我们可以观察到,写的数据块的大小会影响读写速度,在两个关键点会产生突变(32kb/256kb),这是由于各级cache的不同,进行内存读写时,较小的数据块会存放在cache中,较大的数据块则会经过cache存放在主存中。
突变的原因就是达到了cache的上限,而转向了下层存储。
mbw工具的使用
将mbw工具移植到开发板上,并执行./mbw -q -n 3 320
-q 隐藏日志,3 测试次数,64 内存大小(单位是M)结果如下:
我们只需要关注AVG平均值即可。
三种不同的测试方法分别对应的是memcpy(内存拷贝),dump(字符串拷贝),mcblock(内存块拷贝)。
我们可以看到,OK1046A-C的ddr4d的内存的运行速度是非常快的,再内存拷贝的速度达到了2GiB/s,甚至于接近我们的服务器的读写速度。
memtester的使用
▣ 先运行free –h 得出剩余内存:
▣ 可以看到,该开发板剩余1.2G可用内存,所以我使用1G内存大小运行内存检错程序memtester。
▣ ./me mtester 1G 3 截图如下:
如此便是内存运行正常,笔者重复了三天,利用脚本反复调用memtester程序,最终均未发现内存报错和移位的问题,可见内存稳定性基本达标。
结语
综上我们可以看到,OK1046A-C板卡的ddr4内存读写速度非常快,内存使用也非常稳定,可惜因为版本原因未能测得CPU内存交互的实际速度以及CPU一级二级缓存的使用速度,在后期经过修改后再进行追加。
下一期笔者将针对于OK1046A-C的万兆网测试和网络转换方面,请各位保持关注。