RTX3090 与GTX1080Ti Tensorflow1.15训练YOLOv3对比

安装环境:

https://blog.csdn.net/wu496963386/article/details/109583045

基本按照上述链接博主方法安装tensorflow1.15.4

本链接在原博主基础上修改了cudnn包,增加了多gpu需要的nccl,openmpi,horvod支持,以及本人安装成功的环境使用conda pack打包好,有缘人可直接使用pack包恢复环境。

链接: https://pan.baidu.com/s/1P49bpgSy4UXJvahs6SajKw 提取码: kgmt

对比:

输入

输入大小:576*1024×3
网络计算量:97GFLOPs

1080Ti主机(四卡,只评测两张卡,即1080Ti *2)环境:

cudatoolkit 10.0.130
cudnn 7.6.5
tensorflow15.1

训练设置:

bathsize=16(batchsize=8 per-gpu)
每 625 steps,时间: 4分10秒(4:10)

3090主机(3090*2)环境:

cuda 11.1
cudnn 8.0.4
tensorflow1.15.4

训练设置:

bathsize=16(batchsize=8 per-gpu)
每 625 steps,时间: 2分30秒(2:30)
bathsize=32(batchsize=16 per-gpu)
每625 steps,时间: 4分04秒(4:04)

只用一张3090启动训练:

batchsize16单卡
每625 steps,时间: 4分0秒(4:00)

结论:

一张更比两张强,但也是真贵,买二手1080Ti还是更香一点,当然,如果只买新卡,相对于2080Ti来说,还是直接上3090。
2021年1月,二手1080Ti:3500+, 3090:17000+, 2080Ti:10000+

你可能感兴趣的:(3090尝试,tensorflow,深度学习,linux)