旷视科技开源的天元框架,在有pytorch基础的前提下上手很快,中文文档读起来也简单,有自己的社区为用户解决问题。在上面提问解还是很快会得到解决的。 然后华为在四月份也要公测它的全场景MinSpore,有的公司原本有整体架构,想要全都换新的也不是那么简单,各种框架到底哪个会是下一个主流呢。
我的电脑环境是 Ubuntu 18.04 cuda10.0
目前 MegEngine 安装包集成了使用 GPU 运行代码所需的 CUDA 10.1 环境,不区分 CPU 版本和 GPU 版本。如果您想运行 GPU 程序,请保证机器本身配有 NVIDIA 显卡,并且 驱动 版本高于 418.x 。
由于看到文档中写着CUDA 10.1, 所以我又重装了一下ubuntu的环境,cuda10.0的我没实验好不好使
1.安装显卡驱动
禁用自带显卡驱动
sudo gedit /etc/modprobe.d/blacklist.conf
在打开的文档末尾,加上下面两行代码:
blacklist nouveau
options nouveau modeset=0
更新
sudo update-initramfs -u
重启电脑reboot,显卡驱动已经禁用所以现在看不到桌面
lsmod | grep nouveau
检查禁用结果若无输出,则禁用成功
按ctrl+alt+(F1-F6)开始使用命令安装显卡驱动
卸载系统里的Nvidia低版本显卡驱动
sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers
sudo apt-get update
查看Ubuntu推荐的驱动版本:
ubuntu-drivers devices
安装指定版本显卡驱动我安装的430.40
sudo apt-get install nvidia-driver-*** 你的推荐版本
查看安装
是否成功:nvidia-smi
显示你的显卡情况
watch -n 3 -d nvidia-smi 设置3s刷新显卡使用情况,可以观测训练时显卡使用情况
2.下载cuda10.1
官网:https://developer.nvidia.com/cuda-downloads
下载.run文件 sudo sh 安装 截图中有
除了第一个显卡驱动不安装,剩下的都选
添加环境变量
gedit ~/.bashrc
export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/lcoal/cuda-10.1/lib64:$LD_LIBRARY_PATH"
激活环境变量:source ~/.bashrc
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
result==pass 通过或者输入 nvcc -V C查看cuda版本
3.cudnn安装
官网:https://developer.nvidia.com/rdp/cudnn-archive
下载后解压:
下载完成后,进行解压:
tar -zxvf cudnn-10.0-linux-x64-v7.6.x.xx.tgz
进入解压文件夹执行
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*
查看cudnn安装情况
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
结束
等我研究一下github再上传一个unet吧
https://github.com/tangyan-77/MegEngine_unet.git