tensorflow配置服务器环境

linux服务器配置cuda&cdunn

CUDA:将代码放到gpu上
cudnn:优化gpu的计算能力,跑代码更快

一,选择正确的版本号

  • tensorflowcudnnCUDA的版本号一定要对上
    • 先在服务器上检查显卡信息和CUDA版本号(CUDA Version: 11.0)
    nvidia-smi
    
    tensorflow配置服务器环境_第1张图片
    • 然后上网查一下具体的tensorflowcudnnCUDA对应的版本号,网址在此-对应表
    • 我的配置
      • tensorflow-2.4
      • CUDA-11.0
      • cudnn-8.0

二,配置并安装anaconda3

  • 去官网下载一个linux的安装文件以.sh为文件拓展名 (官网:anaconda官网)
  • 把它上传到服务器
  • 安装它
    bash filename.sh
    
  • 配置环境
    vim /etc/profile
    # 在文件底部添加
    export PATH=$PATH:/anaconda3/bin
    
  • 添加channels
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
    conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
    conda config --set show_channel_urls=True
    #设置不自动进入base环境
    #conda config --swt auto_activate_base=False
    

三、配置tensorflow、CUDA和cudnn

  • 直接用conda安装
    conda install -n envname cudatoolkit=11.0
    conda install -n envname cudnn=8.0
    conda install -n envname tensorflow-gpu=2.4
    #当然还要一些别的需要的一些库
    
  • 安装好之后还要跳过sudo权限,删掉一个文件(实际上是哪报错删哪)
    rm -rf /anaconda3/envs/envname/lib/python3.8/site-packages/tensorflow/core/kernels/libbtfkernel_sobol_op.so
    
  • 要检查一下,到底删了没,cd进去看看

四,怎么用gpu跑代码(tensorflow)

  1. 在代码里加入
    tf.device('/gpu:num')#num是nvidia-smi里使用率小的显卡编号
    
  2. 通过CUDA_VISIBLE_DEVICES指定
    import os
    #num1、num2同上,可多可单
    os.environ['CUDA_VISIBLE_DEVICES']='num1,num2'
    
  3. 还可在终端指定
     CUDA_VISIBLE_DEVICES=num python train.py
    

你可能感兴趣的:(python,服务器,Linux,tensorflow,cuda,gpu,anaconda)