最近一直装系统,装系统,还是多卡GPU的,并且显示器接受不到显卡的输出,也就是高清线没办法从显卡上接到显示器上,为啥呢?我也不知道,总之就是没信号,无奈只能从集显上接 普通线到显示器上,以前装过1080ti显卡驱动,也做过笔记http://blog.csdn.net/hjxu2016/article/details/69072779,当时在线安装出现循环登陆问题,只好选择下载run文件安装,这样安装要先禁止ubuntu的集显驱动,理论上显卡能输出高清线就ok,偏偏此多卡gpu的机器显卡上的高清线输出不到屏幕上,导致下载run文件安装驱动,出现屏幕分辨率不正常;而在线安装出现循环登录。。。人生如此忧伤,此时系统已经从ubuntu14.04换到ubuntu16.04.该试过的都试过了。。后来换了ubuntu14.04-mate系统,才解决问题,但还是出现cuda只能root用户调用,不知和解,有解决办法的可以和我讨论一下。下面记录一下安装过程。
系统ubuntu14.04-mate,四块泰坦xp的显卡,安装cuda-8.0,cudnn-6.0,opencv-2.4.9以及gpu版本的caffe和tensorflow,整个安装过程参考大神操作
http://blog.csdn.net/langb2014/article/details/51579491
1、首选装好系统运行下面的代码:
sudo apt-get update
sudo apt-get upgrade #这一步我并没有使用
sudo apt-get install build-essential
sudo apt-get autoremove
碰到的问题:https://linux.cn/article-3874-1.html
问题:我试着通过运行apt-get update命令来再次同步包索引文件,但是却出现了“404 无法找到”的错误,看起来似乎是我不能从先前添加的第三方PPA仓库中获取最新的索引。我怎样才能清除这些破损而且陈旧的PPA仓库呢?
Err http://ppa.launchpad.net trusty/main amd64 Packages
404 Not Found
Err http://ppa.launchpad.net trusty/main i386 Packages
404 Not Found
W: Failed to fetch http://ppa.launchpad.net/finalterm/daily/ubuntu/dists/trusty/main/binary-amd64/Packages 404 Not Found
W: Failed to fetch http://ppa.launchpad.net/finalterm/daily/ubuntu/dists/trusty/main/binary-i386/Packages 404 Not Found
E: Some index files failed to download. They have been ignored, or old ones used instead.
当你试着更新APT包索引时,“404 无法找到”错误总是会在版本更新之后发生。就是说,在你升级你的Ubuntu发行版后,你在旧的版本上添加的一些第三方PPA仓库就不再受新版本的支持。在此种情况下,你可以像下面这样来鉴别并清除那些破损的PPA仓库。
首先,找出那些引起“404 无法找到”错误的PPA。
$ sudo apt-get update|grep"Failed"
$ sudo add-apt-repository--remove ppa:finalterm/daily
你得去重复重复再重复,把上面找到的所有过时的PPA仓库一个一个地移除。
如果在GUI中删除的话,https://itsfoss.com/how-to-remove-or-delete-ppas-quick-tip/
这样就解决了。
2、安装git
1、找机子的显卡
2、自己下载Nvidia-375.run或在线安装
本教程选择在线安装
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-375
也可以下载nvidia.run文件安装,以前写过笔记http://blog.csdn.net/hjxu2016/article/details/69072779
3、重启
sudo shutdown -r now
4、nvidia检查
1、下载CUDA-8.0,由于我直接拿的实验室之前的cuda-8.0的deb文件,所以并没有从网上下载。大家需要先下载cuda-ubuntu×.deb文件,然后安装就可以了
2、添加CUDA环境
3、检查CUDA版本
4、重启
1、编译cuda的sample:注意这边路径问题
2、查看显卡里面的信息
bin/x86_64/linux/release/deviceQuery
1、安装cudnn_v5,首先需要下载cudnn然后下面操作
1、tensorflow我选择的在线安装
sudo apt-get install python-pip python-dev
2、如果中途安装不了可以先下载那个网址东西,下载好了,然后安装,中途会有几个包的numpy、six、protobuf、wheel下载安装比较慢或者下载不了,可以单独安装。
具体操作如下,权限不够加sudo
pip install \
-i https://pypi.tuna.tsinghua.edu.cn/simple/ \
https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow_gpu-1.4.0-cp36-cp36m-linux_x86_64.whl
3、测试Tensorflow
5、推荐IDE调试工具
pyCharm免费的社区版(community release)不支持远程调试,百度下载然后到bin里面,运行pycharm安装文件就可以了。
1、先下载git,然后安装OpenBLAS
2、添加lib库的变量路径
1、安装来自Scipy的普通tools
2、如果安装matplotlib时无法安装,按照下面方法:
先下载:here
然后减压matplotlib-1.5.0,并进入matplotlib-1.5.0里面
最后运行
OpenCV
我安装的opencv版本是2.4.9,因为CUDA版本比较新,所以opencv版本不能太新,3.x的编译不支持(已测试)安装opencv以前写过笔记http://blog.csdn.net/hjxu2016/article/details/70946094
注意,我把上面的qt选项关了。
cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D WITH_CUDA=OFF -D WITH_OPENMP=ON -D WITH_QT=OFF ..
1、caffe相信大家都很熟悉了,下面是一些基础依赖库,如果出现不能下载,那就一个一个下载
2、克隆caffe
3、如果安装了cuDNN然后把Makefile文件的USE_CUDNN := 1注释去掉
sed -i 's/# USE_CUDNN := 1/USE_CUDNN := 1/' Makefile.config
4、如果安装了OpenBLAS,修改BLAS参数
5、安装需求build和测试caffe,编译PyCaffe
6、添加caffe的环境变量
echo 'export CAFFE_ROOT=$(pwd)' >> ~/.bashrc
echo 'export PYTHONPATH=$CAFFE_ROOT/python:$PYTHONPATH' >> ~/.bashrc
source ~/.bashrc
7、测试caffe接口
1、安装Theano
2、测试接口
1、这个编译器(关于Theano和Tensorflow)不是很熟悉,顺便安装一下试试。默认是Theano,如果想换Tensorflow,可以按照here.
1、这个是facebook的深度框架
2、添加环境变量
3、推荐IDE工具eclipse,安装相应的插件(Lua Development Tools)
首先安装eclipse c/c++的开发版,然后在官网搜索Lua,看到LDT就点进去,找到Existing Eclipse installation,按照官网指示安装插件,就ok了。
mxnet是cxxnet的下一代,目前实现了cxxnet所有功能,但借鉴了minerva/torch7/theano,加入更多新的功能。
将mxnet/目录里找到mxnet/make/子目录,把该目录下的config.mk复制到mxnet/目录,用文本编辑器打开,找到并修改以下两行:
USE_CUDA = 1
USE_CUDA_PATH = /usr/local/cuda
1、X2GO是一个远程控制桌面,下面是安装教程
自己在CUDA cudnn这一块出现错误了‘’/sbin/ldconfig.real: /usr/local/cuda-8.0/targets/x86_64-linux/lib/libcudnn.so.4 不是符号连接‘’
然后在终端输入:
是这个链接错误,然后在终端输入:
问题就解决了。。。。。。。。。。。。。
=================================================================================================================
http://stackoverflow.com/questions/43016255/libegl-so-1-is-not-a-symbolic-link
出现的问题
/sbin/ldconfig.real: /usr/lib/nvidia-375/libEGL.so.1 不是符号连接
/sbin/ldconfig.real: /usr/lib32/nvidia-375/libEGL.so.1 不是符号连接
原因:
系统找的是一个符号连接,而不是一个文件。
解决方法:
sudo mv /usr/lib/
nvidia-375/libEGL.so.1 /usr/lib/nvidia-375/libEGL.so.1.org
sudo mv /usr/lib32/nvidia-375/libEGL.so.1 /usr/lib32/nvidia-375/libEGL.so.1.org
sudo ln -s /usr/lib/nvidia-375/libEGL.so.375.39 /usr/lib/nvidia-375/libEGL.so.1
sudo ln -s /usr/lib32/nvidia-375/libEGL.so.375.39 /usr/lib32/nvidia-375/libEGL.so.1