Dell G3 pro ubuntu16.04+Win10双系统,nvidia显卡驱动,nvidia docker测试,问题记录


此博客主要是问题记录,暂不包含完整流程


Ubuntu16.04安装

1 检测不到系统硬盘

原因是系统默认使用RAID的SSD驱动方式,而Ubuntu并不支持

解决:需要在BIOS中把SSD operation改为ACHI。Dell官方给了标准的双系统安装方式,解决了把RAID给成ACHI后WIN10无法正常引导的问题。


Nvidia显卡驱动

显卡型号为GTX 1660TIMQ

查找合适的驱动,430.09往后的版本似乎都支持,

截止当前Ubuntu apt-get 安装的nvidia驱动最新是430.24,是支持的。

然而按照先禁用nouveau再apt-get安装驱动的方式(参考其他博客如https://blog.csdn.net/max_loo/article/details/81304949),还是会有很多问题

 

1 直接apt-get 安装的驱动会导致系统进入"low-graphics mode"

原因:不明。在进入命令行界面后( ctrl+alt+(F1-F6) ),输入nvidia-smi,输出了正确的显卡信息,说明显卡驱动正确安装了,但Ubuntu系统检测不到nvidia显卡。

不小心进入这一模式的,可以在命令行界面删除nvidia驱动,就可以恢复正常

sudo apt-get purge nvidia-*

解决:去nvidia官网下载对应版本的nvidia驱动,在命令行界面安装(https://blog.csdn.net/max_loo/article/details/81304949)

系统可以正常进入,输入nvidia-smi能输出显卡信息。然而系统使用的仍然是intel集成显卡。

nvidia显卡能否正常使用有待进一步验证。

 

2 装NVIDIA418.88.sh后,屏幕分辨率变小,并且无法改变

原因:nvidia驱动安装时会更新x文件,这是改变了屏幕分辨率的罪魁祸首,好在nvidia会自动备份x文件

解决:进入 /etc/X11 下找到 xorg.conf 文件,应该有nvidia备份的该文件,命名类似与xorg.conf.backup,换回来吧。

也用用xrandr添加新“屏幕”的方式,但是这种方式相当于每次都执行一遍添加虚拟屏幕的命令,很膈应。另外在登录界面的分辨率依然是很低的分辨率,因此不采用。


Docker使用nvidia

1 在运行docker镜像并使用nvidia显卡时,出现报错:

docker: Error response from daemon: OCI runtime create failed: unable to retrieve OCI runtime error (open /run/docker/containerd/daemon/io.containerd.runtime.v1.linux/moby/97b8b155759b7e79892eb809697d0ad09d2f256c49e08d4132315e776519a972/log.json: no such file or directory): fork/exec /usr/bin/nvidia-container-runtime: no such file or directory: unknown.

原因:在NVIDIA驱动,docker版本均无误的情况下,应是没有安装nvidia-docker2,输入

dpkg -l '*nvidia*'

若没有nvidia-contain和nvidia-docker2则确认没有安装nvidia-docker2,正确安装后的输出示例如下:

+++-==============-============-============-=================================
un  nvidia-304                   (no description available)
un  nvidia-340                   (no description available)
un  nvidia-384                   (no description available)
un  nvidia-common                (no description available)
ii  nvidia-contain 3.1.2-1      amd64        NVIDIA container runtime
un  nvidia-contain               (no description available)
ii  nvidia-contain 1.0.3-1      amd64        NVIDIA container runtime hook
un  nvidia-docker                (no description available)
ii  nvidia-docker2 2.2.1-1      all          nvidia-docker CLI wrapper
un  nvidia-legacy-               (no description available)
un  nvidia-libopen               (no description available)
un  nvidia-prime                 (no description available)
un  nvidia-vdpau-d               (no description available)

解决:参考https://github.com/NVIDIA/nvidia-docker/issues/686,安装nvidia-docker2

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update

# Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd

 

你可能感兴趣的:(问题记录)