解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题

目录

  • 问题一、Linux查看硬件配置信息
  • 问题二、迁移虚拟环境到离线机器
  • 问题三、输出tensor有省略号

问题一、Linux查看硬件配置信息

在Linux系统中,你可以使用一些命令来查看硬件配置信息。以下是几个常用的命令:
1️⃣:查看CPU

cat /proc/cpuinfo

解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第1张图片
一些关键性指标:

vendor_id:制造商信息,这里显示为 GenuineIntel,表示是英特尔(Intel)的处理器。
model name:处理器的具体型号,这里是 Intel® Xeon® Platinum,表示是英特尔至强(Xeon)铂金系列的处理器。
cpu MHz:处理器的时钟频率,这里显示为 2500.000 MHz,表示是 2.5 GHz 的处理器。
cachesize:处理器的缓存大小,这里显示为 33792 KB,表示是 33 MB 的缓存。
siblings 和 cpucores:分别表示处理器的超线程数(同时执行的线程数)和物理核心数。在这里,每个处理器都有 2 个siblings,表示支持超线程技术,每个处理器有 1 个cpu core,表示每个处理器有1个物理核心。
flags:列出了处理器支持的各种特性和指令集,包括 MMX、SSE、SSE2、AVX 等。这些特性在编程和优化程序时很有用。

2️⃣:查看内存信息

cat /proc/meminfo

解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第2张图片
一些关键的内存相关指标:

MemTotal:总内存大小。
MemFree:空闲内存大小。
MemAvailable:可用内存大小。
Buffers:用于缓冲文件系统数据的内存大小。
Cached:用于缓存文件系统数据的内存大小。
SwapTotal:交换空间(Swap)总大小。
SwapFree:空闲的交换空间大小。

3️⃣:查看显卡信息
方法一:lspci | grep VGA
此方法会列出所有的显卡设备,如果系统中有多个显卡,将会显示它们的信息
方法二:nvidia-smi
此方法仅仅针对 Nvidia 显卡的命令,它可以提供更详细的 Nvidia GPU 相关信息,包括 GPU 的型号、温度、内存使用情况等。

4️⃣:查看硬盘信息

fdisk -l

命令会显示硬盘的分区表、分区的起始扇区和结束扇区、分区的大小、分区的类型等信息。这些信息可以帮助用户了解硬盘的分区情况,以及分区的用途和格式。

解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第3张图片

问题二、迁移虚拟环境到离线机器

有时候我们在维护服务器、更换机器、迁移服务器、模型固化部署等情况时会经常碰到迁移,这时如果重新在目标机器再安装一次虚拟环境,耗时耗力,而且也有可能目标机器是离线状态。

这时需要将本地的环境移植到新的机器上。

解决方案:conda 常用来执行虚拟环境配置和包管理工作,可以使用conda-pack 进行conda 环境打包和分发。

  1. 安装conda pack:conda install conda-pack
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第4张图片

  2. 复制一份虚拟环境:conda create -n xx(拷贝虚拟环境命名) --clone **(源虚拟环境),这一步是避免打包的时候出现问题导致源虚拟环境受损,可选做。
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第5张图片

  3. 打包刚刚拷贝的虚拟环境:conda pack -n xx,这里需要等待一段时间,包涉及到的库越多,打包时间越长;
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第6张图片

  4. 得到一个 xx.tar.gz的文件,将该.tar.gz压缩包下载,大小在几百MB到几个G不等
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题_第7张图片

  5. 输入 conda config --show ,查找Anaconda虚拟环境

  6. 通过mobaxterm或者其他方式把 xx.tar.gz上传到目标服务器的如下目录里面:/home/用户名/anaconda3/envs/xx/

  7. 在目标服务器上解压压缩包:tar -xzf xx.tar.gz

  8. 在目标服务器上查看虚拟环境:conda info --envs

问题三、输出tensor有省略号

问题描述:Torch 在输出tensor的时候,如何指定输出全部,不要省略号略过中间值
tensor([[[-102.1618, -102.1618, -103.8347, …, -117.6031, -111.0496,-111.0496],[-102.1618, -102.1618, -103.8347, …, -117.6031, -111.0496,-111.0496], device=‘cuda:0’)

问题原因:输出的时候,由于tensor太长,pytorch会自动将其省略

解决方案:
在开始增加:torch.set_printoptions(threshold=np.inf)

这个方法是来修改pytorch中的打印选项的(其实就是和numpy中更改打印方法一样),就是使用print打印tensor时,我们显示的元素精度,最多显示元素个数等一系列的有关操作的选项。其参数含义如下:

参数名 意义
precision=None 显示浮点tensor中元素的精度
threshold=None 指定tensor的数目超过多少时开始显示进行折叠。默认为1000。
edgeitems=None 显示的前面与后面的数据的行数
linewidth=None 指定每行的字符数
profile=None 三种显示方法 ,分别为default、short、full
sci_mode=None 是否使用科学计数法

你可能感兴趣的:(各种解决方案,java,开发语言,linux,深度学习,anaconda,conda)