阿里云torch环境配置问题

每次在新的电脑上配置torch环境总是会遇上各种各样的问题,今天又搞了一天,心态爆炸。。。。。

出现问题

这次的问题涉及到.dll文件的缺失,我忘记截报错信息的图了,这里简单说明一下:
1). import torch 时出错
2).报错信息中提示在ctypes.CDLL(dll)这里出错(坑爹的是没提示缺少哪个文件)
3).OSError: [WinError 126] 找不到指定的模块(这就是告诉你缺少了某个(些).dll文件)

解决方法:

1.通过pycharm的调试功能锁定到程序中断处的代码,可以找到是哪个.dll文件会导致报错(报错原因是这个.dll依赖的其他.dll文件不存在)


image.png

2.下载Dependency Walker,网址:http://www.dependencywalker.com/
3.打开你第一步找到的.dll文件打开

image.png

它会提示你有哪些文件找不到(那些长串的都不用管,找那种看起来就不一样的),当时我是缺了这个nvcuda.dll文件(这里是我已经补上这个文件的图),然后去网上找对应版本的(x64或者x86)添加到C:\Windows\System32下。
image.png

4.可以成功import torch

结语

这只是我个人解决问题的方法,我今天整了一下午和晚上才搞好(菜是原罪),网上好像有许多别的方法,包括下载vc_redist添加各种框架啥的,我都试了,并没有用(第二天我小伙伴遇到了同样的问题,事实证明,这个vc_redist还是要下载安装一下)。最后自己摸索着搞好了,写下这个随笔看看能不能帮到别人,或者下次自己再配环境的时候也许还能用上。

你可能感兴趣的:(阿里云torch环境配置问题)