零、环境准备
git下载:https://git-for-windows.github.io/
MINGW下载:http://www.mingw.org/
Tensorflow源码下载:git clone https://github.com/tensorflow/tensorflow/tree/r1.3
cmake for windows:https://cmake.org/download/
swig(python for c++ interface):http://www.swig.org/download.html
Visual Studio 2015:
Anaconda 4.2.0(此版本非最新版本,之所以使用是因为其默认python版本为3.5.2):https://www.anaconda.com/download/
Numpy:https://www.scipy.org/scipylib/download.html
一、安装CUDA
0. 首先需要在cuda-gpus检查电脑的GPU是否支持cuda编程,要求Compute Capability 3.0及以上。
1. 安装Visual Studio 2015(需要在CUDA之前安装好)
2. 安装CUDA toolkit 8.0(推荐下载离线版本)
3. 解压下载好的cuDNN,将其中的 bin、include、lib 覆盖到CUDA的安装目录
二、安装tensorflow-gpu
1. 安装anaconda
2. 进入python3.5环境,通过以下命令安装tensorflow-gpu:
pip install --ignore-installed --upgrade tensorflow-gpu
3. 如果遇到各种lib、dll缺失的问题,可以尝试通过添加对应的路径到path中来解决
在CUDA_PATH后面添加bin和lib\x64路径
将cudnn64_7改为cudnn64_6
4. 测试代码
如下:
#Creates a graph.
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
#Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
#Runs the op.
print sess.run(c)
三、编译tensorflow-gpu
官方只提供了Ubuntu和Mac OS X的编译支持,在Windows下可以通过Bazel和CMake两种方式进行编译,但只是 “highly experimental”,可能会遇到各种错误。下面使用CMake来进行编译。
0. 进行编译之前安装一下软件:
Cmake 3.5以上
Git
swig
Windows下的额外要求:
Visual Studio 2015
Python 3.5
Numpy 1.11.0 or later
1. 设置环境变量
进入目录 C:\Program Files (x86)\Microsoft Visual Studio version\VC\,运行命令 vcvarsall amd64,从64位命令行编译到64位的目标平台。执行这一步可以避免编译的时候出现内存不足的错误。
将CUDA dlls和cuDNN dll添加到环境变量:
NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin
cudnn-8.0-windows7-x64-v7\cuda\bin
将Cmake和git添加到环境变量
CMake\bin
2. 下载 Tensorflow源代码, 在其中的 tensorflow\tensorflow\contrib\cmake 目录下新建 build 目录,用于存放编译结果。
D:\temp> git clone https://github.com/tensorflow/tensorflow.git
D:\temp> cd tensorflow\tensorflow\contrib\cmake
D:\temp\tensorflow\tensorflow\contrib\cmake> mkdir build
D:\temp\tensorflow\tensorflow\contrib\cmake> cd build
D:\temp\tensorflow\tensorflow\contrib\cmake\build>
3. 调用cmake来产生Visual Studio solution 和project files.
D:\...\build> cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^
More? -DSWIG_EXECUTABLE=C:/tools/swigwin-3.0.10/swig.exe ^
More? -DPYTHON_EXECUTABLE=C:/Users/%USERNAME%/AppData/Local/Continuum/Anaconda3/python.exe ^
More? -DPYTHON_LIBRARIES=C:/Users/%USERNAME%/AppData/Local/Continuum/Anaconda3/libs/python35.lib
如果有NVIDIA显卡,且安装好了cuDNN,那么可以添加以下参数:
More? -Dtensorflow_ENABLE_GPU=ON ^
More? -DCUDNN_HOME="D:\...\cudnn"
4. 调用MSBiuld来编译Tensorflow
使用以下命令产生.whl文件
D:\...\build> MSBuild /p:Configuration=Release tf_python_build_pip_package.vcxproj
遇到的问题:
error C2001: newline in constant
打开对应的文件发现出现了乱码,google之后发现可以通过修改locale为 英语(美国) 来解决。
编译过程中下载失败或者 git clone缓慢
使用命令 nslookup 查找失效ip(github.global.ssl.fastly.net,storage.googleapis.com等),修改host文件。完了之后 ipconfig /flushdns。当然也可以尝试手动下载到对应的目录。
参考guide:
https://github.com/tensorflow/tensorflow/tree/r1.3/tensorflow/contrib/cmake
http://blog.csdn.net/DawnRanger/article/details/77755412
http://blog.csdn.net/xingwei_09/article/details/72822360