ubuntu20.04 自己编译源码安装tensorflow

自己编译源码安装tensorflow

文章目录

  • 自己编译源码安装tensorflow
  • 前言
  • 1 准备工作
    • 1.1 下载源码
    • 1.2 安装bazel
  • 2 编译tensorflow
    • 2.1 配置选项
    • 2.2 编译CPU版本的tensorflow
    • 2.3 编译GPU版本的tensorflow
  • 3 构建pip安装包
  • 4 安装pip包


前言

为什么要自己编译源码呢?自己编译tensorflow,为自己的机器定制一个tensorflow版本,不需要的模块可以不编译,算是为自己裁剪奠定一点基础。还有一个好处是,可以直接拉取最新的开源代码,这往往要比别人快几个月体验新特性。然而自己编译源码会遇到很多错误,而且每个人因为环境不一样,报的错误也不一样。一般都是缺少包,或者包的名字有差异,版本不对,一个个根据错误信息去解决。Come ON!


1 准备工作

1.1 下载源码

因为国内github过于慢,可以在gitee上下载。

1.2 安装bazel

网上有很多方式,不去外网的前提下唯一成功的方式是下面的办法。

npm install -g @bazel/bazelisk

2 编译tensorflow

2.1 配置选项

在tensorflow的源码根目录下运行configure,根据对话选择要支持的特性。

./configure

补充说明运行configure时出现的几个名词:
RoCm–AMD GPU生态
TensorRT–加速神经网络实时计算,这个特性的支持一般要落后一个大版本,也就是说英伟达支持TensorRT8的时候,tensorflow才支持TensorRT7。也就是最新出的GPU,tensorflow往往支持的不好。

2.2 编译CPU版本的tensorflow

使用bazel编译cpu版本的tensorflow,指定--jobs的目的是防止bazel编译时吃掉全部内存而导致编译失败。如下命令中参考数字--jobs=16,机器实际物理内存为32G。

bazel build  //tensorflow/tools/pip_package:build_pip_package --jobs=16

2.3 编译GPU版本的tensorflow

在编译GPU版本时,提示找不到python,解决的办法是创建一个名为python的软链接指向python3。

ln -s /usr/bin/python /usr/bin/python3
bazel build  --config=cuda //tensorflow/tools/pip_package:build_pip_package --jobs=16

3 构建pip安装包

多一句嘴,tmp目录实际上是内存虚拟文件。

./bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg

4 安装pip包

敲了目录/tmp/tensorflow_pkg/,后面可用tab自动补齐tensorflow的版本信息。如下图,成功安装了tensorflow的最新发布版本,此时该版本还没有进入到pip install。自己安装的源码,不要在tensorflow源码中启动python,到后导入tensorflow,这是从设计角度所禁止的行为。

pip install /tmp/tensorflow_pkg/tensorflow-version-tags.whl

ubuntu20.04 自己编译源码安装tensorflow_第1张图片

你可能感兴趣的:(linux,C/C++,AI,tensorflow,python,人工智能)