TensorFlow Hub--用一行代码完成迁移学习

TensorFlow Hub简介

TensorFlow Hub是一个用于促进机器学习模型中可复用部分再次进行探索与发布的库,主要将预训练过的TensorFlow模型片段再次利用到新的任务上。(可以理解为做迁移学习)

要使用TensorFlow Hub需要你本地安装的TensorFlow的版本在1.7以上(TensorFlow的安装配置过程本文不做介绍,若有需要,可以参考此文)

通过以下命令即可安装TensorFlow Hub
pip install tensorflow-hub

下载好的TensorFlow Hub版本信息如下图所示


版本信息.png

TensorFlow Hub使用

方便起见,我们使用TensorFlow Hub官方提供的花卉图片集来作为我们的数据集,网络条件允许的读者,可以使用如下命令下载图片集
cd ~
curl -LO http://download.tensorflow.org/example_images/flower_photos.tgz
tar xzf flower_photos.tgz

下载不下来也没事,本人贴心的准备了百度云链接
链接: https://pan.baidu.com/s/1NVl8uUU7iVktxE0g7Oa5jw 密码: ivt8
下载下来之后解压即可。

解压之后我们可以看到,flower_photos文件夹下包含了如下几个子文件夹,每一个子文件夹的名字都代表了其中图片的标签,如dandelion(蒲公英)文件夹下的所有图片皆为蒲公英的图片。

数据集目录.png

有了图片集了,我们还需要用于迁移学习的训练代码。
同样,也可以通过如下命令下载用于迁移学习的训练代码
mkdir ~/example_code
cd ~/example_code
curl -LO https://github.com/tensorflow/hub/raw/master/examples/image_retraining/retrain.py

读者也可自行前往TensorFlow Hub的官方GitHub仓库下载。
我们需要使用的是hub-master\examples\image_retraining路径下的retrain.py文件,这个py文件是官方为我们准备好的用作图片分类迁移学习的样板代码。

关键的地方到了

如何用一行代码实现复杂的迁移学习

因为本人的tensorflow-gpu库装在单独的环境下,所以我需要启用Anaconda Prompt,然后激活我所要用的指定环境
activate my_special_env
(若用系统Path路径下的python环境,则忽略上一步)

再将路径cd到你本地retrain.py文件的路径下(具体的路径根据自己的实际情况更改,下图为本人的路径地址)


路径地址.png

最后,最关键的一行代码来了:
python retrain.py --image_dir ~/flower_photos
(~/flower_photos为下载下来解压好的图片集的路径,请根据实际情况修改)

然后,迁移学习的训练就跑起来了~!


TensorFlow Hub小贴士

1.为什么训练一直卡在downloading位置?
因为TensorFlow Hub是通过url的形式获取的网上发布的模型,如果你有幸成功跑完整个训练,你可以在C:\Users\你的用户名\AppData\Local\Temp\tfhub_modules中看到一个文件夹和一个txt文本
其中,txt文本的内容如下:
Module: https://tfhub.dev/google/imagenet/inception_v3/feature_vector/1
Download Time: 2018-07-02 18:21:36.051380
Downloader Hostname: WSJ-LAPTOP (PID:18172)
从中不难看出,TensorFlow Hub是将从网上下载的inception_v3模型用作我们刚才迁移学习的预训练模型(通过阅读retrain.py的源码你也能发现这一点),所以如果网络状态不好或者翻墙不顺的话,那就自然是下载不下来的......

2.训练完后的的模型文件保存在哪儿?
默认是保存在tmp/文件夹下的,因为本人retrain.py文件所在盘符为E盘,所以所有训练生成的瓶颈文件,ckpt文件,pb文件,label文件都在E:\tmp路径下。

3.训练完的模型中,输入和输出的tensor分别是什么?
根据官方文档,输入的tensor是"Placeholder",输出的tensor是"final_result"。读者可以使用官方的图像分类预测代码来测试已训练好的模型。此文不展开描述测试的具体步骤,读者可自行查阅

4.除了默认的模型,我们还可以用哪些预训练模型?
retrain.py中--tfhub_moduled的默认值即为inception_v3模型的url,如需替换模型,可以参考官方文档,其中列举了所有可用到的已发布的官方预训练模型。

tfhub_module.png


若想了解更多的资料,如超参数的设置等详细配置信息,请大家自行查阅官方GitHub仓库
TensorFlow Hub最新中文网站:https://tensorflow.google.cn/hub/



若您觉得本文章对您有用,请您为我点上一颗小心心以表支持。感谢!

你可能感兴趣的:(TensorFlow Hub--用一行代码完成迁移学习)