本文将基于蝰蛇峡谷(SerpentCanyon) 详细介绍如何在英特尔独立显卡上训练TensorFlow模型的全流程。
1.1 英特尔锐炫™独立显卡简介
英特尔锐炫™ 显卡基于Xe-HPG 微架构,Xe HPG GPU 中的每个 Xe 内核都配置了一组 256 位矢量引擎,旨在加速传统图形和计算工作负载,以及新的 1024 位矩阵引擎或 Xe 矩阵扩展,旨在加速人工智能工作负载。
1.2 蝰蛇峡谷简介
蝰蛇峡谷(SerpentCanyon) 是一款性能强劲,并且体积小巧的高性能迷你主机,搭载全新一代混合架构的第 12 代智能英特尔® 酷睿™ 处理器,并且内置了英特尔锐炫™ A770M独立显卡。
1.3 搭建训练TensorFlow模型的开发环境
1.3.1 Windows版本要求:
训练TensorFlow所依赖的软件包TensorFlow-DirectML-Plugin 包要求:
- Windows 10的版本≥1709
- Windows 11的版本≥21H2
用“Windows logo 键+ R键”启动“运行”窗口,然后输入命令“winver”可以查得Windows版本。
1.3.2 下载并安装最新的英特尔显卡驱动
到Intel官网下载并安装最新的 英特尔显卡驱动
1.3.3 下载并安装Anaconda
下载并安装Python虚拟环境和软件包管理工具Anaconda。安装完毕后,用下面的命令创建并激活虚拟环境tf2_a770:
conda create --name tf2_a770 python=3.9
conda activate tf2_a770
1.3.4 安装TensorFlow2
在虚拟环境tf2_a770中安装TensorFlow 2.10。需要注意的是:tensorflow-directml-plugin软件包当前只支持TensorFlow 2.10。
pip install tensorflow-cpu==2.10
1.3.5 安装tensorflow-directml-plugin
在虚拟环境tf2_a770中安装tensorflow-directml-plugin,这是一个在Windows平台上的机器学习训练加速软件包。
pip install tensorflow-directml-plugin
到此,在Windows平台上用英特尔独立显卡训练TensorFlow模型的开发环境配置完毕。
1.4 在英特尔独立显卡上训练TensorFlow模型
1.4.1 下载并解压flower数据集
用下载器下载并解压flower数据集
1.4.2 下载训练代码启动训练
请下载tf2_training_on_A770.py并放入flower_photos同一个文件夹下运行。
from pathlib import Path
import tensorflow as tf
data_dir = Path("flower_photos")
image_count = len(list(data_dir.glob('*/*.jpg')))
print("Number of image files:", image_count)
# 导入Flower数据集
train_ds = tf.keras.utils.image_dataset_from_directory(data_dir, validation_split=0.2,
subset="training", seed=123, image_size=(180, 180), batch_size=32)
val_ds = tf.keras.utils.image_dataset_from_directory(data_dir, validation_split=0.2, subset="validation", seed=123, image_size=(180, 180), batch_size=32)
# 启动预取和数据缓存
train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=tf.data.AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=tf.data.AUTOTUNE)
# 创建模型
model = tf.keras.Sequential([
tf.keras.layers.Rescaling(1./255),
tf.keras.layers.Conv2D(16, 3, padding='same', activation='relu'),
tf.keras.layers.MaxPooling2D(),
tf.keras.layers.Conv2D(32, 3, padding='same', activation='relu'),
tf.keras.layers.MaxPooling2D(),
tf.keras.layers.Conv2D(64, 3, padding='same', activation='relu'),
tf.keras.layers.MaxPooling2D(),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dense(5)
])
# 编译模型
model.compile(optimizer='adam',
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
metrics=['accuracy'])
#训练模型
model.fit(train_ds,validation_data=val_ds,epochs=20)
运行结果如下:
结论:英特尔独立显卡支持TensorFlow模型训练。下一篇文章,我们将介绍在英特尔独立显卡上训练PyTorch模型