Intel® AI DevCloud

申请

网址 https://software.intel.com/zh-cn/ai-academy/tools/devcloud
Intel® AI DevCloud_第1张图片
Intel® AI DevCloud_第2张图片
等一天后
Intel® AI DevCloud_第3张图片
申请成功

登录

从邮件中给的地址进去
Intel® AI DevCloud_第4张图片
点击Learn,学习基本的一些使用方式
Intel® AI DevCloud_第5张图片
点击Connect,按照教程去连接,教程非常详细。
下载的一个神奇的文件
这里写图片描述
这个文件正确使用后
Intel® AI DevCloud_第6张图片
配置代理时,我出现了错误
Intel® AI DevCloud_第7张图片
原因是忽略了这一句Under "Proxy Type", move the radio button to Local
Intel® AI DevCloud_第8张图片
成功连接
Intel® AI DevCloud_第9张图片
在Deepin 15.5上连接
Intel® AI DevCloud_第10张图片
在deepin上更详细的使用请参考 在deepin15.5上使用 Intel® AI DevCloud

使用

先来一个lenet玩一玩
制作数据集的脚本
create_mnist.sh

DATA=/data/handwriting_character_recognition
BIN=/glob/intel-python/python3/bin/convert_mnist_data
OUTPUT=.
BACKEND="lmdb"
$BIN \
$DATA/train-images-idx3-ubyte \
$DATA/train-labels-idx1-ubyte \
$OUTPUT/train_lmdb --backend=${BACKEND}

$BIN \
$DATA/t10k-images-idx3-ubyte \
$DATA/t10k-labels-idx1-ubyte \
$OUTPUT/test_lmdb --backend=${BACKEND}

发送任务的脚本
launch_create_mnist

#PBS -N my_project_1
cd ~/
echo "Starting calculation"
bash create_mnist.sh
echo "End of calculation"

提交任务

qsub launch_create_mnist

然后就能在当前目录下看到test_lmdbh和train_lmdb两个文件夹了。
从GitHub上下载训练用的lenet_solver.prototxt和lenet_train_test.prototxt文件,改改路径啥的。
然后创建新的启动任务的脚本
launch_train_test_mnist

#PBS -N my_project_1
cd ~/
echo "Starting calculation"
caffe train -solver lenet_solver.prototxt
echo "End of calculation"

提交任务,让计算节点跑。
这个速度还是很快的。跑一万次迭代,


########################################################################
# Colfax Cluster - https://colfaxresearch.com/
#      Date:           Mon Jan 22 00:24:29 PST 2018
#    Job ID:           36780.c009
#      User:           u9860
# Resources:           neednodes=1:ppn=2,nodes=1:ppn=2,walltime=06:00:00
########################################################################
。。。
########################################################################
# Colfax Cluster
# End of output for job 36780.c009
# Date: Mon Jan 22 00:25:11 PST 2018
########################################################################

比较奇怪的是,它在o文件中输出了网络配置信息,而还在e文件中输出了运行时的日志,e文件不是出错才会写吗?
测试一下lenet
launch_test_mnist

#PBS -N my_project_1
cd ~/
echo "Starting calculation"
caffe test -model lenet_train_test.prototxt \
-weights mnist/lenet_iter_10000.caffemodel \
-iterations 100
#bash create_mnist.sh
echo "End of calculation"

有关devCloud中卡的问题
有时候,我写了一个launch脚本,感觉没问题的,提交过去,就一直卡,Time Use一直是0,要是我写错了,你好歹报个错呀。

你可能感兴趣的:(软创)