tensorflow 分布式启动

import tensorflow as tf

#1配置服务器相关信息

#因为tensorflow 底层代码中,默认就是使用ps和work分别表示俩类不同的工作节点

#ps:变量/张量的初始化,存储相关的节点

#work:变量/张量的计算/运算的相关节点

ps_hosts = ['127.0.0.1:33331','127.0.0.1:33332']

work_hosts =['127.0.0.1:33333','127.0.0.1:33334','127.0.0.1:33335']

cluster = tf.train.ClusterSpec({'ps':ps_hosts,'work':work_hosts})

#2.定义一些运行参数 job_name 属性名称

tf.app.flags.DEFINE_string('jon_name',default_value='work',docstring="One of 'ps' or 'work'")

tf.app.flags.DEFINE_integer('task_index',default_value=0,docstring="Index of task within the job")

FLAGS  = tf.app.flags.FLAGS

#2.启动服务

def main():

print(FLAGS.job_name)

server = tf.train.Server(cluster,job_name=FLAGS.jon_name,task_index=FLAGS.task_index)

server.join()

if __name__ =='__main__':

tf.app.run()

你可能感兴趣的:(tensorflow 分布式启动)