[译]TensorFlow Serving RESTful API

今年六月TensorFlow Serving在以往的gRPC API之外，开始支持RESTful API了，使得访问更加符合常用的JSON习惯，本文翻译自官方文档，提供RESTful API的使用指南，如与官网有出入，以官网为准，以下为正文。

除了gRPC APIs，TensorFlow ModelServer也开始支持使用RESTful API在TensorFlow模型上进行分类、回归、和预测了。本文介绍使用这些API的端点和request/response格式。

TensorFlow ModelServer通过host:port接受下面这种RESTful API请求：

POST http://host:port/:
URI: /v1/models/${MODEL_NAME}[/versions/${MODEL_VERSION}]
VERB: classify|regress|predict

其中“/versions/${MODEL_VERSION}”是可选的，如果省略，则使用最新的版本。

该API基本遵循gRPC版本的PredictionService API。

请求URL的示例：

http://host:port/v1/models/iris:classify
http://host:port/v1/models/mnist/versions/314:predict

请求和回复都是JSON对象。该对象的组成取决于请求类型或操作。细节请查看下面的API特性一节。

为防错误，所有的API都会在返回体中返回一个JSON对象，其中“error”作为key，错误信息则是value：

{
"error":
}

分类和回归API

请求格式

分类和回归的API的请求体必须是一个遵循下述格式的JSON对象：

{
  // Optional: serving signature to use.
  // If unspecifed default serving signature is used.
  "signature_name": ,

  // Optional: Common context shared by all examples.
  // Features that appear here MUST NOT appear in examples (below).
  "context": {
    "": |
    "": |
  },

  // List of Example objects
  "examples": [
    {
      // Example 1
      "": |,
      "": |,
      ...
    },
    {
      // Example 2
      "": |,
      "": |,
      ...
    }
    ...
  ]
}

其中“”是一个JSON数字（整数或小数）或字符串，“”则是一系列该。查看下面的编码二进制值
一节可获知如何表示二进制（比特流）值。该格式和gRPC的“ClassificationRequest”和“RegressionRequest”接口很像。这些版本都接受Example对象的list。

回复格式

分类请求会在返回体中返回一个格式如下的JSON对象：

{
  "result": [
    // List of class label/score pairs for first Example (in request)
    [ [, ], [, ], ... ],

    // List of class label/score pairs for next Example (in request)
    [ [, ], [, ], ... ],
    ...
  ]
}

其中“”是字符串（如果模型没有关联分数的label，可以为空字符串" "）。
“”是小数（浮点型）。

回归请求会在返回体中返回一个格式如下的JSON对象：

{
  // One regression value for each example in the request in the same order.
  "result": [ , , , ...]
}

“”是个小数。

gRPC API的用户会注意到这些格式和“ClassificationRequest”和“RegressionRequest”接口很像。

预测 API

请求格式

预测API的请求体必须是如下格式的JSON对象：

{
  // (Optional) Serving signature to use.
  // If unspecifed default serving signature is used.
  "signature_name": ,

  // Input Tensors in row ("instances") or columnar ("inputs") format.
  // A request can have either of them but NOT both.
  "instances": |<(nested)list>|
  "inputs": |<(nested)list>|

TensorFlow数据类型	JSON值	JSON示例	备注
DT_BOOL	true, false	true, false	-
DT_STRING	string	"Hello World!"	如果DT_STRING 表示的是二进制值（比如序列化的图片比特流），会以Base64编码。查看编码二进制值获取更多内容
DT_INT8, DT_UINT8, DT_INT16, DT_INT32, DT_UINT32, DT_INT64, DT_UINT64	number	1, -10, 0	JSON值为十进制整数
DT_FLOAT, DT_DOUBLE	number	1.1, -10.0, 0, NaN, Infinity	JSON值会是一个数字或者特殊标示值NaN和Infinity，查看JSON一致性获取更多内容。指数符号也是接受的。

[译]TensorFlow Serving RESTful API

分类和回归API

请求格式

回复格式

预测 API

请求格式

回复格式

JSON映射

编码二进制值

JSON一致性

示例

从REST API端口启动ModelServer

使用REST API调用ModelServer

你可能感兴趣的:([译]TensorFlow Serving RESTful API)