qq_38196982

7.接着跑一下triton官方教程

5.Model Ensemble

在此示例中，我们将探索使用模型集成来仅通过单个网络调用在服务器端执行多个模型。这样做的好处是减少了在客户端和服务器之间复制数据的次数，并消除了网络调用固有的一些延迟。

为了说明创建模型集成的过程，我们将重用第 1 部分中首次介绍的模型管道。在前面的示例中，我们分别执行了文本检测和识别模型，我们的客户端进行两个不同的网络调用并在其间执行各种处理步骤，例如裁剪和调整图像大小，或将张量解码为文本。下面是管道的简化图，其中一些步骤发生在客户端，一些步骤发生在服务器上。

为了减少必要的网络调用和数据复制次数（并利用可能更强大的服务器来执行前/后处理），我们可以使用 Triton 的Model Ensemble功能通过一次网络调用来执行多个模型。

1.部署基础模型

直接执行脚本即可

cd /triton/tutorials/Conceptual_Guide/Part_5-Model_Ensembles
sh utils/export_text_detection.sh
sh utils/export_text_recognition.sh

此时，model_repository的文件结构为

2.使用 Python 后端部署预处理/后处理脚本

在第1部分，client.py用于在客户端进程中执行各种预处理和后处理步骤,包括

读取图像
对图像进行缩放和标准化
将图像发送到 Triton 服务器
根据文本检测模型返回的边界框裁剪图像
将裁剪后的图像保存回磁盘

现在，实现第二个client,client2.py包括

从client.py读取裁剪后的图像
对图像进行缩放和标准化
将裁剪后的图像发送到 Triton 服务器
将文本识别模型返回的张量解码为文本
打印解码后的文本

为了将其中许多步骤移至 Triton 服务器，我们可以创建一组将在Triton 的 Python 后端中运行的脚本。Python 后端可用于执行任何 Python 代码，因此我们只需进行一些更改即可将客户端代码直接移植到 Triton。

总的来说，我们将创建 3 种不同的 Python 后端模型，以配合我们现有的 ONNX 模型来为 Triton 提供服务：

detection_preprocessing
detection_postprocessing
recognition_postprocessing

model.py您可以在此目录中的文件夹中找到每个脚本的完整脚本model_repository。

让我们看一个例子。在 model.py中，我们TritonPythonModel使用以下方法创建一个类定义：

class TritonPythonModel:
    def initialize(self, args):
        ...
    def execute(self, requests):
        ...
    def finalize(self):
        ...

initialize和finalize方法是可选的，分别在加载和卸载模型时调用。大部分逻辑将进入该execute方法，该方法接收请求对象列表，并且必须返回响应对象列表。

在我们最初的客户端中，我们使用以下代码来读取图像并对其执行一些简单的转换：

### client.py

image = cv2.imread("./img1.jpg")
image_height, image_width, image_channels = image.shape

# Pre-process image
blob = cv2.dnn.blobFromImage(image, 1.0, (inpWidth, inpHeight), (123.68, 116.78, 103.94), True, False)
blob = np.transpose(blob, (0, 2,3,1))

# Create input object
input_tensors = [
    httpclient.InferInput('input_images:0', blob.shape, "FP32")
]
input_tensors[0].set_data_from_numpy(blob, binary_data=True)

在 python 后端执行时，python代码处理输入列表。但不再是从磁盘读取图像，而是直接从 Triton 服务器提供的输入张量检索它们。

### model.py

responses = []
for request in requests:
    # Read input tensor from Triton
    in_0 = pb_utils.get_input_tensor_by_name(request, "detection_preprocessing_input")
    img = in_0.as_numpy()
    image = Image.open(io.BytesIO(img.tobytes()))

    # Pre-process image
    img_out = image_loader(image)
    img_out = np.array(img_out)*255.0

    # Create object to send to next model
    out_tensor_0 = pb_utils.Tensor("detection_preprocessing_output", img_out.astype(output0_dtype))
    inference_response = pb_utils.InferenceResponse(output_tensors=[out_tensor_0])
    responses.append(inference_response)
return responses

3.将模型与模型集成结合在一起

创建一个集成“模型”，它可以按顺序执行每个模型，并在每个模型之间传递各种输入和输出。

为此，我们将在模型存储库中创建另一个条目

cd /triton/tutorials/Conceptual_Guide/Part_5-Model_Ensembles
mkdir model_repository/ensemble_model/1
此时ensemble_model的文件结构为

ensemble_model/
├── 1
└── config.pbtxt

这次，我们只需要配置文件来描述我们的整体以及一个空版本文件夹（您需要使用来创建mkdir -p model_repository/ensemble_model/1）。在配置文件中，我们将定义整体的执行图。该图描述了集成的总体输入和输出，以及数据如何以有向无环图的形式流过模型。下面是我们模型管道的图形表示。菱形代表整体的最终输入和输出，这是客户端将与之交互的所有内容。圆圈是不同的部署模型，矩形是在模型之间传递的张量。

为了向 Triton 表示该图，我们将创建以下配置文件。请注意我们如何将平台定义为"ensemble"并指定集成本身的输入和输出。然后，在该ensemble_scheduling块中，我们为每个集成创建一个条目step，其中包括要执行的模型的名称，以及该模型的输入和输出如何映射到完整集成或其他模型的输入和输出。

ensemble的config.pbtxt内容为

name: "ensemble_model"
platform: "ensemble"
max_batch_size: 256
input [
  {
    name: "input_image"
    data_type: TYPE_UINT8
    dims: [ -1 ]
  }
]
output [
  {
    name: "recognized_text"
    data_type: TYPE_STRING
    dims: [ -1 ]
  }
]

ensemble_scheduling {
  step [
    {
      model_name: "detection_preprocessing"
      model_version: -1
      input_map {
        key: "detection_preprocessing_input"
        value: "input_image"
      }
      output_map {
        key: "detection_preprocessing_output"
        value: "preprocessed_image"
      }
    },
    {
      model_name: "text_detection"
      model_version: -1
      input_map {
        key: "input_images:0"
        value: "preprocessed_image"
      }
      output_map {
        key: "feature_fusion/Conv_7/Sigmoid:0"
        value: "Sigmoid:0"
      },
      output_map {
        key: "feature_fusion/concat_3:0"
        value: "concat_3:0"
      }
    },
    {
      model_name: "detection_postprocessing"
      model_version: -1
      input_map {
        key: "detection_postprocessing_input_1"
        value: "Sigmoid:0"
      }
      input_map {
        key: "detection_postprocessing_input_2"
        value: "concat_3:0"
      }
      input_map {
        key: "detection_postprocessing_input_3"
        value: "preprocessed_image"
      }
      output_map {
        key: "detection_postprocessing_output"
        value: "cropped_images"
      }
    },
    {
      model_name: "text_recognition"
      model_version: -1
      input_map {
        key: "INPUT__0"
        value: "cropped_images"
      }
      output_map {
        key: "OUTPUT__0"
        value: "recognition_output"
      }
    },
    {
      model_name: "recognition_postprocessing"
      model_version: -1
      input_map {
        key: "recognition_postprocessing_input"
        value: "recognition_output"
      }
      output_map {
        key: "recognition_postprocessing_output"
        value: "recognized_text"
      }
    }
  ]
}

4.启动与测试

 /opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/Conceptual_Guide/Part_5-Model_Ensembles/model_repository/

客户端文件内容为

## client.py

import tritonclient.grpc as grpcclient
import numpy as np

client = grpcclient.InferenceServerClient(url="localhost:8001")

image_data = np.fromfile("img1.jpg", dtype="uint8")
image_data = np.expand_dims(image_data, axis=0)

input_tensors = [grpcclient.InferInput("input_image", image_data.shape, "UINT8")]
input_tensors[0].set_data_from_numpy(image_data)
results = client.infer(model_name="ensemble_model", inputs=input_tensors)
output_data = results.as_numpy("recognized_text").astype(str)
print(output_data)

发起请求

cd /triton/tutorials/Conceptual_Guide/Part_5-Model_Ensembles
python3 client.py

结果为

6.使用BLS

在第5部分，讨论了如何使用模型集成通过单个网络调用在 Triton 上执行多个模型。当模型pipeline采用有向无环图的形式时，模型集成是一个很好的解决方案。然而，并不是所有的管道都可以这样表达。例如，pipeline逻辑需要条件分支或循环执行，则更适合使用业务逻辑脚本(BLS)在 Python 中创建定义更复杂的管道。

1.使用多个后端

在构建由深度学习模型驱动的流程时，通常需要多个贡献者的协作。这些贡献者可能使用不同的开发环境和工具，这可能导致在整合来自不同贡献者的工作时出现问题。

为了解决这个挑战，Triton Inference Server的用户可以利用Python或C++后端以及业务逻辑脚本API（BLS API）。这使得用户可以编写脚本来触发模型执行，而不受贡献者使用的特定开发环境的限制。这种方法有助于统一和简化不同贡献者的工作，确保整个深度学习流程能够顺利运行。

总之，BLS API提供了一种通用的方式来集成深度学习模型的执行，无论贡献者使用的是Python还是C++，都可以在整个流程中进行模型推理。这有助于加速开发和部署过程，同时降低了协作和整合的复杂性。

在此示例中，模型运行于：

ONNX 后端
TensorRT 后端
Python后端

部署在框架后端的两个模型都可以使用以下 API 触发：

encoding_request = pb_utils.InferenceRequest(
    model_name="text_encoder",
    requested_output_names=["last_hidden_state"],
    inputs=[input_ids_1],
)

response = encoding_request.exec()
text_embeddings = pb_utils.get_output_tensor_by_name(response, "last_hidden_state")

在/triton/tutorials/Conceptual_Guide/Part_6-building_complex_pipelines/model_repository/pipeline/1路径下的model.py里有完整的pipeline

2.测试示例

安装Python后端运行的模型所需的依赖项

cd /triton/tutorials/Conceptual_Guide/Part_6-building_complex_pipelines
# PyTorch & Transformers Lib
pip install torch torchvision torchaudio
pip install transformers ftfy scipy accelerate
pip install diffusers==0.9.0
pip install transformers[onnxruntime]
huggingface-cli login

需要有hugging face账号，并从setting->Access Tokens里获取token

导出并转换模型

# Accelerating VAE with TensorRT
/usr/src/tensorrt/bin/trtexec --onnx=vae.onnx --saveEngine=vae.plan --minShapes=latent_sample:1x4x64x64 --optShapes=latent_sample:4x4x64x64 --maxShapes=latent_sample:8x4x64x64 --fp16

# Place the models in the model repository
mkdir model_repository/vae/1
mkdir model_repository/text_encoder/1
mv vae.plan model_repository/vae/1/model.plan
mv encoder.onnx model_repository/text_encoder/1/model.onnx

启动模型

/opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/Conceptual_Guide/Part_6-building_complex_pipelines/model_repository/

发送请求

# Client with no GUI
python3 client.py

结果如下

root@aea5f00fde8d:/triton/tutorials/Conceptual_Guide/Part_6-building_complex_pipelines# python3 client.py
Time taken: 6.338625431060791

# Client with GUI
pip install gradio packaging
python3 gui/client.py --triton_url="localhost:8001"

结果如下

7.数据管道

弄清楚如何把tensor从客户端移动到客户端，或者tensor在后端之间如何移动，是非常重要的。

本部分主要包含2个内容：

1. **API 用于在客户端和服务器之间移动数据：** Triton 提供了一组 API，允许用户将数据从客户端发送到服务器，以及在服务器内部移动数据，以便进行推理。这对于将输入数据传递给模型以及将模型的输出传递回客户端非常重要。

2. **如何熟练使用模型集成调度器：** Triton 支持模型集成，这意味着您可以同时部署多个模型，并将它们组合在一起执行以实现更复杂的任务。集成调度器用于管理多个模型之间的数据流和调度。

1.虚拟管道

要移动的数据类型取决于您正在构建的管道的类型。因此，没有一个干净的现实世界示例可以用来迎合广大受众。因此，本教程将简单演示如何通过虚拟管道移动字符串、UINT8 和 INT8 数组、FP32 图像和布尔值。

1.设置Model

在我们进一步讨论之前，让我们先建立模型。为了演示的目的，我们使用“Python 模型”。Triton 中的 Python 模型基本上是具有三个 Triton 特定函数的类：initialize、execute和finalize。用户可以自定义这个类来服务他们编写的任何Python函数或任何他们想要的模型，只要它可以在Python运行时加载。该initialize函数在 python 模型加载到内存中时运行，而finalize在模型从内存中卸载时运行。这两个函数都是可选定义的。同样，为了使这个示例简单，我们将仅使用该execute函数来打印“python 模型”接收到的张量。让我们看看它是如何完成的：

def execute(self, requests):
    responses = []
    for request in requests:
        inp = pb_utils.get_input_tensor_by_name(request, "model_1_input_string")
        inp2 = pb_utils.get_input_tensor_by_name(request, "model_1_input_UINT8_array")
        inp3 = pb_utils.get_input_tensor_by_name(request, "model_1_input_INT8_array")
        inp4 = pb_utils.get_input_tensor_by_name(request, "model_1_input_FP32_image")
        inp5 = pb_utils.get_input_tensor_by_name(request, "model_1_input_bool")

        print("Model 1 received", flush=True)
        print(inp.as_numpy(), flush=True)
        print(inp2.as_numpy(), flush=True)
        print(inp3.as_numpy(), flush=True)
        print(inp4.as_numpy(), flush=True)
        print(inp5.as_numpy(), flush=True)

        inference_response = pb_utils.InferenceResponse(output_tensors=[
            pb_utils.Tensor(
                "model_1_output_string",
                inp.as_numpy(),
            ),
            pb_utils.Tensor(
                "model_1_output_UINT8_array",
                inp2.as_numpy(),
            ),
            pb_utils.Tensor(
                "model_1_output_INT8_array",
                inp3.as_numpy(),
            ),
            pb_utils.Tensor(
                "model_1_output_FP32_image",
                inp4.as_numpy(),
            ),
            pb_utils.Tensor(
                "model_1_output_bool",
                inp5.as_numpy(),
            )
        ])
        responses.append(inference_response)
    return responses

有2个函数需要注意：pb_utils.get_input_tensor_by_name(...)和pb_utils.InferenceResponse(...)。顾名思义，这些函数用于接收和发送张量。Triton Inference Server 支持多种数据类型。在此示例中，我们展示了其中 5 个，但有关支持的数据类型的完整列表，请参阅此处的文档。

在此示例中，“输入层”为model_1_input_string、model_1_input_UINT8_array、model_1_input_INT8_array、model_1_input_FP32_image和model_1_input_bool。在config.pbtxt里定义该模型的预期维度和数据类型

input [
  {
    name: "model_1_input_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  {
    name: "model_1_input_UINT8_array"
    data_type: TYPE_UINT8
    dims: [-1]
  },
  {
    name: "model_1_input_INT8_array"
    data_type: TYPE_INT8
    dims: [-1]
  },
  {
    name: "model_1_input_FP32_image"
    data_type: TYPE_FP32
    dims: [-1, -1, -1]
  },
  {
    name: "model_1_input_bool"
    data_type: TYPE_BOOL
    dims: [-1]
  }
]

类似地，“输出层”是model_1_output_string、model_1_output_UINT8_array、model_1_output_INT8_array和model_1_output_FP32_image，model_1_output_bool。同样定义在config.pbttx里：

output [
  {
    name: "model_1_output_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  {
    name: "model_1_output_UINT8_array"
    data_type: TYPE_UINT8
    dims: [-1]
  },
  {
    name: "model_1_output_INT8_array"
    data_type: TYPE_INT8
    dims: [-1]
  },
  {
    name: "model_1_output_FP32_image"
    data_type: TYPE_FP32
    dims: [-1, -1, -1]
  },
  {
    name: "model_1_output_bool"
    data_type: TYPE_BOOL
    dims: [-1]
  }
]

注意：对于常规onnx、torchscript或tensorflow任何其他模型，我们只需要在中定义输入和输出层config.pbtxt。ensemble和client之间的交互将保持不变。如果您不确定模型的layers、datatype和w维度，您可以使用Netron或Polygraphy等工具来获取所需的信息。

Netron 和 Polygraphy 是用于深度学习模型开发和分析的两个不同工具：

1. **Netron：** Netron 是一个模型可视化工具，用于可视化和分析深度学习模型的结构和参数。它支持多种深度学习框架（如TensorFlow、PyTorch、ONNX等）的模型可视化，可以帮助开发人员和研究人员更好地理解模型的架构，查看层次结构，参数和张量的形状，以及模型中的各种详细信息。Netron 提供了用户友好的界面，支持交互式浏览和导出模型的能力，是一个有用的工具，用于模型调试和分析。

2. **Polygraphy：** Polygraphy 是一个模型分析工具，用于评估和验证深度学习模型的性能、准确性和稳定性。它可以执行各种模型评估任务，包括模型推理性能的基准测试、模型推理准确性的验证、模型压力测试等。Polygraphy 还可以帮助用户优化模型的性能，包括自动化的模型优化和部署，以满足特定的性能需求。它支持多种深度学习框架和硬件平台，可以帮助开发人员更好地了解模型在不同条件下的行为，并优化模型以适应实际部署。

Netron 主要用于深度学习模型的可视化和架构分析，而 Polygraphy 用于深度学习模型的性能评估、验证和优化。这两个工具可以在深度学习模型的开发、调试和优化过程中发挥重要作用。

本例中的第二个模型与上面的模型相同，将使用该模型展示在model ensemble中的数据流。如果您已经参考过概念指南的第 5 部分，那么以下对ensemble的解释可能看起来很熟悉。

2.设置Ensebmle

ensemble用于构建具有两个或多个模型的pipeline。使用ensemble的好处是 Triton 推理服务器可以处理两个模型之间所需的所有张量/内存移动。此外，用户可以使用简单的配置文件定义模型流程。此功能对于用户设置多个pipeline并在其中共享一些通用模型的情况特别有用。

稍后将讨论model_repository的结构,先看一下ensemble的配置。

由于所有tensors的流程都相同，因此我们将重点关注输入字符串。ensemble model的完整配置如下所示：

name: "ensemble_model"
platform: "ensemble"
max_batch_size: 8
input [
  {
    name: "ensemble_input_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  ...
]
output [
  {
    name: "ensemble_output_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  ...
]

ensemble_scheduling {
  step [
    {
      model_name: "model1"
      model_version: -1
      input_map {
        key: "model_1_input_string"
        value: "ensemble_input_string"
      },
      ...
      
      output_map {
        key: "model_1_output_string"
        value: "model1_to_model2_string"
      },
      ...

    },
    {
      model_name: "model2"
      model_version: -1
      input_map {
        key: "model_2_input_string"
        value: "model1_to_model2_string"
      },
      ...

      output_map {
        key: "model_2_output_string"
        value: "ensemble_output_string"
      },
      ...

    }
  ]

我们分解一下：

1)首先，我们定义整个ensemble的input和output。

input [
  {
    name: "ensemble_input_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  ...
]
output [
  {
    name: "ensemble_output_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  ...
]

这和在常规模型中定义input和output层是相似的。

2)其次，定义ensemble的确切流程。该流程由“stemps”组成，其中每个steps定义输入/输出以及要在此步骤执行的模型。

ensemble_scheduling {
  step [
    {
      model_name: "model1"
      model_version: -1
      ...

    },
    {
      model_name: "model2"
      model_version: -1
      ...

    }
  ]

用户需要理解的第一部分是如何定义其ensemble pipeline的一般流程。如哪个模型需要先运行？tensor在每个model/step之间如何流动？为了完成这一点，我们使用input_map和output_map。

ensemble_scheduling {
  step [
    {
      model_name: "model1"
      model_version: -1
      input_map {
        key: "model_1_input_string"       # Model 1's input Tensor
        value: "ensemble_input_string"    # this is the name of the ensemble's input
      },
      ...
      
      output_map {
        key: "model_1_output_string"      # Model 1's output Tensor
        value: "model1_to_model2_string"  # Mapping output from Model1 to Model2
      },
      ...

    },
    {
      model_name: "model2"
      model_version: -1
      input_map {
        key: "model_2_input_string"       # Model 2's input Tensor
        value: "model1_to_model2_string"  # Mapping output from Model1 to Model2
      },
      ...

      output_map {
        key: "model_2_output_string"      # Model 2's output Tensor
        value: "ensemble_output_string"   # this is the name of the ensemble's output
      },
      ...

    }
  ]

在构建深度学习模型ensemble时，需要定义用于连接模型之间的输入和输出的键（key）和值（value）字段。

- **键字段（Key Field）：** 键字段通常由模型所需的层的名称填充。这意味着每个模型都可以通过层的名称来标识其输出，并将其发送给ensemble中的其他模型。例如，如果模型1的某一层的输出需要传递给模型2，那么模型1可以使用该层的名称作为键字段。

- **值字段（Value Field）：** 值字段是由ensemble系统识别的。这个字段用于定义数据张量的流动。当一个模型的输出需要传递给另一个模型的输入时，需要使用值字段将它们连接起来。如果你想将model1某一层的输出作为model2某一层的输入，需要将model1的output_map中的值字段，作为model2的input_map中的值字段，以确保数据正确传递。

总之，键字段用于标识模型的输出，而值字段用于定义数据流的路径，以便将一个模型的输出传递给另一个模型的输入。这种方式可以有效地组织和管理模型之间的数据传递，实现深度学习模型的集成。

了解了各个配置后，让我们简要地看一下此示例的模型存储库的结构。本质上我们有两个模型

model_repository/
├── ensemble_model
│   ├── 1               # Empty version folder required for ensemble models
│   └── config.pbtxt    # Config for the Ensemble
├── model1
│   ├── 1
│   │   └── model.py
│   └── config.pbtxt    # Config for model 1
└── model2
    ├── 1
    │   └── model.py
    └── config.pbtxt    # Config for model 2

2.了解 Python 客户端

服务器端设置完成后，我们来讨论客户端代码。

def main():
    client = httpclient.InferenceServerClient(url="localhost:8000")

    # Inputs
    prompts = ["This is a string"]
    text_obj = np.array([prompts], dtype="object")

    url = "http://images.cocodataset.org/val2017/000000039769.jpg"
    image = np.asarray(Image.open(requests.get(url, stream=True).raw)).astype(np.float32)
    uint8_array = np.expand_dims(np.array([1,2,3], dtype = np.uint8), axis = 0)
    int8_array = np.expand_dims(np.array([-1,2,-3], dtype = np.int8), axis = 0)
    image = np.expand_dims(image, axis=0)
    boolean = np.expand_dims(np.array([True]), axis = 0)

    # Set Inputs
    input_tensors = [
        httpclient.InferInput("ensemble_input_string", text_obj.shape,np_to_triton_dtype(text_obj.dtype)),
        httpclient.InferInput("ensemble_input_UINT8_array", uint8_array.shape, datatype="UINT8"),
        httpclient.InferInput("ensemble_input_INT8_array", int8_array.shape, datatype="INT8"),
        httpclient.InferInput("ensemble_input_FP32_image", image.shape, datatype="FP32"),
        httpclient.InferInput("ensemble_input_bool", boolean.shape, datatype="BOOL")
    ]
    input_tensors[0].set_data_from_numpy(text_obj)
    input_tensors[1].set_data_from_numpy(uint8_array)
    input_tensors[2].set_data_from_numpy(int8_array)
    input_tensors[3].set_data_from_numpy(image)
    input_tensors[4].set_data_from_numpy(boolean)

    # Set outputs
    output = [
        httpclient.InferRequestedOutput("ensemble_output_string"),
        httpclient.InferRequestedOutput("ensemble_output_UINT8_array"),
        httpclient.InferRequestedOutput("ensemble_output_INT8_array"),
        httpclient.InferRequestedOutput("ensemble_output_FP32_image"),
        httpclient.InferRequestedOutput("ensemble_output_bool")
    ]

    # Query
    query_response = client.infer(model_name="ensemble_model",
                                  inputs=input_tensors,
                                  outputs=output)

    print(query_response.as_numpy("ensemble_output_string"))
    print(query_response.as_numpy("ensemble_output_UINT8_array"))
    print(query_response.as_numpy("ensemble_output_INT8_array"))
    print(query_response.as_numpy("ensemble_output_FP32_image"))
    print(query_response.as_numpy("ensemble_output_bool"))

让我们看看设置输入和输出。

# Input
input_tensors = [
    httpclient.InferInput("ensemble_input_string", text_obj.shape,np_to_triton_dtype(text_obj.dtype)),
    httpclient.InferInput("ensemble_input_UINT8_array", uint8_array.shape, datatype="UINT8"),
    httpclient.InferInput("ensemble_input_INT8_array", int8_array.shape, datatype="INT8"),
    httpclient.InferInput("ensemble_input_FP32_image", image.shape, datatype="FP32"),
    httpclient.InferInput("ensemble_input_bool", boolean.shape, datatype="BOOL")
]
input_tensors[0].set_data_from_numpy(text_obj)
input_tensors[1].set_data_from_numpy(uint8_array)
input_tensors[2].set_data_from_numpy(int8_array)
input_tensors[3].set_data_from_numpy(image)
input_tensors[4].set_data_from_numpy(boolean)

# Output
output = [
    httpclient.InferRequestedOutput("ensemble_output_string"),
    httpclient.InferRequestedOutput("ensemble_output_UINT8_array"),
    httpclient.InferRequestedOutput("ensemble_output_INT8_array"),
    httpclient.InferRequestedOutput("ensemble_output_FP32_image"),
    httpclient.InferRequestedOutput("ensemble_output_bool")
]

在本例中，我们使用http客户端，并指定输入和输出的名称以及预期的数据类型。请注意，在这种情况下，我们使用的是ensemble inputs/outputs，例如ensemble_input_string作为输入到ensemble中的字符串。如果要单独查询组合模型之一，可以更改输入名称、输出名称和模型名称以匹配所需的模型。

# Creating a client for the server
client = httpclient.InferenceServerClient(url="localhost:8000")

# Querying the Server
query_response = client.infer(model_name="ensemble_model",
                                inputs=input_tensors,
                                outputs=output)

print(query_response.as_numpy("ensemble_output_string"))
print(query_response.as_numpy("ensemble_output_UINT8_array"))
print(query_response.as_numpy("ensemble_output_INT8_array"))
print(query_response.as_numpy("ensemble_output_FP32_image"))
print(query_response.as_numpy("ensemble_output_bool"))

3.使用示例

首先不要忘记将

name: "ensemble_model"
backend: "ensemble"
max_batch_size: 8

input [
  {
    name: "ensemble_input_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  {
    name: "ensemble_input_UINT8_array"
    data_type: TYPE_UINT8
    dims: [-1]
  },
  {
    name: "ensemble_input_INT8_array"
    data_type: TYPE_INT8
    dims: [-1]
  },
  {
    name: "ensemble_input_FP32_image"
    data_type: TYPE_FP32
    dims: [-1, -1, -1]
  },
  {
    name: "ensemble_input_bool"
    data_type: TYPE_BOOL
    dims: [-1]
  }
]
output [
  {
    name: "ensemble_output_string"
    data_type: TYPE_STRING
    dims: [-1]
  },
  {
    name: "ensemble_output_UINT8_array"
    data_type: TYPE_UINT8
    dims: [-1]
  },
  {
    name: "ensemble_output_INT8_array"
    data_type: TYPE_INT8
    dims: [-1]
  },
  {
    name: "ensemble_output_FP32_image"
    data_type: TYPE_FP32
    dims: [-1, -1, -1]
  },
  {
    name: "ensemble_output_bool"
    data_type: TYPE_BOOL
    dims: [-1]
  }
]

ensemble_scheduling {
  step [
    {
      model_name: "model1"
      model_version: -1
      input_map {
        key: "model_1_input_string"
        value: "ensemble_input_string"
      },
      input_map {
        key: "model_1_input_UINT8_array"
        value: "ensemble_input_UINT8_array"
      },
      input_map {
        key: "model_1_input_INT8_array"
        value: "ensemble_input_INT8_array"
      },
      input_map {
        key: "model_1_input_FP32_image"
        value: "ensemble_input_FP32_image"
      },
      input_map {
        key: "model_1_input_bool"
        value: "ensemble_input_bool"
      }
      output_map {
        key: "model_1_output_string"
        value: "model1_to_model2_string"
      },
      output_map {
        key: "model_1_output_UINT8_array"
        value: "model1_to_model2_uint8"
      },
      output_map {
        key: "model_1_output_INT8_array"
        value: "model1_to_model2_int8"
      },
      output_map {
        key: "model_1_output_FP32_image"
        value: "model1_to_model2_image"
      },
      output_map {
        key: "model_1_output_bool"
        value: "model1_to_model2_bool"
      }
    },
    {
      model_name: "model2"
      model_version: -1
      input_map {
        key: "model_2_input_string"
        value: "model1_to_model2_string"
      },
      input_map {
        key: "model_2_input_UINT8_array"
        value: "model1_to_model2_uint8"
      },
      input_map {
        key: "model_2_input_INT8_array"
        value: "model1_to_model2_int8"
      },
      input_map {
        key: "model_2_input_FP32_image"
        value: "model1_to_model2_image"
      },
      input_map {
        key: "model_2_input_bool"
        value: "model1_to_model2_bool"
      }
      output_map {
        key: "model_2_output_string"
        value: "ensemble_output_string"
      },
      output_map {
        key: "model_2_output_UINT8_array"
        value: "ensemble_output_UINT8_array"
      },
      output_map {
        key: "model_2_output_INT8_array"
        value: "ensemble_output_INT8_array"
      },
      output_map {
        key: "model_2_output_FP32_image"
        value: "ensemble_output_FP32_image"
      },
      output_map {
        key: "model_2_output_bool"
        value: "ensemble_output_bool"
      }
    }
  ]
}

要运行此示例，请打开两个终端。

# Server
cd /triton/tutorials/Feature_Guide/Data_Pipelines
/opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/Feature_Guide/Data_Pipelines/model_repository/

以上将启动 Triton 推理服务器。在第二个终端中,运行客户端脚本：

# Client

cd /path/to/this/folder
# Replace yy.mm with year and month of release. Eg. 23.02
docker run -it --net=host -v ${PWD}:/workspace/ nvcr.io/nvidia/tritonserver:yy.mm-py3-sdk bash
pip install image
python3 client.py

结果如下

root@aea5f00fde8d:/triton/tutorials/Feature_Guide/Data_Pipelines# python3 client.py
[[b'This is a string']]
[[1 2 3]]
[[-1  2 -3]]
[[[[140.  25.  56.]
   [144.  25.  67.]
   [146.  24.  73.]
   ...
   [ 94.  16.  38.]
   [107.  13.  39.]
   [102.  10.  33.]]

  [[138.  22.  57.]
   [142.  26.  49.]
   [139.  20.  48.]
   ...
   [103.  11.  36.]
   [115.  17.  42.]
   [ 96.  13.  31.]]

  [[135.  22.  42.]
   [150.  33.  59.]
   [142.  23.  53.]
   ...
   [103.   8.  32.]
   [108.  19.  39.]
   [ 93.  10.  26.]]

  ...

  [[237. 100. 190.]
   [225.  84. 196.]
   [236.  96. 203.]
   ...
   [171.  47. 131.]
   [181.  62. 144.]
   [147.  28. 110.]]

  [[230.  84. 221.]
   [226.  80. 213.]
   [238.  99. 202.]
   ...
   [114.  24.  62.]
   [103.   5.  46.]
   [ 89.   9.  44.]]

  [[238. 100. 175.]
   [246. 109. 191.]
   [238.  96. 214.]
   ...
   [ 74.  13.  29.]
   [ 74.  25.  44.]
   [ 73.  17.  42.]]]]
[[ True]]

9.部署 HuggingFace 模型

HuggingFace 拥有许多开源模型。此处讨论如何使用 Triton 推理服务器部署 HuggingFace 中的几乎任何模型。在此示例中，使用了HuggingFace上提供的ViT模型。

在 Triton 推理服务器上部署model pipeline有两种主要方法：

方法 1：部署pipeline而不显式地将model与pipeline分离。这种方法的核心优势是用户可以快速部署他们的管道。这可以通过使用 Triton 的“Python 后端”来实现。请参阅此示例以获取更多信息。总之，我们使用 Python 后端部署模型/管道。
方法 2：分解pipeline，使用不同的后端进行前/后处理，并将核心模型部署在框架后端上。这种情况下的优点是在专用框架后端上运行核心网络可提供更高的性能。此外，还可以利用许多特定于框架的优化。有关详细信息，请参阅概念指南的第 4 部分。这是通过 Triton 的 Ensembles 实现的。对此的解释可以在概念指南的第 5 部分中找到。请参阅文档以获取更多信息。总之，我们构建了一个具有预处理步骤和导出模型的集成。

1.示例

出于本说明的目的，正在使用ViT模型（链接到 HuggingFace ）。这个特定的 ViT 模型没有应用程序头（如图像分类），但HuggingFace 提供了具有不同头的 ViT 模型供用户使用。部署模型时的一个好习惯是了解并探索模型的结构（如果您不熟悉模型）。通过图形界面查看结构的一种简单方法是使用Netron等工具。虽然 Triton 自动生成模型的配置文件，但用户可能仍然需要输入和输出层的名称来构建我们可以使用此工具的客户端/模型集合。

1.使用Python后端部署

使用 Triton 的 python 后端需要用户定义TritonPythonModel类的三个函数：

initialize()：该函数在 Triton 加载模型时运行。建议使用此函数来初始化/加载任何模型和/或数据对象。此函数是可选的。

def initialize(self, args):
    self.feature_extractor = ViTFeatureExtractor.from_pretrained('google/vit-base-patch16-224-in21k')
    self.model = ViTModel.from_pretrained("google/vit-base-patch16-224-in21k")

execute()：此函数根据每个请求执行。该函数可以容纳容纳所有需要的pipeline逻辑。

def execute(self, requests):
    responses = []
    for request in requests:
        inp = pb_utils.get_input_tensor_by_name(request, "image")
        input_image = np.squeeze(inp.as_numpy()).transpose((2,0,1))
        inputs = self.feature_extractor(images=input_image, return_tensors="pt")

        outputs = self.model(**inputs)

        # Sending results
        inference_response = pb_utils.InferenceResponse(output_tensors=[
            pb_utils.Tensor(
                "label",
                outputs.last_hidden_state.numpy()
            )
        ])
        responses.append(inference_response) 
    return responses

finialize()：该函数在Triton卸载模型时执行。用于释放任何内存、或安全卸载模型所需的任何操作。定义此函数是可选的。

启动服务

cd /triton/tutorials/HuggingFace
/opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/HuggingFace/python_model_repository/

发送请求

cd /triton/tutorials/HuggingFace
python3 client.py --model_name "python_vit"

结果如下：

root@aea5f00fde8d:/triton/tutorials/HuggingFace# python3 client.py --model_name "python_vit"
(1, 197, 768)

2.使用 Triton Ensemble 部署

第一步是下载并导出模型。建议在 NGC 上提供的 PyTorch 容器内运行以下命令。如果这是您第一次尝试在 Triton 中设置模型集成，强烈建议您在继续之前查看本指南。分解管道的主要优点是提高性能并获得多种加速选项。浏览概念指南的第 4 部分，了解有关模型加速的详细信息。

pip install transformers
pip install transformers[onnx]

python -m transformers.onnx --model=google/vit-base-patch16-224 --atol=1e-3 onnx/vit

下载模型后，按照下述结构设置模型存储库。模型存储库的基本结构以及所需的配置文件可在ensemble_model_repository获取

在这种方法中，需要考虑三点。

预处理：ViT 的特征提取步骤是在 python 后端完成的。此步骤的实现细节与上一节中遵循的过程相同。
ViT 模型：只需如上所述将模型放入存储库中即可。Triton 推理服务器将自动生成所需的配置文件。如果您希望查看生成的配置，请--log-verbose=1在启动服务器时附加。
ensemble配置：在此配置中，我们映射ensemble中两个部分的输入和输出层，preprocessing在 python 后端处理，而 ViT 模型部署在 ONNX 后端。

启动服务

cd /triton/tutorials/HuggingFace
/opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/HuggingFace/ensemble_model_repository/

发送请求

cd /triton/tutorials/HuggingFace
python3 client.py --model_name "ensemble_model"

结果为

root@aea5f00fde8d:/triton/tutorials/HuggingFace# python3 client.py --model_name "ensemble_model"
(1, 197, 768)

10.迁移到Triton推理服务器

迁移到新的推理堆栈可能看起来具有挑战性，但可以通过分解挑战并了解最佳实践来理解该任务。在本指南中，我们展示了使用 Triton 推理服务器等专用推理服务解决方案的一些好处，并介绍了最适合您采用 Triton 的路径。

1.为什么我们需要专用的推理解决方案？

构建推理所需的基础设施可能相当复杂。让我们考虑一个简单的情况，我们没有任何扩展，并且在不需要负载均衡器的单个节点上运行。我们需要什么来为模型提供服务？

如果您正在使用 Python，并且是模型推理空间的新手，或者只是想快速构建一些东西，您可能会转向Flask这样的工具：一个多功能的微框架，让您可以自由地构建生态系统需要。要在 Flask 中提供任何服务，您所需要的只是一个可以处理传入的 POST 请求的函数。

@app.route('/run_my_model',methods=['POST'])
def predict():
    data = request.get_json(force=True)

    # Pre-processing
    ...

    prediction = model()

    # Post-processing
    ...

    return output

只需几行代码，我们就可以启动并运行模型。任何人都可以发送请求并使用该模型！但是当我们收到多个请求时，我们需要一种方法来对这些任务/请求进行排队。假设我们利用Celery来解决这个排队挑战。当我们这样做时，我们还可以构建一个响应缓存来解决重复查询。

上述设置确实有效，但限制性大且资源效率低下。假设我们正在使用一个图像分类模型，其max_batch_size为64，服务器每隔100ms 接收50次请求。如果不实施任何形式的批处理策略，所有这些请求都必须按顺序处理，从而浪费 GPU 资源。考虑以下情况：

如果我们想支持多种模型怎么办？每次更新模型都需要重新启动服务器吗？
我们如何对模型进行版本控制？
我们可以在同一台服务器上提供 PyTorch 和 TensorFlow 模型吗？
如果一个模型需要在 CPU 上运行而另一个模型需要 GPU 该怎么办？我们如何优化执行？
我们如何管理同一节点上的多个 GPU？
我们的执行运行时间优化了吗？我们是否有效地处理 I/O？
我们如何与模型合奏合作？
监控服务器指标的最佳方法是什么？

这些只是我们必须考虑的一些因素，并投入工程时间进行构建。此外，必须针对软件和硬件加速器或执行上下文的每个版本定期维护和优化这些功能。随着部署规模的扩大，这些挑战只会变得更加严峻。显然，解决方案不可能是每个开发人员都从一个多功能框架开始，并花费资源来构建和维护基础设施。这就是像 Triton Inference Server 这样专门构建的推理服务器可以解决很多问题的地方。

2.如何将我的工作流程迁移到 Triton？

本指南假设您在概念层面上了解 Triton 推理服务器的基础知识。如果您是 Triton 推理服务器的新手，您可能需要先查看此入门视频和本指南。

每个现有的推理pipeline都是独一无二的，因此不存在“一刀切”的解决方案来将当前堆栈迁移到 Triton 推理服务器。也就是说，本指南将尝试简化迁移过程。从广义上讲，大多数推理堆栈分为四个一般类别。

与更大的模块紧密耦合：也许您正在迭代或微调模型，其中将模型与现有堆栈解耦将需要相当大的努力。您仍然需要更好的性能来使用尽可能少的硬件资源并与内部团队共享您的开发分支。隔离依赖项、导出模型、设置某种形式的存储等所需的工作是不可行的。您需要的是一个可以注入到现有代码库中的解决方案，该解决方案不会具有侵入性或耗时。

在这种情况下，我们建议使用PyTriton，它是一个类似 Flask/FastAPI 的接口，用户可以利用 Triton 推理服务器来处理他们的用例。

from pytriton.decorators import sample
from pytriton.model_config import ModelConfig, Tensor
from pytriton.triton import Triton

MODEL = ...

@sample
def (sequence: np.ndarray, labels: np.ndarray):
    # Decode input
    sequence = np.char.decode(sequence.astype("bytes"), "utf-8")
    labels = np.char.decode(labels.astype("bytes"), "utf-8")

    result = MODEL(...)

    return {"scores": results}

# PyTriton code
with Triton() as triton:
    triton.bind(
        model_name="",
        infer_func=,      # function you want to serve
        inputs=[
            Tensor(name="sequence", dtype=bytes, shape=(1,)),
            Tensor(name="labels", dtype=bytes, shape=(-1,)),
        ],
        outputs=[
            Tensor(name="scores", dtype=np.float32, shape=(-1,)),
        ],
        # add the features you want to enable here
        config=ModelConfig(batching=False),
    )
    triton.serve()

上面的例子是这个例子的骨架版本。需要注意的关键点是，您希望提供的任何功能，无论是模型推理组件或 Python 代码，都可以绑定到 Triton。作为用户，您不必担心启动 Triton 推理服务器或构建模型存储库，所需的所有步骤都由 PyTriton 库处理。有关该架构的更多信息可以在这里找到。

松散耦合但混乱的pipeline：假设model pipeline在内部测试中已经取得很好的效果，可以将其隔离到不同的环境中(意味着将模型集成的一部分或整个过程移到一个独立的、与其他开发环境隔离的环境中进行。这通常是为了进行更严格的测试、优化或管理，以确保模型集成在不同情况下都能正常运行)。但可能存在模型无法导出，前/后处理步骤与pipeline逻辑紧密耦合。

在这种情况下，用户仍然可以使用 pytriton，但如果某些模型是可导出的，则用户可以通过使用 Triton 的 Python 后端以及其他框架后端来获得更高的性能。概念指南的第 6 部分是这种情况的一个很好的例子。

目前，并非所有 Triton 推理服务器的功能都可以使用 PyTriton 来利用。用户还可以选择使用 Python 后端来利用 Triton 推理服务器提供的完整功能集。这个HuggingFace 示例可以引导您了解具体细节。
松散耦合的模块化管道：当深度学习管道变得越来越复杂时，通常会出现这样一种情况：多个管道共用一组通用的模型或前后处理步骤。在这种情况下，将管道的所有组件部署到 Triton 推理服务器上，并构建模型集成是非常有益的。即使在没有重叠的情况下，使用 Triton 的模型集成来管理管道也能提供扩展性和性能的好处。这种方法可以有效地管理和扩展管道中的各个组件。有关深入的解释，请参阅本指南。
部署单个模型而不进行前/后处理：在许多情况下，管道逻辑以高度优化的低级脚本的形式存在，这些脚本经过多年的开发构建而成。在这种情况下，用户可能更愿意仅部署模型并避免 HTTP/gRPC 网络调用，因为模型正在被更大的应用程序使用。对于这种情况，可以使用 Triton 的共享内存扩展和C API来访问模型，从而无需网络接口。

11.快速部署

1.ONNX

1.设置 Triton 推理服务器

要使用 Triton，我们需要构建一个模型存储库。存储库的结构如下：

model_repository
|
+-- resnet
    |
    +-- config.pbtxt
    +-- 1
        |
        +-- model.onnx

配置文件config.pbtxt是可选的。如果用户未提供配置文件，则 Triton 推理服务器会自动生成该文件。如果您是 Triton 新手，强烈建议您查看概念指南的第 1 部分。

cd /triton/tutorials/Quick_Deploy/ONNX
mkdir -p model_repository/densenet_onnx/1
wget -O model_repository/densenet_onnx/1/model.onnx \
     https://contentmamluswest001.blob.core.windows.net/content/14b2744cf8d6418c87ffddc3f3127242/9502630827244d60a1214f250e3bbca7/08aed7327d694b8dbaee2c97b8d0fcba/densenet121-1.2.onnx

/opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/Quick_Deploy/ONNX/model_repository/

2.使用 Triton 客户端查询服务器

安装依赖项并下载示例图像来测试推理。

cd /triton/tutorials/Quick_Deploy/ONNX
wget  -O img1.jpg "https://www.hakaimagazine.com/wp-content/uploads/header-gulf-birds.jpg"
python3 client.py

client.py主要分为3步。首先，与 Triton 推理服务器建立连接。

client = httpclient.InferenceServerClient(url="localhost:8000")

其次，指定模型的input和output层的名称，并描述预期输入的shape和datetype。

inputs = httpclient.InferInput("data_0", transformed_img.shape, datatype="FP32")
inputs.set_data_from_numpy(transformed_img, binary_data=True)

outputs = httpclient.InferRequestedOutput("fc6_1", binary_data=True, class_count=1000)

最后，向 Triton 推理服务器发送推理请求。

# Querying the server
results = client.infer(model_name="densenet_onnx", inputs=[inputs], outputs=[outputs])
inference_output = results.as_numpy('fc6_1').astype(str)

print(np.squeeze(inference_output)[:5])

其输出应如下所示：

['11.549026:92' '11.232335:14' '7.528014:95' '6.923391:17' '6.576575:88']

这里的输出格式是:. 要了解如何将它们映射到标签名称等，请参阅我们的文档。上面的客户端代码可在client.py.

2.PyTorch

1.导出模型

保存 PyTorch 模型。需要对该模型进行跟踪/脚本化以获得 torchscript 模型。

cd /triton/tutorials/Quick_Deploy/PyTorch
python export.py

2.Triton 推理服务器

构建一个模型存储库

mkdir -p model_repository/resnet50/1
mv model.pt model_repository/resnet50/1
mv config.pbtxt model_repository/resnet50

存储库的结构如下：

model_repository
|
+-- resnet50
    |
    +-- config.pbtxt
    +-- 1
        |
        +-- model.pt

此演示中包含模型的示例模型配置，格式为config.pbtxt。如果您是 Triton 新手，强烈建议您查看概念指南的第 1 部分。

/opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/Quick_Deploy/PyTorch/model_repository/

3.使用 Triton 客户端查询服务器

安装依赖项并下载示例图像来测试推理。

wget  -O img1.jpg "https://www.hakaimagazine.com/wp-content/uploads/header-gulf-birds.jpg"
python3 client.py

建立客户需要三个基本点。首先，我们设置与 Triton 推理服务器的连接。

client = httpclient.InferenceServerClient(url="localhost:8000")

其次，我们指定模型的输入和输出层的名称。

inputs = httpclient.InferInput("input__0", transformed_img.shape, datatype="FP32")
inputs.set_data_from_numpy(transformed_img, binary_data=True)

outputs = httpclient.InferRequestedOutput("output__0", binary_data=True, class_count=1000)

最后，我们向 Triton 推理服务器发送推理请求。

# Querying the server
results = client.infer(model_name="resnet50", inputs=[inputs], outputs=[outputs])
predictions = results.as_numpy('output__0')
print(predictions[:5])

其输出应如下所示：

[b'12.468750:90' b'11.523438:92' b'9.664062:14' b'8.429688:136'
 b'8.234375:11']

这里的输出格式是:. 要了解如何将它们映射到标签名称等，请参阅我们的文档。上面的客户端代码可在client.py.

3.TensorFlow

1.导出模型

将 TensorFlow 模型导出为已保存模型。

cd /triton/tutorials/Quick_Deploy/TensorFlow
python export.py

2.设置 Triton 推理服务器

构建一个模型存储库

mkdir -p model_repository/resnet50/1/model.savedmodel
mv config.pbtxt model_repository/resnet50/
mv resnet50_saved_model/saved_model.pb model_repository/resnet50/1/model.savedmodel/
mv resnet50_saved_model/variables/ model_repository/resnet50/1/model.savedmodel/

存储库的结构如下：

model_repository
|
+-- resnet50
    |
    +-- config.pbtxt
    +-- 1
        |
        +-- model.savedmodel
            |
            +-- saved_model.pb
            +-- variables
                |
                +-- variables.data-00000-of-00001
                +-- variables.index

此演示中包含模型的示例模型配置，格式为config.pbtxt。如果您是 Triton 新手，强烈建议您查看概念指南的第 1 部分。

 /opt/tritonserver/bin/tritonserver --model-repository=/triton/tutorials/Quick_Deploy/TensorFlow/model_repository/

3.使用 Triton 客户端查询服务器

安装依赖项并下载示例图像来测试推理。

cd /triton/tutorials/Quick_Deploy/TensorFlow
pip install --upgrade tensorflow
pip install image

wget  -O img1.jpg "https://www.hakaimagazine.com/wp-content/uploads/header-gulf-birds.jpg"
python3 client.py

client.py主要有3步。首先，与 Triton 推理服务器建立连接。

triton_client = httpclient.InferenceServerClient(url="localhost:8000")

其次,指定模型的输入和输出层的名称。

inputs = httpclient.InferInput("input_1", transformed_img.shape, datatype="FP32")
inputs.set_data_from_numpy(transformed_img, binary_data=True)

output = httpclient.InferRequestedOutput("predictions", binary_data=True, class_count=1000)

最后，向 Triton 推理服务器发送推理请求。

# Querying the server
results = triton_client.infer(model_name="resnet50", inputs=[inputs], outputs=[output])
predictions = results.as_numpy('predictions')
print(predictions)

其输出应如下所示：

[b'0.301167:90' b'0.169790:14' b'0.161309:92' b'0.093105:94'
 b'0.058743:136' b'0.050185:11' b'0.033802:91' b'0.011760:88'
 b'0.008309:989' b'0.004927:95' b'0.004905:13' b'0.004095:317'
 b'0.004006:96' b'0.003694:12' b'0.003526:42' b'0.003390:313'
 ...
 b'0.000001:751' b'0.000001:685' b'0.000001:408' b'0.000001:116'
 b'0.000001:627' b'0.000001:933' b'0.000000:661' b'0.000000:148']

这里的输出格式是:. 要了解如何将它们映射到标签名称等，请参阅我们的文档。上面的客户端代码可在client.py.

你可能感兴趣的:(triton,开发语言)

计算机毕业设计JAVA房屋租赁系统mybatis 煦洋cxsj985 mybatis java 开发语言
计算机毕业设计JAVA房屋租赁系统mybatis计算机毕业设计JAVA房屋租赁系统mybatis+源码+调试部署+系统+数据库+lw本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https://pan
【课程设计推荐】基于JSP的论文格式化系统后台模块的设计与实现想念@思恋课程设计 jsp java 课程设计 java jsp
关注【墨岚创客】，回复【毕设】，赠送免费毕设资源，具体联系方式见文末摘要论文的格式修改是一件很麻烦的事情，一篇论文在定稿以前为了让格式达到标准，需要修改很多次，浪费了大量时间。本系统的设计初衷就是为了解决论文书写格式的规范化，方便学者论文格式的自动生成。本系统是基于Java平台的Web应用程序。采用JSP作为后台开发语言，HTML和JavaScript作为前台开发语言，MYSQL5.0作为后台数据
TorchServe环境构建+模型更新+新模型注册有来有去9527 torch 深度学习人工智能
目录1.背景2.torchserve环境搭建2.1jdk环境搭建2.2python环境搭建2.3启动服务2.3.1注册模型2.3.2模型查看2.3.3接口调用3进阶功能3.1模型多版本管理3.2新模型注册1.背景由于技术路线调整，需求调整原本的模型推理服务——tensorflow-serving，经过初步调研，可替换的服务框架有：torchserve和triton。本文只设计torchserve的
基于JavaWeb的原色蛋糕商城的设计与实现 yh1340327157 计算机毕业设计实战案例 java-ee struts kafka tomcat hibernate intellij-idea spring
开发环境开发语言：Java框架：springbootJDK版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包：Maven3.3.9浏览器：谷歌浏览器后台路径地址：localhost:8080/项目名称/admin/dist/index.html前台路径地址：localh
JAVA毕业设计高校学生智慧党建系统设计与开发计算机源码+lw文档+系统+调试部署+数据库瑞致网络 java 开发语言
JAVA毕业设计高校学生智慧党建系统设计与开发计算机源码+lw文档+系统+调试部署+数据库JAVA毕业设计高校学生智慧党建系统设计与开发计算机源码+lw文档+系统+调试部署+数据库本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQ
JAVA儿童教育系统计算机毕业设计Mybatis+系统+数据库+调试部署七七科技数据库 java mybatis
JAVA儿童教育系统计算机毕业设计Mybatis+系统+数据库+调试部署JAVA儿童教育系统计算机毕业设计Mybatis+系统+数据库+调试部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https
java毕业设计校园共享单车管理系统源码+lw文档+mybatis+系统+mysql数据库+调试好好吃肉 mybatis mysql 数据库
java毕业设计校园共享单车管理系统源码+lw文档+mybatis+系统+mysql数据库+调试java毕业设计校园共享单车管理系统源码+lw文档+mybatis+系统+mysql数据库+调试本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据
AI软件外包需要注意什么外包开发AI软件的关键因素是什么如何选择AI外包开发语言北京动点飞扬软件 AI外包
1.定义目标与需求首先，要明确你希望AI智能体做什么。是自动化任务、数据分析、自然语言处理，还是其他功能？明确目标可以帮助你选择合适的技术和方法。2.选择开发平台与工具开发AI智能体的软件时，你需要选择适合的编程语言、框架和工具。例如：编程语言：Python是最常用的语言，因为它有强大的AI/ML库，如TensorFlow、PyTorch、scikit-learn等。开发平台：你可以使用本地环境、
C#常用257单词 Lu01 c#
1、VisualStudio直译：可视化开发环境说明：简称VS，我们编写程序的集成开发环境，可以写代码、编译代码、调试代码、发布程序。2、.Net直译：dotNet说明：我们常说的.net读作dotnet，表示网络开发平台3、Sharp直译：锋利的说明：C#就读作“CSharp”，表示这是开发语言中的一个“利器”4、Framework直译：框架，骨架说明：.NETFramework为我们开发各种程
《CPython Internals》读后感 python
一、为什么选择这本书？Python是本人工作中最常用的开发语言，为了加深对Python的理解，更好的掌握Python这门语言，所以想对Python解释器有所了解，看看是怎么使用C语言来实现Python的，以期达到对Python语言的掌握达到精通的程度，。关于Python解释器的书不多——AnthonyShaw写的《CPythonInternals》，陈儒写的《Python源码剖析》。因为《CPyt
Github 2024-05-28 Python开源项目日报 Top10 老孙正经胡说 github python 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-05-28统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目10TypeScript项目2HTML项目1稳定扩散WebUI创建周期：512天开发语言：Python协议类型：GNUAfferoGeneralPublicLicensev3.0Star数量：117672个Fork数量：23480次关
nvdia triton server运行pt文件滑稽的柴犬神经网络机器学习 python
tritonserver默认都是tensorrt推理。但也会出现有操作不支持，导致无法转模型为engine的情况。可以选择直接运行pytorch的pt文件，以下为操作步骤。1.pytorch后端环境编译步骤原理是使用pytorchC++API运行pt文件模型。安装依赖项apt-getinstallpatchelfrapidjson-devpython3-dev构建NGC的PyTorch容器。例如，
【鸿蒙生态学堂 02】ArkTS语法介绍 harmonyos
课程简介本课程是【HarmonyOS生态学堂】的第2课。本课程将深入介绍HarmonyOS的应用开发语言——ArkTS。您将学习到ArkTS的基本语法，包括变量声明、类型系统、运算符等，以及如何使用ArkTS进行声明式UI开发。课程还将展示如何利用DevEcoStudio这一强大的集成开发环境，进行代码编写、调试和应用构建，帮助您快速上手HarmonyOS应用开发。标签ArkTS基础语法声明式UI
Windows 下安装 triton 教程 yyywxk #Python模块有关问题 windows triton
目录背景解决方法方法一：（治标不治本）方法二：（triton-windows）-安装MSVC和WindowsSDK-vcredist安装-whl安装-验证背景triton目前官方只有Linux版本，若未安装，则会出现报错：ModuleNotFoundError:Nomodulenamed'triton'在Windows系统中，如果直接用pipinstalltriton来安装，则会报错：ERROR:
MySQL与Oracle对比及区别 m0_74823434 面试学习路线阿里巴巴 java
一、比较1、MySQL的特点性能卓越，服务稳定，很少出现异常宕机；开放源代码无版本制约，自主性及使用成本低；历史悠久，社区和用户非常活跃，遇到问题及时寻求帮助；软件体积小，安装使用简单且易于维护，维护成本低；品牌口碑效应；支持多种OS，提供多种API接口，支持多种开发语言，对流行的PHP，Java很好的支持2、Oracle的特点兼容性：Oracle产品采用标准SQL，并经过美国u构架标准技术所（N
【自动化】使用PlayWright+代理IP实现多环境隔离青塬科技 Python
Playwright是由微软公司2020年初发布的新一代自动化测试工具，相较于目前最常用的Selenium，它仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作。对各种开发语言也有非常好的支持。常用的NodeJs、Java、python都有支持，且有丰富的文档参考。Python环境下的安装使用1、安装依赖库pipinstallplaywright2、安装
基于JAVA软件技术课程学习系统设计与实现计算机毕业设计源码+数据库+lw文档+系统+部署小朱科技学习
基于JAVA软件技术课程学习系统设计与实现计算机毕业设计源码+数据库+lw文档+系统+部署基于JAVA软件技术课程学习系统设计与实现计算机毕业设计源码+数据库+lw文档+系统+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQ
java计算机毕业设计-学生宿舍故障报修管理信息系统-源码+数据库+系统+lw文档+mybatis+运行部署雪夜科技 mybatis java 数据库
java计算机毕业设计-学生宿舍故障报修管理信息系统-源码+数据库+系统+lw文档+mybatis+运行部署java计算机毕业设计-学生宿舍故障报修管理信息系统-源码+数据库+系统+lw文档+mybatis+运行部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Wi
Kotlin语言之let、with、run、apply、also内联函数 mysimplelove 学无止境 Android kotlin 内联函数 let with run apply also lambda
前言：随着公司项目对主开发语言切换的需要，本人也是在持续的对Kotlin语言进行深入全面的学习和使用。相比Java,Kotlin提供了不少高级语法特性，在Kotlin中的源码标准库(Standard.kt)中提供了一些Kotlin扩展的内置函数可以优化kotlin的编码。Standard.kt是Kotlin库的一部分，它定义了一些基本函数。这个源代码文件虽然一共不到50行代码，但是这些函数功能都非
基于springbootBBS论坛系统的设计与实现四金学长计算机毕业设计参考案例 spring boot maven java BBS论坛系统
1.引言在当今的软件开发领域，企业级应用的开发和部署速度直接影响着业务的竞争力。SpringBoot以其轻量级、快速启动和强大的集成能力，成为构建现代企业级应用的首选框架。本文将带您深入了解SpringBoot框架的核心特性，并展示如何利用它构建一个高效、可扩展的系统。2.开发环境开发语言：Java框架：springbootJD版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定
selenium框架你们的好朋友大强测试开发 python 功能测试 selenium
selenium（仅作为个人笔记，如有雷同，请联系删除。。）1、Selenium的特点：开源、免费，多浏览器支持，多平台支持，多语言支持，对Web页面有良好的支持，API简单，灵活(用开发语言驱动)，支持分布式测试用例执行。2、Windows下的测试环境搭建：安装Python；安装setuptools与pip（注：Python3不支持setuptools，但已经集成了pip）安装Selenium：
Python语法总结彧侠脚本处理 Python
Python作为一种解释型的脚本语言，无论从自动化运维、大数据处理还是人工智能都得到了广泛的应用，而且它好理解、易学习、上手快的特点也使它成为了当下最火热的开发语言之一。下面就对Python语言中的各种语法做一个总结，以备后用数据类型一、整数二、浮点数三、字符串四、布尔值五、空值print语句注释什么是变量比如：定义字符串raw字符串与多行字符串Unicode字符串字符串还有一个编码问题。整数和浮
ArkTS（Ark TypeScript）荔枝寄 typescript javascript 前端
在现代编程语言的丰富生态系统中，循环结构是构建复杂逻辑和处理重复任务不可或缺的一部分。鸿蒙操作系统（HarmonyOS），作为一款面向未来的分布式操作系统，引入了ArkTS（ArkTypeScript）作为其主要的开发语言之一。ArkTS是一种基于TypeScript的静态类型语言，它不仅继承了TypeScript的所有特性，还特别针对HarmonyOS进行了优化，以满足高性能和跨设备开发的需求。
鸿蒙系统用什么开发应用？ 109702008 编程 harmonyos 华为人工智能
鸿蒙系统（HarmonyOS）是华为技术有限公司开发的一款分布式操作系统，旨在实现跨设备的无缝协同和高效运行。在应用开发方面，鸿蒙系统提供了多种编程语言的支持，以满足不同开发者的需求。以下是一些常用的鸿蒙系统应用开发语言：Java：Java是一种广泛使用的编程语言，特别在移动应用开发领域。鸿蒙系统支持Java开发，这使得安卓开发者可以快速上手。Java拥有优秀的跨平台能力和丰富的API库，涵盖了网
[读书日志]从零开始学习Chisel 第一篇：书籍介绍，Scala与Chisel概述，Scala安装运行（敏捷硬件开发语言Chisel与数字系统设计） JoneMaster 从零开始学Chisel JM读书日志系列开发语言 scala 后端 fpga开发架构嵌入式硬件
简介：从20世纪90年代开始，利用硬件描述语言和综合技术设计实现复杂数字系统的方法已经在集成电路设计领域得到普及。随着集成电路集成度的不断提高，传统硬件描述语言和设计方法的开发效率低下的问题越来越明显。近年来逐渐崭露头角的敏捷化设计方法将把集成电路设计带入一个新的阶段。与此同时，集成电路设计也需要一种适应敏捷化设计方法的新型硬件开发语言。本书从实用性和先进性出发，较全面地介绍新型硬件开发语言Chi
每个程序员都该学习的5种开发语言阿玥的小东东学习开发语言
我曾在某处读到过（可能在《代码大全》，但我不敢确定），程序员应该每年学习一门新的编程语言。但如果做不到，我建议，你至少学习以下5种开发语言，以便你在职业生涯有很好的表现。每个公司都喜爱精通多种编程语言并且多才多艺的程序员。一个既能很麻利地写脚本，也能编写复杂的Java程序的程序员，确实相当有价值。所以实际上，对于高级开发者来说，学习不止一种编程语言，几乎就是必然的要求。目前而言，面试官越来越看重那
MDX语言的移动应用开发沈霁晨包罗万象 golang 开发语言后端
以MDX语言的移动应用开发在当今快速发展的技术时代，移动应用程序的普及已经不可逆转。无论是社交媒体、在线购物还是游戏娱乐，移动应用在我们生活中的每一个角落都发挥着重要作用。随着需求的不断变化和技术的持续进步，开发者们也在不断寻找新的解决方案，以提高开发效率、降低成本并满足用户日益增长的期望。MDX（MarkDownExtended）作为一种新兴的移动应用开发语言，凭借其简洁的语法、灵活的结构和强大
【过程记录】windows安装triton 靠才华吃土过程记录 pip
windows安装triton记录问题原因解决办法问题在执行pipinstalltriton=2.0.0的时候遇到报错：没有对应的版本原因triton只适用于Linux操作系统，对于Windows不适用，需要做相应的转换解决办法下载对应的.whl文件triton-2.0.0-cp310-cp310-win_amd64.whl地址：https://github.com/PrashantSaikia/
Android开发网络编程，使用API获取网络数据浩宇软件开发 android okhttp java Android开发网络编程 AndroidStudio
文章目录1.实现步骤2.开发环境3.运行效果图4.视频教程1.实现步骤阅读API接口使用文档使用okhttp获取网络数据使用gson将json数据转为数据实体类安装GsonFormatPlus插件使用glide加载网络图片2.开发环境开发工具：Androidstudio开发语言：Javabuild.gradle下导入相关依赖//数据解析implementation'com.google.code.
前端校园圈子交友源码打造跑腿为一体的平台前端后端app
搭建一个功能完善、运营顺畅的校园圈子跑腿和外卖一体化的平台。同时，平台还需要不断优化和改进，以满足用户不断变化的需求和期望。市场调研：了解校园内学生和教职工对跑腿和外卖服务的需求。分析竞争对手的服务内容、价格策略和用户反馈。确定平台的目标用户群体和服务范围。制定商业计划：明确平台的商业模式和盈利点。设定服务项目和收费标准。规划市场推广策略和合作伙伴关系。技术开发：选择适合的开发语言和框架，如微信小
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi