zxros10

【TVM帮助文档学习】使用Python接口编译和优化模型(AutoTVM)

本文翻译自：Compiling and Optimizing a Model with the Python Interface (AutoTVM) — tvm 0.9.dev0 documentation

在Compiling and Optimizing a Model with TVMC — tvm 0.9.dev0 documentation中，我们介绍了如何使用TVM的命令行界面来编译、运行和调优预训练的视觉模型ResNet-50 v2。TVM不仅仅是一个命令行工具，它还是一个优化框架，带有许多不同语言的api，在使用机器学习模型时为您提供了极大的灵活性。

在本教程中，我们将讨论与TVMC相同的内容，但将展示如何使用Python API完成。本节完成后，我们将使用TVM的Python API完成以下任务:

为TVM运行时编译一个预训练的ResNet-50 v2模型。
使用编译后的模型中运行一张真实的图片，并解释输出和模型性能。
使用TVM调优CPU上的模型。
使用TVM收集的调优数据重新编译优化模型。
使用优化后的模型推理图片，并比较输出和模型性能。

本节的目标是向您概述TVM的功能，以及如何通过Python API使用它们。

TVM是一个深度学习编译器框架，具有许多不同的模块，可用于处理深度学习模型和算子。在本教程中，我们将学习如何使用Python API加载、编译和优化模型。

我们先导入依赖包,包括onnx加载和转换模型,下载测试数据的辅助工具,处理图像数据的Python Image Library,图像数据的预处理和后处理的numpy,TVM Relay框架, TVM图执行器等。

import onnx
from tvm.contrib.download import download_testdata
from PIL import Image
import numpy as np
import tvm.relay as relay
import tvm
from tvm.contrib import graph_executor

下载和加载ONNX模型

在本教程中，我们将使用ResNet-50 v2。ResNet-50是一个深度为50层的卷积神经网络，旨在对图像进行分类。我们将使用的模型已经在1000种不同分类的100多万张图像上进行了预先训练。该网络的输入图像尺寸为224x224。如果您对ResNet-50模型的结构感兴趣，我们建议下载Netron，这是一个免费的ML模型查看器。

TVM提供了一个辅助库来下载预先训练的模型。通过模块提供模型URL、文件名和模型类型，TVM将下载模型并保存到磁盘。对于某个ONNX模型的实例，你可以使用ONNX运行时将其加载到内存中。

model_url = (
    "https://github.com/onnx/models/raw/main/"
    "vision/classification/resnet/model/"
    "resnet50-v2-7.onnx"
)

model_path = download_testdata(model_url, "resnet50-v2-7.onnx", module="onnx")
onnx_model = onnx.load(model_path)

TVM支持许多流行的模型格式。可以在TVM文档的编译深度学习模型（Compile Deep Learning Models — tvm 0.9.dev0 documentation）部分找到一个列表。

下载、预处理和加载测试图片

每个模型都有特定的张量形状、格式和数据类型。所以大多数模型需要一些预处理和后处理，以确保输入正确，并解释输出。TVMC的输入和输出数据都采用了NumPy的.npz格式。这是一种支持良好的NumPy格式，可以将多个数组序列化存入到一个文件中。

作为本教程的输入，我们将使用一只猫的图像，您也可以替换为其他任何图像。

下载图片，并将它转换为numpy数组作为模型的输入：

img_url = "https://s3.amazonaws.com/model-server/inputs/kitten.jpg"
img_path = download_testdata(img_url, "imagenet_cat.png", module="data")

# Resize it to 224x224
resized_image = Image.open(img_path).resize((224, 224))
img_data = np.asarray(resized_image).astype("float32")

# Our input image is in HWC layout while ONNX expects CHW input, so convert the array
img_data = np.transpose(img_data, (2, 0, 1))

# Normalize according to the ImageNet input specification
imagenet_mean = np.array([0.485, 0.456, 0.406]).reshape((3, 1, 1))
imagenet_stddev = np.array([0.229, 0.224, 0.225]).reshape((3, 1, 1))
norm_img_data = (img_data / 255 - imagenet_mean) / imagenet_stddev

# Add the batch dimension, as we are expecting 4-dimensional input: NCHW.
img_data = np.expand_dims(norm_img_data, axis=0)

使用Relay编译模型

接下来是编译ResNet模型。我们首先使用from_onnx接口将模型导入到Relay。然后我们使用标准优化将模型构建为一个TVM库。最后，我们使用库创建一个TVM图形运行时模块。

target = "llvm"

正确定义target：指定正确的目标可能会对编译模块的性能产生巨大影响，因为它可以利用目标上可用的硬件特性。有关更多信息，请参阅x86 CPU的卷积网络自动调优（Auto-tuning a Convolutional Network for x86 CPU — tvm 0.9.dev0 documentation）。我们建议确定您运行的是哪个CPU，以及可选的特性，并适当地设置目标。例如，对于某些具有AVX-512向量指令集的处理器，target = "llvm -mcpu=skylake"，或者target = "llvm -mcpu=skylake-avx512"。

# The input name may vary across model types. You can use a tool
# like Netron to check input names
input_name = "data"
shape_dict = {input_name: img_data.shape}

mod, params = relay.frontend.from_onnx(onnx_model, shape_dict)

with tvm.transform.PassContext(opt_level=3):
    lib = relay.build(mod, target=target, params=params)

dev = tvm.device(str(target), 0)
module = graph_executor.GraphModule(lib["default"](dev))

在TVM运行时上执行

现在我们已经编译好了模型，我们可以使用TVM运行时对其进行预测。为了使用TVM运行模型并进行预测，我们需要两个条件:

我们刚才编译好的模型。
对模型进行预测的有效输入。

dtype = "float32"
module.set_input(input_name, img_data)
module.run()
output_shape = (1, 1000)
tvm_output = module.get_output(0, tvm.nd.empty(output_shape)).numpy()

收集基本性能数据

我们在这里收集一些基本的性能数据，用来与稍后调优后的模型进行比较。为了帮助解释CPU噪声，我们以多batch、多次重复运行计算，然后收集关于平均值、中值和标准偏差的一些基本统计信息。

import timeit

timing_number = 10
timing_repeat = 10
unoptimized = (
    np.array(timeit.Timer(lambda: module.run()).repeat(repeat=timing_repeat, number=timing_number))
    * 1000
    / timing_number
)
unoptimized = {
    "mean": np.mean(unoptimized),
    "median": np.median(unoptimized),
    "std": np.std(unoptimized),
}

print(unoptimized)

输出：

{'mean': 496.2511969099978, 'median': 495.80396929999324, 'std': 0.7997811122746795}

输出后处理

正如前面提到的，每个模型都有自己特定的输出张量

在我们的示例中，我们需要对esNet-50 v2的输出做一些后处理，使用为模型提供的查找表，使其呈现为更便于人类阅读的形式。

from scipy.special import softmax

# Download a list of labels
labels_url = "https://s3.amazonaws.com/onnx-model-zoo/synset.txt"
labels_path = download_testdata(labels_url, "synset.txt", module="data")

with open(labels_path, "r") as f:
    labels = [l.rstrip() for l in f]

# Open the output and read the output tensor
scores = softmax(tvm_output)
scores = np.squeeze(scores)
ranks = np.argsort(scores)[::-1]
for rank in ranks[0:5]:
    print("class='%s' with probability=%f" % (labels[rank], scores[rank]))

输出：

class='n02123045 tabby, tabby cat' with probability=0.621103
class='n02123159 tiger cat' with probability=0.356379
class='n02124075 Egyptian cat' with probability=0.019712
class='n02129604 tiger, Panthera tigris' with probability=0.001215
class='n04040759 radiator' with probability=0.000262

调优

前吻是将模型编译为在TVM运行时上运行，但是不包括任何平台相关的优化。在本节中，我们将向您展示如何使用TVM构建一个针对您的工作平台的优化模型。

在某些情况下，当使用编译后的模块运行推断时，可能无法获得预期的性能。在这种情况下，我们可以使用自动调优器，为我们的模型找到更好的配置，从而提高性能。TVM中的调优是指对模型进行优化，使其在给定目标上运行得更快的过程。这与训练或微调不同，因为它不会影响模型的准确性，而只会影响运行时性能。作为调优过程的一部分，TVM将尝试运行算子的许多不同的实现变体，以查看哪一种性能最好。这些运行的结果存储在一个调优记录文件中。

以最简单的形式来说，调优需要提供以下三件事:

您打算在其上运行此模型的设备的目标规格
输出文件的路径，调优记录将存储在该文件中
要调优的模型的路径。

import tvm.auto_scheduler as auto_scheduler
from tvm.autotvm.tuner import XGBTuner
from tvm import autotvm

为运行器设置一些基本参数。运行器执行由一组特定参数编译生成的代码，并测量它的性能。number指定我们将测试的不同配置的数量，而repeat指定我们将对每个配置进行多少次测量。min_repeat_ms是一个值，用于指定运行配置测试所需的时间。如果重复次数低于这个时间，则会增加。这个选项对于精确的gpu调优是必需的，而对于CPU调优则不是必需的。将该值设置为0将禁用它。超时设置了每个测试配置运行训练代码的时间上限。

number = 10
repeat = 1
min_repeat_ms = 0  # since we're tuning on a CPU, can be set to 0
timeout = 10  # in seconds

# create a TVM runner
runner = autotvm.LocalRunner(
    number=number,
    repeat=repeat,
    timeout=timeout,
    min_repeat_ms=min_repeat_ms,
    enable_cpu_cache_flush=True,
)

创建一个简单的结构来保存调优选项。我们使用XGBoost算法来指导搜索。对于生产作业，您需要将试验次数设置为大于此处使用的值10。对于CPU我们推荐1500，对于GPU我们推荐3000-4000。所需的试验次数可能取决于特定的模型和处理器，因此值得花一些时间综合一系列值评估性能，以找到调优时间和模型优化之间的最佳平衡。因为运行调优是时间密集型的，所以我们将试验次数设置为10次，但不建议设置这么小的值。early_stopping参数是在应用满足提前停止搜索的条件之前，要运行的最小实验次数。measure_option选项指示将在哪里构建实验代码，以及在哪里运行它。在本例中，我们使用刚刚创建的LocalRunner和一个LocalBuilder。tuning_records选项指定要将调优数据写入的文件。

tuning_option = {
    "tuner": "xgb",
    "trials": 10,
    "early_stopping": 100,
    "measure_option": autotvm.measure_option(
        builder=autotvm.LocalBuilder(build_func="default"), runner=runner
    ),
    "tuning_records": "resnet-50-v2-autotuning.json",
}

定义调优搜索算法：默认情况下，使用XGBoost Grid算法引导搜索。根据模型的复杂性和可用时间，您可能想要选择不同的算法。

设置调优参数：在本例中，出于时间考虑，我们将试验次数(trails)和提前停止（early_stopping）的数量设置为10。如果将这些值设置得更大，您可能会看到更多的性能改进，但这是以调优时间为代价的。得到一个兼顾各种条件的结果所需的试验次数，将取决于模型和目标平台的具体情况。

# begin by extracting the tasks from the onnx model
tasks = autotvm.task.extract_from_program(mod["main"], target=target, params=params)

# Tune the extracted tasks sequentially.
for i, task in enumerate(tasks):
    prefix = "[Task %2d/%2d] " % (i + 1, len(tasks))
    tuner_obj = XGBTuner(task, loss_type="rank")
    tuner_obj.tune(
        n_trial=min(tuning_option["trials"], len(task.config_space)),
        early_stopping=tuning_option["early_stopping"],
        measure_option=tuning_option["measure_option"],
        callbacks=[
            autotvm.callback.progress_bar(tuning_option["trials"], prefix=prefix),
            autotvm.callback.log_to_file(tuning_option["tuning_records"]),
        ],
    )

输出：

[Task  1/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  1/25]  Current/Best:   15.08/  19.42 GFLOPS | Progress: (4/10) | 7.45 s
[Task  1/25]  Current/Best:   16.95/  19.42 GFLOPS | Progress: (8/10) | 11.76 s
[Task  1/25]  Current/Best:   17.05/  19.42 GFLOPS | Progress: (10/10) | 12.64 s Done.

[Task  2/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  2/25]  Current/Best:   12.61/  20.46 GFLOPS | Progress: (4/10) | 2.48 s
[Task  2/25]  Current/Best:   13.28/  20.46 GFLOPS | Progress: (8/10) | 3.59 s
[Task  2/25]  Current/Best:   13.12/  20.46 GFLOPS | Progress: (10/10) | 4.42 s Done.

[Task  3/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  3/25]  Current/Best:   17.04/  17.04 GFLOPS | Progress: (4/10) | 2.95 s
[Task  3/25]  Current/Best:   23.87/  23.87 GFLOPS | Progress: (8/10) | 6.39 s
[Task  3/25]  Current/Best:   17.69/  23.87 GFLOPS | Progress: (10/10) | 7.17 s Done.

[Task  4/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  4/25]  Current/Best:   17.23/  18.64 GFLOPS | Progress: (4/10) | 2.52 s
[Task  4/25]  Current/Best:   13.85/  22.40 GFLOPS | Progress: (8/10) | 4.04 s
[Task  4/25]  Current/Best:   10.79/  22.40 GFLOPS | Progress: (10/10) | 9.28 s Done.

[Task  5/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  5/25]  Current/Best:   12.48/  21.12 GFLOPS | Progress: (4/10) | 2.49 s
[Task  5/25]  Current/Best:   14.24/  21.12 GFLOPS | Progress: (8/10) | 4.88 s
[Task  5/25]  Current/Best:   17.85/  21.12 GFLOPS | Progress: (10/10) | 5.63 s Done.

[Task  6/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  6/25]  Current/Best:   11.62/  11.62 GFLOPS | Progress: (4/10) | 3.61 s
[Task  6/25]  Current/Best:   14.97/  19.32 GFLOPS | Progress: (8/10) | 5.40 s
[Task  6/25]  Current/Best:    4.89/  19.32 GFLOPS | Progress: (10/10) | 6.80 s Done.

[Task  7/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  7/25]  Current/Best:   15.88/  15.88 GFLOPS | Progress: (4/10) | 3.25 s
[Task  7/25]  Current/Best:   13.90/  15.88 GFLOPS | Progress: (8/10) | 5.41 s
[Task  7/25]  Current/Best:   16.98/  20.14 GFLOPS | Progress: (10/10) | 6.19 s Done.

[Task  8/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  8/25]  Current/Best:   15.27/  15.27 GFLOPS | Progress: (4/10) | 9.10 s
[Task  8/25]  Current/Best:    9.71/  15.27 GFLOPS | Progress: (8/10) | 12.85 s
[Task  8/25]  Current/Best:    5.26/  19.76 GFLOPS | Progress: (10/10) | 13.95 s Done.

[Task  9/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  9/25]  Current/Best:   21.00/  23.28 GFLOPS | Progress: (4/10) | 2.26 s
[Task  9/25]  Current/Best:    6.83/  23.28 GFLOPS | Progress: (8/10) | 4.53 s
[Task  9/25]  Current/Best:    8.35/  23.28 GFLOPS | Progress: (10/10) | 5.16 s Done.

[Task 10/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 10/25]  Current/Best:    4.24/  13.50 GFLOPS | Progress: (4/10) | 2.65 s
[Task 10/25]  Current/Best:   18.35/  18.35 GFLOPS | Progress: (8/10) | 4.04 s
[Task 10/25]  Current/Best:    7.82/  18.35 GFLOPS | Progress: (10/10) | 4.73 s Done.

[Task 11/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 11/25]  Current/Best:   12.36/  15.69 GFLOPS | Progress: (4/10) | 3.37 s
[Task 11/25]  Current/Best:   15.19/  23.20 GFLOPS | Progress: (8/10) | 4.97 s
[Task 11/25]  Current/Best:   14.85/  23.33 GFLOPS | Progress: (10/10) | 5.73 s Done.

[Task 12/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 12/25]  Current/Best:   15.70/  20.95 GFLOPS | Progress: (4/10) | 3.11 s
[Task 12/25]  Current/Best:   13.96/  20.95 GFLOPS | Progress: (8/10) | 6.27 s
[Task 12/25]  Current/Best:    6.09/  20.95 GFLOPS | Progress: (10/10) | 7.64 s Done.

[Task 13/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 13/25]  Current/Best:   11.49/  19.01 GFLOPS | Progress: (4/10) | 3.13 s
[Task 13/25]  Current/Best:    9.63/  19.01 GFLOPS | Progress: (8/10) | 6.25 s
[Task 13/25]  Current/Best:   10.28/  19.01 GFLOPS | Progress: (10/10) | 7.64 s Done.

[Task 14/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 14/25]  Current/Best:   15.85/  15.85 GFLOPS | Progress: (4/10) | 3.17 s
[Task 14/25]  Current/Best:    5.76/  18.55 GFLOPS | Progress: (8/10) | 6.54 s
[Task 14/25]  Current/Best:   13.77/  18.55 GFLOPS | Progress: (10/10) | 7.30 s
[Task 15/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 15/25]  Current/Best:   18.00/  19.72 GFLOPS | Progress: (4/10) | 2.77 s
[Task 15/25]  Current/Best:    1.72/  23.47 GFLOPS | Progress: (8/10) | 4.84 s
[Task 15/25]  Current/Best:    7.08/  23.47 GFLOPS | Progress: (10/10) | 5.56 s
[Task 16/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 16/25]  Current/Best:    7.06/  11.45 GFLOPS | Progress: (4/10) | 4.34 s
[Task 16/25]  Current/Best:   17.36/  20.81 GFLOPS | Progress: (8/10) | 5.45 s
[Task 16/25]  Current/Best:   11.77/  20.81 GFLOPS | Progress: (10/10) | 7.54 s Done.

[Task 17/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 17/25]  Current/Best:   17.96/  21.18 GFLOPS | Progress: (4/10) | 3.15 s Done.
 Done.

[Task 17/25]  Current/Best:   16.94/  21.18 GFLOPS | Progress: (8/10) | 6.81 s
[Task 17/25]  Current/Best:   18.82/  21.18 GFLOPS | Progress: (10/10) | 7.71 s Done.

[Task 18/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 18/25]  Current/Best:    7.06/  21.85 GFLOPS | Progress: (4/10) | 6.66 s
[Task 18/25]  Current/Best:   13.46/  21.85 GFLOPS | Progress: (8/10) | 8.50 s
[Task 18/25]  Current/Best:    4.30/  21.85 GFLOPS | Progress: (10/10) | 10.63 s Done.

[Task 19/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 19/25]  Current/Best:   19.72/  19.72 GFLOPS | Progress: (4/10) | 3.58 s
[Task 19/25]  Current/Best:   11.06/  19.72 GFLOPS | Progress: (8/10) | 8.72 s
[Task 19/25]  Current/Best:   20.04/  20.04 GFLOPS | Progress: (10/10) | 10.02 s Done.

[Task 20/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 20/25]  Current/Best:   13.85/  17.00 GFLOPS | Progress: (4/10) | 2.22 s
[Task 20/25]  Current/Best:    6.31/  20.17 GFLOPS | Progress: (8/10) | 7.44 s
[Task 20/25]  Current/Best:   15.74/  20.17 GFLOPS | Progress: (10/10) | 8.15 s
[Task 21/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 21/25]  Current/Best:   14.35/  19.50 GFLOPS | Progress: (4/10) | 2.63 s
[Task 21/25]  Current/Best:   16.28/  19.50 GFLOPS | Progress: (8/10) | 5.50 s
[Task 21/25]  Current/Best:   10.70/  19.50 GFLOPS | Progress: (10/10) | 6.82 s
[Task 22/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 22/25]  Current/Best:   10.63/  19.50 GFLOPS | Progress: (4/10) | 3.26 s
[Task 22/25]  Current/Best:    2.71/  19.50 GFLOPS | Progress: (8/10) | 5.71 s
[Task 22/25]  Current/Best:   17.89/  19.50 GFLOPS | Progress: (10/10) | 6.49 s Done.

[Task 23/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 23/25]  Current/Best:   20.28/  20.28 GFLOPS | Progress: (4/10) | 4.05 s
[Task 23/25]  Current/Best:   22.31/  22.31 GFLOPS | Progress: (8/10) | 6.62 s
[Task 23/25]  Current/Best:   12.03/  22.31 GFLOPS | Progress: (10/10) | 7.65 s Done.

[Task 24/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s Done.
 Done.

[Task 24/25]  Current/Best:    3.68/   3.68 GFLOPS | Progress: (4/10) | 50.27 s
[Task 24/25]  Current/Best:    2.41/   9.14 GFLOPS | Progress: (8/10) | 73.54 s
[Task 24/25]  Current/Best:    5.75/   9.14 GFLOPS | Progress: (10/10) | 75.42 s
[Task 25/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 25/25]  Current/Best:    5.65/   5.65 GFLOPS | Progress: (4/10) | 23.04 s
[Task 25/25]  Current/Best:    3.50/   8.90 GFLOPS | Progress: (8/10) | 25.65 s
[Task 25/25]  Current/Best:    2.99/   8.90 GFLOPS | Progress: (10/10) | 26.52 s
T

这个调优过程的输出如下所示:

# [Task  1/24]  Current/Best:   10.71/  21.08 GFLOPS | Progress: (60/1000) | 111.77 s Done.
# [Task  1/24]  Current/Best:    9.32/  24.18 GFLOPS | Progress: (192/1000) | 365.02 s Done.
# [Task  2/24]  Current/Best:   22.39/ 177.59 GFLOPS | Progress: (960/1000) | 976.17 s Done.
# [Task  3/24]  Current/Best:   32.03/ 153.34 GFLOPS | Progress: (800/1000) | 776.84 s Done.
# [Task  4/24]  Current/Best:   11.96/ 156.49 GFLOPS | Progress: (960/1000) | 632.26 s Done.
# [Task  5/24]  Current/Best:   23.75/ 130.78 GFLOPS | Progress: (800/1000) | 739.29 s Done.
# [Task  6/24]  Current/Best:   38.29/ 198.31 GFLOPS | Progress: (1000/1000) | 624.51 s Done.
# [Task  7/24]  Current/Best:    4.31/ 210.78 GFLOPS | Progress: (1000/1000) | 701.03 s Done.
# [Task  8/24]  Current/Best:   50.25/ 185.35 GFLOPS | Progress: (972/1000) | 538.55 s Done.
# [Task  9/24]  Current/Best:   50.19/ 194.42 GFLOPS | Progress: (1000/1000) | 487.30 s Done.
# [Task 10/24]  Current/Best:   12.90/ 172.60 GFLOPS | Progress: (972/1000) | 607.32 s Done.
# [Task 11/24]  Current/Best:   62.71/ 203.46 GFLOPS | Progress: (1000/1000) | 581.92 s Done.
# [Task 12/24]  Current/Best:   36.79/ 224.71 GFLOPS | Progress: (1000/1000) | 675.13 s Done.
# [Task 13/24]  Current/Best:    7.76/ 219.72 GFLOPS | Progress: (1000/1000) | 519.06 s Done.
# [Task 14/24]  Current/Best:   12.26/ 202.42 GFLOPS | Progress: (1000/1000) | 514.30 s Done.
# [Task 15/24]  Current/Best:   31.59/ 197.61 GFLOPS | Progress: (1000/1000) | 558.54 s Done.
# [Task 16/24]  Current/Best:   31.63/ 206.08 GFLOPS | Progress: (1000/1000) | 708.36 s Done.
# [Task 17/24]  Current/Best:   41.18/ 204.45 GFLOPS | Progress: (1000/1000) | 736.08 s Done.
# [Task 18/24]  Current/Best:   15.85/ 222.38 GFLOPS | Progress: (980/1000) | 516.73 s Done.
# [Task 19/24]  Current/Best:   15.78/ 203.41 GFLOPS | Progress: (1000/1000) | 587.13 s Done.
# [Task 20/24]  Current/Best:   30.47/ 205.92 GFLOPS | Progress: (980/1000) | 471.00 s Done.
# [Task 21/24]  Current/Best:   46.91/ 227.99 GFLOPS | Progress: (308/1000) | 219.18 s Done.
# [Task 22/24]  Current/Best:   13.33/ 207.66 GFLOPS | Progress: (1000/1000) | 761.74 s Done.
# [Task 23/24]  Current/Best:   53.29/ 192.98 GFLOPS | Progress: (1000/1000) | 799.90 s Done.
# [Task 24/24]  Current/Best:   25.03/ 146.14 GFLOPS | Progress: (1000/1000) | 1112.55 s Done.

使用调优数据编译一个优化的模型

上述调优过程的输出（即调优记录）存储在resnet-50-v2-autotuning.json中。编译器将使用它们为您指定的目标上的模型生成高性能代码。

现在已经收集了模型的调优数据，我们可以使用优化的算子重新编译模型，以加快计算速度。

with autotvm.apply_history_best(tuning_option["tuning_records"]):
    with tvm.transform.PassContext(opt_level=3, config={}):
        lib = relay.build(mod, target=target, params=params)

dev = tvm.device(str(target), 0)
module = graph_executor.GraphModule(lib["default"](dev))

输出：

Done.

运行优化后的模型，验证优化前后输出是一致的:

dtype = "float32"
module.set_input(input_name, img_data)
module.run()
output_shape = (1, 1000)
tvm_output = module.get_output(0, tvm.nd.empty(output_shape)).numpy()

scores = softmax(tvm_output)
scores = np.squeeze(scores)
ranks = np.argsort(scores)[::-1]
for rank in ranks[0:5]:
    print("class='%s' with probability=%f" % (labels[rank], scores[rank]))

输出：

class='n02123045 tabby, tabby cat' with probability=0.621104
class='n02123159 tiger cat' with probability=0.356378
class='n02124075 Egyptian cat' with probability=0.019712
class='n02129604 tiger, Panthera tigris' with probability=0.001215
class='n04040759 radiator' with probability=0.000262

可以看到输出结果和优化前一致：

# class='n02123045 tabby, tabby cat' with probability=0.610550
# class='n02123159 tiger cat' with probability=0.367181
# class='n02124075 Egyptian cat' with probability=0.019365
# class='n02129604 tiger, Panthera tigris' with probability=0.001273
# class='n04040759 radiator' with probability=0.000261

比较优化和未优化的模型

我们希望收集当前优化模型的一些基本性能数据，以便与优化前进行比较。通过比较您应该会看到性能改进，提升多少取决于底层硬件、迭代次数以及其他因素。

import timeit

timing_number = 10
timing_repeat = 10
optimized = (
    np.array(timeit.Timer(lambda: module.run()).repeat(repeat=timing_repeat, number=timing_number))
    * 1000
    / timing_number
)
optimized = {"mean": np.mean(optimized), "median": np.median(optimized), "std": np.std(optimized)}


print("optimized: %s" % (optimized))
print("unoptimized: %s" % (unoptimized))

输出：

optimized: {'mean': 426.5695632400002, 'median': 426.31598235000183, 'std': 0.8991986364530805}
unoptimized: {'mean': 496.2511969099978, 'median': 495.80396929999324, 'std': 0.7997811122746795}

小结

在本教程中，我们给出了一个关于如何使用TVM Python API来编译、运行和调优模型的简短示例。我们还讨论了对输入和输出进行预处理和后处理的必要性。在调优过程之后，我们演示了如何比较未优化模型和优化模型的性能。

这里我们给出了一个在本地使用ResNet-50 v2的简单示例。但是，TVM支持更多的特性，包括交叉编译、远程执行和分析/基准测试。

脚本的总运行时间:(7分钟48.959秒)

你可能感兴趣的:(TVM官方文档翻译,深度学习)

每天五分钟深度学习pytorch：基于Pytorch搭建ResNet模型的残差块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 人工智能 ResNet 机器学习
残差块我们分析一下这个残差块，x经过两个卷积层得到F(x)，然后F(x)+x作为残差块的输出，此时就有一个问题，这个问题就是F(x)+x的维度问题，如果图片数据经过两个卷积层之后F(x)变小（height和weight变小）或者通道数发生了变化，那么此时F(x)是没有办法和x相加的，当然我们可以学习前面的GoogLeNet的方式，也就是说卷积之后的F(x)和x一样，大小不变，或者对x变道和F(x)
Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）境心镜免训练深度学习人工智能 NAS
代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距，该范式系统地寻找最佳架构，给定客观标准，例如最大分类准确度。然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种
智能教育：DeepSeek在课堂管理中的应用与代码实现 Evaporator Core #DeepSeek快速入门系统架构设计师 Python开发经验 deepseek
课堂管理是教育领域的重要组成部分，它直接影响教学效果和学生的学习体验。随着人工智能技术的发展，DeepSeek正在通过其强大的算法和数据处理能力，推动课堂管理的智能化和高效化。本文将结合代码实现，深入探讨DeepSeek在课堂管理中的应用。一、智能课堂管理系统：从数据到实时监控智能课堂管理的核心在于通过实时监控学生的学习行为，提供及时的反馈和调整。DeepSeek通过深度学习算法，能够从课堂数据中
基于PyTorch的深度学习5——神经网络工具箱 Wis4e 深度学习 pytorch 神经网络
可以学习如下内容：•介绍神经网络核心组件。•如何构建一个神经网络。•详细介绍如何构建一个神经网络。•如何使用nn模块中Module及functional。•如何选择优化器。•动态修改学习率参数。5.1核心组件神经网络核心组件不多，把这些组件确定后，这个神经网络基本就确定了。这些核心组件包括：1)层：神经网络的基本结构，将输入张量转换为输出张量。2)模型：层构成的网络。3)损失函数：参数学习的目标函
深度学习-Android-图片加载框架-Glide-(二)-切入源码层深入分析-Glide-缓存策略 2401_84123077 程序员 android glide 缓存
介绍在上一篇中，我们知道了Glide框架的最基本的执行流程，那么只知道基本执行流程，这显然是不够的，我们要深挖Glide框架的细节处理原理，比如缓存机制，图片处理等，这一篇我们就一起去探索Glide的缓存机制。Glide缓存机制可以说是设计的非常完美，考虑的非常周全，下面就以一张表格来说明下Glide缓存。缓存类型缓存代表说明活动缓存ActiveResources如果当前对应的图片资源是从内存缓存
【人工智能基础】生成模型：让数据“无中生有”的神奇魔法 roman_日积跬步-终至千里 #人工智能基础知识人工智能
文章目录一、生成模型的发展脉络二、生成模型的基本原理三、主要生成模型及其逻辑1、生成对抗网络（GAN）2、变分自编码器（VAE）3、扩散模型（DPM）4、基于能量的模型（EBM）5、正规化流（NF）四、生成模型对比分析五、生成模型的应用拓展一、生成模型的发展脉络在深度学习尚未兴起的时期，计算机视觉领域的传统图像生成算法主要依赖纹理合成和纹理映射等技术。这些算法基于手工设计的特征进行图像构建，然而，
2024年最新PyTorch深度学习项目实战100例数据集_python 深度学习项目演练 2401_84585440 程序员深度学习 python pytorch
前言最近很多订阅了《PyTorch深度学习项目实战100例》的用户私信咨询有些数据集下载不了以及一些文章中没有给出数据集链接，为了解决这个问题，专门开设了本篇文章，提供数据集下载链接，打包100例的所有数据集。本专栏适用人群：深度学习初学者，刚刚接触PyTorch的用户群体，专栏将具体讲解如何快速搭建深度学习模型用自己的数据集实现深度学习小项目，快速让新手小白能够对基于深度学习方法有个基本的框架认
PyTorch 学习路线 gorgor在码农 #python入门基础 python pytorch
学习PyTorch需要结合理论理解和实践编码，逐步掌握其核心功能和实际应用。以下是分阶段的学习路径和资源推荐，适合从入门到进阶：1.基础知识准备前提条件Python基础：熟悉Python语法（变量、函数、类、模块等）。数学基础：了解线性代数、微积分、概率论（深度学习的基础）。机器学习基础：理解神经网络、损失函数、优化器（如梯度下降）等概念。学习资源Python入门：Python官方教程机器学习基础
Imagen原理与代码实例讲解 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Imagen原理与代码实例讲解1.背景介绍在人工智能领域中,图像生成一直是一个具有挑战性的任务。传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。随着深度学习技术的不断发展,生成式对抗网络(GenerativeAdversarialNetworks,GAN)等新型模型逐渐展现出了令人惊叹的图像生成能力。谷歌的Imagen就是一种基于大型视觉语言模型的全新图
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法带上一无所知的我智能体的自我修炼：强化学习指南深度学习算法人工智能 DQN
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法“好的代码如同山水画，既要工笔细描，又要留白写意”——一个在终端前顿悟的开发者DQN是Q-Learning算法与深度神经网络的结合体，通过神经网络近似Q值函数，解决传统Q-Learning在高维状态空间下的"维度灾难"问题。引言：代码与禅的碰撞♂️在某个调试代码到凌晨三点的夜晚，我突然意识到：强化学习的过程，竟与佛家修行惊人地相似。智能体在环境中探索
无监督AI训练:机遇与挑战并存 AI天才研究院计算 ChatGPT DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
无监督AI训练：机遇与挑战并存关键词：无监督学习、AI训练、机器学习、聚类算法、降维技术、深度学习摘要：本文深入探讨无监督AI训练这一新兴领域，首先介绍了其基本概念与原理，然后详细解析了无监督AI训练的核心技术，如聚类算法和降维技术，以及无监督深度学习。接着，本文通过实际项目案例分析，展示了无监督AI训练的应用实践。最后，本文分析了无监督AI训练面临的挑战，并展望了其未来发展趋势。通过本文的阅读，
PyTorch：Python深度学习框架使用详解零度° python python 深度学习 pytorch
PyTorch是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理领域。它由Facebook的AI研究团队开发，因其动态计算图、易用性以及与Python的紧密集成而受到开发者的青睐。PyTorch的主要特点动态计算图：PyTorch的计算图在运行时构建，使得模型的修改和调试更加灵活。自动微分：自动计算梯度，简化了机器学习模型的训练过程。丰富的API：提供了丰富的神经网络层、函数和损失函数。跨平
关于自然语言处理（三）深度学习中的文字序列数据的分词操作 MatrixSparse 大模型人工智能自然语言处理深度学习人工智能
深度学习中的文字序列数据二维文字序列在文字数据中，样本与样本之间的联系是语义的联系，语义的联系即是词与词之间、字与字之间的联系，因此在文字序列中每个样本是一个单词或一个字（对英文来说大部分时候是一个单词，偶尔也可以是更小的语言单位，如字母或半词），故而在中文文字数据中，一张二维表往往是一个句子或一段话，而单个样本则表示单词或字。此时，不能够打乱顺序的维度是vocab_size，它代表了一个句子/一
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
基于CNN-BIGRU-Attention模型的功率预测（模型详解及代码复现）清风AI 深度学习算法详解及代码复现深度学习人工智能算法机器学习计算机视觉 cnn 神经网络
整体架构基于CNN-BiGRU-Attention模型的功率预测模型是一种融合了卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(Attention)的深度学习架构。这种混合模型旨在充分利用CNN的局部特征提取能力、BiGRU的长序列处理能力以及Attention机制的关键特征突出能力，从而提高功率预测的准确性和可靠性。模型的整体架构主要包括以下几个关键组件：输入层：设计的输入特
文生图图生视频文生视频人工智能AI工具节选行思理 AI 人工智能文生图文生视频图生视频数字人
1、MidjourneyAI图像和插画生成工具，官网地址：Midjourney中文站,MJ中文站-专业AI绘图网站2、StableDiffusion一种基于扩散技术的深度学习文本转图像模型，演示地址：StabilityAI3、通义万相阿里云通义大模型旗下的AI创意作画与视频生成平台，官网地址：通义万相_AI创意作画_AI绘画_人工智能-阿里云4、PhotoStudioAI模特AI商品图及视频一键生
ChatGPT-4o引领医学革命：临床科研创新与效率的新纪元小艳加油教程语言类人工智能数据分析 ChatGPT-4o 临床医学
2024年5月12日，更强版本的ChatGPT-4o上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。因此，帮助广大临床医学相关的医院管理人员、医生、学生、科研人员更加熟练地掌握ChatGPT-4o在临床医学日常生活、工作与学习、课题申报、论文选题、实验方案设计、实验数据统计分析与可视化等方面的强大功能，同时更加系统地学习人工智能（包括传统机器学习、深度学习等）的基础理
人工智能引领技术革命：ChatGPT与深度学习的突破性进展撒旦骑路西法，大战吕布国内外安全资讯人工智能
在全球科技快速发展的今天，人工智能（AI）正以前所未有的速度渗透到各个行业，成为推动社会变革的重要力量。特别是在自然语言处理（NLP）领域，OpenAI的ChatGPT凭借深度学习技术的持续突破，展现了AI在理解、推理、对话生成等方面的惊人进步。本文将深入探讨ChatGPT及深度学习的最新突破，以及它对不同行业的深远影响。1.ChatGPT：AI语言模型的革新者1.1什么是ChatGPT？Chat
深入探索Deeplearning4j（DL4J）：Java深度学习的全面指南软件职业规划 java 深度学习开发语言
一、DL4J框架概述Deeplearning4j（DL4J）是一个开源的深度学习框架，专为Java和Scala设计，运行在Java虚拟机（JVM）上。它由Skymind公司开发并维护，旨在将深度学习技术应用于大规模商业应用。DL4J支持多种深度学习模型，包括卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等。自2014年首次发布以来，DL4J已经成为Java深度学习领域的
电机的声音数据进行AI分析鹿屿二向箔人工智能
对电机的声音数据进行分析，尤其是当数据来源于加速度传感器时，涉及到的不仅仅是声音分析，还包含了振动分析。这类问题通常可以归类于机械故障诊断或预测性维护领域。以下是一些适合处理这种类型数据的人工智能模型和方法：1.特征工程+传统机器学习模型在直接应用深度学习之前，通常首先会进行特征提取。对于振动信号（即使通过加速度传感器采集），常用的方法包括计算频域特征（如傅里叶变换后的频谱）、时域特征（如均方根值
李沐深度学习预备知识——数据操作 flex_university 李沐课程学习笔记深度学习人工智能
预备知识——数据操作1、数据操作1.1基本操作importtorchx=torch.arange(12)print(x)print(x.shape)print(x.numel())x=x.reshape(3,4)#变形x=x.reshape(2,-1)#-1代表自动计算torch.zeros((2,3,4))#生成全0张量torch.ones((2,3,4))#生成全1张量torch.randn(
基于Pytorch的语音情感识别系统鱼弦人工智能时代 pytorch 人工智能 python
基于Pytorch的语音情感识别系统介绍语音情感识别（SpeechEmotionRecognition,SER）是指通过分析和处理人的语音信号来识别其情感状态。常见的情感状态包括愤怒、喜悦、悲伤、惊讶等。基于Pytorch的语音情感识别系统使用深度学习技术，通过训练神经网络模型来实现情感识别任务。应用使用场景客户服务中心：自动识别客户情绪，提供有针对性的服务。智能语音助手：提升人机交互体验，更加智
新一代 AI 软件Manus 将重新将AI市场大洗牌 CircuitWizard 人工智能
Manus是一家专注于手部追踪、虚拟现实（VR）和增强现实（AR）技术的公司，其新一代AI软件结合了先进的机器学习和计算机视觉技术，致力于提升人机交互的自然性和效率。以下是关于Manus新一代AI软件的详细介绍及其核心功能：1.核心技术与创新Manus的AI软件基于以下技术突破：高精度手部追踪：通过深度学习算法和摄像头/传感器数据，实时捕捉手部骨骼、关节和肌肉的细微动作，精度可达亚毫米级，支持复杂
【自然语言处理-NLP】情感分析与主题建模云博士的AI课堂深度学习哈佛博后带你玩转机器学习自然语言处理人工智能情感分析主题建模深度学习机器学习 NLP
以下内容详细剖析了NLP中情感分析（SentimentAnalysis）和主题建模（TopicModeling）的技术与方法，分别展示如何从文本中提取情感倾向和潜在主题，并提供示例代码和讲解，可在Python环境下直接运行。目录情感分析（SentimentAnalysis）1.1概念与方法概览1.2传统机器学习方法1.3深度学习与预训练模型1.4代码示例：基于机器学习的情感分类主题建模（Topic
搜广推校招面经三十八 Y1nhl 搜广推面经算法 pytorch 推荐算法搜索算法机器学习
字节推荐算法一、场景题：在抖音场景下为用户推荐广告词，吸引用户点击搜索，呈现广告这一流程的关键点以及可能遇到的困难。二、Transformer中对梯度消失或者梯度爆炸的处理在Transformer模型中，梯度消失和梯度爆炸是深度学习中常见的问题，尤其是在处理长序列数据时。为了克服这些问题，Transformer采用了一系列技术：2.1.残差连接（ResidualConnections）每个子层（包
【深度学习】PyTorch v2.6 Overview OpenSeek 人工智能 #机器学习 #深度学习 python pytorch 人工智能
PyTorchv2.6OverviewPythonAPILibrariesPyTorch是一个优化的张量库，用于使用GPU和CPU进行深度学习。PythonAPI序号API名称解释1torchPyTorch核心库(中文:火炬)PyTorch的核心库，提供了张量操作、自动求导等基础功能。2torch.nn神经网络模块包含构建神经网络所需的各种模块，如层、损失函数等。3torch.nn.functio
PyTorch 显存分配不均匀 LutingWang debug pytorch 人工智能 python
在使用PyTorch进行深度学习训练时，可能会遇到GPU0的显存占用明显高于其他GPU的情况。这可能导致显存不足，影响训练效率。排查思路：开启两个Shell，ShellA用于运行训练脚本，ShellB用于实时监控显存。在ShellA运行训练脚本。在另一个shell中运行nvidia-smi-l1。这个命令会每秒刷新一次nvidia-smi的结果，方便实时观察各GPU显存的变化情况。观察GPU0何时
PyTorch 训练循环全攻略：从零到精通的深度学习秘籍吴师兄大模型 PyTorch 深度学习 pytorch 人工智能训练循环 LLM 大模型 python
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
python搭建NPL模型的详细步骤和代码百锦再@新空间代码工作室包罗万象 python 开发语言 django flask pygame pip
目录**一、环境准备****二、数据准备****三、文本预处理****1.清理文本****四、特征工程****1.TF-IDF****2.Word2Vec****五、搭建NLP模型****1.逻辑回归****2.LSTM深度学习模型****六、使用预训练的BERT模型****七、模型评估****八、部署模型****总结**1.**人机交互的核心技术**2.**推动AI技术发展的动力**3.**广泛
golang深度学习-性能分析老狼伙计 golang 编程语言云原生学习笔记 golang 深度学习开发语言
性能分析Go语言原生支持在运行时保留重要的特征指标和状态，有许多工具可以分析甚至可视化程序运行的状态和过程。pprof工具：常用于分析资源的使用情况，可以采集程序运行时的多种不同类型的数据（例如CPU占用、内存消耗和协程数量等），并对数据进行分析聚合生成的报告。trace工具：则关注程序运行时的事件（例如协程状态切换，GC的开始和结束、系统调用等等），常用于分析延迟、阻塞和调度等问题。pprof工
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &