姆克儿

TVM User Tutorial -- Compiling and Optimizing a Model with the Python Interface (AutoTVM)

Compiling and Optimizing a Model with the Python Interface (AutoTVM)

Author: Chris Hoge

注：在练习这一节之前需要自行完成TVM的安装！

在 TVMC 教程中，我们介绍了如何使用 TVM 的命令行界面 TVMC 编译、运行和调整预训练的视觉模型 ResNet-50 v2。 TVM 不仅仅是一个命令行工具，它是一个优化框架，具有可用于多种不同语言的 API，为您在使用机器学习模型时提供了极大的灵活性。

在本教程中，我们将介绍我们使用 TVMC 所做的相同基础，但展示它是如何使用 Python API 完成的。完成本节后，我们将使用 Python API for TVM 完成以下任务：

为 TVM 运行时编译预训练的 ResNet-50 v2 模型。
通过编译的模型运行真实图像，并解释输出和模型性能。
使用 TVM 调整在 CPU 上建模的模型。
使用 TVM 收集的调整数据重新编译优化模型。
通过优化模型运行图像，并比较输出和模型性能。

本节的目标是概述 TVM 的功能以及如何通过 Python API 使用它们。
TVM 是一个深度学习编译器框架，有许多不同的模块可用于处理深度学习模型和运算符。在本教程中，我们将介绍如何使用 Python API 加载、编译和优化模型。
我们首先导入一些依赖项，包括用于加载和转换模型的 onnx、用于下载测试数据的辅助实用程序、用于处理图像数据的 Python 图像库、用于图像数据预处理和后处理的 numpy、TVM 中继框架和 TVM 图形执行器。

import onnx
from tvm.contrib.download import download_testdata
from PIL import Image
import numpy as np
import tvm.relay as relay
import tvm
from tvm.contrib import graph_executor

下载和加载 ONNX 模型

在本教程中，我们将使用 ResNet-50 v2。 ResNet-50 是一种卷积神经网络，深度为 50 层，旨在对图像进行分类。我们将使用的模型已经在超过 100 万张具有 1000 种不同分类的图像上进行了预训练。该网络的输入图像大小为 224x224。如果您有兴趣探索更多 ResNet-50 模型的结构，我们建议下载 Netron，一个免费提供的 ML 模型查看器。
TVM 提供了一个帮助库来下载预训练的模型。通过模块提供模型 URL、文件名和模型类型，TVM 将下载模型并将其保存到磁盘。对于 ONNX 模型的实例，您可以使用 ONNX runtime 将其加载到内存中。

使用其他模型格式
TVM 支持许多流行的模型格式。可以在 TVM 文档的编译深度学习模型部分找到一个列表。

model_url = "".join(
    [
        "https://github.com/onnx/models/raw/",
        "master/vision/classification/resnet/model/",
        "resnet50-v2-7.onnx",
    ]
)

model_path = download_testdata(model_url, "resnet50-v2-7.onnx", module="onnx")
onnx_model = onnx.load(model_path)

下载、预处理和加载测试图像

当涉及到预期的张量形状、格式和数据类型时，每个模型都是有独特要求的。出于这个原因，大多数模型都需要一些预处理和后处理，以确保输入有效并解释输出。 TVMC 对输入和输出数据采用了 NumPy 的 .npz 格式。
作为本教程的输入，我们将使用猫的图像，但您可以随意用此图像替换您选择的任何图像。
下载图像数据，然后将其转换为 numpy 数组以用作模型的输入。

img_url = "https://s3.amazonaws.com/model-server/inputs/kitten.jpg"
img_path = download_testdata(img_url, "imagenet_cat.png", module="data")

# Resize it to 224x224
resized_image = Image.open(img_path).resize((224, 224))
img_data = np.asarray(resized_image).astype("float32")

# Our input image is in HWC layout while ONNX expects CHW input, so convert the array
img_data = np.transpose(img_data, (2, 0, 1))

# Normalize according to the ImageNet input specification
imagenet_mean = np.array([0.485, 0.456, 0.406]).reshape((3, 1, 1))
imagenet_stddev = np.array([0.229, 0.224, 0.225]).reshape((3, 1, 1))
norm_img_data = (img_data / 255 - imagenet_mean) / imagenet_stddev

# Add the batch dimension, as we are expecting 4-dimensional input: NCHW.
img_data = np.expand_dims(norm_img_data, axis=0)

使用 Relay 编译模型

下一步是编译 ResNet 模型。我们首先使用 from_onnx 导入器导入要中继的模型。然后，我们通过标准优化将模型构建到 TVM 库中。最后，我们从库中创建一个 TVM 图形运行时模块。

target = "llvm"

定义正确的目标

定义正确的目标
指定正确的目标会对编译模块的性能产生巨大影响，因为它可以利用目标上可用的硬件功能。有关详细信息，请参阅为 x86 CPU 自动调整卷积网络。我们建议确定您正在运行的 CPU 以及可选功能，并适当地设置目标。例如，对于某些处理器，`target = "llvm -mcpu=skylake"`，或者对于具有 AVX-512 矢量指令集的处理器，`target = "llvm -mcpu=skylake-avx512"`。

指定正确的目标会对编译模块的性能产生巨大影响，因为它可以利用目标上可用的硬件功能。有关详细信息，请参阅为 x86 CPU 自动调整卷积网络。我们建议确定您正在运行的 CPU 以及可选功能，并适当地设置目标。例如，对于某些处理器，target = "llvm -mcpu=skylake"，或者对于具有 AVX-512 矢量指令集的处理器，target = "llvm -mcpu=skylake-avx512"。

# The input name may vary across model types. You can use a tool
# like Netron to check input names
input_name = "data"
shape_dict = {input_name: img_data.shape}

mod, params = relay.frontend.from_onnx(onnx_model, shape_dict)

with tvm.transform.PassContext(opt_level=3):
    lib = relay.build(mod, target=target, params=params)

dev = tvm.device(str(target), 0)
module = graph_executor.GraphModule(lib["default"](dev))

Out：
One or more operators have not been tuned. Please tune your model for better performance. Use DEBUG logging level to see more details.

在 TVM runtime执行

现在我们已经编译了模型，我们可以使用 TVM runtime对其进行预测。要使用 TVM 运行模型并进行预测，我们需要两件事：

我们刚刚生成的编译模型。
模型的有效输入以进行预测。

dtype = "float32"
module.set_input(input_name, img_data)
module.run()
output_shape = (1, 1000)
tvm_output = module.get_output(0, tvm.nd.empty(output_shape)).numpy()

收集基本性能数据

我们想收集一些与这个未优化模型相关的基本性能数据，然后将其与调整后的模型进行比较。为了帮助解释 CPU 噪声，我们在多个批次中多次重复运行计算，然后收集一些关于均值、中值和标准差的基础统计数据。



import timeit

timing_number = 10
timing_repeat = 10
unoptimized = (
    np.array(timeit.Timer(lambda: module.run()).repeat(repeat=timing_repeat, number=timing_number))
    * 1000
    / timing_number
)
unoptimized = {
    "mean": np.mean(unoptimized),
    "median": np.median(unoptimized),
    "std": np.std(unoptimized),
}

print(unoptimized)

Out:
{'mean': 104.3666648492217, 'median': 103.54426596313715, 'std': 2.3251255299765776}

后处理输出

如前所述，每个模型都有自己特定的方式来提供输出张量。
在我们的例子中，我们需要使用为模型提供的查找表运行一些后处理，以将 ResNet-50 v2 的输出呈现为更易于阅读的形式。

from scipy.special import softmax

# Download a list of labels
labels_url = "https://s3.amazonaws.com/onnx-model-zoo/synset.txt"
labels_path = download_testdata(labels_url, "synset.txt", module="data")

with open(labels_path, "r") as f:
    labels = [l.rstrip() for l in f]

# Open the output and read the output tensor
scores = softmax(tvm_output)
scores = np.squeeze(scores)
ranks = np.argsort(scores)[::-1]
for rank in ranks[0:5]:
    print("class='%s' with probability=%f" % (labels[rank], scores[rank]))

Out:
class='n02123045 tabby, tabby cat' with probability=0.610551
class='n02123159 tiger cat' with probability=0.367180
class='n02124075 Egyptian cat' with probability=0.019365
class='n02129604 tiger, Panthera tigris' with probability=0.001273
class='n04040759 radiator' with probability=0.000261

调整模型

之前的模型被编译为在 TVM runtime上工作，但不包括任何特定于平台的优化。在本节中，我们将向您展示如何使用 TVM 针对您的工作平台构建优化模型。
在某些情况下，使用我们编译的模块运行推理时，我们可能无法获得预期的性能。在这种情况下，我们可以使用自动调谐器，为我们的模型找到更好的配置并提高性能。 TVM 中的调优是指优化模型以在给定目标上运行得更快的过程。这与训练或微调不同，它不会影响模型的准确性，而只会影响运行时性能。作为调整过程的一部分，TVM 将尝试运行许多不同的算子实现变体，以查看哪些执行得最好。这些运行的结果存储在调整记录文件中。
在最简单的形式中，调优需要您提供三件事：

准备运行此模型的设备的规格
将存储调整记录的输出文件的路径
要调整的模型的路径。

import tvm.auto_scheduler as auto_scheduler
from tvm.autotvm.tuner import XGBTuner
from tvm import autotvm

为runner设置一些基本参数。运行程序获取使用一组特定参数生成的编译代码并测量其性能。 number 指定我们将测试的不同配置的数量，而 repeat 指定我们将对每个配置进行多少次测量。 min_repeat_ms 是一个值，指定运行配置测试需要多长时间。如果重复次数低于此时间，则会增加。此选项对于在 GPU 上进行精确调优是必需的，而对于 CPU 调优则不是必需的。将此值设置为 0 将禁用它。 timeout设置了为每个测试配置运行训练代码的时间上限。

number = 10
repeat = 1
min_repeat_ms = 0  # since we're tuning on a CPU, can be set to 0
timeout = 10  # in seconds

# create a TVM runner
runner = autotvm.LocalRunner(
    number=number,
    repeat=repeat,
    timeout=timeout,
    min_repeat_ms=min_repeat_ms,
    enable_cpu_cache_flush=True,
)

创建一个简单的结构来保存调整选项。我们使用 XGBoost 算法来指导搜索。对于生产作业，您需要将试验次数设置为大于此处使用的值 10。对于 CPU，我们推荐 1500，对于 GPU 3000-4000。所需的试验次数可能取决于特定的模型和处理器，因此值得花一些时间评估一系列值的性能，以找到调整时间和模型优化之间的最佳平衡。因为运行调优需要大量时间，我们将试验次数设置为 10，但不建议使用这么小的值。 early_stopping 参数是在可以应用提前停止搜索的条件之前运行的最小跟踪数。 measure 选项指示将在何处构建试用代码以及将在何处运行。在这种情况下，我们使用刚刚创建的 LocalRunner 和 LocalBuilder。 Tuning_records 选项指定将调整数据写入的文件。

tuning_option = {
    "tuner": "xgb",
    "trials": 10,
    "early_stopping": 100,
    "measure_option": autotvm.measure_option(
        builder=autotvm.LocalBuilder(build_func="default"), runner=runner
    ),
    "tuning_records": "resnet-50-v2-autotuning.json",
}

定义优化搜索算法：默认情况下，此搜索使用 XGBoost Grid 算法进行引导。根据您的模型复杂性和可用时间量，您可能需要选择不同的算法。
设置调谐参数：在此示例中，为了节省时间，我们将试验次数和提前停止次数设置为 10。如果将这些值设置得更高，您可能会看到更多的性能改进，但这是以花费调优时间为代价的。收敛所需的试验次数将根据模型和目标平台的具体情况而有所不同。

# begin by extracting the tasks from the onnx model
tasks = autotvm.task.extract_from_program(mod["main"], target=target, params=params)

# Tune the extracted tasks sequentially.
for i, task in enumerate(tasks):
    prefix = "[Task %2d/%2d] " % (i + 1, len(tasks))
    tuner_obj = XGBTuner(task, loss_type="rank")
    tuner_obj.tune(
        n_trial=min(tuning_option["trials"], len(task.config_space)),
        early_stopping=tuning_option["early_stopping"],
        measure_option=tuning_option["measure_option"],
        callbacks=[
            autotvm.callback.progress_bar(tuning_option["trials"], prefix=prefix),
            autotvm.callback.log_to_file(tuning_option["tuning_records"]),
        ],
    )

Out:
[Task  1/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  1/25]  Current/Best:   83.61/  99.28 GFLOPS | Progress: (10/10) | 9.39 s Done.

[Task  2/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  2/25]  Current/Best:   29.20/  44.65 GFLOPS | Progress: (10/10) | 8.64 s Done.

[Task  3/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  3/25]  Current/Best:   44.41/  75.69 GFLOPS | Progress: (10/10) | 10.53 s Done.

[Task  4/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  4/25]  Current/Best:   29.06/  60.24 GFLOPS | Progress: (10/10) | 13.08 s Done.

[Task  5/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  5/25]  Current/Best:   23.66/  45.20 GFLOPS | Progress: (10/10) | 8.91 s Done.

[Task  6/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  6/25]  Current/Best:   31.09/  68.37 GFLOPS | Progress: (10/10) | 8.73 s Done.

[Task  7/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  7/25]  Current/Best:   65.03/  80.42 GFLOPS | Progress: (10/10) | 10.94 s Done.

[Task  8/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  8/25]  Current/Best:   32.80/  80.68 GFLOPS | Progress: (10/10) | 8.72 s Done.

[Task  9/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task  9/25]  Current/Best:   46.53/  64.57 GFLOPS | Progress: (10/10) | 24.11 s
[Task 10/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s Done.

[Task 10/25]  Current/Best:   30.82/  48.08 GFLOPS | Progress: (10/10) | 8.17 s Done.

[Task 11/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 11/25]  Current/Best:   77.05/  89.22 GFLOPS | Progress: (10/10) | 9.41 s Done.

[Task 12/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 12/25]  Current/Best:   61.88/  74.52 GFLOPS | Progress: (10/10) | 8.19 s Done.

[Task 13/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 13/25]  Current/Best:   70.05/  70.05 GFLOPS | Progress: (10/10) | 11.08 s Done.

[Task 14/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 14/25]  Current/Best:   36.07/  78.54 GFLOPS | Progress: (10/10) | 32.87 s
[Task 15/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 15/25]  Current/Best:   43.33/  64.05 GFLOPS | Progress: (10/10) | 31.58 s
[Task 16/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s Done.

[Task 16/25]  Current/Best:   24.70/  60.63 GFLOPS | Progress: (10/10) | 5.29 s Done.

[Task 17/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 17/25]  Current/Best:   87.25/ 102.08 GFLOPS | Progress: (10/10) | 5.80 s Done.

[Task 18/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 18/25]  Current/Best:   36.05/  81.76 GFLOPS | Progress: (10/10) | 15.41 s
[Task 19/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 19/25]  Current/Best:   20.82/  90.13 GFLOPS | Progress: (10/10) | 12.99 s Done.

[Task 20/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 20/25]  Current/Best:   41.25/  75.61 GFLOPS | Progress: (10/10) | 35.15 s
[Task 21/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s Done.
 Done.

[Task 21/25]  Current/Best:   30.62/  71.62 GFLOPS | Progress: (10/10) | 174.63 s
[Task 22/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 22/25]  Current/Best:   14.67/  49.61 GFLOPS | Progress: (10/10) | 12.36 s Done.

[Task 23/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 23/25]  Current/Best:   83.44/  87.09 GFLOPS | Progress: (10/10) | 6.68 s Done.

[Task 24/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s
[Task 24/25]  Current/Best:    1.42/  27.01 GFLOPS | Progress: (10/10) | 21.82 s
[Task 25/25]  Current/Best:    0.00/   0.00 GFLOPS | Progress: (0/10) | 0.00 s Done.

[Task 25/25]  Current/Best:    0.36/   1.98 GFLOPS | Progress: (10/10) | 38.19 s

使用调整数据编译优化模型

作为上述调优过程的输出，我们获得了存储在 resnet-50-v2-autotuning.json 中的调优记录。编译器将使用结果为您指定目标上的模型生成高性能代码。
现在已经收集了模型的调整数据，我们可以使用优化的运算符重新编译模型以加快计算速度。

with autotvm.apply_history_best(tuning_option["tuning_records"]):
    with tvm.transform.PassContext(opt_level=3, config={}):
        lib = relay.build(mod, target=target, params=params)

dev = tvm.device(str(target), 0)
module = graph_executor.GraphModule(lib["default"](dev))

验证优化模型是否运行并产生相同的结果：

dtype = "float32"
module.set_input(input_name, img_data)
module.run()
output_shape = (1, 1000)
tvm_output = module.get_output(0, tvm.nd.empty(output_shape)).numpy()

scores = softmax(tvm_output)
scores = np.squeeze(scores)
ranks = np.argsort(scores)[::-1]
for rank in ranks[0:5]:
    print("class='%s' with probability=%f" % (labels[rank], scores[rank]))

Out:
class='n02123045 tabby, tabby cat' with probability=0.610553
class='n02123159 tiger cat' with probability=0.367179
class='n02124075 Egyptian cat' with probability=0.019365
class='n02129604 tiger, Panthera tigris' with probability=0.001273
class='n04040759 radiator' with probability=0.000261

比较调整和未调整的模型

我们希望收集与此优化模型相关的一些基本性能数据，以将其与未优化模型进行比较。根据您的底层硬件、迭代次数和其他因素，在比较优化模型和未优化模型时，您应该会看到性能改进。

import timeit

timing_number = 10
timing_repeat = 10
optimized = (
    np.array(timeit.Timer(lambda: module.run()).repeat(repeat=timing_repeat, number=timing_number))
    * 1000
    / timing_number
)
optimized = {"mean": np.mean(optimized), "median": np.median(optimized), "std": np.std(optimized)}


print("optimized: %s" % (optimized))
print("unoptimized: %s" % (unoptimized))

Out:
optimized: {'mean': 118.84035926312208, 'median': 120.0346483848989, 'std': 15.774653321691925}
unoptimized: {'mean': 104.3666648492217, 'median': 103.54426596313715, 'std': 2.3251255299765776}

Final Remarks

在本教程中，我们提供了一个简短示例，说明如何使用 TVM Python API 编译、运行和调整模型。我们还讨论了对输入和输出进行预处理和后处理的必要性。在调整过程之后，我们演示了如何比较未优化和优化模型的性能。
在这里，我们展示了一个在本地使用 ResNet-50 v2 的简单示例。然而，TVM 支持更多功能，包括交叉编译、远程执行和分析/基准测试。

【源代码】python爬虫，爬取足球赛制比分码农之家★资源共享 python 爬虫开发语言
完整代码！fromseleniumimportwebdriverfromselenium.common.exceptionsimportNoSuchElementExceptionfromselenium.webdriver.common.keysimportKeysimporttimefrombs4importBeautifulSoupimportselectimportsocketimpor
python：print语句中插入水平制表符\t来对齐内容听海边涛声 python 开发语言
说明\t是水平制表符，就是键盘上的tab键。print语句中插入水平制表符\t来对齐内容，使得打印出来的内容格式漂亮。下面以在pycharm中的打印进行演示。在print语句中，如果插入\t，相当于插入多少空格不是固定的，跟\t前面有多个字符有关系：情况1：如果前面字符数不是4的倍数，那么\t的作用是插入一定数量的空格，补足到4的倍数。例如，如果前面有1个字符，那么\t就是插入3个空格；如果前面有
Python爬虫–爬取酷狗音乐 2024亲测可用！！！ LinHZ2012 爬虫 python
相信很多小伙伴都有听歌的习惯~今天我们就来学习怎么用Python来爬取音乐吧~~~首先打开音乐网站，找到想听的歌，打开播放页面在网页上右键点击检查，调出开发者工具，找到网络（Network）选项。然后刷新网页以上是其他多数博主的做法然后，你在右边一顿翻找，却根本找不到mp3......不要慌！教程来喽！首先在右下角的歌单里面随便找一首其他的歌播放~然后再重新点回来——————你就会惊喜的发现——m
每天五分钟深度学习pytorch：基于Pytorch搭建ResNet模型的残差块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 人工智能 ResNet 机器学习
残差块我们分析一下这个残差块，x经过两个卷积层得到F(x)，然后F(x)+x作为残差块的输出，此时就有一个问题，这个问题就是F(x)+x的维度问题，如果图片数据经过两个卷积层之后F(x)变小（height和weight变小）或者通道数发生了变化，那么此时F(x)是没有办法和x相加的，当然我们可以学习前面的GoogLeNet的方式，也就是说卷积之后的F(x)和x一样，大小不变，或者对x变道和F(x)
数据分析师的SQL到底应该掌握到什么程度流里流气李 sql mysql 数据库
最近有网站统计了“雇主最想要的技术技能”，其中SQL力压Java、Python等，排名第一，成为雇主们最喜爱的技能。SQL简直是数据岗位心照不宣的“宠儿”。随手翻开网上对于数据分析岗位的要求，我们就会发现，熟悉SQL是必须的任职要求。都知道做数据分析需要学习sql，但在学习的过程中还是不太清楚，应该掌握到什么程度。今天给大家讲一下作为数据分析师：不需要学习的部分、基础部分和进阶部分。首先我们先揭穿
chatgpt赋能python：Python如何制表符：让您的代码更整洁易读 boRRjxBZRf ChatGpt python chatgpt 开发语言计算机
Python如何制表符：让您的代码更整洁易读代码对于程序员来说是最基础的工具，但能否让人轻松地阅读代码才是更重要的。一种有效的方法是通过制表符来对齐代码，使代码更整洁易读。Python是一门使用缩进来表示一个代码块的编程语言，因此掌握Python中的制表符可以让您的代码变得更加整洁、易读。本文将介绍Python中如何使用制表符，让您的代码更加整洁易读。什么是制表符？制表符是一种空格字符，用于将文本
玩转python: 掌握Python数据结构之字典千益浅显易懂玩转python 数据结构 python 开发语言
字典（Dictionary）是Python中一种非常强大的数据结构，它以键值对（Key-ValuePair）的形式存储数据。字典的特点是快速查找、灵活存储和高效操作。想象一下字典就像一本电话簿：通过名字（键）可以快速找到对应的电话号码（值）。本文将带你深入理解字典的概念，并通过丰富的案例展示其实际应用。字典的常见方法以下是字典的20个常见方法及其功能的简要说明：方法名功能描述clear()移除字典
python 程序一次启动有两个进程的问题（flask）小郎碎碎念我恨BUG python flask 开发语言
0.背景写了一个使用flask作为服务框架的程序，发现每次启动程序的时候，使用ps都能观察到两个python进程。此外，这个程序占用了GPU资源，我发现有两个python进程，分别占用了完全相同的GPU显存1.原因问题出在flask的启动方式上，我启动的时候，是这样启动的app.run(debug=True,host='0.0.0.0',port=5000)查到的资料如下，Flask中的debug
Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）境心镜免训练深度学习人工智能 NAS
代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距，该范式系统地寻找最佳架构，给定客观标准，例如最大分类准确度。然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种
关于 Scapy 的详细介绍、安装指南、使用方法及配置说明程序员的世界你不懂效率工具提升百度新浪微博
一、Scapy简介Scapy是一个开源的Python库，专注于网络数据包的创建、嗅探、分析和注入。它支持几乎所有标准的网络协议（如IP、TCP、UDP、ICMP、ARP等），并提供灵活的扩展机制，可自定义协议字段或开发专用工具。核心特点：跨平台：支持Linux、Windows、macOS等操作系统。低层级操作：直接访问原始数据包的二进制格式。强大的过滤与分析：支持BPF表达式过滤数据包。脚本化：可
智能教育：DeepSeek在课堂管理中的应用与代码实现 Evaporator Core #DeepSeek快速入门系统架构设计师 Python开发经验 deepseek
课堂管理是教育领域的重要组成部分，它直接影响教学效果和学生的学习体验。随着人工智能技术的发展，DeepSeek正在通过其强大的算法和数据处理能力，推动课堂管理的智能化和高效化。本文将结合代码实现，深入探讨DeepSeek在课堂管理中的应用。一、智能课堂管理系统：从数据到实时监控智能课堂管理的核心在于通过实时监控学生的学习行为，提供及时的反馈和调整。DeepSeek通过深度学习算法，能够从课堂数据中
CCF-GESP Python一级考试全解析：网络协议+编程技能双突破奕澄羽邦 python 网络协议开发语言
第一章CCF-GESP考试全景透视1.1认证体系权威性中国计算机学会（CCF）主办的GESP编程能力等级认证，是国内首个面向青少年的编程能力标准化评估体系。Python一级考试作为入门级认证，主要考察考生对计算机基础逻辑、编程工具使用及网络基础概念的掌握程度，证书受教育部认可，为后续人工智能、大数据等领域学习奠定基石。1.2考试内容三维度编程语言：Python语法基础（变量、循环、条件判断）、函数
基于PyTorch的深度学习5——神经网络工具箱 Wis4e 深度学习 pytorch 神经网络
可以学习如下内容：•介绍神经网络核心组件。•如何构建一个神经网络。•详细介绍如何构建一个神经网络。•如何使用nn模块中Module及functional。•如何选择优化器。•动态修改学习率参数。5.1核心组件神经网络核心组件不多，把这些组件确定后，这个神经网络基本就确定了。这些核心组件包括：1)层：神经网络的基本结构，将输入张量转换为输出张量。2)模型：层构成的网络。3)损失函数：参数学习的目标函
python可應用在金融分析的那一個方面，如何部署在linux server上面。蠟筆小新工程師金融
Python在金融分析中應用廣泛，以下是幾個主要方面：###1.**數據處理與分析**-使用**Pandas**和**NumPy**等庫來處理和分析大規模數據集，進行清理、轉換和統計運算。-舉例：處理歷史市場數據，分析價格趨勢、交易量等。###2.**機器學習與預測**-使用**scikit-learn**、**TensorFlow**或**PyTorch**建立模型進行股票價格預測、信用風險評估
Deepseek可以通过多种方式帮助CAD加速工作蠟筆小新工程師 python 开发语言 seepdeek
自动化操作：通过Deepseek的AI能力，可以编写脚本来自动化重复性任务。例如，使用Python脚本调用DeepseekAPI，在CAD中实现自动化操作。插件开发：结合Deepseek进行二次开发，可以创建自定义的CAD插件。例如，使用Deepseek生成代码来实现特定功能，如自动生成图形。脚本制作：利用Deepseek与CAD结合，可以制作脚本来加速工作流程。例如，使用Deepseek生成的以
Python实战项目（‌Hands-on Python Project） Linux运维老纪无悔青春追梦绿意编程师Python python 开发语言 sql 运维开发云计算 mysql 数据库
Python实战项目奖本章总结了20个适合Python初学者的实战项目，这些项目涵盖了不同的主题和难度，能够帮助你巩固基础知识并提升编程技能。1.计算器创建一个简单的命令行计算器，支持基本的加、减、乘、除运算。2.猜数字游戏编写一个程序，让用户猜一个随机生成的数字，提供提示（如“太高了”或“太低了”）。3.待办事项列表实现一个命令行待办事项管理器，允许用户添加、删除和查看待办事项。4.文本文件分析
服务器python项目部署菜鸡6666 python 服务器开发语言
角色：root,其他用户应该也可以1.安装python3环境#如果是新机器，尽量执行，避免未知报错yum-yupdatepython-vyuminstallpython3python3-v2.使用virtualenvwrapper创建虚拟环境,并使用workon切换不同的虚拟环境#安装virtualenvwrapperpip3installvirtualenvwrapper-ihttps://mi
深度学习-Android-图片加载框架-Glide-(二)-切入源码层深入分析-Glide-缓存策略 2401_84123077 程序员 android glide 缓存
介绍在上一篇中，我们知道了Glide框架的最基本的执行流程，那么只知道基本执行流程，这显然是不够的，我们要深挖Glide框架的细节处理原理，比如缓存机制，图片处理等，这一篇我们就一起去探索Glide的缓存机制。Glide缓存机制可以说是设计的非常完美，考虑的非常周全，下面就以一张表格来说明下Glide缓存。缓存类型缓存代表说明活动缓存ActiveResources如果当前对应的图片资源是从内存缓存
【openAI库】Python语言openAI库详解：从入门到精通（从0到1手把手教程） ChatGPT-千鑫 Python基础人工智能 python 开发语言人工智能 gpt AIGC 机器学习
欢迎来到我的博客！很高兴能在这里与您相遇！首页：GPT-千鑫–热爱AI、热爱Python的天选打工人，活到老学到老！！！导航-人工智能系列：包含OpenAIAPIKey教程,50个Prompt指令,Midjourney生成攻略等更多教程…-常用开发工具：包含AI代码补全工具,Vscode-AI工具,IDERorPycharm-AI工具,获取OpenAIAPIKey的多种方式等更多教程…-VScod
【vLLM 教程】使用 TPU 安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href="https://v
python openai 关于会话管理问题（一）哦里哦里哦里给 AI 大语言模型实战 python ai
目录一、会话长度二、会话保持三、上下文窗口管理1、对话中token使用2、截断策略3、消息注释一、会话长度线程和消息表示助手和用户之间的会话会话。每个线程的消息限制为100,000条。一旦消息的大小超过了模型的上下文窗口，线程将尝试聪明地截断消息，然后再完全删除它认为最不重要的消息。二、会话保持thread=client.beta.threads.create(messages=[{"role":
python openai 通过Function Call 创建自动化任务哦里哦里哦里给 AI 大语言模型实战自动化运维
目录一、什么是FunctionCall（函数掉用）1.功能概述2.工作原理二、如何实现函数调用1、定义自己的get_weather函数2、给助手添加函数调用3、写好instrction，指导assistant去掉用你定义的方法。4、最后也是最重要的，捕获Assistant的FunctionCall三、常见问题四、应用场景一、什么是FunctionCall（函数掉用）OpenAIAssistant的
Python使用OpenAI的API（附大模型资源）闯江湖50年 python windows 开发语言 langchain 人工智能 llama
OpenAIAPIOpenAIAPI可以应用于几乎所有涉及生成自然语言、代码或图像的任务。提供了一系列不同能力级别的模型，适用于不同任务的，并且能够微调自己的自定义模型。OpenAIAPI参考：https://platform.openai.com/docs/api-reference安装OpenAI库或安装其他的开源大语言模型bash复制代码pipinstallopenai设置OpenAIAPI
构建一个完整的视觉Transformer（ViT）图像分类模型 VIT （vision transformer）图像分类 Jackie_AI transformer 分类深度学习
构建一个完整的视觉Transformer（ViT）图像分类模型VIT（visiontransformer）图像分类根据提供的截图内容，我们可以看到一个名为VitNet的视觉Transformer（VisionTransformer，简称ViT）网络架构的部分代码。下面我将提供完整的VitNet类以及相关的辅助函数和训练流程示例代码。计算机视觉、图像处理、毕业辅导、作业帮助、代码获取，远程协助，代码
【PyQt5 应用程序】开启PyQt5入门之旅 Mr数据杨 Python 实用程序 qt pyqt 开发语言
在当今的软件开发领域，Python因其简洁的语法和强大的功能库而广受欢迎。PyQt是一个创建跨平台桌面应用程序的工具集，它允许开发者使用Python语言。通过结合Python的易用性和Qt的强大功能，PyQt让开发现代GUI应用变得既简单又有趣。本教程旨在为有志于学习如何使用PyQt开发桌面应用程序的开发者提供一个实用的起点。无论你是Python的初学者还是经验丰富的开发者，只要你对创建自己的GU
Python GUI测试实战：Selenium与PyQt的联合应用步入烟尘 Python超入门指南全册 python selenium pyqt
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
图像标注与OCR工具分析 winfredzhang ocr 框选裁剪标示位置遍历
图像标注和OCR（光学字符识别）工具的代码进行详细分析。该工具允许用户在图像上进行矩形标注，使用OCR对标注区域进行文本识别，并将结果保存为Excel文件。同时，用户可以保存和加载标注，清除标注，以及裁剪图像等。C:\pythoncode\new\scipgetpersoninfofromphoto.py项目简介这个图像标注和OCR工具的功能主要包括：加载图像并显示在界面上。允许用户在图像上绘制矩
Python pip查询需要更新的包安装并升级包的指令 Lucky-Hp python pip python anaconda
列出所有的包piplist列出所有的包和版本pipfreeze列出所有过期的库piplist--outdatedpip更新的命令pipinstall--upgrade库名升级pippipinstall--upgradepip或者pipinstall-Upip安装某个包pipinstallpackage-name安装指定版本的包：pipinstallmatplotlib==3.4.1卸载或者是更新包
给求职者的建议：软件工程师追寻向上 python java c语言软件工程
一、编程基础：构建核心能力语言选择与学习首推Python：语法简洁，适合入门。推荐书籍《Python编程：从入门到实践》，重点掌握列表推导、装饰器、文件操作。Java/C++进阶：理解内存管理（如JVM垃圾回收）、多线程编程（synchronized关键字）。推荐《Java核心技术卷Ⅰ》。辅助语言：JavaScript（必学）、Go或Rust（扩展视野）。数据结构与算法基础必刷：数组、链表、哈希表
PyScript 与 JavaScript Q shen javascript 开发语言 ecmascript
大家好。请不要将这篇文章视为神圣的真理。这是我个人的看法。JS如果您有超过两年的前端应用程序开发经验，您无疑已经知道一些尝试替换奇怪、丑陋的JavaScript的失败尝试。尽管已经尝试替代或避免使用JavaScript，但JS仍然是一个强大的对手！JavaScript在网络上无处不在。它是最常用的编程语言，97.7%的网站使用JavaScript作为客户端编程语言。脚本近年来，Python的使用大
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文