shaojie_wang

初探TVM--通过TVM的python接口编译优化resnet50

通过TVM的python接口编译优化resnet50

通过TVM的python接口编译优化resnet50
- 下载并加在onnx模型
- 下载和预处理图片
- 用relay接口编译模型
- 基于TVM运行时组件执行编译后的模型
- 基础优化的数据
- 后处理输出数据
- 用autoTVM调优模型
- 指定目标平台

通过TVM的python接口编译优化resnet50

在上一章的教程中¹，我们通过tvmc这个command line工具优化并且调优（tune）了一个预训练好的视觉模型–resnet50 v2. 不过tvm本身也有一套基于python的API，他们在优化深度学习模型的工作上提供了强大的灵活性。
在本章的教程中，我们会继续使用在tvmc教程中的背景，但是主要使用python API来完成任务，而不是使用TVMC工具。在本章节的教程中，我们会使用TVM的python API实现以下任务功能：

基于tvm运行时组件，编译一个预训练好的resnet 50 v2模型
通过编译过的模型，在一张真实图片上跑出运算结果
在CPU上对模型调优
编译基于调优过的模型
在真实图片上，运行调优过的模型，获取输出

本章节的目标是对tvm的使用场景有一个大体的理解，并且能够知道怎样使用tvm的python API来完成一个模型编译和优化的任务。

使用python API写脚本的话，首先会需要import很多必须的库，例如onnx、numpy等等。

import onnx
from tvm.contrib.download import download_testdata
from PIL import Image
import numpy as np
import tvm.relay as relay
import tvm
from tvm.contrib import graph_executor

下载并加在onnx模型

在本章节中，我们仍然使用resnet 50 v2，这是一个有50层卷积的图片分类模型。模型通过超过100万张图片和1000中不同分类做过预训练，需要输入的图片分辨率为224x224。由于之前内容对resnet50做过介绍，这里就不再多说了。
TVM封装了一个库可以用来下载预训练的模型，只需要提供模型地址，类型等信息，TVM可以有API来完成模型下载和保存。

model_url = "".join(
    [
        "https://github.com/onnx/models/raw/",
        "master/vision/classification/resnet/model/",
        "resnet50-v2-7.onnx",
    ]
)

model_path = download_testdata(model_url, "resnet50-v2-7.onnx", module="onnx")
onnx_model = onnx.load(model_path)

下载和预处理图片

和前面章节一样，我们还会再把这只可爱的小猫咪拉出来分类（写到这里，又想我们家提米了）。

下载和预处理的代码在下面啦：

img_url = "https://s3.amazonaws.com/model-server/inputs/kitten.jpg"
img_path = download_testdata(img_url, "imagenet_cat.png", module="data")

# Resize it to 224x224
resized_image = Image.open(img_path).resize((224, 224))
img_data = np.asarray(resized_image).astype("float32")

# Our input image is in HWC layout while ONNX expects CHW input, so convert the array
img_data = np.transpose(img_data, (2, 0, 1))

# Normalize according to the ImageNet input specification
imagenet_mean = np.array([0.485, 0.456, 0.406]).reshape((3, 1, 1))
imagenet_stddev = np.array([0.229, 0.224, 0.225]).reshape((3, 1, 1))
norm_img_data = (img_data / 255 - imagenet_mean) / imagenet_stddev

# Add the batch dimension, as we are expecting 4-dimensional input: NCHW.
img_data = np.expand_dims(norm_img_data, axis=0)

用relay接口编译模型

接下来我们就可以编译这个resnet50的模型了。首先使用relay的onnx模块导入，然后用标准优化流程编译，最后会创建出一个TVM的图运行时模块：

target = "llvm"
# The input name may vary across model types. You can use a tool
# like Netron to check input names
input_name = "data"
shape_dict = {input_name: img_data.shape}

mod, params = relay.frontend.from_onnx(onnx_model, shape_dict)

with tvm.transform.PassContext(opt_level=3):
    lib = relay.build(mod, target=target, params=params)

dev = tvm.device(str(target), 0)
module = graph_executor.GraphModule(lib["default"](dev))

如果能够在指定target时给出准确的平台信息，就能够获得更好的性能，因为TVM内部会利用平台特性，做出相应的优化策略，例如target = "llvm -mcpu=skylake" 或者 target="llvm -mcpu=skylake-avx512"，这样就可以利用X86的avx512指令集优化。

基于TVM运行时组件执行编译后的模型

在编译好模型后，就可以用tvm 运行时组件做推理运算了。

dtype = "float32"
module.set_input(input_name, img_data)
module.run()
output_shape = (1, 1000)
tvm_output = module.get_output(0, tvm.nd.empty(output_shape)).numpy()

不知道这里换成float16会不会也可以

基础优化的数据

在调优模型之前，我们先看一下基础的模型的优化数据。为了是测试准确，我们多次运行模型，计算平均计算时间。

import timeit

timing_number = 10
timing_repeat = 10
unoptimized = (
    np.array(timeit.Timer(lambda: module.run()).repeat(repeat=timing_repeat, number=timing_number))
    * 1000
    / timing_number
)
unoptimized = {
    "mean": np.mean(unoptimized),
    "median": np.median(unoptimized),
    "std": np.std(unoptimized),
}

print(unoptimized)

在我用的机器上面，耗时：

{'mean': 22.72307151928544, 'median': 22.025499097071588, 'std': 1.3807440805647897}

后处理输出数据

与之前的方式一样，我们用model zoo里面的结果内容对模型输出做个后处理：

from scipy.special import softmax

# Download a list of labels
labels_url = "https://s3.amazonaws.com/onnx-model-zoo/synset.txt"
labels_path = download_testdata(labels_url, "synset.txt", module="data")

with open(labels_path, "r") as f:
    labels = [l.rstrip() for l in f]

# Open the output and read the output tensor
scores = softmax(tvm_output)
scores = np.squeeze(scores)
ranks = np.argsort(scores)[::-1]
for rank in ranks[0:5]:
    print("class='%s' with probability=%f" % (labels[rank], scores[rank]))

可以得到如下结果：

class='n02123045 tabby, tabby cat' with probability=0.610552
class='n02123159 tiger cat' with probability=0.367179
class='n02124075 Egyptian cat' with probability=0.019365
class='n02129604 tiger, Panthera tigris' with probability=0.001273
class='n04040759 radiator' with probability=0.000261

用autoTVM调优模型

与上一章节类似，我们可以使用autoTVM模块对模型调优，与之不同得是，这次使用python API来完成调优。

import tvm.auto_scheduler as auto_scheduler
from tvm.autotvm.tuner import XGBTuner
from tvm import autotvm

number = 10
repeat = 1
min_repeat_ms = 0  # since we're tuning on a CPU, can be set to 0
timeout = 10  # in seconds

# create a TVM runner
runner = autotvm.LocalRunner(
    number=number,
    repeat=repeat,
    timeout=timeout,
    min_repeat_ms=min_repeat_ms,
    enable_cpu_cache_flush=True,
)

tuning_option = {
    "tuner": "xgb",
    "trials": 10,
    "early_stopping": 100,
    "measure_option": autotvm.measure_option(
        builder=autotvm.LocalBuilder(build_func="default"), runner=runner
    ),
    "tuning_records": "resnet-50-v2-autotuning.json",
}

# begin by extracting the tasks from the onnx model
tasks = autotvm.task.extract_from_program(mod["main"], target=target, params=params)

# Tune the extracted tasks sequentially.
for i, task in enumerate(tasks):
    prefix = "[Task %2d/%2d] " % (i + 1, len(tasks))
    tuner_obj = XGBTuner(task, loss_type="rank")
    tuner_obj.tune(
        n_trial=min(tuning_option["trials"], len(task.config_space)),
        early_stopping=tuning_option["early_stopping"],
        measure_option=tuning_option["measure_option"],
        callbacks=[
            autotvm.callback.progress_bar(tuning_option["trials"], prefix=prefix),
            autotvm.callback.log_to_file(tuning_option["tuning_records"]),
        ],
    )

通过tuning 我们可以看到一步步调优的结果：

[Task  1/25]  Current/Best:  165.26/ 216.09 GFLOPS | Progress: (10/10) | 4.50 s Done.
[Task  2/25]  Current/Best:  150.98/ 192.87 GFLOPS | Progress: (10/10) | 3.50 s Done.
[Task  3/25]  Current/Best:  168.08/ 249.73 GFLOPS | Progress: (10/10) | 5.44 s Done.
[Task  4/25]  Current/Best:   95.23/ 196.60 GFLOPS | Progress: (10/10) | 7.79 s Done.
[Task  5/25]  Current/Best:  207.23/ 262.81 GFLOPS | Progress: (10/10) | 4.27 s Done.
[Task  6/25]  Current/Best:  132.89/ 550.37 GFLOPS | Progress: (10/10) | 7.08 s Done.
[Task  7/25]  Current/Best:  261.82/ 284.37 GFLOPS | Progress: (10/10) | 3.83 s Done.
[Task  8/25]  Current/Best:  257.41/ 433.27 GFLOPS | Progress: (10/10) | 3.97 s Done.
[Task  9/25]  Current/Best:  176.71/ 211.27 GFLOPS | Progress: (10/10) | 10.51 s Done.
[Task 10/25]  Current/Best:  128.45/ 311.06 GFLOPS | Progress: (10/10) | 3.42 s Done.
[Task 11/25]  Current/Best:  211.18/ 284.83 GFLOPS | Progress: (10/10) | 3.99 s Done.
[Task 12/25]  Current/Best:  165.26/ 325.64 GFLOPS | Progress: (10/10) | 9.99 s Done.
[Task 13/25]  Current/Best:  261.55/ 328.09 GFLOPS | Progress: (10/10) | 5.42 s Done.
[Task 14/25]  Current/Best:  242.21/ 289.98 GFLOPS | Progress: (10/10) | 9.33 s Done.
[Task 15/25]  Current/Best:  231.47/ 241.25 GFLOPS | Progress: (10/10) | 9.91 s Done.
[Task 16/25]  Current/Best:  271.65/ 271.65 GFLOPS | Progress: (10/10) | 3.84 s Done.
[Task 17/25]  Current/Best:  245.57/ 245.57 GFLOPS | Progress: (10/10) | 4.32 s Done.
[Task 18/25]  Current/Best:  292.00/ 381.25 GFLOPS | Progress: (10/10) | 4.28 s Done.
[Task 19/25]  Current/Best:   79.44/ 441.70 GFLOPS | Progress: (10/10) | 4.42 s Done.
[Task 20/25]  Current/Best:  516.32/ 541.19 GFLOPS | Progress: (10/10) | 13.30 s Done.
[Task 21/25]  Current/Best:  414.80/ 449.63 GFLOPS | Progress: (10/10) | 4.99 s Done.
[Task 22/25]  Current/Best:   16.18/ 490.37 GFLOPS | Progress: (10/10) | 5.87 s Done.
[Task 23/25]  Current/Best:  443.06/ 573.66 GFLOPS | Progress: (10/10) | 4.92 s Done.
[Task 24/25]  Current/Best:    5.43/  80.01 GFLOPS | Progress: (10/10) | 13.03 s Done.
[Task 25/25]  Current/Best:   19.45/  24.78 GFLOPS | Progress: (10/10) | 13.21 s Done.

获取到tuning的param后，需要依据log，重新编译模型模型，再次运行并测试耗时：

with autotvm.apply_history_best(tuning_option["tuning_records"]):
    with tvm.transform.PassContext(opt_level=3, config={}):
        lib = relay.build(mod, target=target, params=params)

dev = tvm.device(str(target), 0)
module = graph_executor.GraphModule(lib["default"](dev))

dtype = "float32"
module.set_input(input_name, img_data)
module.run()
output_shape = (1, 1000)
tvm_output = module.get_output(0, tvm.nd.empty(output_shape)).numpy()

scores = softmax(tvm_output)
scores = np.squeeze(scores)
ranks = np.argsort(scores)[::-1]
for rank in ranks[0:5]:
    print("class='%s' with probability=%f" % (labels[rank], scores[rank]))

测试调优后的耗时：

import timeit

timing_number = 10
timing_repeat = 10
optimized = (
    np.array(timeit.Timer(lambda: module.run()).repeat(repeat=timing_repeat, number=timing_number))
    * 1000
    / timing_number
)
optimized = {"mean": np.mean(optimized), "median": np.median(optimized), "std": np.std(optimized)}


print("optimized: %s" % (optimized))
print("unoptimized: %s" % (unoptimized))

能够得到如下结果：

optimized: {'mean': 24.068975364789367, 'median': 23.36287514772266, 'std': 1.595523633701862}
unoptimized: {'mean': 22.72307151928544, 'median': 22.025499097071588, 'std': 1.3807440805647897}

tune过之后比之前还慢，猜测可能是tuning的次数太少，甚至没有搜索到tune之前的参数就结束了，加大些tune的步骤先试试：

#small change of tuning option:
tuning_option = {
    "tuner": "xgb",
    "trials": 1000,
    "early_stopping": 1000,
    "measure_option": autotvm.measure_option(
        builder=autotvm.LocalBuilder(build_func="default"), runner=runner
    ),
    "tuning_records": "resnet-50-v2-autotuning.json",
}

果然快了一些，但是不多。。。

optimized: {'mean': 17.606267603114247, 'median': 17.284288653172553, 'std': 0.6380016394113105}
unoptimized: {'mean': 23.359683020971715, 'median': 22.71405295468867, 'std': 1.538688442981107}

指定目标平台

来个重点吧
tuning这个东西，跟编译出来的code object关系很大，如果能够指定一个CPU来编译的话，真的效果很好，可能llvm里面会有很多相关的pass吧。下面我就把target改成我的目标机器。
首先查看一下自己的目标机器：

llc-12 --version

会输出下面一段儿东西：

LLVM (http://llvm.org/):
  LLVM version 12.0.0
  
  Optimized build.
  Default target: x86_64-pc-linux-gnu
  Host CPU: znver2

  Registered Targets:
    aarch64    - AArch64 (little endian)
    aarch64_32 - AArch64 (little endian ILP32)
    ...

重点就是：Host CPU: znver2。然后改target：

target = "llvm -mcpu=znver2"

重新优化编译过，果然快了非常多：

optimized: {'mean': 9.935215310179046, 'median': 9.931096900618286, 'std': 0.04295490942983339}

质变啊，xdm。

使用TVMC优化resnet50【1】【2】 ↩︎

c语言do循环函数,C语言do-while循环张景淇 c语言do循环函数
本篇文章帮大家学习c语言do-while循环，包含了C语言do-while循环使用方法、操作技巧、实例演示和注意事项，有一定的学习价值，大家可以用来参考。要执行程序或代码的一部分几次或多次，我们可以使用C语言的do-while循环。在do和while之间给出的代码将被执行，直到条件(condition)成为true。在do-while循环中，语句在条件之前给出，所以语句或代码将至少有一次执行。换句
图像配准的方法 wangtaohappy
迄今为止，在国内外的图像处理研究领域，已经报道了相当多的图像配准研究工作，产生了不少图像配准方法。总的来说，各种方法都是面向一定范围的应用领域，也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配，依据其完成的主要功能而被称为目标检测与定位，根据其所采用的算法称之为图像相关等等。图像配准的方式可以概括为相对配准和绝对配准两种：相对配准是指选择多图像中的一张图像作为参考图像，将其
简单工厂模式、工厂方法模式和抽象工厂模式-设计模式学习 luoxn28 读书笔记简单工厂工厂方法抽象工厂
1、简单工厂模式简单工厂模式是属于创建型模式，又叫做静态工厂方法（StaticFactoryMethod）模式，但不属于23种GOF设计模式之一。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。工厂（Creator）角色简单工厂模式的核心，它负责实现创建所有实例的内部逻辑。工厂类的创建产品类的方法可以被
软件综合实习课程设计报告--学生选课管理系统（python）小李独爱秋课程设计大数据 python
1问题的提出（绪论）1.1课题设计的目的学生选课管理系统的设计目的是为了简化和优化高校学生选课的流程。通过信息化手段，帮助学生更便捷地选择课程，减少传统手工选课的繁琐步骤，提高选课效率和准确性。同时，该系统还旨在提供一个平台，供教务管理部门有效管理和监控选课情况，确保教学资源合理配置，满足学生的学习需求。1.2课题设计的意义1.提升效率：通过自动化系统，学生可以在线查看课程信息和安排，快速完成选课
Python中IO流与File对象 qq_45920294 python python
IO流：什么叫做IOstream（inputoutputstream）：输入输出流指的就是内存数据的读入和写出！！！！广义上来说，IO流指的就是数据到磁盘、到另一电脑间（socket）的都可以被称为IO流狭义上来说，IO流一般指的就是内存和磁盘之间的数据交互python的IO流操作和C语言的非常的像，所以操作非常简单IO的分类：数据流动的方向：|--输入流read读取inputstream|--输
Did you forget to `#include ＜pybind11/stl.h＞`? Or ＜pybind11/complex.h＞,＜pybind11/functional.h＞沉迷单车的追风少年深度学习-计算机视觉深度学习 python pytorch
项目场景：基于深度学习的三维点云可视化问题描述：Traceback(mostrecentcalllast):File".\draw_npy.py",line25,ino3d.visualization.draw_geometries([pcd.points])TypeError:draw_geometries():incompatiblefunctionarguments.Thefollowing
python_文件IO与内存IO Oayia python 软测 python 开发语言 linux
目录一、文件操作1、文件常见操作2、os.path.realpath()、os.path.getcwd()、os.path.abspath()的区别3、文件读写4、seek、tell5、shutil模块6、输⼊⽂件的名字，然后程序⾃动完成对⽂件进⾏备份7、批量修改文件名二、内存IO1、StringIO2、文件IO、StringIO同时使用3、BytesIO4、文件IO、BytesIO同时使用一、文
即插即用的注意力机制21种 @Mr_LiuYang 论文阅读 AttentionModule 注意力机制即插即用
提示：谬误之处请指出更正摘要随着深度学习特别是自然语言处理领域的飞速发展，注意力机制（AttentionMechanism）已成为提升模型表现的关键技术，本文主要记录了即插即用的注意力机制结构的功能、出处及核心代码。1、SEBlock(Squeeze-and-Excitation)功能：自适应学习通道权重，增强重要通道特征。出处：SENet#SEBlock(PyTorch)classSEBlock
异配图对比学习24整理 mumukehao 异配图对比学习对比学习异配图
数据集介绍：大类数据集名称pyg‘cora’，‘citeseer’，‘pubmed’，‘cornell’，‘texas’，wisconsin’,flickr,reddit,actoryandexchameleon_filtered,squirrel_filtered,roman_empire,amazon_ratings,minesweeper,tolokers,questionslinkx‘ar
AI写代码工具赋能前端开发：提升开发者解决问题能力 bd_ming 人工智能前端
近年来，人工智能（AI）技术在各个领域都取得了显著进展，前端开发领域也不例外。AI的快速发展为前端开发者带来了前所未有的机遇，同时也带来了新的挑战。开发者需要不断学习新的技术和工具，以适应快速变化的开发环境。而AI写代码工具的出现，为开发者提升解决问题的能力提供了强有力的支持。本文将探讨AI前端开发工具如何帮助开发者更高效地解决问题，并以ScriptEcho为例进行说明。……传统的Web前端开发工
Python文件操作与面向对象午觉千万别睡过 Python python
文件操作文件操作open函数open(file,model,encoding)上述函数中:file:待操作文件路径model:打开文件的格式,程序默认是rmodel:r(读)w（写）wb（书写字节文件）rb(读取字节文件)a(追加写入)(所有这些字母的后面加上一个+则表示即可读又可写)encoding:gbk\utf-8说明：a表示追加写入，追加写入的意思是不会覆盖掉原有的内容。如果model对应
Python 文件&目录操作杨涣群 python
1|文件I/O普通文件，有时也称为平面文件（flatfile），是最简单的持久化形式。将文件内容读入内存，再将内存中的内容写入文件，标准库os提供了许多系统函数，Python文件操作像Unix1-1|基本操作open(filename,mode)打开文件，目标文件不存在，则创建文件mode的第一个字符指定了操作r表示读取。w表示写入。如果文件不存在，则创建文件；如果同名文件存在，就覆盖该文件。x表
【GESP】C++一级真题 luogu-B4035，美丽数字 CoderCodingNo GESP c++算法开发语言
2024年GESP一级真题，循环应用的问题。题目题解详见：https://www.coderli.com/gesp-1-luogu-b4035/【GESP】C++一级真题luogu-B4035，美丽数字|OneCoder2024年GESP一级真题，循环应用的问题。https://www.coderli.com/gesp-1-luogu-b4035/C++GESP专项交流频道：GESP学习交流频道加
解决ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the ‘ssl‘ module is compiled 问题兮城以空825 pip requests库 urllib3 v2.0版本
PyCharm解决urllib3v2.0问题，库的安装1.打开File-settings2.找到project：文件名--PythonInterpreter3.-号卸载原urllib3v2.0，以上图片是我已经卸载重新安装好的4.+号安装需要版本urllib35.库的安装也同上述操作
每日一题之（多态）三学习java 座山雕~ 学习 java
重要的几句话：（1）一个对象的编译类型和运行类型可以不一致如：Dog类是Anlimal的子类，Animalanimal=newDog();（2）编译类型在定义对象时，就确定了，不能改变。如：一旦创建，Animal就是编译类型，不会在改变Animalanimal=newDog();（3）运行类型是可以改变的如：此时，编译类型仍然是Animal，运行类型就从Dog变成Cat。Animalanimal=
Python 文件&对象&IO 赤胜骄阳 python python java 前端
Python文件&对象&IO基本的I/O函数打印到屏幕读取键盘输入打开和关闭文件open函数File对象的属性close()方法write()方法read()方法文件定位重命名和删除文件rename()方法remove()方法Python里的目录：mkdir()方法chdir()方法rmdir()方法文件、目录相关的方法基本的I/O函数打印到屏幕最简单的输出方法是用print语句，你可以给它传递零
网关类设备技术演进思路看兵马俑的程序员网闸安全
1.新技术采纳5G和物联网技术：支持更快的数据传输和更多连接。人工智能（AI）和机器学习：用于数据分析、用户行为预测和自动化决策。边缘计算：在设备端进行数据处理，减少对云服务的依赖，提高响应速度。区块链技术：用于确保数据安全和网络安全。2.安全性和隐私数据加密和隐私保护：采用最新的加密技术保护数据传输和存储。身份验证和访问控制：强化用户身份验证，确保只有授权用户可以访问网关。固件和软件安全更新：支
使用Python实现数组数据转换为Excel表格嘿何i python excel pandas 开发语言
在数据分析和处理中，将Python中的数组或列表数据转换为Excel表格是一项常见的任务。本文将详细介绍如何使用Python编程语言和相关库，实现从数组数据到Excel表格的转换过程，包括必要的步骤、代码示例以及实际应用中的注意事项。引言：数组数据到Excel的转换需求在数据科学和工程中，我们经常需要将Python中的数据转换为Excel格式，以便于数据的可视化、共享和进一步分析。Python提供
检测加密货币挖矿活动的异常端口扫地僧009 大数据安全分析深度学习机器学习安全
以下是基于DeepSeek架构思想实现的服务器异常端口检测案例与代码示例。我们以检测加密货币挖矿活动的异常端口为例，使用无监督学习（自编码器）实现动态基线建模。案例背景某云服务器出现异常流量：正常端口：80(HTTP),443(HTTPS),22(SSH)异常端口：6666（检测到高频TCP长连接，疑似门罗币挖矿流量）目标：通过自编码器学习正常端口行为模式，自动标记6666端口的异常活动。代码实现
用python爬网站评论_python爬取携程景点评论信息 weixin_39654352 用python爬网站评论
今天要分析的网站是携程网，获取景点的用户评论，评论信息通过json返回API，页面是这个样子的按下F12之后，F5刷新一下具体需要URLRequest的方式为POST，还需要你提取的哪一页，下面图片显示了页面id，景点id(viewid),pagenum页面数，pagesize页面的项数等等。最基本的GET请求可以直接用post方法response=requests.post("http://ww
python～http的请求参数中携带map ~kiss~ python python http 开发语言
背景调试httpGET请求的map参数，链路携带参数一直有问题，最终采用如下方式携带map解决user={"demo":"true","info":"王者"}urlencode之后的效果如下所示user=%7B%22demo%22:%22true%22,%22info%22:%22%E7%8E%8B%E8%80%85%22%7D最终http的url如下：http://www.demo.com?us
面试技巧|软件测试面试题八股文-数据库题库 sszmvb1234 软件测试面试软件测试面试题面试数据库职场和发展软件测试
本期主要是一些原理性和实践类问题，如果你有使用数据库的相关经历，面试官大概率会深入问下面这些问题，回答上来是加分项！小编提醒：理解第一，不要死记硬背哈！可以根据面试题来展开学习相关知识点，会让你进步得更快。关系型数据库和非关系型数据库的区别？关系型数据库以表格形式存储数据，遵循严格规则，便于处理结构化数据的复杂查询；非关系型数据库更灵活，适于存储半结构化和非结构化数据，例如文档、图像。扩展问题-关
python 自动化将日志添加至测试工程中小赖同学啊自动化测试(app pc API)
通往罗马道路千万条，爱干自己才最强。来来来同志们走起！！！让测试工程看起来比较完善于是向里添加了日志，百度一大堆那么我就厉害了没有选择那么怎么添呢！！？importloggingclassloginmanger():defconsel_out(s
【Spring】学习笔记3——Spring常用注解详解白衣染霜陈 ——【Spring】Spring Spring注解 Spring AOP IOC
你只管努力，——剩下的交给时光。常用的spring注解有如下几种：标红为常用的几种，建议深刻理解使用最好动手敲一敲@Controller@Service@Autowired@RequestMapping@RequestParam@ModelAttribute@Cacheable@CacheFlush@Resource@PostConstruct@PreDestroy@Repository@Comp
程序员初识宏观经济学猿脑2.0 python
这是宏观经济学学习、核心内容概括、数据资源及实际作用的系统性总结：一、宏观经济学学习框架1.核心知识模块模块关键内容基础理论-国民收入核算（GDP、GNP）-总需求与总供给模型（AD-AS）-IS-LM模型与货币政策传导经济增长-索洛增长模型-内生增长理论（知识、技术的作用）-中国经济增长模式与挑战经济周期-经济波动的原因（需求冲击、供给冲击）-实际经济周期（RBC）与新凯恩斯主义理论失业与通胀-
程序员读点微观经济学猿脑2.0 python
微观经济学学习路径、核心内容、数据来源、实际作用及案例实践的系统性总结：一、微观经济学学习框架1.核心知识模块模块关键内容基础理论-供需理论（均衡价格、弹性分析）-消费者行为（效用最大化、无差异曲线）-生产者行为（成本曲线、利润最大化）市场结构-完全竞争市场-垄断与寡头（价格歧视、博弈论）-垄断竞争（产品差异化）市场失灵与政策-外部性（污染、补贴）-公共物品与搭便车问题-信息不对称（逆向选择、道德
蓝桥杯学习笔记04-滑动窗口不定长（最短/最小） Ares^o^ 学习笔记
题目来源分享丨【题单】滑动窗口与双指针（定长/不定长/单序列/双序列/三指针/分组循环）-力扣（LeetCode）209.长度最小的子数组-力扣（LeetCode）题目要求大于等于classSolution{public:intminSubArrayLen(inttarget,vector&nums){intn=nums.size();intleft=0,right=0;intminiLen=n+
Java学习笔记——单元测试，面试必备 m0_64867152 程序员面试 java 后端
assertEquals(“这是错误信息2”,12,m.getArea(3,4));}}@Test注解的方法每个@Test对应一个方法，这个方法会被识别为一个测试方法一个测试类里面可以有多个@Test，但是每个@Test对应的测试方法只会被执行一次通常我们会在@Test测试方法中使用assertEquals断言语句，来判断方法是否能够正常运行并且输出我们希望的结果assertEquals（“错误信
OKHttp 3.10源码解析（四）：连接机制十月开源框架 Android
OKhttp的底层用的是Socket连接而不是URLConnection，所以整体来说还是比较复杂的，涉及到Http协议的封装和解封装、TLS/SSL安全协议的封装、Http2的封装等等，但还是非常值得我们去学习一下的，本篇文章不会对这些底层原理有详细的解析，但读完之后至少大概知道Http请求的底层是如何实现的一.HTTP请求的优化1.keep-alive机制我们知道，一个HTTP的请求需要经过三
RadASM环境，win32汇编入门教程之十一一品人家 win32汇编编程入门系列教程汇编
;运行效果;RadASM环境，win32汇编入门教程之十一;在上一个教程里，我们学习了如何利用资源编辑器创建对话框，并把对话框载入主程序，但是它只是显示出来，没有什么功能;那么，在这个教程里，我们通过单击按钮，了解其消息机制的内涵。这个很重要，是窗口系统的核心理念;首先，我们把上一教程的代码复制过来，同时把改变的代码标示出来，然后来理解这些不同的代码;这些看起来很简单，但却要深入理解，其实并不简单
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 fred@myhost.com # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

初探TVM--通过TVM的python接口编译优化resnet50

通过TVM的python接口编译优化resnet50

通过TVM的python接口编译优化resnet50

下载并加在onnx模型

下载和预处理图片

用relay接口编译模型

基于TVM运行时组件执行编译后的模型

基础优化的数据

后处理输出数据

用autoTVM调优模型

指定目标平台

你可能感兴趣的:(tvm学习,python,深度学习,计算机视觉)