寻找永不遗憾

0基础学习地平线QAT量化感知训练

文章目录

1. 背景
2. 基础理论知识
3. 文件准备与程序运行
4. 代码详解
- 4.1 导入必要依赖
- 4.2 主函数
- 4.3 构建fx模式所需要的float_model
- 4.4 不同阶段模型的获取
- 4.5 定义常规模型训练与验证的函数
- 4.6 float与qat训练代码解读——float_model/qat_model
- 4.7 模型校准部分的代码解读——calib_model
- 4.8 定点模型评测精度代码解读——quantized_model
- 4.9 编译生成上板模型——script_model/model.hbm
5. 建议or吐槽

1. 背景

首先感谢一下地平线工具链用户手册和官方提供的示例，给了我很大的帮助，特别是代码的注释写了很多的知识点，超赞！要是注释能再详细点，就是超超赞了！下面开始正文。
以前从0开始学习过地平线的PTQ(后量化)方案，写了一些基础知识文章，后来发现地平线的用户手册关于PTQ方面其实挺完善的，东西很多很全，就没再想着写。
最近想着学QAT(量化感知训练)玩玩，大体看了一下地平线的用户手册，不说精度调优、性能调优之类比较复杂的，光一个QAT上手，就感觉对我这种小白不是很友好，比如我这种小白，捣鼓了好久，感觉在用户手册中很多基础概念都没写，不同模块之间的关联性也没有详细地介绍，直到我“精读”用户手册 4.2量化感知训练(QAT) ，发现了这么一句话，

懂了，没用过Pytorch的QAT，直接看手册学起来有点费劲才是正常滴！
那针对只使用过Pytorch在服务器上训练过一些分类、检测模型，没接触过QAT的小白，又不想读PyTorch官方文档，只想简单入个门，怎么办嘞？欢迎看看这篇文章，提供实操代码和运行步骤，如果文章对你有点作用的话，麻烦收藏+点个赞再走~

该文章参考自J5 OE1.1.52中对应的示例以及用户手册，为啥不是用的XJ3 OE，请看第5节吐槽部分

2. 基础理论知识

深度学习量化通常是指以int类型的数据代替浮点float类型的数据进行计算和存储，从而减小模型大小，降低带宽需求，理论上，INT8 量化，与常规的 FP32 模型相比，模型大小减少 4 倍，内存带宽需求减少 4 倍。
量化可以分为PTQ与QAT，

PTQ：Post-training Quantization，训练后量化，指浮点模型训练完成后，基于一些校准数据，直接通过工具自动进行模型量化的过程，相比QAT，PTQ更简单一些，这篇文章不介绍PTQ。
QAT：Quantization aware training，量化感知训练，指浮点模型训练完成后，在模型中插入伪量化节点再进行量化训练的过程，大体过程如下图所示，相比PTQ，QAT精度更有保障一些，这篇文章介绍QAT。

小白：图中伪量化节点FakeQuantize node是什么？有什么作用？

大黑：从命名看，就是假装量化呗，模拟将数据从float类型量化为int类型，主要作用于网络的权重和激活(节点输出，不是relu这种激活函数的意思)。在QAT中，通过使用伪量化节点，可以在训练期间优化模型以适应后续的真实量化操作，从而提高量化模型的准确性和性能。一旦模型训练完成后，伪量化节点将被替换为真实的量化操作，以生成最终的量化模型。

小白：插入伪量化节点后需要Retraining/Funetuning？感觉很浪费资源的样子…

大黑：通常再多训 1/10 浮点阶段训练的轮数就好了，比如浮点阶段训练了100epoch，QAT训个10epoch就好，为了精度，浪费就浪费点，小问题！

小白：从上面这个图看，感觉QAT还挺简单的，其实目前我就只会用pytorch搭一个卷积网络，然后去训练，那我要经历哪些阶段才能得到最终上板部署的模型呢？

大黑：整个过程会涉及到以下几个模型：

在每个阶段，还有一些需要注意的地方，比如…

小白：停停停，先别急，这里面新名词有点多，先帮我捋捋。float_model和我直接用pytorch搭建的有什么不同吗？fx是什么？calib是什么？qat_model和quantized_model还不是一个意思？script_model又是哪儿冒出来的？板端部署hbm模型我知道，就是可以在板子上推理的模型，类似于PTQ里的bin模型对吧？

大黑：这一连串问题问的挺好，我下面逐个简单解释一下。

float_model和我直接用pytorch搭建的有什么不同吗？
这里float_model浮点模型，其实就是在pytorch搭建的常规网络输入处插入QuantStub节点、输出处插入DeQuantstub节点，在PyTorch中，QuantStub/DequantStub 是一种用于量化的辅助工具，用于标记量化过程中需要量化/反量化的层或操作，前期浮点训练时可以当它不存在，在量化时会自动被替换为对应的量化操作。从普遍意义上说，每个分支都要对应插入QuantStub，别再追问为什么了，问就是甲鱼的臀部——“规定”。
fx是什么？
pytorch中量化方式有两种，分别是Eager Mode Quantization和FX Graph Mode Quantization，它俩各有优劣。对于初学者，Eager模式需要手工修改网络代码，并对很多节点进行替换，比较复杂，而 FX模式不需要这种操作，使用起来比较简单，因此，推荐使用fx模式。
关于fx与eager两种模式体现在地平线量化训练以及部署层面的差异，大家感兴趣的话，可参考地平线开发者社区专业介绍：QAT - 异构与非异构方案使用简介。
地平线同时支持fx和eager两种模式，fx模式体现在地平线封装的各种函数中，例如prepare_qat_fx()，就是在函数最后有fx字样。
calib是什么？
calib是校准calibration的缩写，主要作用是确定量化参数，我们知道，合理的初始量化参数能够显著提升模型精度并加快模型的收敛速度。calibration 就是在浮点模型中插入 Observer，使用少量训练数据，在模型 forward 过程中统计各处的数据分布，以确定合理的量化参数的过程。虽然不做 Calibration 也可以进行量化训练，但一般来说，它对量化训练有益无害，所以推荐大家将此步骤作为必选项。
qat_model和quantized_model还不是一个意思？
不一样的。
qat_model是一种插入了伪量化节点的伪量化模型，简单理解为：它是为了量化训练而存在的模型，里面还“流淌”着浮点的参数，伪量化节点在模拟量化而已。
quantized_model：模型中的浮点参数转换为定点参数，且把浮点算子转换成定点算子，这种转换后的模型称之为quantized_model /定点模型 / 量化模型。
script_model又是哪儿冒出来的？
scipt_model是一种可以序列化的Torch脚本（TorchScript），方便在不需要Python解释器的环境中使用模型，例如C++应用程序、移动端应用等。scipt_model的获取通过torch.jit.trace实现。torch.jit.trace是PyTorch中的一个静态图转换工具，用于将一个PyTorch模型转换成一个可以序列化的Torch脚本（TorchScript）。其工作流程是，首先使用输入张量对模型进行前向计算，然后将计算图转换为Torch脚本。在这个过程中，PyTorch会执行所有与输入相关的计算，从而记录下计算图的结构和参数的值。
以下是torch.jit.trace方法的基本语法：script_model = torch.jit.trace(model, example_inputs, optimize=True)，其中，model是待转换的PyTorch模型，并不一定需要是quantized_model，普通的也可以，这里是QAT场景，因此是quantized_model。example_inputs是一个输入张量或元组，用于为模型执行前向计算，并记录计算图的结构和参数的值。optimize是一个布尔值，用于指定是否对转换后的计算图进行优化。默认情况下，optimize为True，将对计算图进行常量折叠、运算融合等优化。
板端部署hbm模型我知道，就是可以在板子上推理的模型，类似于PTQ里的bin模型对吧？
非常对。

小白：这些模型是如何生成的？通过图中那几个函数？是地平线封装好的，直接用？
大黑：是的。

3. 文件准备与程序运行

一共就需要3个文件

(plugin) [xxx plugin_basic]$ tree -L 3
.
|-- data
|   |-- cifar-10-batches-py    					# cifar10数据集
|-- mobilenet_example_release_fx_only.py    	# 代码
|-- model
|   `-- mobilenetv2
|       |-- mobilenet_v2-b0353104.pth       	# 预训练权重

为了方便大家获取，以上文件均存放在网盘链接中：

链接：https://pan.baidu.com/s/1yJjjWEOB9rtHug77yA5mIw 
提取码：zdi5

代码运行，建议在地平线提供的docker里运行，当然，如果大家自己会配置本地环境的话，也可以不用docker，我两种都试了，都是ok的。

运行过程

# 生成float-checkpoint.ckpt
python3 mobilenet_example_release_fx_only.py --stage=float 
# 生成calib-checkpoint.ckpt   
python3 mobilenet_example_release_fx_only.py --stage=calib
# 生成qat-checkpoint.ckpt    
python3 mobilenet_example_release_fx_only.py --stage=qat
# 使用定点quantized model evaluate一次      
python3 mobilenet_example_release_fx_only.py --stage=int_infer    
# 编译生成model.hbm，并对script_model进行可视化
python3 mobilenet_example_release_fx_only.py --stage=compile

特别是在stage=compile，产出物有点多，在这儿具体介绍一下

模型名称	模型解读
int_model.pt	torch.jit.save(script_model, “int_model.pt”)生成的，指 torchscript 模型
model.pt	compile_model函数产出的中间产物，和int_model.pt是一回事，指 torchscript 模型
model.hbir	compile_model函数产出的中间产物，用于出现问题时提供给地平线技术支持分析，我们不需要关注
model.hbm	compile_model函数产出的最终产物，即板端可部署模型
xxx.html	perf_model函数的产物，一个html文件，里面提供一些编译器层面分析出的性能信息

运行完全程，所有文件如下图：

跑起来很简单，下面再和大家一起看看代码层面的情况。

4. 代码详解

该章节参考地平线用户手册：XJ3用户手册 4.2.3 快速上手、J5用户手册 4.2.3. 快速入门，由于XJ3 OE包中未提供对应示例，代码参考的是J5 OE ddk/samples/ai_toolchain/horizon_model_train_sample/plugin_basic/mobilenet_example_release.py，OE包中代码是fx模式和eager模式混合在一起的，为了防止大家搞混，我给拆开了，这里只放fx模式的例子，其实XJ3用户手册 4.2.3 快速上手、J5用户手册 4.2.3. 快速入门都有提供fx模式对应ipynb的代码，只是我不太习惯而已，大家可以根据自己偏好使用。

4.1 导入必要依赖

之所以写这一节，主要是希望大家可以从注释中，简单了解各个函数的作用，像torch、os这种导入就省略没写，全部的依赖可以看提供的代码。其中，horizon_plugin_pytorch是地平线基于 PyTorch 开发的的量化训练工具，可以理解成numpy这种库，里面有很多用于量化训练的的依赖，我们直接用就好了。

# 定义程序需要接收哪些命令行参数，以及这些参数的类型、默认值等信息。
import argparse     
# torch中的一个类，主要用于将量化操作的结果转换回浮点数，也就是对输出数据转换回浮点数
from torch.quantization import DeQuantStub
# 用CIFAR10数据集，简单快速
from torchvision.datasets import CIFAR10
# 导入两个类，用来当父类，目的是构建float_model。model_urls是一个字典
from torchvision.models.mobilenetv2 import (
    InvertedResidual,
    MobileNetV2,
    model_urls,
)      
# 从url中下载预训练权重
from torchvision._internally_replaced_utils import load_state_dict_from_url
# 硬件芯片架构，J5：bayes；XJ3：bernoulli2，具体可看源码
from horizon_plugin_pytorch.march import March, set_march       
from horizon_plugin_pytorch.quantization import (
    QuantStub,      # 类似于torch中的类QuantStub，用于将输入数据量化，使用plugin中的QuantStub是因为它支持通过参数手动固定 scale
    convert_fx,     # 将伪量化模型qat_model转换为定点模型quantized_model
    prepare_qat_fx, # 将float模型转成calib/qat模型，变动表现：进行一些conv+bn等算子融合
    set_fake_quantize,  # 用于设置qat/calib model 伪量化状态，内参包括FakeQuantState
    FakeQuantState,     # 用于设置伪量化状态，有FakeQuantState.QAT用于qat model train，FakeQuantState.VALIDATION用于qat/calib model eval，FakeQuantState.CALIBRATION用于 calib eval
    check_model,        # 用于检查模型是否可以被硬件支持，本例中输入是可序列化的script_model，并给出一些根据硬件对齐规则可以提升性能的建议
    compile_model,      # 用于编译生成可以上板的hbm模型
    perf_model,         # 用于推测模型耗时等信息
    visualize_model,    # 用于可视化算子优化替换后的模型结构
)
from horizon_plugin_pytorch.quantization.qconfig import (
    default_calib_8bit_fake_quant_qconfig,      # 校准时，模型总体伪量化节点的量化配置
    default_qat_8bit_fake_quant_qconfig,        # 量化训练时，模型总体伪量化节点的量化配置
    default_qat_out_8bit_fake_quant_qconfig,    # 模型输出的伪量化节点配置，用于配置输出conv节点高精度int32输出
    default_calib_out_8bit_fake_quant_qconfig,  # 和上一行是一个东西
)

4.2 主函数

看了第2节理论知识部分，主函数部分的代码就是严格执行那几个阶段stage(详见第2节)，很easy，关于内部细节，在后面几个小节挨个介绍。

def main(
    stage: str,
    data_path: str,
    model_path: str,
    train_batch_size: int,
    eval_batch_size: int,
    epoch_num: int,
    device_id: int = 0,
    quant_method: str = "fx",
    march: str = March.BAYES,
    compile_opt: int = 0,
):
    # 对应操作几个阶段的模型
    assert stage in ("float", "calib", "qat", "int_infer", "compile")
    assert quant_method in ("fx")

    device = torch.device(
        "cuda:{}".format(device_id) if device_id >= 0 else "cpu"
    )

    if not os.path.exists(model_path):
        os.makedirs(model_path, exist_ok=True)

    # 浮点训练阶段优化器
    def float_optim_config(model: nn.Module):
        # This is an example to illustrate the usage of QAT training tool, so
        # we do not fine tune the training hyper params to get optimized
        # float model accuracy.
        optimizer = torch.optim.Adam(model.parameters(), weight_decay=2e-4)

        return optimizer, None

    # qat训练阶段优化器
    def qat_optim_config(model: nn.Module):
        # QAT training is targeted at fine tuning model params to match the
        # numerical quantization, so the learning rate should not be too large.
        optimizer = torch.optim.SGD(
            model.parameters(), lr=0.0001, weight_decay=2e-4
        )

        return optimizer, None

    default_epoch_num = {
        "float": 20,     
        "qat": 2,       # 通常float训练epoch数量是qat训练epoch数量的10倍
    }

    if stage in ("float", "qat"):
        if epoch_num is None:
            epoch_num = default_epoch_num[stage]

        train(
            data_path,
            model_path,
            train_batch_size,
            eval_batch_size,
            epoch_num,
            device,
            float_optim_config if stage == "float" else qat_optim_config,
            stage,
            march,
            quant_method,
        )

    elif stage == "calib":
        calibrate(
            data_path,
            model_path,
            train_batch_size,
            eval_batch_size,
            device,
            march=march,
            quant_method=quant_method,
        )

    elif stage == "int_infer":
        int_infer(
            data_path,
            model_path,
            eval_batch_size,
            device,
            march=march,
            quant_method=quant_method,
        )

    else:
        compile(
            data_path,
            model_path,
            compile_opt,
            march=march,
            quant_method=quant_method,
        )

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Run mobilenet example.")
    parser.add_argument(
        "--stage",
        type=str,
        choices=("float", "calib", "qat", "int_infer", "compile"),
        help=(
            "Pipeline stage, must be executed in following order: "
            "float -> calib(optional) -> qat(optional) -> int_infer -> compile"
        ),
    )
    parser.add_argument(
        "--data_path",
        type=str,
        default="data",
        help="Path to the cifar-10 dataset",
    )
    parser.add_argument(
        "--model_path",
        type=str,
        default="model/mobilenetv2",
        help="Where to save the model and other results",
    )
    parser.add_argument(
        "--train_batch_size",
        type=int,
        default=256,
        help="Batch size for training",
    )
    parser.add_argument(
        "--eval_batch_size",
        type=int,
        default=256,
        help="Batch size for evaluation",
    )
    parser.add_argument(
        "--epoch_num",
        type=int,
        default=None,
        help=(
            "Rewrite the default training epoch number, pass 0 to skip "
            "training and only do evaluation (in stage 'float' or 'qat')"
        ),
    )
    parser.add_argument(
        "--device_id",
        type=int,
        default=2,
        help="Specify which device to use, pass a negative value to use cpu",
    )
    parser.add_argument(
        "--quant_method",
        type=str,
        choices=["fx"],
        default="fx",
        help=(
            "Specify fx mode quantization."
            " Please do not change quant method "
            "between different stages, or the model may fail to load"
        ),
    )
    parser.add_argument(
        "--opt",
        type=str,
        choices=["0", "1", "2", "3", "ddr", "fast", "balance"],
        default=0,
        help="Specity optimization level for compilation",
    )
    args = parser.parse_args()
    print(args)

    main(
        args.stage,
        args.data_path,
        args.model_path,
        args.train_batch_size,
        args.eval_batch_size,
        args.epoch_num,
        args.device_id,
        args.quant_method,
        compile_opt=args.opt,
    )

4.3 构建fx模式所需要的float_model

从torchvision.models中继承MobileNetV2，微调一下，以支持量化相关操作。模型改造必要的操作有：

在模型所有输入分支前插入 QuantStub
在模型所有输出分支后插入 DequantStub

这部分具体实现过程解读可见代码注释。

# ----------------------------------------------------------------------------#
# At first, we do necessary modify to the MobilenetV2 model from torchvision.
# For FX mode, we need to:
# 1. Insert QuantStub before first layer and DequantStub after last layer.
# Operation replacement and fusion will be carried out automatically (^_^).
# ----------------------------------------------------------------------------#
# 在PyTorch中，QuantStub/DequantStub 是一种用于量化的辅助工具，
# 用于标记量化过程中需要量化/反量化的层或操作，
# 前期浮点训练时当它不存在，在量化时会自动被替换为对应的量化操作
# ----------------------------------------------------------------------------#
# 从torchvision.models中继承MobileNetV2，微调一下
class FxQATReadyMobileNetV2(MobileNetV2):
    def __init__(
        self,
        num_classes: int = 10,      # 实例变量，使用self.来引用变量
        width_mult: float = 0.5,
        inverted_residual_setting: Optional[List[List[int]]] = None,
        round_nearest: int = 8,
    ):
        super().__init__(   # 类变量，使用类名来引用变量，如ClassName.variable_name
            num_classes, width_mult, inverted_residual_setting, round_nearest
        )
        # --------------------------------------------------------------------#
        # 简单理解，在模型首尾部包一层类似于量化反量化操作，每个输入分支都需要包一下
        # --------------------------------------------------------------------#
        # 地平线plugin中的QuantStub可以配置scale
        # 这里的scale=1/128是后面模型输入配置为pyramid必备的
        # pyramid是地平线的芯片上的一个硬件，数据输入可以从这儿来，也可以从DDR来
        # --------------------------------------------------------------------#
        self.quant = QuantStub(scale=1 / 128)   
        self.dequant = DeQuantStub()

    def forward(self, x: Tensor) -> Tensor:
        x = self.quant(x)
        x = super().forward(x)
        x = self.dequant(x)

        return x

关于如何加载预训练权重部分的代码在函数load_pretrain里，详细内容可以看Python文件，这里不再呈现。

def load_pretrain(model: nn.Module, model_path: str):
    state_dict = load_state_dict_from_url(
        model_urls["mobilenet_v2"], model_dir=model_path, progress=True
    )   # model_urls是一个字典，取里面mobilenet_v2的对应url，下载路径到model_dir，progress是下载进度条显示

4.4 不同阶段模型的获取

在代码运行时，有个输入参数stage必须配置，表示拿到哪个model去整后面的事，当stage参数传入(“float”, “calib”, “qat”, “int_infer”)中某一个时，会通过如下函数去获取，具体实现过程解读可见代码注释。

# --------------------------------------------------------------------------#
# Next, we define the model convert pipeline to generate model for each stage.
# --------------------------------------------------------------------------#
def get_model(
    stage: str,
    model_path: str,
    device: torch.device,
    march=March.BAYES,
    quant_method="fx",
) -> nn.Module:
    # 运行代码时，有个输入参数stage必须配置，表示拿到哪个model去整后面的事
    assert stage in ("float", "calib", "qat", "int_infer")
    assert quant_method in ("fx")

    model_kwargs = dict(num_classes=10, width_mult=1.0)
    float_model = FxQATReadyMobileNetV2(**model_kwargs).to(device)

    if stage == "float":
        # Load pretrained model (on ImageNet) to speed up float training.
        load_pretrain(float_model, model_path)

        return float_model      # float的时候，到这儿就退出了

    # 浮点训练完成后的权重
    float_ckpt_path = os.path.join(model_path, "float-checkpoint.ckpt")
    assert os.path.exists(float_ckpt_path)
    float_state_dict = torch.load(float_ckpt_path, map_location=device)

    # A global march indicating the target hardware version must be setted
    # before prepare qat.
    set_march(march)

    # Preserve a clean float_model for calibration and qat training.
    ori_float_model = float_model         
    float_model = copy.deepcopy(ori_float_model)

    float_model.load_state_dict(float_state_dict)
    # -----------------------------------------------------------#
    # The op fusion is included in `prepare_qat_fx`.
    # -----------------------------------------------------------#
    # Make sure the output model is on target device.
    # CAUTION: prepare_qat_fx and convert_fx do not guarantee the
    # output model is on the same device as input model.
    # ----------------------------------------------------------#

    # ----------------从float_model转成calib_model----------------#
    float_model.qconfig = default_calib_8bit_fake_quant_qconfig
    # ----------------------------------------------------------------------#
    #   不配置输出层的qconfig，其输出默认是int8输出
    #   尾部conv/linear，calib和qat配置为
    #   default_{calib/qat}_out_8bit_fake_quant_qconfig时，表示int32高精度输出
    # ----------------------------------------------------------------------#
    float_model.classifier.qconfig = (
        default_calib_out_8bit_fake_quant_qconfig
    )
    calib_model = prepare_qat_fx(float_model).to(device)

    # calib stage时，函数到这儿就会返回了
    if stage == "calib":
        return calib_model

    calib_ckpt_path = os.path.join(model_path, "calib-checkpoint.ckpt")
    assert os.path.exists(calib_ckpt_path)
    calib_state_dict = torch.load(calib_ckpt_path, map_location=device)

    # ---------------------------------------------#
    #   这一行是必须的，上面的float_model已经"变味"了
    # ---------------------------------------------#
    float_model = copy.deepcopy(ori_float_model)

    # 尾部conv/linear，qat配置为default_qat_out_***_qconfig时，可为int32高精度输出
    qat_model = prepare_qat_fx(
        float_model,        # 这儿必须是float_model，不能是calib_model，也不能是"变味"的float_model
        {
            "": default_qat_8bit_fake_quant_qconfig,
            "module_name": {
                "classifier": default_qat_out_8bit_fake_quant_qconfig,
            },
        },
    ).to(device)    # prepare_qat_fx 接口不保证输出模型的 device 和输入模型完全一致

    # qat_model加载的是calib_state_dict！！！
    qat_model.load_state_dict(calib_state_dict)

    if stage == "qat":    # qat阶段到这儿就退出了
        return qat_model

    qat_ckpt_path = os.path.join(model_path, "qat-checkpoint.ckpt")
    assert os.path.exists(qat_ckpt_path)
    qat_model.load_state_dict(torch.load(qat_ckpt_path, map_location=device))

    # 将模型转为定点状态
    # 通过参数转换把伪量化模型中的浮点参数转换成定点参数，
    # 并且把浮点算子转换成定点算子，该转换后的模型称为 Quantized 模型 / 定点模型 / 量化模型
    quantized_model = convert_fx(qat_model).to(device)

    return quantized_model    # int_infer阶段会到这儿才退出

4.5 定义常规模型训练与验证的函数

具体实现，看py代码就行，很常规。

# --------------------------------------------------------------------------#
# Next, we define dataloaders and other helper functions used in training
# and evaluation.
# --------------------------------------------------------------------------#

def prepare_data_loaders(
    data_path: str, train_batch_size: int, eval_batch_size: int
) -> Tuple[data.DataLoader, data.DataLoader]:


class AverageMeter(object):
    """Computes and stores the average and current value"""
    

def accuracy(output: Tensor, target: Tensor, topk=(1,)) -> List[Tensor]:
    """Computes the accuracy over the k top predictions for the specified values of k"""
    

def train_one_epoch(
    model: nn.Module,
    criterion: Callable,
    optimizer: torch.optim.Optimizer,
    scheduler: Optional[torch.optim.lr_scheduler._LRScheduler],
    data_loader: data.DataLoader,
    device: torch.device,
) -> None:


def evaluate(
    model: nn.Module, data_loader: data.DataLoader, device: torch.device
) -> Tuple[AverageMeter, AverageMeter]:

4.6 float与qat训练代码解读——float_model/qat_model

针对float_model和qat_model的参数训练，代码解读如下，

# --------------------------------------------------------------------------#
# Next, we define the main function for each stage.
# --------------------------------------------------------------------------#

# Float and qat share the same training procedure.
def train(
    data_path: str,
    model_path: str,
    train_batch_size: int,
    eval_batch_size: int,
    epoch_num: int,
    device: torch.device,
    optim_config: Callable,
    stage: str,
    march=March.BAYES,
    quant_method="fx",
):
    # --------------------------------------------#
    #   qat模型训练和普通浮点模型训练的不同之处！
    # --------------------------------------------#
    model = get_model(stage, model_path, device, march, quant_method)

    train_data_loader, eval_data_loader = prepare_data_loaders(
        data_path, train_batch_size, eval_batch_size
    )

    optimizer, scheduler = optim_config(model)

    best_acc = 0

    for nepoch in range(epoch_num):
        # Train/Eval state must be setted correctly
        # before `set_fake_quantize`
        model.train()
        # --------------------------------------------#
        #   qat模型训练和普通浮点模型训练的不同之处！
        # --------------------------------------------#
        if stage == "qat":
            set_fake_quantize(model, FakeQuantState.QAT)

        train_one_epoch(
            model,
            nn.CrossEntropyLoss(),
            optimizer,
            scheduler,
            train_data_loader,
            device,
        )

        model.eval()
        # --------------------------------------------#
        #   qat模型训练和普通浮点模型训练的不同之处！
        # --------------------------------------------#
        if stage == "qat":
            set_fake_quantize(model, FakeQuantState.VALIDATION)

        top1, top5 = evaluate(
            model,
            eval_data_loader,
            device,
        )
        print(
            "{} Epoch {}: evaluation Acc@1 {:.3f} Acc@5 {:.3f}".format(
                stage.capitalize(), nepoch, top1.avg, top5.avg
            )
        )

        if top1.avg > best_acc:
            best_acc = top1.avg

            torch.save(
                model.state_dict(),
                os.path.join(model_path, "{}-checkpoint.ckpt".format(stage)),
            )   # 可用于保存 float-checkpoint.ckpt 和 qat-checkpoint.ckpt

    # ----------------------------------------------#
    #   当传入epoch_num=0，用于qat eval
    # ----------------------------------------------#
    if nepoch == 0:
        model.eval()
        if stage == "qat":
            set_fake_quantize(model, FakeQuantState.VALIDATION)

        top1, top5 = evaluate(
            model,
            eval_data_loader,
            device,
        )
        print(
            "{} eval only: evaluation Acc@1 {:.3f} Acc@5 {:.3f}".format(
                stage.capitalize(), top1.avg, top5.avg
            )
        )   # stage.capitalize()表示将字符串首字母大写

    print("Best Acc@1 {:.3f}".format(best_acc))

    return model

4.7 模型校准部分的代码解读——calib_model

float模型训练完成后，需要进行参数校准，得到calib_model，如果calib_model精度满足要求，qat训练就不需要了，即使calib_model精度不行，calib_model_state_dict(校准后的权重)对qat训练收敛也非常有帮助。

def calibrate(
    data_path,
    model_path,
    calib_batch_size,
    eval_batch_size,
    device,
    num_examples=float("inf"),  # float("inf")表示无穷大，主要用于控制使用多少数据进行校准，默认使用所有数据集
    march=March.BAYES,
    quant_method="fx",
):
    calib_model = get_model("calib", model_path, device, march, quant_method)
    # Please note that calibration need the model in eval mode
    # to make BatchNorm act properly.
    calib_model.eval()  # 即使下面用的是train数据集，这儿也是eval
    # set CALIBRATION state will make FakeQuantize in training mode.
    set_fake_quantize(calib_model, FakeQuantState.CALIBRATION)

    train_data_loader, eval_data_loader = prepare_data_loaders(
        data_path, calib_batch_size, eval_batch_size
    )

    with torch.no_grad():
        cnt = 0
        for image, target in train_data_loader:
            image, target = image.to(device), target.to(device)
            calib_model(image)
            print(".", end="", flush=True)
            cnt += image.size(0)
            if cnt >= num_examples:     # 主要用于控制使用多少数据进行校准，默认使用所有数据集
                break
        print()

    # Must set eval mode again before validation, because
    # set CALIBRATION state will make FakeQuantize in training mode.
    calib_model.eval()  
    set_fake_quantize(calib_model, FakeQuantState.VALIDATION)

    top1, top5 = evaluate(
        calib_model,
        eval_data_loader,
        device,
    )
    print(
        "Calibration: evaluation Acc@1 {:.3f} Acc@5 {:.3f}".format(
            top1.avg, top5.avg
        )
    )

    torch.save(
        calib_model.state_dict(),
        os.path.join(model_path, "calib-checkpoint.ckpt"),
    )

    return calib_model

4.8 定点模型评测精度代码解读——quantized_model

定点模型/quantized模型/量化模型 eval推理一下看看精度

# 定点模型/quantized模型/量化模型 eval推理一下看看精度
def int_infer(
    data_path,
    model_path,
    eval_batch_size,
    device,
    march=March.BAYES,
    quant_method="fx",
):
    # 定点模型/quantized模型/量化模型
    quantized_model = get_model(
        "int_infer", model_path, device, march, quant_method
    )

    _, eval_data_loader = prepare_data_loaders(
        data_path, eval_batch_size, eval_batch_size
    )

    top1, top5 = evaluate(
        quantized_model,
        eval_data_loader,
        device,
    )
    print(
        "Quantized: evaluation Acc@1 {:.3f} Acc@5 {:.3f}".format(
            top1.avg, top5.avg
        )
    )

    return quantized_model

4.9 编译生成上板模型——script_model/model.hbm

编译生成上板模型model.hbm，同时针对script_model预估模型性能，并进行可视化

def compile(
    data_path,
    model_path,
    compile_opt=0,
    march=March.BAYES,
    quant_method="fx",
):
    # It is recommended to do compile on cpu, because associated interfaces
    # do not fully support cuda.
    device = torch.device("cpu")

    # 定点模型
    quantized_model = get_model(
        "int_infer", model_path, device, march, quant_method
    )

    # prepare_data_loaders(data_path: str, train_batch_size: int, eval_batch_size: int)
    _, eval_data_loader = prepare_data_loaders(data_path, 1, 1)

    # We can generate random input data (in proper shape) for
    # tracing and compiling and so on.
    # Use real data in `perf_model` will get more accurate perf result.
    example_input = next(iter(eval_data_loader))[0]     # Tensor

    # ------------------------------------------------------------------#
    #   torch.jit.trace是PyTorch中的一个静态图转换工具，
    #   用于将一个PyTorch模型转换成一个可以序列化的Torch脚本（TorchScript），
    #   以便在不需要Python解释器的环境中使用模型。
    #   model并不一定需要是quantized_model，普通的也可以，这里是QAT场景
    # ------------------------------------------------------------------#
    script_model = torch.jit.trace(quantized_model.cpu(), example_input)    # 单纯为了更保险，这儿再次加上.cpu()
    # 这个.pt结尾，就和手册中术语约定对上了：文档中的 pt 模型指 torchscript 模型
    torch.jit.save(script_model, os.path.join(model_path, "int_model.pt"))  

    check_model(script_model, [example_input], advice=1)

    compile_model(
        script_model,
        [example_input],
        hbm=os.path.join(model_path, "model.hbm"),
        input_source="pyramid",     # 上板时输入的数据来源，通常有ddr/resizer/pyramid，多输入时配置为字符串列表
        opt=compile_opt,
    )

    # hbdk预估模型性能，生成html文件，里面提供一些性能评测信息
    perf_model(
        script_model,
        [example_input],
        out_dir=os.path.join(model_path, "perf_out"),
        input_source="pyramid",
        opt=compile_opt,
        layer_details=True,     # html中会提供逐层算子耗时
    )

    # 可视化torchscript模型，也就是hbdk眼中的模型，会考虑到layout的变换、硬件对齐、算子融合、算子等效替换等情况
    visualize_model(
        script_model,
        [example_input],
        save_path=os.path.join(model_path, "model.svg"),
        show=False,
    )

    return script_model

5. 建议or吐槽

免责声明：纯纯吐槽，如有雷同，请勿当真！

提供用户手册、提供上手示例，很棒！只是说好的快速上手示例，能麻烦大佬们写的基础一点嘛~
一定要善于看源码，里面有函数的作用和使用方法的介绍，很有用！可惜我用vscode在docker里总是无法跳转，馋哭了，其实可以有个笨方法，如下图
初次上手的例子，建议和我们说一个最标准的流程就好了，像float_model到底选用origin_float_model更好还是FxQATReadyModel更好？calib这一步到底要不要？qat_model到底加载float_state_dict更合适还是calib_state_dict更合适？这些问题在我初次看代码时产生了一些疑惑~
X3的OE包里，能否像J5 OE包里一样提供plugin_basic的例子？要不是J5 OE包也对外释放了，都学不到这种好东西，偏心了啊！
J5 OE包里提供的plugin_basic例子，能否把fx和eager拆开成两个py文件？放到一起，刚开始学的时候总搞混…(当然，也可能是我水平问题)
用户手册中把快速上手部分全部可执行代码放出来，感觉还挺好的，适合我这种小白，当然，在OE包里还有一份全面的代码，感觉在手册里告诉我它在OE包里的位置，这样也可以接受。其实我想说：手册中更建议多放点需要跟着操作的步骤，或者理论介绍，或者代码多点注释，不是很理解为啥把全部log日志都贴出来了(4.2.3 快速上手)！输出日志部分，放点开头、结尾、关键部分说明意思就行，想看全部的话，我自己会去跑跑试一下的，难道手册有最低字数限制？
想让尾部conv以高精度int32输出，竟然配置的是default_qat_out_8bit_fake_quant_qconfig，大大问号脸？明明是out_8bit啊！后来咨询技术支持，原来这里的8bit是weight的量化方式为8bit。感觉这个命名有点容易造成误解，不知道能否修改为qat_out_int32_weight_8bit_fake_quant_qconfig？(反正都已经很长了…，哦在最新发的版本中已修改为default_qat_8bit_weight_32bit_act_fake_quant_qconfig，这里的act应该是activation的缩写，表示节点输出)
OE包中看着提供了很多例子，但例子之间又有很多共用的代码，造成非常多的嵌套，我就参考其中一个，还得下载整个OE包，不知道能否拆开例子，放到github或者gitee上，想参考哪个我就下载哪个多好！
能否给点从浮点训练到量化转换编译到上板部署(python/c++) 到可视化的全流程示例仓库，本来生态就不如英伟达，支持国产总得让我们用起来很顺溜才好吧！建议搞点全流程例子给我们！(理直气不壮)

都看到这儿了，如果对您有帮助的话，麻烦给点个赞呀~

你可能感兴趣的:(地平线开发板相关,QAT,量化感知训练,plugin)

佛山三水上户口亲子鉴定，三水上户口亲子鉴定机构推荐亲子DNA鉴定咨询中心
佛山三水上户口哪里做亲子鉴定？这里推荐2家正规机构！佛山三水区可以做上户亲子鉴定的机构在哪？佛山司法上户亲子鉴定咨询中心可以做咨询，佛山司法亲子鉴定价格约为2200-5000元。业务范围：上户口亲子鉴定，迁户亲子鉴定，孕期亲子鉴定、亲缘鉴定等亲子鉴定服务。佛山做亲子鉴定要多少钱？佛山的亲子鉴定费用在2200-4500元之间，具体费用取决于鉴定类型和相关因素。以下是三种常见的亲子鉴定类型及其价格明细
数据标注管理工具：AI燃料工厂的精益引擎花海如潮淹人工智能经验分享笔记
标注团队的三重灾难链1.质量波动的死亡螺旋某自动驾驶公司因漏标3%的障碍物边缘，导致感知模型误判引发事故（IEEE2024案例）。质检员发现标注员A的错误率超行业标准5倍，但传统抽检仅覆盖8%数据量（ScaleAI白皮书）。2.任务调度的纳什困境某医疗影像标注项目，肝脏分割任务积压2周，而简单分类任务空闲率达37%（Labelbox调度报告）。标注员平均28%时间浪费在任务切换（Appen生产力研
ChatGPT如何实现文字分类？精选案例和最佳实践山城程序员
ChatGPT是一种预训练语言模型，通常用于生成自然语言文本。但是，在将其应用于分类任务时，它也可以表现出色。本文将介绍如何使用ChatGPT实现文本分类，并提供实践步骤和示例代码。1.数据准备在进行文本分类之前，您需要选择一个合适的数据集并对其进行清理和预处理。确保您的数据集包含带有标签的文本数据。例如，您可能拥有一些产品评论，并且需要将它们分类为积极或消极。以下是一个示例代码，演示如何加载数据
YOLOv11轻量化方案的技术方案包，包含代码实现、对比图表和图文说明 zzywxc787 python 深度学习机器学习
以下为YOLOv11轻量化方案的技术方案包，包含代码实现、对比图表和图文说明：一、核心轻量化方案模型结构优化（代码示例）importtorchimporttorch.nnasnnclassEfficientConv(nn.Module):"""轻量化卷积模块"""def__init__(self,in_channels,out_channels,kernel_size=3,stride=1):su
看了这么多年电视机剧，电视机台具体是如何赚钱的？氧惠全网优惠
这个问题问得是相当的有水平，咱们要知道电视机台是如何赚钱的，首先我们要知道“收视率”是指什么？氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。古楼导师氧惠邀请码555888，注册送万元推广大礼包，教你如何1年做到百万团队。我整理了一份《最新1
【系统架构设计师】二十、云原生架构设计理论与实践② 帅次系统架构设计师(新版)云原生系统架构设计师 ios android 软考系统架构
目录五、云原生架构相关技术5.1容器技术5.2云原生微服务5.2.1微服务设计约束5.2.2主要微服务技术六、无服务器技术七、服务网格八、云原生架构案例分析8.1某旅行公司云原生改造8.2云原生技术助力某汽车公司数字化转型实践8.3某快递公司核心业务系统云原生改造8.4某电商业务云原生改造相关推荐五、云原生架构相关技术5.1容器技术容器作为标准化软件单元，它将应用及其所有依赖项打包，使应用不再受环
外卖优惠券在哪里领？外卖优惠券要如何领取? 氧惠评测
外卖优惠券的领取方式多种多样，以下是一些主要的领取途径：一、外卖平台APP内领取美团外卖：用户可以在美团外卖APP的首页或相关活动页面查找优惠券，点击领取即可。部分优惠券可能需要完成特定任务（如邀请好友、下单满额等）才能领取。美团外卖还经常推出节日活动、新用户专享等优惠活动，用户可以关注APP内的推送消息，及时领取优惠券。饿了么：饿了么APP同样会在首页或活动页面展示优惠券，用户可以直接点击领取。
unixbench系统性能测试 itas109 运维 unixbench 系统性能测试 cpu基准测试 cpu性能测试系统基准测试
unixbench系统性能测试环境：UnixBench:6.0.0(2025-05-21)简介UnixBench是一款经典的Unix/Linux系统性能测试工具，主要用于评估系统的CPU运算能力、内存性能、多线程处理能力以及部分系统调用（如进程创建、文件操作）的效率。UnixBench是开发板（如ARM架构的树莓派、RK3588等）评估CPU和系统整体性能的常用工具。2.编译和运行2.1获取Uni
猫头虎推荐｜用 AI 控制硬件设备的 MCP 工具：MCP2MQTT开源项目猫头虎猫头虎 AI 探索之路人工智能开源 AIGC gpt agi prompt AI编程
猫头虎推荐｜用AI控制硬件设备的MCP工具：MCP2MQTT开源项目MCP2MQTT是一款将物联网设备接入AI大模型的框架，它通过ModelContextProtocol（MCP）与MQTT协议的桥接，使得AI能够用自然语言实时感知并控制物理硬件。无论是机器人舵机控制，还是智能家居调光调色，你都可以借助MCP2MQTT快速原型、轻松上手。用自然语言控制硬件设备AI实时响应设备状态并调整物理参数让设
Android音视频探索之旅 | Webrtc 1对1音视频通话核心流程分析慢行的骑兵音视频 android 音视频 webrtc
一.前言使用Webrtc实现1对1的音视频通话，先从Web端进行学习要比直接从Android端进行学习要轻松许多（若没有JS和Html以及Node基础，查找相关基础教程，能梳理代码的逻辑即可）。本文Android端接入Webrtc是通过引入官方的sdk来实现的。本文涉及到的Demo代码包含三部分，服务器端、Web端、Android端。服务器端使用的是Node，Web使用的是Html和JS，Andr
深度解读：路由交换、负载均衡与防火墙的网络交响 xixixi77777 防火墙负载均衡路由交换
一、路由交换：网络流动的“大动脉”1.路由：决定命运的“路径规划师”路由技术如同现代交通网络中的导航系统，决定了数据从起点到终点的最佳路径。路由器基于网络层IP地址，对每个数据包进行精确的路径选择，并确保其在多层网络中实现无缝传输。其核心机制是通过路由协议，如OSPF、BGP等，动态计算网络拓扑的最佳路径。OSPF（开放最短路径优先）：内部网关协议，通过链路状态信息迅速感知网络变化，在大型企业网络
pytorch图像分类全流程（二）前人栽树,后人乘凉 datawhale pytorch pytorch 分类 python
本次使用的是ImageNet1000类别信息，resnet18预训练模型。记录一些一坑和知识点。在传入图片或视频之前我们都会对其进行预处理，归纳下来为四个字母RCTN：缩放、裁剪、转Tensor、归一化，可以使用transforms.Compose()函数打包对应四个函数进行预处理，当然这里有个小坑，transforms.Compose()只接受pillow格式的图像，不能拿opencv传入图片。
大连17所正规个人隐私亲子鉴定中心地址大全更新（附2024年机构名录）国医基因吴主任
在大连随着社会对亲子鉴定需求的增加，许多正规且具有资质的亲子鉴定机构相继设立，为市民提供科学、准确的鉴定服务。亲子鉴定知识可以咨询大连国医基因亲子鉴定咨询中心，机构地址：大连市西岗区中山路222号。以下是关于亲子鉴定的相关信息，以帮助您了解在哪里可以进行亲子鉴定以及如何选择合适的鉴定机构。大连鉴定机构名单参考2、大连博爱司法鉴定中心机构地址：辽宁省大连市普兰店区颐莲园1-1号业务范围：法医临床鉴定
2021年，村干部又有新任务了，扎根一线，三农将成核心工作！边缘的荳子
今天是初五，一些地方的农民兄弟已经开始准备春耕的事情了。而对于不少村子的村干部来说，也是在学习《农村工作会议》纪要的时间。那么，今年的村干部又有哪些新的任务呢？今天荳子就和大家重点地聊一聊。荳子解析：三农将成为新一年村干部工作的核心，扎根一线，落地才是根本。1、2021年，村干部各有哪些新任务荳子细细通读了关于《农村工作会议》纪要的相关内容，然后给大家总结了一下，以便大家能有一个简单的了解。按照我
《匠人精神》肖家菇凉
秋山木工的十条规则想要进入秋山学校的人，首先要接受十天的各项训练，并且通过考试才能入学。为什么秋山利辉会有这样的要求呢？①不能正确、完整地进行自我介绍者不予录取。②被秋山学校录取的学徒，无论男女一律留光头。剃光头是为了让学徒们下定决心，全身心地投入学校当中，如果决心不够，可能就无法坚持到底吧。③禁止使用手机，只许书信联系。想想也有道理，书写也是一种训练，如果连给客户的感谢信都写不好，如何胜任工作呢
我与教育行走珙桐花的话
初识时，我不以为然。再遇时，我勇于挑战。走进时，我欣然前行。虽然这三句话就可以概括我与教育行走的相识过程，但内心的触动与变化，岂是三言两语就能说清楚的？一、相识之前2020年对我而言是人生进入重大转折的一年，本来迎接宝宝的到来是让人充满欢喜的。可是突如其来的妊高症加上宝宝早产，使初为人母的我更加恐慌。这时好友张老师建议我开始读书，她去看我时所带的三本书中，有与我教育工作相关的，还有一本是日本作家和
2023-07-18 莫忘小寒
你觉得沟通重要吗？你认为什么样的沟通是有效沟通呢？1接纳就是爱，接纳他人和自己的不完美，就会成就自己和他人走向越来越好2接纳自己目前的能量和状态，接纳和尊重孩子的状态收获：1.提有助于思考的问题。无效问题：我如何能把文章写出来有效问题：电影讲的什么？哪里感动到我？2.定义-什么是什么例如，金钱是一笔好生意；唤醒游戏是提升能力的训练场3.区分是为了从定义中找一条有价值的路4.要多想自己要什么而不是怕
nestjs[一文学懂TypeORM在nestjs中的日常使用]
前提第一步：需要先了解nestjs中使用typeorm的引入和使用。参考官方：TypeORM集成第二步：熟悉typeorm文档了解与熟悉相关的api内容基础。学习步骤1.了解nestjs中引入typeorm并且配置引入相关库，参考前提-第一步在真实的项目中往往数据库信息都是放在配置文件中。其中Entities代表着数据表实体集，往往好多学习文档中都会开启自动扫描autoLoadEntities或者
我还要厚着脸皮拉着早睡早起？凤凰康
今天是训练营的第一天，我把早睡早起定为本次心力量训练营的第一目标，小伙伴们特别棒，基本都在6:30前打卡。你的睡眠时间和起床时间只要比昨天、比过去提前半小时就已经在进步。早睡早起，按道理是每个人很私人的事情，按道理我不该加以干预，为什么我还要厚着脸皮拉着大家跑起来，动起来？01精神状态差别都说早起的鸟儿有虫吃，关于早起这个清晨的时间你可以做多少事情，因人而异。不过有一点是肯定的：当你习惯早起，或者
第二十章—阅读的第四个层次：主题阅读（下） YYece
一、主题阅读的练习实例：进步论研究进步论的步骤列出研究主题相关的章节，也就是列出书目。主要选用论说性作品为参考书籍厘清问题二、如何应用主题工具书1.主题阅读的矛盾：如果你不知道从何开始，你就没法做主题阅读因此，你需要一本工具书—能够在广泛的资料当中，到哪里去找你感兴趣的主题相关的章节的书主题工具书只有一些粗略的指引并没有包含具体的知识内容。主题工具书的能从三方面帮助刚开始做研究的人：启动阅读，建议
谷歌引入开源全栈 AI 代理栈：借助 Gemini 2.5 和 LangGraph 实现多步网络搜索、反思与综合
对话式AI已迅速从基础聊天机器人框架中发展起来。然而，大多数大型语言模型（LLM）仍存在一个关键限制——它们仅依据静态训练数据生成回复，缺乏自我识别知识空白或执行实时信息综合的能力。因此，这些模型常常给出不完整或过时的答案，尤其在涉及不断演变或小众话题时。为解决这些问题，AI代理必须超越被动查询。它们需要识别信息空白，执行自主网络搜索，验证结果，并完善回复——有效模仿人类研究助手的工作方式。谷歌与
生成式 AI：从 “理解” 到 “创造” 的突破田园Coder 人工智能科普人工智能科普
1.生成式AI的定义：让AI从“识别”走向“创造”1.1什么是生成式AI生成式AI是一类能自主生成新内容（文本、图像、音频、视频等）的人工智能技术。与传统“判别式AI”（如人脸识别、垃圾邮件过滤，专注于分类和判断）不同，生成式AI的核心是“创造”——它能基于学习的规律，生成与训练数据相似但全新的内容。例如，判别式AI能判断“这是一幅梵高的画”，而生成式AI能模仿梵高的风格创作一幅全新的油画；判别式
计算机视觉：打开机器之眼看世界 LeafyJee_ 人工智能人工智能深度学习计算机视觉
计算机视觉是人工智能领域中备受关注的一部分，它的目标是赋予计算机类似于人类眼睛的功能，让机器能够感知和理解周围的世界。通过图像和视频数据，计算机视觉技术将信息转化为可理解和可操作的数据，为各种应用领域提供了强大的支持。一、计算机视觉的起源和发展计算机视觉起源于20世纪50年代，当时科学家们开始研究如何让计算机能够识别和理解图像。随着技术的不断进步，计算机视觉逐渐发展成为一门独立的学科，并广泛应用于
精读《能断金刚》（14）：六时书一心船长
6:471上一篇介绍到，要想将“万物潜能和意识铭印”这一套理念转化为个人事业上的成功，最好的实践方式是建立一个追踪体系，你用这个体系来积累你的行为。在西藏，这套体系被称为“undruk”，意思是“一天六次”，我们称之为“六时书”。具体如何实施？出门给自己买一本可以随身携带的小记事本。然后回顾之前提到的46个商业问题，从中找出自己最相关的三个问题。这些是你最棘手的三大问题。当某个问题化解或者情况有所
Python 进阶（一）：多线程
目录1.相关概念1.1解释器1.2GIL2.threading2.1方法属性2.2线程对象2.3锁对象2.4条件对象2.5信号量对象2.6事件对象1.相关概念1.1解释器Python解释器的主要作用是将我们在.py文件中写好的代码交给机器去执行，比较常见的解释器包括如下几种：CPython：官方解释器，我们从官网下载安装后获得的就是这个解释器，它使用C语言开发，是使用范围最广泛的Python解释器
0106晨间日记我是彩虹小姐
【今日完成】1.读《掌控习惯》，完成财富共创打卡2.英语学习记单词30个3.看完文案书籍《非常文案》4.看综艺节目，触及人性问题，不免有些感伤5.文案抄写5则6.写文7.看牙8.boss直聘沟通【今日心得】学习比较专注，不错【今日见识】生活就是一连串选择的集合文案的框架设计，顿时觉得万物相通，都有一个可普适的框架【需要改进】5秒停止瞎想【明日目标】1.阅读文案相关书籍2.英语打卡30个单词3.阅读
HAL STM32 I2C方式读取MT6701磁编码器获取角度例程 perseverance52 嵌入式开发笔记 stm32 MT6701
HALSTM32I2C方式读取MT6701磁编码器获取角度例程相关篇《Arduino通过I2C驱动MT6701磁编码器并读取角度数据》《STM32软件I2C方式读取MT6701磁编码器获取角度例程》使用CH341编程器读取，可以参考《CH341A/BUSB转USART/I2C/SPI介绍》MT6701当前最新文档资料：https://www.magntek.com.cn/upload/MT6701
中国传统节日中秋节吃什么？中秋节必吃的美食好项目高省
中秋节是一个充满诗意和温情的节日，不仅有赏月、团聚等活动，还有与之相关的丰富传统食物和习俗。一、传统食物月饼：作为中秋节的象征，月饼有各种口味和花样，是必不可少的美食。一家人围坐在一起，分享月饼，象征着团圆和美满。桂花酒：芬芳的桂花酿成的美酒，给节日增添了一份浪漫。在中秋佳节，与家人一起品尝桂花酒，感受那份独特的香气和醇厚的口感。田螺：中秋时节田螺正肥，是很多地方的传统佳肴。人们品尝田螺，不仅是为
打车优惠券领取公众号？滴滴出行优惠券领取方式氧惠评测
滴滴出行优惠券的领取方式多种多样，以下是几种常见的领取途径：月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。金珊
19、Java正则表达式与字符集详解杠精协会主席 Java NIO：革新I/O处理的新范式 Java 正则表达式 Pattern
Java正则表达式与字符集详解1.Java正则表达式相关类在JavaJ2SE1.4版本中，引入了一些期待已久的正则表达式类，下面为你详细介绍：-CharSequence：这是一个新的接口，由多个类实现，用于以抽象的方式描述字符序列。-Pattern：该类将正则表达式封装在一个不可变的对象实例中。可以通过编译表达式字符串来创建实例，同时还有一些静态实用方法用于一次性匹配。importjava.uti
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方