HaoBBNuanMM

【代码分析】TensorRT sampleMNIST 详解

前言

代码分析

Main入口

网络构建（build）阶段

网络推理(infer) 阶段

释放资源

前言

TensorRT 的”hello world“ 程序sampleMNIST是众多TensorRT初学者很好的起点，本文旨在详细分析sampleMNIST的代码，从实践出发帮助理解TensorRT的相关概念、与cuda的关系、以及核心API的使用。

代码分析

sampleMNIST的github 代码参考link: https://github.com/NVIDIA/TensorRT/blob/release/6.0/samples/opensource/sampleMNIST/sampleMNIST.cpp

程序的主要流程分为 main与程序输入参数初始化 -> 网络构建 -> 网络推理 -> 释放资源结束这几个阶段，下面逐个阶段分析代码

Main入口

void printHelpInfo()
{
    std::cout
        << "Usage: ./sample_mnist [-h or --help] [-d or --datadir=] [--useDLACore=]\n";
    std::cout << "--help          Display help information\n";
    std::cout << "--datadir       Specify path to a data directory, overriding the default. This option can be used "
                 "multiple times to add multiple directories. If no data directories are given, the default is to use "
                 "(data/samples/mnist/, data/mnist/)"
              << std::endl;
    std::cout << "--useDLACore=N  Specify a DLA engine for layers that support DLA. Value can range from 0 to n-1, "
                 "where n is the number of DLA engines on the platform."
              << std::endl;
    std::cout << "--int8          Run in Int8 mode.\n";
    std::cout << "--fp16          Run in FP16 mode.\n";
}

int main(int argc, char** argv)
{
    samplesCommon::Args args;
    bool argsOK = samplesCommon::parseArgs(args, argc, argv);

main函数开始获取程序的输入参数，允许指定caffe模型的文件目录、使用DLA engine的数目、int8或者fp16的模式，参考printHelpInfo()函数

samplesCommon::CaffeSampleParams initializeSampleParams(const samplesCommon::Args& args)
{
    samplesCommon::CaffeSampleParams params;
    if (args.dataDirs.empty()) //!< Use default directories if user hasn't provided directory paths
    {
        params.dataDirs.push_back("data/mnist/");
        params.dataDirs.push_back("data/samples/mnist/");
    }
    else //!< Use the data directory provided by the user
    {
        params.dataDirs = args.dataDirs;
    }

    params.prototxtFileName = locateFile("mnist.prototxt", params.dataDirs);
    params.weightsFileName = locateFile("mnist.caffemodel", params.dataDirs);
    params.meanFileName = locateFile("mnist_mean.binaryproto", params.dataDirs);
    params.inputTensorNames.push_back("data");
    params.batchSize = 1;
    params.outputTensorNames.push_back("prob");
    params.dlaCore = args.useDLACore;
    params.int8 = args.runInInt8;
    params.fp16 = args.runInFp16;

    return params;
}

......

int main(int arg, char** arg)
{
......
samplesCommon::CaffeSampleParams params = initializeSampleParams(args);

根据程序运行参数生成CaffeSampleParams实例，包括配置caffe模型的默认目录、minist的proto文件、caff模型文件、binary proto文件，配置minist深度学习网络的input Tensor名字为data，output Tensor名字为prob，batch size为1，根据用户的输入参数来配置是由需要DLA Engine，是否运行在Int8 / FP16模式

class SampleMNIST
{
    template 
    using SampleUniquePtr = std::unique_ptr;

public:
    SampleMNIST(const samplesCommon::CaffeSampleParams& params)
        : mParams(params)

......

int main(int argc, char** argv)
{
......

SampleMNIST sample(params);
    gLogInfo << "Building and running a GPU inference engine for MNIST" << std::endl;

通过CaffeSampleParams作为配置参数来构造SampleMNIST对象，将配置参数保存到mParams中

int main(int argc, char** argv)
{
......

    if (!sample.build())
    {
        return gLogger.reportFail(sampleTest);
    }

通过SampleMNIST对象来创建MNIST深度学习网络，下面开始详细分析网络构建阶段的build方法

网络构建（build）阶段

bool SampleMNIST::build()
{
    auto builder = SampleUniquePtr(nvinfer1::createInferBuilder(gLogger.getTRTLogger()));
    if (!builder)
    {
        return false;
    }

    auto network = SampleUniquePtr(builder->createNetwork());
    if (!network)
    {
        return false;
    }

    auto config = SampleUniquePtr(builder->createBuilderConfig());
    if (!config)
    {
        return false;
    }

    auto parser = SampleUniquePtr(nvcaffeparser1::createCaffeParser());
    if (!parser)
    {
        return false;
    }

    constructNetwork(parser, network);

TensorRT使用的标准流程即通过Logger创建IBuilder，通过IBuilder创建INetworkDefinition，通过INetworkDefinition创建IBuilderConfig，再创建用于解析Caffe模型的ICafferParser，然后调用constructNetwork通过ICafferParser对象分析caffe模型，通过INetworkDefinition对象创建可以被TensorRT优化和运行的网络

void SampleMNIST::constructNetwork(
    SampleUniquePtr& parser, SampleUniquePtr& network)
{
    const nvcaffeparser1::IBlobNameToTensor* blobNameToTensor = parser->parse(
        mParams.prototxtFileName.c_str(), mParams.weightsFileName.c_str(), *network, nvinfer1::DataType::kFLOAT);

    for (auto& s : mParams.outputTensorNames)
    {
        network->markOutput(*blobNameToTensor->find(s.c_str()));
    }

    // add mean subtraction to the beginning of the network
    nvinfer1::Dims inputDims = network->getInput(0)->getDimensions();
    mMeanBlob
        = SampleUniquePtr(parser->parseBinaryProto(mParams.meanFileName.c_str()));
    nvinfer1::Weights meanWeights{nvinfer1::DataType::kFLOAT, mMeanBlob->getData(), inputDims.d[1] * inputDims.d[2]};
    // For this sample, a large range based on the mean data is chosen and applied to the head of the network.
    // After the mean subtraction occurs, the range is expected to be between -127 and 127, so the rest of the network
    // is given a generic range.
    // The preferred method is use scales computed based on a representative data set
    // and apply each one individually based on the tensor. The range here is large enough for the
    // network, but is chosen for example purposes only.
    float maxMean
        = samplesCommon::getMaxValue(static_cast(meanWeights.values), samplesCommon::volume(inputDims));

    auto mean = network->addConstant(nvinfer1::Dims3(1, inputDims.d[1], inputDims.d[2]), meanWeights);
    mean->getOutput(0)->setDynamicRange(-maxMean, maxMean);
    network->getInput(0)->setDynamicRange(-maxMean, maxMean);
    auto meanSub = network->addElementWise(*network->getInput(0), *mean->getOutput(0), ElementWiseOperation::kSUB);
    meanSub->getOutput(0)->setDynamicRange(-maxMean, maxMean);
    network->getLayer(0)->setInput(0, *meanSub->getOutput(0));
    samplesCommon::setAllTensorScales(network.get(), 127.0f, 127.0f);
}

通过parser->parse方法分析caffe的模型和权重文件，构建network并返回可以通过名字查找数据ITensor的对象blobNameToTensor
通过blobNameToTensor->find方法找到输入参数中指定的网络output ITensor对象，并通过network->markOutput标记它为网络的Output ITensor
通过network->getInput(0)->getDimensions()找到网络的input ITensor对象并获取它的Dims维度对象
通过parser->parseBinaryProto解析caffe权重平均值文件并包装为IBinaryProtoBlob对象
创建Input的平均权重meanWeights，该权重的数据从mMeanBlob->getData()获得，数据个数是inputDims.d[1] * inputDims.d[2]
如下图所示为网络的Input做一个范围限制处理，包括

通过network->addConstant方法创建一个IConstant Layer，该Layer的input是个3维Dims3对象
通过network->addElementWise方法创建一个IElementWise Layer，将原网络的Input和IConstant Layer的output作为Input求相减
最后通过network->getLayer(0)->setInput替换原网络的Input为IElementWise Layer的output，完成对原网络Input的范围限制处理

替换原网络的Input做范围限制处理

bool SampleMNIST::build()
{
......   
    builder->setMaxBatchSize(mParams.batchSize);
    config->setMaxWorkspaceSize(16_MiB);
    config->setFlag(BuilderFlag::kGPU_FALLBACK);
    config->setFlag(BuilderFlag::kSTRICT_TYPES);
    if (mParams.fp16)
    {
        config->setFlag(BuilderFlag::kFP16);
    }
    if (mParams.int8)
    {
        config->setFlag(BuilderFlag::kINT8);
    }

    samplesCommon::enableDLA(builder.get(), config.get(), mParams.dlaCore);

    mEngine = std::shared_ptr(
        builder->buildEngineWithConfig(*network, *config), samplesCommon::InferDeleter());

    if (!mEngine)
        return false;

    assert(network->getNbInputs() == 1);
    mInputDims = network->getInput(0)->getDimensions();
    assert(mInputDims.nbDims == 3);

    return true;
}

constructNetwork函数执行完毕后，通过builder设置程序运行参数中的batchSize
通过config设置每一层Layer的内存大小和相关FLAG
通过enableDLA函数设置是否适用NV的DeepLearn Accelerator做硬件加速
通过network和config对象创建ICudaEngine对象用户后续的推理过程
最后确定network的input个数只有1个，input的维度为3维

网络推理(infer) 阶段

bool SampleMNIST::infer()
{
    // Create RAII buffer manager object
    samplesCommon::BufferManager buffers(mEngine, mParams.batchSize);

    auto context = SampleUniquePtr(mEngine->createExecutionContext());
    if (!context)
    {
        return false;
    }

    // Pick a random digit to try to infer
    srand(time(NULL));
    const int digit = rand() % 10;

    // Read the input data into the managed buffers
    // There should be just 1 input tensor
    assert(mParams.inputTensorNames.size() == 1);
    if (!processInput(buffers, mParams.inputTensorNames[0], digit))
    {
        return false;
    }

.....


int main(int argc, char** argv)
{

......

if (!sample.infer())
    {
        return gLogger.reportFail(sampleTest);
    }

main函数执行完build函数后，通过infer函数开始做网络推理
infer函数通过帮助类构建了BufferManager，用户创建和管理host与device的memory，如下图所示

BufferManager 主要类图

模板类GenericBuffer通过模板参数AllocFunc和FreeFunc来指定Host和Device分配存储的类型，如下代码所示，DeviceAllocator/DeviceFree类使用了cudaMalloc/cudaFree方法从GPU Device分配和释放存储，HostAllocator/HostFree则时候用malloc/free方法从CPU Device分配和释放存储

class DeviceAllocator
{
public:
    bool operator()(void** ptr, size_t size) const
    {
        return cudaMalloc(ptr, size) == cudaSuccess;
    }
};

class DeviceFree
{
public:
    void operator()(void* ptr) const
    {
        cudaFree(ptr);
    }
};

......

class HostAllocator
{
public:
    bool operator()(void** ptr, size_t size) const
    {
        *ptr = malloc(size);
        return *ptr != nullptr;
    }
};

class HostFree
{
public:
    void operator()(void* ptr) const
    {
        free(ptr);
    }
};

ManagerBuffer对象通过配对的deviceBuffer和hostBuffer来管理Device和Host 存储

    BufferManager(std::shared_ptr engine, const int& batchSize,
        const nvinfer1::IExecutionContext* context = nullptr)
        : mEngine(engine)
        , mBatchSize(batchSize)
    {
        // Create host and device buffers
        for (int i = 0; i < mEngine->getNbBindings(); i++)
        {
            auto dims = context ? context->getBindingDimensions(i) : mEngine->getBindingDimensions(i);
            size_t vol = context ? 1 : static_cast(mBatchSize);
            nvinfer1::DataType type = mEngine->getBindingDataType(i);
            int vecDim = mEngine->getBindingVectorizedDim(i);
            if (-1 != vecDim) // i.e., 0 != lgScalarsPerVector
            {
                int scalarsPerVec = mEngine->getBindingComponentsPerElement(i);
                dims.d[vecDim] = divUp(dims.d[vecDim], scalarsPerVec);
                vol *= scalarsPerVec;
            }
            vol *= samplesCommon::volume(dims);
            std::unique_ptr manBuf{new ManagedBuffer()};
            manBuf->deviceBuffer = DeviceBuffer(vol, type);
            manBuf->hostBuffer = HostBuffer(vol, type);
            mDeviceBindings.emplace_back(manBuf->deviceBuffer.data());
            mManagedBuffers.emplace_back(std::move(manBuf));
        }
    }

BufferManager对象则管理多个ManagerBuffer，保存每个ManagerBuffer中deviceBuffer对应的设备存储器指针到DeviceBindering
BufferManager的构造函数可以看到，通过mEngine->getNbBindings()遍历当前网络的所有Input/Output（此处有个细节，即遍历的index i和Tensor的名字是有一一对应关系的，即通过Tensor的名字查找到的Binding index == 对应的index i ），对每个Input/Output获得它的维度dims和数据类型type，计算Input/Output的ITensor数据需要的存储器容量vol，通过构造ManagerBuffer的DeviceBuffer和HostBuffer对象来分配Device和Host存储（用于后续CPU Host端输入数据到GPU Device端），再将Device的数据指针保存到DeviceBindering，将ManagerBuffer保存到BufferManager的队列中，最终通过BufferManager获得了所有Input/Output的Device和Host 存储空间

bool SampleMNIST::infer()
{

......

    // Pick a random digit to try to infer
    srand(time(NULL));
    const int digit = rand() % 10;

    // Read the input data into the managed buffers
    // There should be just 1 input tensor
    assert(mParams.inputTensorNames.size() == 1);
    if (!processInput(buffers, mParams.inputTensorNames[0], digit))
    {
        return false;
    }

......

bool SampleMNIST::processInput(
    const samplesCommon::BufferManager& buffers, const std::string& inputTensorName, int inputFileIdx) const
{
    const int inputH = mInputDims.d[1];
    const int inputW = mInputDims.d[2];

    // Read a random digit file
    srand(unsigned(time(nullptr)));
    std::vector fileData(inputH * inputW);
    readPGMFile(locateFile(std::to_string(inputFileIdx) + ".pgm", mParams.dataDirs), fileData.data(), inputH, inputW);

    // Print ASCII representation of digit
    gLogInfo << "Input:\n";
    for (int i = 0; i < inputH * inputW; i++)
    {
        gLogInfo << (" .:-=+*#%@"[fileData[i] / 26]) << (((i + 1) % inputW) ? "" : "\n");
    }
    gLogInfo << std::endl;

    float* hostInputBuffer = static_cast(buffers.getHostBuffer(inputTensorName));

    for (int i = 0; i < inputH * inputW; i++)
    {
        hostInputBuffer[i] = float(fileData[i]);
    }

    return true;
}

有了 BufferManager后通过processInput函数来获取Input数据，通过随机构建文件名的方式readPGMFfile 读取Input的数据
如下代码所示，通过buffers.getHostBuffer(inputTensorName) 根据Input Tensor的名字找到对应的Binding index，进而找到对应的HostBuffer获得CPU Host端的存储指针
通过inputH*inputW 计算input数据的尺寸、遍历input数据，将input数据从文件中读取到CPU 端的存储器中（ hostInputBuffer[i] = float(fileData[i]); ）

    void* getDeviceBuffer(const std::string& tensorName) const
    {
        return getBuffer(false, tensorName);
    }


    void* getHostBuffer(const std::string& tensorName) const
    {
        return getBuffer(true, tensorName);
    }

......

    void* getBuffer(const bool isHost, const std::string& tensorName) const
    {
        int index = mEngine->getBindingIndex(tensorName.c_str());
        if (index == -1)
            return nullptr;
        return (isHost ? mManagedBuffers[index]->hostBuffer.data() : mManagedBuffers[index]->deviceBuffer.data());
    }

bool SampleMNIST::infer()
{
......

// Create CUDA stream for the execution of this inference.
    cudaStream_t stream;
    CHECK(cudaStreamCreate(&stream));

    // Asynchronously copy data from host input buffers to device input buffers
    buffers.copyInputToDeviceAsync(stream);

......

通过cudaStreamCreate 创建cuda stream用于GPU Device上做并行计算流
通过buffers.copyInputToDeviceAsync 将processInput中读取的Input数据从CPU 端异步传送到GPU Device端，如下代码所示copyInputToDeviceAsync最终会通过cudeMemcpyAsync方法结合CPU -> GPU还是GPU -> CPU的方向来异步传送数据

    void copyInputToDeviceAsync(const cudaStream_t& stream = 0)
    {
        memcpyBuffers(true, false, true, stream);
    }

......

    void memcpyBuffers(const bool copyInput, const bool deviceToHost, const bool async, const cudaStream_t& stream = 0)
    {
        for (int i = 0; i < mEngine->getNbBindings(); i++)
        {
            void* dstPtr
                = deviceToHost ? mManagedBuffers[i]->hostBuffer.data() : mManagedBuffers[i]->deviceBuffer.data();
            const void* srcPtr
                = deviceToHost ? mManagedBuffers[i]->deviceBuffer.data() : mManagedBuffers[i]->hostBuffer.data();
            const size_t byteSize = mManagedBuffers[i]->hostBuffer.nbBytes();
            const cudaMemcpyKind memcpyType = deviceToHost ? cudaMemcpyDeviceToHost : cudaMemcpyHostToDevice;
            if ((copyInput && mEngine->bindingIsInput(i)) || (!copyInput && !mEngine->bindingIsInput(i)))
            {
                if (async)
                    CHECK(cudaMemcpyAsync(dstPtr, srcPtr, byteSize, memcpyType, stream));
                else
                    CHECK(cudaMemcpy(dstPtr, srcPtr, byteSize, memcpyType));
            }
        }
    }

bool SampleMNIST::infer()
{
......

    // Asynchronously enqueue the inference work
    if (!context->enqueue(mParams.batchSize, buffers.getDeviceBindings().data(), stream, nullptr))
    {
        return false;
    }
    // Asynchronously copy data from device output buffers to host output buffers
    buffers.copyOutputToHostAsync(stream);

    // Wait for the work in the stream to complete
    cudaStreamSynchronize(stream);

    // Release stream
    cudaStreamDestroy(stream);

    // Check and print the output of the inference
    // There should be just one output tensor
    assert(mParams.outputTensorNames.size() == 1);
    bool outputCorrect = verifyOutput(buffers, mParams.outputTensorNames[0], digit);

    return outputCorrect;
}

通过context->enqueue 通知TensorRT 进行网络推理过程，传入的参数包括batchSize，Input与Output的Device端存储器指针（其中Input的数据已经在processInput函数中传入Device端），用于cuda并行计算的stream流
通过buffers.copyOutputToHostAsync将TensorRT计算结果从Device端的Output存储器指针copy到CPU端的存储器指针中
通过cudaStreamSynchronize同步等待上面的所有计算完成，这样在buffers的CPU端Output指针中即保持了网络的推理结果
通过cudaStreamDestroy(stream) 释放cuda并行计算资源

bool SampleMNIST::verifyOutput(
    const samplesCommon::BufferManager& buffers, const std::string& outputTensorName, int groundTruthDigit) const
{
    const float* prob = static_cast(buffers.getHostBuffer(outputTensorName));

    // Print histogram of the output distribution
    gLogInfo << "Output:\n";
    float val{0.0f};
    int idx{0};
    const int kDIGITS = 10;

    for (int i = 0; i < kDIGITS; i++)
    {
        if (val < prob[i])
        {
            val = prob[i];
            idx = i;
        }

        gLogInfo << i << ": " << std::string(int(std::floor(prob[i] * 10 + 0.5f)), '*') << "\n";
    }
    gLogInfo << std::endl;

    return (idx == groundTruthDigit && val > 0.9f);
}

通过verifyOutput方法来验证网络推理结果的正确性
通过buffers.getHostBuffer(outputTensorName)根据output Tensor的名字找到对应的Binding index，进而找到对应的HostBuffer和它的数据指针*prob
遍历所有*prob找到概率最大的结果并输出
最后判断概率最大的结果是否等于groundTruth，得出Output是否正确的结论

释放资源

bool SampleMNIST::teardown()
{
    //! Clean up the libprotobuf files as the parsing is complete
    //! \note It is not safe to use any other part of the protocol buffers library after
    //! ShutdownProtobufLibrary() has been called.
    nvcaffeparser1::shutdownProtobufLibrary();
    return true;
}

......

int main(int argc, char** argv)
{
.......

    if (!sample.teardown())
    {
        return gLogger.reportFail(sampleTest);
    }

    return gLogger.reportPass(sampleTest);
}

最后通过teardown 释放分配的资源，完成整个构建网络，网络推理的过程

Seatunnel Web基于Docker独立部署 yongge 大数据系统分布式 docker 容器运维
目录1.编写背景2.基于docker容器seatunnel和seatunnelweb分离式部署2.1Dockerfile编写2.2镜像编译2.3容器启动2.4系统访问3.seatunnelweb与seatuennel通信4.小结1.编写背景在进行seatunnelweb项目容器化部署时，发现官网未提供比较完整的详解且准确的文档进行指导部署，并且网上的编写的不是非常准确，只能在测试环境中使用，难用于
MySQL、HBase 和 Elasticsearch：特点与区别详解一休哥助手 mysql hbase elasticsearch
引言随着大数据和分布式计算的快速发展，数据库系统已从传统的关系型数据库（RDBMS）扩展到多种新型数据存储技术，包括NoSQL数据库和搜索引擎等。MySQL、HBase和Elasticsearch是其中三种非常常见的数据存储系统，它们在各自的领域都有着重要的应用。MySQL作为传统的关系型数据库，HBase则是一个分布式、可扩展的NoSQL数据库，而Elasticsearch则是一个分布式的搜索引
Transformer架构原理详解：多头注意力（MultiHead Attention） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,多头注意力,Multi-HeadAttention,机器翻译,自然语言处理,深度学习1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展。传统的循环神经网络（RNN）在处理长序列数据时存在效率低下和梯度消失等问题。为了解决这些问题，谷歌于2017年提出了Transformer架构，并将其应用于机器翻译任务，取得了突破性的成果。Transformer的核心创
小波变换算法详解（附Python和C++代码）卢一涵算法人工智能机器学习 c++
小波变换算法是将初始数据分解为低频和高频的两组数据，再由这两组数据重新构造初始数据的算法（与傅里叶变换算法类似）。一般来说小波变换常用于数据降噪领域，也可以用于对数据进行压缩、数据特征提取、特征增强等方面。小波算法很难理解对不对，博主也觉得难理解，不过，算法本身并没有特别复杂，简单说就使把数据分解然后再重构这两个步骤。只要知道这两个步骤，剩下的就是顺水推舟，容易理解多了。小波分解：分解的步骤其实就
面向服务架构（SOA）设计及其应用详解一休哥助手架构架构
目录什么是面向服务架构？SOA的核心理念与设计原则服务解耦服务重用服务自治SOA架构的常见组件服务注册中心服务提供者与消费者消息总线（ESB）面向服务架构的实现方式SOAP与RESTful服务微服务架构与SOA的关系SOA的应用场景与优势SOA设计中的挑战与解决方案结语1.什么是面向服务架构？**面向服务架构（SOA）**是一种软件设计方法论，其核心思想是将应用程序的功能通过一系列松耦合的服务（S
P14 - 软件维护之四大维护详解濯一一 #软考-软件设计师软件维护软件设计师正确性适应性完善性预防性软考
【软考-软件设计师-历年真题-2013年上半年上午基础知识】在软件维护中，由于企业的外部市场环境和管理需求的变化而导致的维护工作，属于（33）维护。(33)A.正确性B.适应性C.完善性D.预防性【答案】B【解析】本题考查软件维护方面的基础知识。······软件维护方面·····四大方面软件维护主要是指根据需求变化或硬件环境的变化对应用程序进行部分或全部的修改。修改时应充分利用源程序，修改后要填写
python md5加密_Python MD5加密实例详解 weixin_39870238 python md5加密
详解PythonMD5加密Python3下MD5加密#由于MD5模块在python3中被移除#在python3中使用hashlib模块进行md5操作importhashlib#待加密信息str='thisisamd5test.'#创建md5对象hl=hashlib.md5()#Tips#此处必须声明encode#若写法为hl.update(str)报错为：Unicode-objectsmustbe
VMD（变分模态分解）详解 DuHz 波的分析方法现代谱分析方法音频处理数据挖掘信号处理人工智能信息与通信数学建模
VMD（变分模态分解）详解目录前言背景及发展VMD原理与数学基础问题的提出变分框架与能量最小化中心频率与带宽定义目标函数及约束拉格朗日乘子法频域迭代更新公式VMD与EMD/EEMD/CEEMDAN等方法比较VMD算法流程主要参数的选择与影响优点与不足实际应用中需要注意的问题示例代码代码简要解读参考资料前言在信号处理、时频分析、故障诊断等诸多领域，如何将一个复杂信号进行多分量分解，进而提取到其中所包
Windows 11安全中心闪退解决方法详解 mmoo_python windows 安全
Windows11安全中心闪退解决方法详解近期，部分Windows11用户反馈在使用Windows安全中心时遇到了无法开启、点击即闪退的问题，且在任务栏的安全中心图标上显示有黄色的感叹号。这一问题不仅影响了系统的安全性监控，还给用户带来了诸多不便。为了帮助大家有效解决这一问题，本文将详细介绍几种实用的解决方法。方法一：通过PowerShell命令修复步骤一：打开WindowsPowerShell（
K8S中Service详解（二）元气满满的热码式 kubernetes 网络 linux
Service类型Service的资源清单文件：---kind:Service#资源类型apiVersion:v1#资源版本metadata:#元数据name:service#资源名称namespace:dev#命名空间spec:#描述selector:#标签选择器，用于确定当前service代理哪些podapp:nginxtype:ClusterIP#Service类型，指定service的访问
锁争用详解缘来是黎 linux service java jvm 开发语言
锁争用（LockContention）是并发编程中常见的问题，特别是在多线程或多进程环境下。当多个线程或进程竞争同一把锁时，会导致系统负载升高，性能下降。以下是锁争用导致系统负载高的详细原理：1.锁的基本概念锁：用于控制对共享资源的访问，确保同一时间只有一个线程或进程可以访问资源。锁争用：当多个线程或进程同时尝试获取同一把锁时，只有一个线程或进程能够成功获取锁，其他线程或进程会被阻塞，直到锁被释放
Linux 权限体系详解:、777、755、644、600、chmod、chown、chgrp 和 umask；SUID、SGID 和 Sticky Bit；ACL (访问控制列表) 是什么？小胡说技书手册/开发图谱运维 linux 运维服务器
文章目录1.引言1.1为什么学习Linux权限？1.2本文目标2.Linux权限基础概念2.1权限模型2.2权限类型2.3权限表示法2.3.1字母表示法2.3.2数字表示法2.3.3字母与数字表示法对比2.3.4案例：字母与数字的权限切换3.常见权限分配方法对比表格3.1使用`chmod`分配权限3.2使用`chown`和`chgrp`修改拥有者和用户组3.3使用`umask`设置默认权限4.高级
HTTPS keytool工具使用(高频) 笑锝没心没肺 Linux #网络安全 https 网络协议 http
keytool是Java平台的一个密钥和证书管理工具，它用于管理JavaKeystore(JKS)文件，这些文件用于存储密钥和证书。以下是keytool命令的一些常用选项及其详解：基本语法keytool[options]选项列表生成密钥库-genkeypair:生成密钥对。-alias:密钥库条目的别名。-keyalg:密钥算法，例如RSA或EC。-keysize:密钥大小（位数）。-validi
Spring Boot 框架整体启动流程详解阿提说说 Spring Boot 3.x 精讲 java spring spring boot 3
基于SpringBoot版本：3.1Java:17SpringBoot的入口即为xxApplication类的main方法：@SpringBootApplicationpublicclassSpringBootDemoApplication{publicstaticvoidmain(String[]args){SpringApplication.run(SpringBootDemoApplicat
大模型WebUI：Gradio全解11——Chatbot：融合大模型的多模态聊天机器人（5）龙焰智能 gradio events undo retry like edit
大模型WebUI：Gradio全解11——Chatbot：融合大模型的多模态聊天机器人（5）前言本篇摘要11.Chatbot：融合大模型的多模态聊天机器人11.5Chatbot的特殊Events11.5.1各事件总演示11.5.2详解.undo、.retry、.like和.edit事件1..undo：撤销2..retry：重试3..like：点赞4..edit：编辑参考文献前言本系列文章主要介绍W
代码提交与别人的代码发生冲突时解决办法详解匹马夕阳开发工具 git
当你的代码提交与别人的代码发生冲突时，通常是因为多人在同一个文件或代码段上进行了修改。解决冲突是协作开发中常见的任务，以下是一些步骤和建议来帮助你解决代码冲突。文章目录1.检测冲突2.查看冲突文件3.手动解决冲突4.标记冲突解决5.完成合并6.使用工具辅助解决冲突7.避免冲突的建议8.如果冲突复杂，寻求帮助1.检测冲突冲突通常在执行gitpull或gitmerge时被检测到。Git会提示你哪些文件
【大模型】ChatGPT 提示词优化进阶操作实战详解小码农叔叔 AI大模型实战与应用 ChatGPT提示词优化进阶 ChatGPT提示词优化 ChatGPT提示词优化技巧 ChatGPT提示词优化原则 ChatGPT提示词常用技巧
目录一、前言二、ChatGPT提示词几个基本的优化原则2.1明确的提示词2.1.1提示词具体而清晰2.1.1.1操作案例演示2.2确定焦点2.2.1操作案例演示2.3保持提示词的相关性2.3.1什么是相关性2.3.2提示词相关性操作案例一2.3.2提示词相关性操作案例二三、ChatGPT提示词进阶及常用优化策略3.1提示词常用优化策略总结3.2ChatGPT提示词优化操作实战3.2.1身份设定3.
嵌入式驱动开发详解10（MISC杂项实现）嵌入~狮 Linux驱动驱动开发
文章目录前言MISC设备驱动简介重要结构体API函数MISC实现框架后续参考文献前言MISC驱动也叫做杂项驱动，也就是当我们板子上的某些外设无法进行分类的时候就可以使用MISC驱动。MISC驱动其实就是最简单的字符设备驱动，通常嵌套在platform总线驱动中，MISC设备驱动简介所有的MISC设备驱动的主设备号都为10，不同的设备使用不同的从设备号。随着Linux字符设备驱动的不断增加，设备号变
Ubuntu常用指令及用法详解我的混世小魔王 ubuntu
1.ls这个相当于Windows下的dir命令，可以列出当前窗口或指定窗口下的内容。2.rm这个相当于Windows下的del和rmdir命令，可以删除文件及文件夹。常见用法：rm-rf/home/ubuntu/.cache(删除/home/ubuntu/.cache这个文件夹)禁忌：rm-rf/*这个命令会删除根分区下所有文件，在某些efi机器上还会删除主板固件，造成主板固件丢失从而无法开机(比
Bootstrap4网格系统详解半点寒12W css css3
一、基本概念Bootstrap4的网格系统是其核心部分，它基于一个12列的布局，能够帮助你轻松创建响应式的网页布局。这种网格系统可以让你将页面内容划分为不同的行和列，使得内容在不同设备上都能呈现出最佳的显示效果。二、容器（Container）容器的作用：容器是用来包裹页面内容的元素，它提供了一个水平居中的布局空间，并为内部的行和列设置了合适的内边距。容器的类型：**.container：**这是一
差分进化算法 (Differential Evolution) 算法详解及案例分析闲人编程 python 算法 python 开发语言选择 DE 差分进化算法变异
差分进化算法(DifferentialEvolution)算法详解及案例分析目录差分进化算法(DifferentialEvolution)算法详解及案例分析1.引言2.差分进化算法(DE)算法原理2.1基本概念2.2算法步骤3.差分进化算法的优势与局限性3.1优势3.2局限性4.案例分析4.1案例1:单目标优化问题4.1.1问题描述4.1.2代码实现4.1.3流程图4.1.4优化曲线4.2案例2:
conv2former模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能 python 神经网络 conda
模型背景在Conv2Former模型提出之前，视觉识别领域的研究主要集中在两个方向：传统卷积神经网络（ConvNets）新兴的视觉Transformer（ViTs）ConvNets通过堆叠基本模块和采用金字塔结构取得了显著进展，但往往忽略了全局上下文信息的显式建模。ViTs则通过自注意力机制有效捕捉全局依赖关系，在多个视觉任务中展现出优异性能。然而，ViTs在处理高分辨率图像时面临计算成本过高的问
React框架详解：从入门到精通（详细版）布兰妮甜 #React react.js 前端前端框架
文章目录前言一、官方网站二、安装React使用CreateReactApp手动安装三、React核心概念1.组件化2.JSX3.虚拟DOM4.Props和State四、生命周期方法五、新特性介绍1.Hooks2.ContextAPI六、状态管理1.Redux2.Mobx3.ReactContextAPI七、最佳实践1.组件划分2.代码复用3.性能优化4.错误边界结语前言React是由Faceboo
Mybatis-Plus基本使用：从入门到精通 DTcode7 sql数据库相关数据库 mysql SQL 数据库开发 sql
Mybatis-Plus基本使用：从入门到精通一、Mybatis-Plus简介1.1核心特点1.2快速启动二、基本使用详解示例一：CRUD操作示例二：条件查询示例三：分页查询示例四：自动填充示例五：代码生成器三、高级技巧与实战经验3.1多表关联查询3.2性能优化3.3错误排查与调试四、最佳实践与建议五、结语在当今快速发展的软件工程领域，数据库操作的便捷性与效率成为了众多开发者关注的焦点。Mybat
一篇文章让你学会Java之格式化输出凭君语未可 Java java 开发语言
这里写目录标题一、格式化输出方法1.使用`String.format()`方法语法：示例：2.使用`System.out.printf()`方法语法：示例：3.使用`Formatter`类示例：代码分析：二、常见的格式说明符：1.整数类型格式化说明符2.浮点类型格式化说明符3.字符串格式化说明符4.日期和时间格式化说明符5.百分号格式化说明符6.其他格式化控制符三、常用的格式化选项：1.宽度（Wi
HTML 元素详解：从入门到精通浪浪山小白兔 html 前端
HTML（HyperTextMarkupLanguage）是构建网页的基础语言，而HTML元素则是构成网页的基本单位。无论是网页的结构、内容还是样式，都离不开HTML元素。本文将深入探讨HTML元素的概念、结构、属性以及常见的使用方法，帮助你从零开始掌握HTML的基础知识，并逐步进阶到更复杂的应用。什么是HTML元素？HTML元素是构成HTML文档的基本单位，它由开始标签、内容和结束标签组成。每个
Python 调用 Ollama 库：本地大语言模型使用详解 kdayjj966 python
ollama是一个用于调用本地大语言模型（LargeLanguageModels，LLMs）的Python库，旨在提供简单、高效的API接口，以便开发者能够方便地与本地的大语言模型进行交互。以下是关于如何在Python中使用ollama库的详细介绍。1.安装Ollama在使用库之前，请确保安装了ollama。你可以通过以下命令安装：pipinstallollama如果你尚未安装Python的包管理
详解Python迭代器：轻松搞懂工作原理、用法和最佳实践 kdayjj966 python 开发语言
迭代器引入如果开发中有以下需求，如何解决？classStuSystem(object):"""学生管理系统"""def__init__(self):self.stus=[]defadd(self):"""添加一个新的学生:return:"""name=input("请输入新学生的姓名:")tel=input("请输入新学生的手机号:")address=input("请输入新学生的住址:")new_
C++线程库std::thread和std::async的用法详解大王算法 c++开发语言
目录一、背景二、并发编程的背景三、std::thread3.1创建和启动线程3.2线程的参数传递3.3线程的生命周期管理3.4线程同步四、std::async与std::future4.1创建异步任务4.2使用std::launch控制执行策略4.3std::future与std::promise4.4异步任务的取消与超时五、实战案例：并发文件处理5.1使用std::thread实现一、背景C++
Python中enumerate函数的使用详解落英缤纷H python 开发语言 linux Python
Python中enumerate函数的使用详解在Python编程中，我们经常需要遍历列表或其他可迭代对象，并同时获取元素的索引值。为了简化这个过程，Python提供了一个非常有用的内置函数enumerate()。enumerate()函数可以将一个可迭代对象转换为一个索引-元素对的迭代器，使我们能够同时访问索引和元素。enumerate()函数的语法如下：enumerate(iterable,st
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

【代码分析】TensorRT sampleMNIST 详解

前言

代码分析

Main入口

网络构建（build）阶段

网络推理(infer) 阶段

释放资源

你可能感兴趣的:(【代码分析】TensorRT sampleMNIST 详解)