龙啸wyh

YOLOV5之TensorRT加速：C++版

前言
1.TesnsorRT安装
- 1.1 驱动安装、cuda和cudnn配置
- 1.2 环境安装
2. Download tensorrtx
3. 使用C ++ API从头开始创建网络定义
- 3.1 gLogger
- 3.2 过程
- - 3.2.1 创建builder 和 network
  - 3.2.2 添加输入层，包括输入层名称，输入维度及类型
  - 3.2.3 添加卷积层、池化层、全连接层以及Softmax等层
  - 3.2.4 输出
4. 模型转换，生成.wts文件（二进制文件）
5. 主要过程
- 5.1 序列化
- 5.2 反序列化及执行推理
- - 5.2.1 读取yolov5s.engine，创建runtime反序列化加载engine,并加载IExecutionContext用于推理
  - 5.2.2 执行推理
- 5.3 喂入数据，进行推理并解析结果
- 5.4 画框

前言

这篇文章是知乎的一篇文章，算是对前面几篇TensorRT官方文档翻译的小结。后面打算在Jetson Nano上做YOLO算法的TensoRT加速和部署，这篇文章作者没有给出完整的源码，只是用来学习总结用。

1.TesnsorRT安装

1.1 驱动安装、cuda和cudnn配置

首先根据自己的显卡安装相应的显卡驱动、CUDA和CUDNN库，可以参考文章：
NVIDIA驱动和CUDA安装
然后根据自己的CUDA和CUDNN版本下载对应的TensorRT(建议下载TAR版)
http://link.zhihu.com/?target=https%3A//developer.nvidia.com/nvidia-tensorrt-download

1.2 环境安装

cd ~/Downloads
tar -xvzf TensorRT-7.2.2.3.Ubuntu-18.04.x86_64-gnu.cuda-11.1.cudnn8.0.tar.gz
# 配置环境变量
sudo vim ~/.bashrc
# 配置如下,根据自己解压的路径配置TRT_PATH
export TRT_PATH=/your/path/to/TensorRT-7.2.2.3
export PATH=$PATH:$TRT_PATH/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$TRT_PATH/lib
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$TRT_PATH/targets/x86_64-linux-gnu/lib

source ~/.bashrc
#如果需要安装python版，请执行下面的命令
cd TensorRT-7.2.2.3/python
#根据自己的Python版本执行下面命令
pip install tensorrt-7.2.2.3-cp37-none-linux_x86_64.whl
# 配置完成可以到python下导入tensorrt进行测试
>>import tensorrt

2. Download tensorrtx

git clone https://github.com/wang-xinyu/tensorrtx/

3. 使用C ++ API从头开始创建网络定义

3.1 gLogger

想要用TensorRT执行推理，首先需要ICudaEngine对象创建引擎engine，然后利用IExecutionContext接口执行推理。
首先创建一个ILogger类型的全局对象，它是TensorRT API的各种方法的必需参数。这是演示logger创建的示例：

class Logger : public ILogger           
 {
     void log(Severity severity, const char* msg) override
     {
         // suppress info-level messages
         if (severity != Severity::kINFO)
             std::cout << msg << std::endl;
     }
 } gLogger;

3.2 过程

3.2.1 创建builder 和 network

IBuilder* builder = createInferBuilder(gLogger);
INetworkDefinition* network = builder->createNetworkV2(0U);

3.2.2 添加输入层，包括输入层名称，输入维度及类型

auto data = network->addInput(INPUT_BLOB_NAME, dt, Dims3{-1, 1, INPUT_H, INPUT_W});

3.2.3 添加卷积层、池化层、全连接层以及Softmax等层

auto conv1 = network->addConvolution(*data->getOutput(0), 20, DimsHW{5, 5}, weightMap["conv1filter"], weightMap["conv1bias"]);
conv1->setStride(DimsHW{1, 1});
auto pool1 = network->addPooling(*conv1->getOutput(0), PoolingType::kMAX, DimsHW{2, 2});
pool1->setStride(DimsHW{2, 2});
auto ip1 = network->addFullyConnected(*pool1->getOutput(0), 500, weightMap["ip1filter"], weightMap["ip1bias"]);
auto relu1 = network->addActivation(*ip1->getOutput(0), ActivationType::kRELU);
auto prob = network->addSoftMax(*relu1->getOutput(0));
prob->getOutput(0)->setName(OUTPUT_BLOB_NAME);

3.2.4 输出

network->markOutput(*prob->getOutput(0));

4. 模型转换，生成.wts文件（二进制文件）

执行python gen_wts.py生成yolov5s.wts

import torch
import struct
from utils.torch_utils import select_device

# Initialize
device = select_device('cpu')
# Load model
model = torch.load('weights/yolov5s.pt', map_location=device)['model'].float()  # load to FP32
model.to(device).eval()

f = open('yolov5s.wts', 'w')
f.write('{}\n'.format(len(model.state_dict().keys())))
for k, v in model.state_dict().items():
    vr = v.reshape(-1).cpu().numpy()
    f.write('{} {} '.format(k, len(vr)))
    for vv in vr:
        f.write(' ')
        f.write(struct.pack('>f',float(vv)).hex())
    f.write('\n')

5. 主要过程

5.1 序列化

该模块主要包括创建builder,config,engine以及serialize几个过程，其中engine创建根据自定义网络结构来实现。

ICudaEngine* createEngine_s(unsigned int maxBatchSize, IBuilder* builder, IBuilderConfig* config, DataType dt) {
    // 2.利用builder创建网络
    INetworkDefinition* network = builder->createNetworkV2(0U);

    // 3. 输入层,层名为：INPUT_BLOB_NAME, 数据类型为: dt, 数据纬度为： CHW
    ITensor* data = network->addInput(INPUT_BLOB_NAME, dt, Dims3{ 3, INPUT_H, INPUT_W });
    assert(data);

    //加载权重
    std::map<std::string, Weights> weightMap = loadWeights("../yolov5s.wts");
    Weights emptywts{ DataType::kFLOAT, nullptr, 0 };
    //下面的过程参考yolov5s.yaml文件，其中基本操作都在common.hpp文件实现
    // yolov5 backbone
    // Focus层，输入为*data,输入通道为3，输出通道为32
    // 4. 添加层
    auto focus0 = focus(network, weightMap, *data, 3, 32, 3, "model.0");
    auto conv1 = convBlock(network, weightMap, *focus0->getOutput(0), 64, 3, 2, 1, "model.1");
    auto bottleneck_CSP2 = C3(network, weightMap, *conv1->getOutput(0), 64, 64, 1, true, 1, 0.5, "model.2");
    auto conv3 = convBlock(network, weightMap, *bottleneck_CSP2->getOutput(0), 128, 3, 2, 1, "model.3");
    auto bottleneck_csp4 = C3(network, weightMap, *conv3->getOutput(0), 128, 128, 3, true, 1, 0.5, "model.4");
    auto conv5 = convBlock(network, weightMap, *bottleneck_csp4->getOutput(0), 256, 3, 2, 1, "model.5");
    auto bottleneck_csp6 = C3(network, weightMap, *conv5->getOutput(0), 256, 256, 3, true, 1, 0.5, "model.6");
    auto conv7 = convBlock(network, weightMap, *bottleneck_csp6->getOutput(0), 512, 3, 2, 1, "model.7");
    auto spp8 = SPP(network, weightMap, *conv7->getOutput(0), 512, 512, 5, 9, 13, "model.8");

    // yolov5 head
    auto bottleneck_csp9 = C3(network, weightMap, *spp8->getOutput(0), 512, 512, 1, false, 1, 0.5, "model.9");
    auto conv10 = convBlock(network, weightMap, *bottleneck_csp9->getOutput(0), 256, 1, 1, 1, "model.10");

    float *deval = reinterpret_cast<float*>(malloc(sizeof(float) * 256 * 2 * 2));
    for (int i = 0; i < 256 * 2 * 2; i++) {
        deval[i] = 1.0;
    }
    Weights deconvwts11{ DataType::kFLOAT, deval, 256 * 2 * 2 };
    IDeconvolutionLayer* deconv11 = network->addDeconvolutionNd(*conv10->getOutput(0), 256, DimsHW{ 2, 2 }, deconvwts11, emptywts);
    deconv11->setStrideNd(DimsHW{ 2, 2 });
    deconv11->setNbGroups(256);
    weightMap["deconv11"] = deconvwts11;

    ITensor* inputTensors12[] = { deconv11->getOutput(0), bottleneck_csp6->getOutput(0) };
    auto cat12 = network->addConcatenation(inputTensors12, 2);
    auto bottleneck_csp13 = C3(network, weightMap, *cat12->getOutput(0), 512, 256, 1, false, 1, 0.5, "model.13");
    auto conv14 = convBlock(network, weightMap, *bottleneck_csp13->getOutput(0), 128, 1, 1, 1, "model.14");

    Weights deconvwts15{ DataType::kFLOAT, deval, 128 * 2 * 2 };
    IDeconvolutionLayer* deconv15 = network->addDeconvolutionNd(*conv14->getOutput(0), 128, DimsHW{ 2, 2 }, deconvwts15, emptywts);
    deconv15->setStrideNd(DimsHW{ 2, 2 });
    deconv15->setNbGroups(128);

    ITensor* inputTensors16[] = { deconv15->getOutput(0), bottleneck_csp4->getOutput(0) };
    auto cat16 = network->addConcatenation(inputTensors16, 2);
    auto bottleneck_csp17 = C3(network, weightMap, *cat16->getOutput(0), 256, 128, 1, false, 1, 0.5, "model.17");
    IConvolutionLayer* det0 = network->addConvolutionNd(*bottleneck_csp17->getOutput(0), 3 * (Yolo::CLASS_NUM + 5), DimsHW{ 1, 1 }, weightMap["model.24.m.0.weight"], weightMap["model.24.m.0.bias"]);

    auto conv18 = convBlock(network, weightMap, *bottleneck_csp17->getOutput(0), 128, 3, 2, 1, "model.18");
    ITensor* inputTensors19[] = { conv18->getOutput(0), conv14->getOutput(0) };
    auto cat19 = network->addConcatenation(inputTensors19, 2);
    auto bottleneck_csp20 = C3(network, weightMap, *cat19->getOutput(0), 256, 256, 1, false, 1, 0.5, "model.20");
    IConvolutionLayer* det1 = network->addConvolutionNd(*bottleneck_csp20->getOutput(0), 3 * (Yolo::CLASS_NUM + 5), DimsHW{ 1, 1 }, weightMap["model.24.m.1.weight"], weightMap["model.24.m.1.bias"]);

    auto conv21 = convBlock(network, weightMap, *bottleneck_csp20->getOutput(0), 256, 3, 2, 1, "model.21");
    ITensor* inputTensors22[] = { conv21->getOutput(0), conv10->getOutput(0) };
    auto cat22 = network->addConcatenation(inputTensors22, 2);
    auto bottleneck_csp23 = C3(network, weightMap, *cat22->getOutput(0), 512, 512, 1, false, 1, 0.5, "model.23");
    IConvolutionLayer* det2 = network->addConvolutionNd(*bottleneck_csp23->getOutput(0), 3 * (Yolo::CLASS_NUM + 5), DimsHW{ 1, 1 }, weightMap["model.24.m.2.weight"], weightMap["model.24.m.2.bias"]);

    // 获取yolo输出头，有三个尺度，分别为缩放8/16/32
    auto yolo = addYoLoLayer(network, weightMap, det0, det1, det2);
    yolo->getOutput(0)->setName(OUTPUT_BLOB_NAME);
    // 5. 标记输出
    network->markOutput(*yolo->getOutput(0));             

    // 7. 下面的代码为创建engine
    builder->setMaxBatchSize(maxBatchSize);
    
    // 下面的代码为创建引擎
    config->setMaxWorkspaceSize(16 * (1 << 20));  // 16MB
#ifdef USE_FP16
    config->setFlag(BuilderFlag::kFP16);
#endif

    ICudaEngine* engine = builder->buildEngineWithConfig(*network, *config);           // Build the engine using the builder object
    // Don't need the network any more
    network->destroy();

    // Release host memory
    for (auto& mem : weightMap)
    {
        free((void*)(mem.second.values));
    }
    return engine;
}

序列化

void APIToModel(unsigned int maxBatchSize, IHostMemory** modelStream) {
    // 1. 创建builder
    IBuilder* builder = createInferBuilder(gLogger);
    // 6. 创建config
    IBuilderConfig* config = builder->createBuilderConfig();

    ICudaEngine* engine = createEngine_s(maxBatchSize, builder, config, DataType::kFLOAT);
    assert(engine != nullptr);

    // 8. 序列化engine
    (*modelStream) = engine->serialize();

    engine->destroy();
    builder->destroy();
}
//序列化到本地，生成yolov5s.engine
bool toSerial(std::string engine_name)
{
    IHostMemory* modelStream{ nullptr };
    APIToModel(BATCH_SIZE, &modelStream);
    assert(modelStream != nullptr);
    std::ofstream p("yolov5s.engine", std::ios::binary);
    if (!p) {
        std::cerr << "could not open plan output file" << std::endl;
        return -1;
    }
    p.write(reinterpret_cast<const char*>(modelStream->data()), modelStream->size());
    modelStream->destroy();
    return true;
}

5.2 反序列化及执行推理

5.2.1 读取yolov5s.engine，创建runtime反序列化加载engine,并加载IExecutionContext用于推理

std::ifstream file("yolov5s.engine", std::ios::binary);
if (file.good()) {
    file.seekg(0, file.end);
    size = file.tellg();
    file.seekg(0, file.beg);
    trtModelStream = new char[size];
    assert(trtModelStream);
    file.read(trtModelStream, size);
    file.close();
}

IRuntime* runtime = createInferRuntime(gLogger);
assert(runtime != nullptr);
ICudaEngine* engine = runtime->deserializeCudaEngine(trtModelStream, size);
assert(engine != nullptr);
IExecutionContext* context = engine->createExecutionContext();
assert(context != nullptr);
delete[] trtModelStream;

5.2.2 执行推理

void doInference(IExecutionContext& context, cudaStream_t& stream, void **buffers, float* input, float* output, int batchSize) {
    // DMA input batch data to device, infer on the batch asynchronously, and DMA output back to host
    CHECK(cudaMemcpyAsync(buffers[0], input, batchSize * 3 * INPUT_H * INPUT_W * sizeof(float), cudaMemcpyHostToDevice, stream));
    context.enqueue(batchSize, buffers, stream, nullptr);
    CHECK(cudaMemcpyAsync(output, buffers[1], batchSize * OUTPUT_SIZE * sizeof(float), cudaMemcpyDeviceToHost, stream));
    cudaStreamSynchronize(stream);
}

5.3 喂入数据，进行推理并解析结果

void parseYolov5(cv::Mat& img,ICudaEngine* engine,IExecutionContext* context,std::vector<Yolo::Detection>& batch_res)
{
    // 准备数据 ---------------------------
    static float data[BATCH_SIZE * 3 * INPUT_H * INPUT_W];  //输入
    static float prob[BATCH_SIZE * OUTPUT_SIZE];            //输出

    assert(engine->getNbBindings() == 2);
    void* buffers[2];
    // In order to bind the buffers, we need to know the names of the input and output tensors.
    // Note that indices are guaranteed to be less than IEngine::getNbBindings()
    const int inputIndex = engine->getBindingIndex(INPUT_BLOB_NAME);
    const int outputIndex = engine->getBindingIndex(OUTPUT_BLOB_NAME);
    assert(inputIndex == 0);
    assert(outputIndex == 1);
    // Create GPU buffers on device
    CHECK(cudaMalloc(&buffers[inputIndex], BATCH_SIZE * 3 * INPUT_H * INPUT_W * sizeof(float)));
    CHECK(cudaMalloc(&buffers[outputIndex], BATCH_SIZE * OUTPUT_SIZE * sizeof(float)));
    // Create stream
    cudaStream_t stream;
    CHECK(cudaStreamCreate(&stream));

    if (!img.empty())
    {
        cv::Mat pr_img = preprocess_img(img); // letterbox BGR to RGB
        int i = 0;
        for (int row = 0; row < INPUT_H; ++row) {
            uchar* uc_pixel = pr_img.data + row * pr_img.step;
            for (int col = 0; col < INPUT_W; ++col) {
                data[i] = (float)uc_pixel[2] / 255.0;
                data[i + INPUT_H * INPUT_W] = (float)uc_pixel[1] / 255.0;
                data[i + 2 * INPUT_H * INPUT_W] = (float)uc_pixel[0] / 255.0;
                uc_pixel += 3;
                ++i;
            }
        }
    }

    // Run inference
    doInference(*context, stream, buffers, data, prob, BATCH_SIZE);

    nms(batch_res, &prob[0 * OUTPUT_SIZE], CONF_THRESH, NMS_THRESH);

    // Release stream and buffers
    cudaStreamDestroy(stream);
    CHECK(cudaFree(buffers[inputIndex]));
    CHECK(cudaFree(buffers[outputIndex]));
}

5.4 画框

void drawBox(cv::Mat &img,std::vector<Yolo::Detection>& res)
{
    for (size_t j = 0; j < res.size(); j++) {
        cv::Rect r = get_rect(img, res[j].bbox);
        cv::rectangle(img, r, cv::Scalar(0x27, 0xC1, 0x36), 2);
        cv::putText(img, classes[(int)res[j].class_id], cv::Point(r.x, r.y - 1), cv::FONT_HERSHEY_PLAIN, 1.2, cv::Scalar(0xFF, 0xFF, 0xFF), 2);
    }
}

拉流测试可以达到 85FPS （GTX 1070）。

从云端到私有：智慧任务管理工具的私有化转型之路项目管理软件
智慧任务管理工具私有化是指将智慧任务管理工具部署在组织内部的私有服务器或云环境中，以确保数据的安全性、隐私性和完全控制权。以下是对智慧任务管理工具私有化的详细解析：一、私有化的优势●数据安全：私有化部署确保所有数据存储在组织内部的服务器或私有云中，避免数据泄露或被第三方访问，特别适合处理敏感信息或需要遵守数据保护法规（如GDPR、HIPAA等）的组织。●定制化开发：组织可以完全控制系统的配置、更新
构建专属工作流：私有化部署下的数据安全与效率双赢项目管理软件
工作流管理软件私有化是指将工作流管理软件部署在组织内部的私有服务器或专有云环境中，以确保数据的安全性、隐私性和组织的完全控制权。以下是对工作流管理软件私有化的详细分析：一、私有化的优势数据安全：○私有化部署确保所有数据存储在组织内部的服务器或私有云中，避免了数据泄露或被第三方访问的风险。○特别适合处理敏感信息或需要遵守数据保护法规（如GDPR、HIPAA等）的组织。定制化开发：○组织可以完全控制系
Java中字符流和字节流的区别刘小炮吖i Java后端开发面试题 Java java 开发语言
相同点在Java的I/O体系中，字节流和字符流都配备了缓冲机制的实现类，以此显著提升数据读写的效率。字符流：借助BufferedReader和BufferedWriter，它们在处理字符数据时，会将数据先缓存起来，减少与底层数据源或目标的交互次数，从而加速操作。例如，当逐行读取大文本文件时，BufferedReader的缓冲功能能避免频繁的磁盘I/O操作。字节流：BufferedInputStre
【AI+智造】基于阿里云Ubuntu24.04系统，使用Ollama部署开源DeepSeek模型并集成到企业微信邹工转型手札 Duodoo开源 Odoo18开源企业信息化制造人工智能数据分析
作者：Odoo技术开发/资深信息化负责人日期：2025年2月28日本方案结合了本地部署与云服务调用的技术路径，涵盖部署步骤、集成逻辑及关键问题点，适用于企业级AI应用场景。一、方案背景与架构设计1.技术选型背景DeepSeek模型：作为开源大模型，支持文本生成、智能问答等场景，适合企业知识库与自动化服务。Ollama工具：轻量化本地模型部署框架，支持一键拉取模型镜像并启动API服务。企业微信集成：
AI加速回归测试：如何用大模型预测哪些模块最容易出问题测试者家园人工智能测试开发和测试质量效能人工智能质量效能软件测试软件研发大模型预测回归测试风险预测
用ChatGPT做软件测试回归测试是软件开发过程中必不可少的环节，尤其是在持续集成和快速迭代的开发环境下。随着软件系统变得日益复杂，传统的回归测试面临着显著的挑战：测试覆盖面广、执行周期长、资源消耗大，而测试人员又常常无法准确预测哪些模块会出现问题。为了提高回归测试的效率和精准性，AI，特别是大模型技术的引入，为回归测试的智能化提供了前所未有的机遇。通过大模型的预测能力，测试团队能够更加高效地识别
SpringCloud/Boot集成LogBack azoon.top spring cloud logback spring log4j slf4j
一.简要介绍什么是SLF4J？官网介绍：SimpleLoggingFacadeforJava（SLF4J）充当简单的各种日志记录框架的Facade或抽象（e.g.java.util.logging、logback、log4j）允许最终用户在部署时插入所需的日志记录框架。类似java中的接口，如果只集成SLF4J，日志只能输出在控制台，并没有输出到文件的能力，要实现真正的日志能力，需要引入其实现层：
【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核有啥问啥大模型行业调研科普算法语言模型
深入了解FlashMLA：HopperGPU的高效MLA解码内核简介在人工智能(AI)领域，特别是大型语言模型(LLM)领域，对计算效率和速度的需求持续增长。为了应对这些挑战，DeepSeek推出了FlashMLA，这是一种专为NVIDIAHopperGPU架构优化的高效MLA(Multi-LayerAttention)解码内核。FlashMLA旨在加速LLM的解码过程，从而显著提高模型的响应速度
Java微服务的注册中心Nacos 铁锤学代码微服务 java 微服务开发语言
文章目录Nacos的主要作用Nacos实现动态配置更新的技术Nacos实现CAPNacos实现CAP原理Nacos使用Distro和Raft分别干什么用？ZAB与Raft的区别Nacos的主要作用配置中心:可以将微服务中的一些配置信息放到Nacos进行统一管理，也可以通过Nacos实现动态配置管理。也可以将不同环境的配置放在不同的Namespace下的group下，实现动态选择配置发布部署。服务注
国内短剧系统源码部署小程序体验测评讲解南阳迈特网络科技短剧源码短剧小程序短剧系统小程序系统架构 php
在移动互联网飞速发展的今天，短剧作为一种新兴的娱乐形式，凭借其短小精悍、内容丰富的特点，迅速赢得了大量用户的青睐。作为一名软件测试人员，我有幸深入体验了一款功能全面、设计精良的短剧小程序。本文将从前端设计、后端功能、用户体验以及服务支持等多个角度，对这款小程序进行详细评测。如果您也感兴趣欢迎点我了解一起探讨一下吧一、前端设计：灵活与美观的完美融合1.运营方自由DIY：个性化定制的极致体验这款小程序
驱动开发系列39 - Linux Graphics 3D 绘制流程（二）- 设置渲染管线黑不溜秋的 GPU驱动专栏驱动开发
一：概述Intel的Iris驱动是Mesa中的Gallium驱动，主要用于IntelGen8+GPU（Broadwell及更新架构）。它负责与i915内核DRM驱动交互，并通过Vulkan（ANV）、OpenGL（IrisGallium）、或OpenCL（Clover）来提供3D加速。在Iris驱动中，GPUPipeline设置涉及多个部分，包括编译和上传着色器、设置渲染目标、绑定缓冲区、配置固定
神经网络中的Nesterov Momentum 化作星辰神经网络人工智能深度学习
NesterovAcceleratedGradient(NAG)，也称为NesterovMomentum，是一种改进版的动量优化算法，旨在加速梯度下降过程中的收敛速度，并提高对最优解的逼近效率。它由YuriiNesterov在1983年提出，是对传统动量方法的一种增强。###传统动量法回顾在传统的动量方法中，更新规则不仅考虑当前的梯度，还包含了之前所有梯度的方向和大小的累积（即“动量”），以帮助克
DeepSeek R1 简单指南：架构、训练、本地部署和硬件要求爱喝白开水a 人工智能 AI大模型 DeepSeek R1 DeepSeek 算法人工智能训练大模型部署
DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法，通过强化学习（RL）提升大型语言模型（LLM）的推理能力。这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下，增强LLM解决复杂问题的能力上，取得了重要进展。DeepSeek-R1技术概述模型架构DeepSeek-R1不是一个单独的模型，而是包括DeepSeek-R1-Zer
如何用staruml画包图_StarUML的9种图 weixin_39935777 如何用staruml画包图
UML的九种图：用例图，类图，对象图，状态图，活动图，序列图，协作图，构件图，部署图。外加包图。(一)、用例图1、定义:由参与者(Actor)、用例(UseCase)以及它们之间的关系构成的用于描述系统功能的动态视图称为用例图.2、简要介绍:用例图主要用于为系统的功能需求建模，它主要描述系统功能，也就是从外部用户的角度观察，系统应该完成哪些功能，有利于开发人员以一种可视化的方式理解系统的功能需求。
【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
指定的服务已标记为删除勤不了一点 windows windows
同时也适合xampp下的apache、mysql等各个服务转发：https://www.iteye.com/blog/inexus-1608761想重新在windows里部署svn服务，所以第一步删除svn服务：管理员权限下运行cmd：“scdeletesvnserver”之后再部署svn的服务：“sccreatesvnserverbinpath="C:\ProgramFiles\Tortoise
【GO】学习笔记勤不了一点 GO golang 学习笔记 go
目录学习链接开发环境开发工具GVM-GO多版本部署GOPATH与go.modgo常用命令环境初始化编译与运行GDB--GNU调试器基本语法与字符类型关键字与标识符格式化占位符基本语法初始值&零值&默认值变量声明与赋值_下划线的用法字符类型const常量字符串类型转换与判断指针值类型和引用类型复杂数据类型数组：一个由固定长度的特定类型元素组成的序列切片(Slice)：动态序列链表(list)：没有元
【云原生】Docker搭建知识库文档协作平台Confluence 逆风飞翔的小叔运维 Confluence Confluence搭建 Confluence使用 Confluence搭建与使用 Confluence使用详解
目录一、前言二、企业级知识库文档工具部署形式2.1开源工具平台2.1.1开源工具优点2.1.2开源工具缺点2.2私有化部署2.3混合部署三、如何选择合适的知识库平台工具3.1明确目标和需求3.2选择合适的知识库平台工具四、Confluence介绍4.2confluence特点4.3Confluence中的几个概念4.3.1空间（Space）4.3.2Dashboard4.3.3页面（Page）4.
向量数据库milvus部署一方有点方 milvus
官方文档MilvusvectordatabasedocumentationRunMilvusinDocker(Linux)|MilvusDocumentationMilvusvectordatabasedocumentation按部署比较简单，这里说一下遇到的问题一：DockerCompose方式部署1、镜像无法拉取,(docker.io被禁)只能获取以下镜像，image:quay.io/core
如何收集k8s pod的服务日志（rancher）一方有点方 kubernetes rancher 容器
一、环境情况说明当前环境是k8s+rancher+filebeat+es+kibana本文只讲解部署filebeat收集容器日志的过程、使用daemonset的方式部署filebeat，es+kibana+k8s已提前创建好的二、部署安装1、在已创建完成的k8s环境中，用kubectl先创建一个命名空间elk-log，新增一个filebeat目录,上传一下4个代码文件filebeat.daemon
vite构建打包性能优化富朝阳 JavaScript 工具 vite打包优化 vite打包配置 vite vue.js
目录1、清除console和debugger二、gzip静态资源压缩第一步：客户端打包开启第二步：部署服务端开启三、静态文件按类型分包四、超大静态资源拆分(代码分割)第一种：提高静态资源的容量大小第二种：合并路由打包第三种：最小拆分打包五、打包分析插件六、组件按需导入七、图片资源压缩八、CDN加速我的博客原文：https://code-nav.top/article/1071最近在用Vite4+T
基于SpringBoot+Vue驾校理论课模拟考试系统源码(自动化部署) .whl Java学习进阶毕设源码 spring boot vue.js 自动化
DrivingTestSimulationUnity3DProject,subjecttwo,simulateddrivingtest【更新信息】更新时间-2021-1-17解决了方向盘不同机型转动轴心偏离更新时间-2021-2-18加入了手刹系统待更新-2021-6-19（工作太忙少有时间更新，先指出问题）解决了在REC回放下偶然出现的物体回放错位BUG（每一个挂ReplayEntity.cs的
H100生成式AI效能跃升指南智能计算研究中心其他
内容概要作为NVIDIAHopper架构的旗舰产品，H100GPU通过革命性的硬件设计与计算范式重构，为生成式AI工作负载提供了前所未有的加速能力。本文将从芯片架构创新出发，首先解析第四代TensorCore如何通过FP8精度支持与动态指令调度机制，实现矩阵运算效率的指数级提升；继而探讨显存子系统在带宽扩容与智能缓存分配上的突破，揭示其突破生成式AI内存墙的关键路径。在技术实践层面，文章系统梳理了
算力革新引领数字中国智能跃迁智能计算研究中心其他
内容概要算力作为数字经济的核心驱动力，正通过架构创新与场景融合加速重构技术生态。当前算力体系呈现三大演进方向：异构计算突破传统芯片性能瓶颈，实现CPU、GPU、FPGA等多元架构的协同调度；边缘计算推动工业设备、物联网终端等场景的实时响应能力提升，形成“云-边-端”三级计算网络；量子计算则在加密通信、药物研发等领域展现颠覆性潜力，其物理比特操控精度已达实用化临界点。技术方向核心特征典型应用场景异构
通过docker和gitlab实现项目自动打包部署 hxj.. 服务部署 docker 容器运维
Gitlab如何实现自动打包部署到docker集群？预备知识：开发模式转变：瀑布模型——》敏捷开发——》DevOpsDevOps：DevelopmentOperations的组合词CICD：持续集成（ContinuousIntegration），持续交付（ContinuousDelivery），持续部署（ContinuousDeployment）使用Gitlab-CI实现自动打包部署通过pipel
使用Hugging Face Text Embeddings Inference进行文本嵌入推理 dgay_hua python
在自然语言处理中，文本嵌入是一个重要的技术，它将文本转换为可以由机器学习算法处理的数字向量。在这篇文章中，我们将探讨如何使用HuggingFace的TextEmbeddingsInference（TEI）工具包来部署和服务开源文本嵌入和序列分类模型。TEI支持高性能提取，包括常用的嵌入模型如FlagEmbedding、Ember、GTE和E5。技术背景介绍文本嵌入在现代NLP任务中起着关键作用，它
DroidDissector本地部署想做后端的小C linux 运维服务器
DroidDissector本地部署我启动的是MediumPhoneAPI30安卓虚拟机先决条件：把frida-server推送到虚拟机的/data/local/tmp/目录中cdH:\frida_serveradbpushH:\frida_server\frida-server-16.6.6-android-x86/data/local/tmp/
DeepSeek本地部署必要性分析及云端替代方案推荐 Asher_Yao 人工智能
一、本地部署适用场景分析硬件要求完整版模型需≥32GB显存（推荐NVIDIAA100/A800）基础版也需RTX3090级别显卡（约150W功耗）适用人群建议✔️企业用户：需私有化部署处理敏感数据✔️研究人员：需定制模型微调✔️开发者：需API深度集成维护成本单节点年运维成本≈¥18,000（含电费/散热）二、已验证的云端替代方案（2025.2实测）方案1：硅基流动SaaS平台技术特性：支持API
Deepseek开源周第四天：从 DualPipe 到 EPLB deepseek开源
Deepseek开源周第四天：从DualPipe到EPLB前言上周deepseek宣布，将在本周陆续发布五个开源项目，这些库已经在生产环境中经过了记录、部署和实战测试。今天是deepseek开源周的第四天，deepseek发布了三个开源项目，分别是GitHub-deepseek-ai/DualPipeGitHub-deepseek-ai/eplbGitHub-deepseek-ai/profile
怎么设置腾讯云CDN缓存规则幻影龙王腾讯云缓存服务器 CDN缓存规则 CDN
CDN主要功能是在不同的地点缓存内容，通过负载均衡技术，将用户的请求定向到最合适的缓存服务器上去获取内容，比如说，是北京的用户，我们让他访问北京的节点，深圳的用户，我们让他访问深圳的节点。通过就近访问，加速用户对网站的访问。解决Internet网络拥堵状况，提高用户访问网络的响应速度。今天就把我设置的方法贡献出来，可能不是那么完美，但是的的确确起到了简单的防护和加速作用，而且新用户有免费半年的流量
fastapi 大型应用_FastApi项目实战 - 爱投票管理系统（一）赌徒梦 fastapi 大型应用
一、闲来无事，在工作之余自己研究了一下python的异步框架-fastapi，并写包括1、部门管理2、角色管理3、用户管理4、菜单管理5、登录日志6、操作日志7、添加反爬机制六个基础功能模块，演示链接：https://www.lovevote.cn，账号：admin，密码：admin由于我的电脑问题，下载的vue依赖包有几个发生了版本冲突，打包部署后偶尔会在点击菜单按钮时发生前端延时(这时表现为缓
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

YOLOV5之TensorRT加速：C++版