javastart

Jetson嵌入式系列模型部署-1

原文：Jetson嵌入式系列模型部署-1-pudn.com

深度学习
目标检测
arm

- - 前言
  - 1. What、Why and How
  - - 1.1 What
    - 1.2 Why
    - 1.3 How
  - 2. tensorRT
  - - 2.1 什么是tensorRT？
    - 2.2 tensorRT特性
    - 2.3 tensorRT工作流程
  - 3. 驾驭tensorRT的几种方案
  - - 3.1 repo1 https://github.com/wang-xinyu/tensorrtx
    - 3.2 repo2 https://github.com/NVIDIA-AI-IOT/torch2trt
    - 3.3 repo3 https://github.com/shouxieai/tensorRT_Pro
  - 4. tensorRT_Pro
  - - 4.1 Protobuf
    - - 4.1.1 Protobuf简介
      - 4.1.2 基本使用流程
    - 4.2 ONNX
    - - 4.2.1 概念
      - 4.2.2 组成
  - 5. Jetson nano
  - 6. 结语
  - 7. 下载链接
  - 8. 参考

前言

本文旨在为大家提供jetson嵌入式系列模型部署两个简单的技术路线，直白的说就是给大家安利两个仓库分别是tensorrtx和tensorRT_Pro。本文采用常见的yolov5(v6.0版本)目标检测算法实现在jetson nano上的模型部署工作(PS:手头只有nano，太穷了，)。假设各位看官的jetson nano环境配置已经完成，能够使用yolov5成功训练自己的数据集。我们重点关注jetson nano上的部署工作。有错误欢迎各位批评指正!!!

本次训练的模型使用yolov5s-6.0，类别数为2，为口罩识别。先看效果图，第一张图为tensorrtx在jetson nano上的推理效果图，可参考Jetson嵌入式系列模型部署-2查看详细流程；第二张图为tensorRT_Pro在jetson nano上的推理效果图，可参考Jetson嵌入式系列模型部署-3查看详细流程。

1. What、Why and How

问题: 什么是深度学习模型部署？为什么需要部署？如何去部署呢？

1.1 What

什么是深度学习模型部署？

简单来说就是将你训练好的深度学习模型应用在不同场景下的不同设备上(即特定环境下运行),这些设备可能是服务器、移动端、嵌入式…

1.2 Why

为什么要学习部署呢?

直接将模型放在不同的设备上跑不就完事了吗？其实不然，这样做存在两个问题：模型框架兼容性差以及模型运行速度慢。大家知道目前训练模型都基于深度学习框架如pytorch、tensorflow、paddle等，这些框架的兼容性差(直白点说就是环境配置麻烦，一想起深度学习环境配置就头痛)，而且这些框架基于python语言其运行速度无法和C++这类语言相比。

假设我们需要在jetson nano上去部署属于自己的yolov5模型，难道要求我们在jetson nano上配置pytorch等深度学习环境吗？那未免也太折磨人了，单纯基于pytorch等框架去进行模型的推理存在以下几个问题:

环境配置繁琐，且不说在arm架构的嵌入式上配置深度学习环境了，光在PC端都要折腾一阵

携带的框架太过笨重，训练出的模型太冗余需要优化才能满足实际需求

语言问题，框架大多基于python语言，运行速度慢

移植问题，框架环境依赖性强，耦合性高，无法更加方便的移植

参考自模型部署简介

基于以上问题，我们想能不能将框架隔离呢？即仅通过pytorch、tensorflow、paddle等框架训练模型，后续在不同场景下的部署实现仅需要训练好的模型即可，而不需要依赖框架推理。

1.3 How

如何去部署？

即解决方案。怎么利用训练好的模型不依赖框架推理呢？——通过模型推理部署框架，依旧是框架不过这次换成了模型推理框架。目前主流的模型推理部署框架有以下几种：

NVIDIA的TensorRT。首当其冲的肯定是tensorRT，NVIDIA通过其自家的GPU，CUDA、CUDNN等软件环境形成了一个强大的生态圈。该推理框架主要是针对NVIDIA的显卡和其推出的jetson系列嵌入式设备。

Intel的OpenVINO。openvino是Intel开发的基于inter CPU计算设备的推理引擎。

Tencent的NCNN。ncnn是腾讯基于移动端的推理引擎。

Microsoft的ONNXRuntime。onnx是microsoft开发的一个中间格式，而ort(onnxruntime)是其为onnx开发的推理引擎

Rockchip的RKNN。rknn是瑞芯微为其NPU设计的nn推理引擎。

参考自业界主流模型推理部署框架，RKNN使用

具体使用那种推理框架呢？—看需求，部署的方式取决于需求。如果需要在jetson系列嵌入式平台上推理，那么选择tensorRT再合适不过了；如果需要在手机移动端推理，那么可以腾讯的ncnn推理框架；能做到见招拆招即可。参考自训练好的深度学习模型式怎么部署的?

2. tensorRT

分享jetson系列嵌入式设备的模型部署，那肯定需要聊聊tensorRT。

2.1 什么是tensorRT？

tensorRT是一个SDK(Software Development Kit)即软件开发工具包，用于优化经过训练的深度学习模型以实现高性能推理

2.2 tensorRT特性

TensorRT为什么能加速推理过程，它是如何优化的？主要体现在以下几个方面：

算子融合 Conv+Bias+ReLU -> CBR
量化
- INT8或FP16以及TF32
- 存储优势、计算优势、通信优势
内核自动调整
- 根据不同显卡架构、SM数量、内核频率等选择不同的优化策略以及计算方式，寻找最适合当前架构的计算方式
- Kernel可以根据不同大小的batch和问题的复杂度去选择最合适的算法，TensorRT预先写了很多GPU实现，有一个自动选择的过程
动态张量线程WorkSpace
多流执行
参考自tensorRT如何进行推理加速?

通过tensorRT能够在Nvidia系列GPU上发挥出最好的性能。值得注意的是，tensorRT的模型，需要在目标GPU上以实际运行的方式选择最优算法和配置，也因此tensorRT生成的模型是与其设备强绑定的，与其编译时的trt版本、cuda版本、GPU型号相关联。同时tensorRT支持FP32、FP16、INT8等多种精度，如何查看自身GPU是否支持FP16/INT8精度呢？主要分以下两步

1. 访问CUDA GPU | NVIDIA Developer查看显卡对应的算力

2. 访问Support Matrix :: NVIDIA Deep Learning TensorRT Documentation查看对应算力支持的精度

比如说jetson nano算力是5.3，只支持FP32不支持FP16、INT8。

如果想了解关于tensorRT更多细节请查看tensorRT官方文档

2.3 tensorRT工作流程

tensorRT是如何构建模型呢？主要通过两种方式

1. 通过TRT API一层层搭建模型
- tensorRT提供基于C++接口构建模型的方式，见下图，参考自TensorRT/samples/sampleMNISTAPI/sampleMNISTAPI.cpp
- tensorRT也提供基于Python接口构建模型的方式，见下图，参考自TensorRT/samples/python/engine_refit_mnist/sample.py

2. NVIDIA官方也提供另外三种途径实现更加方便的封装，如下图所示
- UFF格式的文件，通过libnvparsers.so可以调用TRT API去解析UFF文件从而构建模型(tensorflow采用的方案)
- ONNX格式的文件，通过libnvonnxparser.so可以调用TRT API去解析ONNX文件从而构建模型(pytorch采用的方案)
- Caffe格式的文件，通过libnvcaffe_parser.so可以调用TRT API去解析Caffe文件从而构建模型(使用较少)

3. 驾驭tensorRT的几种方案

Copy自详解TensorRT的C++/Python高性能部署，建议看原视频的详细讲解

3.1 repo1 https://github.com/wang-xinyu/tensorrtx

repo1为每个模型写硬代码，流程如下所示

使用作者自定义的gen_wts.py存储权重
使用C++硬代码调用TRT API构建模型结构，加载gen_wts.py产生的权重文件
优点
- 可以控制每个layer的细节和权重，直接面对TRT API
- 在认为ONNX方案适配性差的前提下，这种方案不存在算子问题，如果存在不支持的算子，可以自行增加插件。灵活性最高
- 这种方案与官方的samples相似度高，有参照
- 作者提供了大量场景模型的硬代码，方便直接使用，受到Yolov5官方引用
缺点
- 过于灵活，需要控制的细节太多，对技能要求较高
- 模型构建的方式采用的硬代码，灵活度差。新模型需要自己一个layer一个layer的写C++代码构建，不具有通用性
- 作者提供的推理代码是demo级，到使用阶段时，需要修改太多。可以看作官方的扩展
- 部署时无法查看网络结构进行分析和排查

3.2 repo2 https://github.com/NVIDIA-AI-IOT/torch2trt

repo2为每个算子写Converter，反射Moule.forward捕获输入输出和图结构，流程如下所示

作者为pytorch的每一个操作做了Converter，为每个操作的forward反射到自定义函数下
通过反射torch的forward操作捕获模块的权重，调用Python API接口实现模型构建
优点
- 直接集成Python、Pytorch，可以实现pytorch模型到tensorRT模型的无缝无脑简单转换
缺点
- 提供的是Python的方案，并没有C++的方案
- 新的算子需要自己实现Converter，需要维护新的算子库
- 直接用Pytorch转到tensorRT存储的模型是tensorRT模型，如果跨设备则必须在设备上安装pytorch，灵活度不利于部署
- 部署时无法查看网络结构进行分析和排查

3.3 repo3 https://github.com/shouxieai/tensorRT_Pro

repo3基于ONNX路线，提供C++、Python接口，深度定制ONNXParser，低耦合封装，实现常用模型Yolov7、YoloX、Yolov5、Yolov3、Unet、RetinaFace、Arcface、SCRFD、DeepSORT等等。算子由官方维护，模型直接导出，流程如下所示

对，就是he，知道别个的优缺点，就知道该怎么设计了
优点
- 集成工业级推理方案，支持tensorRT从模型导出到应用到项目中的全部工作
- 案例有Yolov5、YoloX、AlphaPose、RetinaFace、SCRFD、Arcface、DeepSORT，每个应用均为高性能工业级拿来即可用，低耦合
- 具有简单的模型导出方法和onnx问题的解决方案
- 具有简单的模型推理接口，封装tensorRT细节。支持插件
- 支持python接口导出模型和推理接口
- 依赖onnx，pytorch方面有官方支持，tensorRT方面也有官方支持。咱们做的是桥梁。虽然onnx存在各种兼容性问题，搞清楚了，还是可以轻松驾驭它
缺点
- 各位看官自己写吧()

4. tensorRT_Pro

单独将这个repo拿出来讲是因为里面有些内容值得深挖，该repo基于ONNX路线完成tensorRT模型构建，需要编译protobuf，下面简单聊聊为什么需要编译protobuf、什么是protobuf以及onnx是什么等相关内容

4.1 Protobuf

关于protobuf的相关介绍Copy自赵老师的百度Apollo智能驾驶课程，建议看原视频，关于protobuf的编译请参考here

4.1.1 Protobuf简介

概念

Protobuf全称Protocol buffers，是Google研发的一种跨语言、跨平台的序列化结构的数据格式，是一个灵活的、高效的用于序列化数据的协议

特点

在序列化数据时常用的数据格式还有XML、JSON等，相比较而言，Protobuf更小、效率更高且使用更为便捷，Protobuf内置编译器protoc，可以将protobuf文件编译成C++、Python、Java、C#、Go等多种语言对应的代码，然后可以直接被对应语言使用，轻松实现对数据流的读或写操作而不需要再做特殊解析。

Protobuf的优点如下：

高效——序列化后字节占用空间少，序列化的时间效率高
便捷——可以将结构化数据封装为类，使用方便
跨语言——支持多种编程语言
高兼容性——当数据交互的双方使用同一数据协议，如果一方修改了数据结构，不影响另一方的使用

Protobuf也有缺点：

二进制格式易读性差
缺乏自描述

4.1.2 基本使用流程

现有需求如下

创建一个protobuf文件，在该文件中声明学生的姓名、身高、年龄…等信息，然后分别使用C++和Python实现学生数据的读写操作。

实现流程如下

1.编写proto文件
2.编译生成对应的C++或Python文件
3.在C++或Python中调用

1.编写proto文件，如下所示

// student.proto

// 使用的 proto 版本
syntax = "proto2"

// 包
package person;

//消息 ---message 是关键字，Student 消息名称
message Student{
    //字段
    //字段格式：字段规则 数据类型 字段名称 字段编号
    required string name   = 1;
    optional unit64 age    = 2;
    optional double height = 3;
    repeated string books  = 4;
}

2.编译，指令如下

$ protoc student.proto --cpp_out=./

执行完成后，在当前目录下student.proto文件会生成student.pb.h和student.pb.cc，将.cc后缀修改为.cpp可供C++调用

3.C++调用，调用demo如下

// test.cpp

#include 

using namespace std;
using namespace person;

int main(int argc, char const *argv[])
{
    // 1. create object
    person::Student stu;
    
    // 2. wirte data
    stu.set_name("zhangsan");
    stu.set_age(18);
    stu.set_height(1.75);
    stu.add_books("c++");
    stu.add_books("python");

    // 3. read data
    std::string name = stu.name();
    uint64_t age = stu.age();
    double height = stu.height();
    std::cout << name << " == " << age << " == " << height << std::endl;
    for (int i = 0; i < stu.books_size(); i++)
    {
        std::cout << stu.books(i) << "-";
    }
    std::cout << std::endl;

    return 0;
}

CMakeLists.txt如下

cmake_minimum_required(VERSION 3.0)
project(test)

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wall -pthread -std=c++11")
set(CMAKE_BUILD_TYPE Debug)
set(EXECUTABLE_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/workspace)

set(PROTOBUF_DIR "/home/zhlab/protobuf")

include_directories(
    ${PROTOBUF_DIR}/include
    ${PROJECT_SOURCE_DIR}/src
)

link_directories(
    ${PROTOBUF_DIR}/lib
)

add_executable(main ${PROJECT_SOURCE_DIR}/src/test.cpp ${PROJECT_SOURCE_DIR}/src/student.pb.cpp)

# add protobuf
target_link_libraries(main protobuf)
target_link_libraries(main pthread)

编译test.cpp文件，在workspace/文件夹下运行可执行文件，图解如下所示

给出protobuf的demo演示源码下载链接Baidu Drive[password:yolo]

4.2 ONNX

4.2.1 概念

onnx可以理解为一种通用货币，开发者可以把自己开发训练好的模型保存为onnx文件，而部署工程师可以借助部署框架(如tensorRT、openvino、ncnn等)部署在不同的硬件平台上，而不必关系开发者使用的是哪一种框架
onnx的本质是一种protobuf格式文件
protobuf通过编译onnx-ml.proto文件得到onnx-ml.pb.h和onnx-ml.pb.cc用于C++调用或onnx_ml_pb2.py用于python调用，如下图所示。如果本地python环境下安装了onnx第三方库，则在该库下可以找到onnx_ml_pb2.py文件
通过编译得到的onnx-ml.pb.cc和代码就可以操作onnx模型文件，实现对应的增删改
onnx-ml.proto用于描述onnx文件时如何组成的，具有什么结构，它是onnx经常参照的东西，如下是onnx-ml.proto部分内容，参考自tensorRT_Pro/onnx-ml.proto at main · shouxieai/tensorRT_Pro · GitHub

4.2.2 组成

onnx文件组成如下图所示

model：表示整个onnx模型，包括图结构和解析器版本、opset版本、导出程序类型
- opset版本即operator版本号即pytorch得op(操作算子)版本
model.graph：表示图结构，通常是Netron可视化工具中看到的结构
model.graph.node：表示图结构中所有节点如conv、bn、relu等
model.graph.initializer：权重数据大都存储在这里
model.graph.input：模型的输入
model.graph.output：模型的输出

5. Jetson nano

关于jetson nano刷机就不再赘述了，需要各位看官自行配置好相关环境，外网访问较慢，这里提供Jetson nano的几个JetPack镜像下载链接Baidu Drive[password:nano]【更新完毕!!!】(PS:提供4.6和4.6.1两个版本，注意4GB和2GB的区别，不要刷错了)，关于Jetson Nano 2GB和4GB的区别可参考链接Jetson NANO是什么？如何选？。(吐槽下这玩意上传忒慢了，超级会员不顶用呀，终于上传完了，折磨!!!)，博主使用的jetpack版本为JetPack4.6.1，其详细信息如下所示

6. 结语

本篇博客简单介绍了模型部署的相关工作以及驾驭tensorRT的几种方案。后续通过tesorrtx和tensorRT_Pro两个repo带大家实现在jetson nano上的yolov5模型部署。可参考Jetson嵌入式系列模型部署-2和Jetson嵌入式系列模型部署-3

7. 下载链接

protobuf的demo演示源码下载链接Biadu Drive[password:yolo]
- protoc_test文件夹下共包含build src workspace CMakeLists.txt四个文件
- build为博主在jetson nano上编译生成的中间文件(PS:可删除自行编译)
- src文件夹下包含student.proto及其生成的student.pb.h和student.pb.cc，test.cpp用于C++调用
- workspace下存放着可执行文件
JetPack镜像下载链接Baidu Drive[password:nano]【更新完毕!!!】，上传忒慢

8. 参考

tensorrtx
tensorRT_Pro
torch2trt
Jetson嵌入式系列模型部署-2
Jetson嵌入式系列模型部署-3
模型部署简介
业界主流模型推理部署框架
RKNN使用
训练好的深度学习模型式怎么部署的?
tensorRT如何进行推理加速?
显卡算力查询
算力支持的精度查询
tensorRT官方文档
详解TensorRT的C++/Python高性能部署博主强烈推荐!!!
赵老师的百度Apollo智能驾驶课程
protobuf编译
Netron可视化工具
Jetson NANO是什么？如何选？

感谢各位看到最后，创作不易，读后有收获的看官请帮忙点个⭐️

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方