车大划水冠军%

NVIDIA deepstream 6.0 python apps 样例test1模型代码解读

硬件：NVIDIA Jetson Xavier NX developer kit

Jetson版本：4.6.1

deepstream版本：6.0.1

test1是deepstream提供的最基础的模型，实现对视频流进行目标检测。新手入门，有很多代码与函数不清楚有何含义，故参考了网站各类介绍，可搭配文末的参考文章一起阅读。

1. 代码解读

代码共260行，为方便查看，将代码分为几部分。其中标注有？为不确定的内容，欢迎前辈指教。

1.1 许可声明与python包导入

SPDX：Software package data exchange 软件包数据交换标准

涉及的python包：sys, gi, common, pyds。sys包请参考文末学习，后3个包建议在系统中查找学习(没搜索到，进一步查找后会更新新文章讲述)。

sys: 涉及系统交互的包，功能如获取文件所在路径，系统硬件状态，输出与报错等。参考文章于文末，本代码中涉及的函数有sys.exit(), sys.path, sys.stderr (参考文章中序号为23, 58, 74).

gi: 简单理解为能将c与python等语言搭建起桥梁的包。一般复杂模型在基层会采用c/c++编写，因为这两种能与系统/硬件直接相连，编译速度快，而更高层的模型用c编写会特别麻烦，采用python等语言会带来极大便利。gi包则是提供了模型基层和高层不同代码之间连接的桥梁。本代码中涉及的函数有require_version(), Glib, Gst 。

common: common为deepstream_python_apps提供的模型通用包，位于与模型文件夹同一层级的文件夹中，即deepstream/apps/ 。本代码中涉及的函数有is_aarch_64(), bus_call() 。

pyds: Gstreamer框架下为deepstream构建的python包，用于视频流分析。本代码中涉及的函数有gst_buffer_get_nvds_batch_meta(), NvDsFrameMeta.cast(), NvDsObjectMeta.cast(), nvds_acquire_display_meta_from_pool() 。

#!/usr/bin/env python3  #运行环境要求使用python3运行？

################################################################################
# 英伟达公司与附属公司，版权所有。
# SPDX-FileCopyrightText: Copyright (c) 2019-2021 NVIDIA CORPORATION & AFFILIATES. All rights reserved.  
# 许可证标识符
# SPDX-License-Identifier: Apache-2.0  
# 根据Apache许可证获得许可
# Licensed under the Apache License, Version 2.0 (the "License");  
# 除非符合许可证，否则不得使用此文件。
# you may not use this file except in compliance with the License.  
# 你可以在下述网站获得一份许可证的备份
# You may obtain a copy of the License at  
#
# http://www.apache.org/licenses/LICENSE-2.0
#
# 除非适用法律要求或书面同意，否则根据许可证分发的软件按“原样”分发，无任何明示或暗示的保证或条件。
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# 请参阅许可证，了解管理许可证下权限和限制的特定语言。
# See the License for the specific language governing permissions and
# limitations under the License.
################################################################################

import sys  #导入sys包
#系统路径指python安装/运行所在路径，为列表，添加../路径(向上一层文件夹)
sys.path.append('../')  #什么作用？

import gi  #导入GObject Introspection包
gi.require_version('Gst', '1.0')  # ??
from gi.repository import GLib, Gst  #  ??

# 引入函数，功能为判断系统是否为arm64架构，这将影响部分代码的运行
from common.is_aarch_64 import is_aarch64  
# 引入函数，功能为
from common.bus_call import bus_call 

import pyds  # 导入pyds包

#对4种目标赋予编号：车辆-0，自行车-1，人-2，路标-3
PGIE_CLASS_ID_VEHICLE = 0
PGIE_CLASS_ID_BICYCLE = 1
PGIE_CLASS_ID_PERSON = 2
PGIE_CLASS_ID_ROADSIGN = 3

1.2 osd_sink_pad_buffer_probe(pad,info,u_data)函数

函数译为OSD接收器垫缓冲探针，理解为缓冲区中以OSD方式存储的探针metadata元数据？。其中osd为~~对象存储，简单理解为一种metadata的存储架构方式~~onscreen display，即显示器上的展示；sink为接收端？，接收视频源数据metadata？；pad为垫/缓冲器单元？；buffer为缓冲区；probe为探针，类似于但不完全等同训练集的概念。以上概念可通过文末参考文章进一步了解。

功能：实现检测结果展示功能，将模型检测好的目标定界框与类别名称展示在视频中，并在terminal中按帧输出检测结果（在第n帧检测到了x个目标，其中a个车辆，b个行人）？

输入：pad，info，u_data

输出：视频和terminal中输出目标检测结果，return结果为OK（仅代表该函数运行完成，无实意）

在阅读代码前，还请学习了解以下的概念：

frame意为帧，即视频帧，我们看到的视频流都是每隔△t就播放一帧，可以理解成视频就是将一系列图片（帧）按照一定时间序列播放的，有过剪辑视频经验的对此不难理解。

batch意为一批/一束，可以理解为把某种东西包装在一起，比如将100朵玫瑰捆绑在一起。

meta/metadata意为元/元数据，即基础单元数据，视频流处理中的基本单元为帧，元数据即每一帧的图片以及一些属性信息，形式上可以通过 meta. 调用。

batch metadata 意为批量元数据，即将所有的metadata包装在一起，视频流处理中的基本单元为帧，理解为所有帧的数据包装在了一起。

garbage collector即垃圾回收器，清理不用的变量或内存空间，以腾出内存提高代码运行效率。

该函数的逻辑可以这样理解：视频有许多帧，需要循环处理，而每一帧的图片中又有许多检测到的目标，也需要循环处理，所以会形成双层循环，第一层循环的单元是帧，第二层循环的单元是每一帧的目标。每层循环的内容基本是这样的流程：获取数据→转化数据（使其符合deepstream）→实现功能。第一层要实现的功能是获取当前帧的子属性数据并在视频上显示检测结果，第二层要实现的功能是对当前帧检测到的目标，进行计数。

其中有一些获取属性的代码，这里的调用方式类似于C/C++中的指针，经过多次调用赋予新名称，都会在指针所指向的原数据上做改动。

def osd_sink_pad_buffer_probe(pad, info, u_data):
    # 预分类变量空间，frame_number将表示视频流的帧的序号0,1,2,...
    frame_number = 0
    # 初始化4种目标的计数器为0，以字典方式存储，类别有车辆、人、自行车、路标
    # Intiallizing object counter with 0.
    obj_counter = {
        PGIE_CLASS_ID_VEHICLE: 0,
        PGIE_CLASS_ID_PERSON: 0,
        PGIE_CLASS_ID_BICYCLE: 0,
        PGIE_CLASS_ID_ROADSIGN: 0
    }
    # 预分配变量空间，num_rects将表示每一帧种检测到的目标总数（rect即rectangle，矩形，代表定界框）
    num_rects = 0

    # 从输入info中，获取其buffer缓冲区，并存为变量gst_buffer
    gst_buffer = info.get_buffer()
    # 若gst_buffer没有被获取到，通过上述函数会赋值为None，将输出提示不能获取并停止该函数
    if not gst_buffer:
        print("Unable to get GstBuffer ")
        return

    # 该部分代码功能：从gst_buffer中取回成批的元数据batch meta/metadata，即将缓冲区中的视频文件获取为可以用python处理的元数据
    # 注意pyds.gst_buffer_get_nvds_batch_meta()期望输入gst_buffer的C语言的地址
    # 这个C语言地址可通过hash()函数获取
    # Retrieve batch metadata from the gst_buffer
    # Note that pyds.gst_buffer_get_nvds_batch_meta() expects the
    # C address of gst_buffer as input, which is obtained with hash(gst_buffer)
    batch_meta = pyds.gst_buffer_get_nvds_batch_meta(hash(gst_buffer))
    # 提取视频流批量元数据的帧属性，存储为帧列表l_frame,就是视频的每一帧图片（以及属性信息）,它是batch_meta的最主要信息
    l_frame = batch_meta.frame_meta_list  #l代表list

    # 对l_frame进行循环检查，如果获取的l_frame是空的，结束循环，这可能代表没有读取到帧的信息
    # 每一次循环调用的可能只是l_frame中的一个元素，即循环单位为一帧
    while l_frame is not None:
        # 该try,except块的作用：将l_frame转化为deepstream变量的frame_data
        try:
            # 注意l_frame.data（l_frame包括主数据和属性，data是最主要部分）需要转化为pyds.NvDsFrameMeta
            # pyds.NvDsFrameMeta是一种专门的NVIDIA-deepstream变量类型
            # 转化过程通过函数pyds.glist_get_nvds_frame_meta()实现
            # 转化保留了C代码中底层内存的所有权，因此Python垃圾收集器将不处理它
            # 上述提及的转化函数，可能 pyds.glist_get_nvds_frame_meta是pyds.NvDsFrameMeta.cast的子函数
            # Note that l_frame.data needs a cast to pyds.NvDsFrameMeta
            # The casting is done by pyds.glist_get_nvds_frame_meta()
            # The casting also keeps ownership of the underlying memory
            # in the C code, so the Python garbage collector will leave
            # it alone.
            # frame_meta = pyds.glist_get_nvds_frame_meta(l_frame.data)
            # 将l_frame.data转化为pyds.NvDsFrameMeta，存储为frame_meta
            frame_meta = pyds.NvDsFrameMeta.cast(l_frame.data)  # 应为某一帧的元数据
        # 如果l_frame调用完了，即上一行函数调用时出现了StopIteration错误，结束循环
        except StopIteration:
            break

        # 该块的作用：准备用于terminal中输出每一帧的数据
        # frame_meta也有子属性，包括当前帧的帧序号、目标检测的类别及数量等
        frame_number = frame_meta.frame_num  # 获取当前帧的序号如0,1,2,...
        num_rects = frame_meta.num_obj_meta  # 获取当前帧检测到的各类目标总数（obj即目标object）
        l_obj = frame_meta.obj_meta_list  # 获取当前帧检测到的各类目标汇总成的列表
        # 当目标列表l_obj不是空的时，执行循环（与外层循环同理），若当前帧的l_obj为空即当前帧没有检测到目标，就不用执行循环的内容
        # 每一次循环调用的是目标列表中的某个目标元素,注意这是第二层循环，外层循环单元是每帧，第二层循环单元是每帧所检测到的目标
        while l_obj is not None:
            try:
                # 把l_obj.data（类似于l_frame,l_obj同样也有主数据和其他属性）转化为pyds.NvDsObjectMeta
                # pyds.NvDsObjectMeta是一种专门的NVIDIA-deepstream变量类型
                # 转化过程通过函数pyds.glist_get_nvds_object_meta()实现，可能是pyds.NvDsObjectMeta.cast()的子函数
                # Casting l_obj.data to pyds.NvDsObjectMeta
                # obj_meta=pyds.glist_get_nvds_object_meta(l_obj.data)
                # 将l_obj.data转化为pyds.NvDsObjectMeta，存储为obj_meta
                obj_meta = pyds.NvDsObjectMeta.cast(l_obj.data)
            # 如果l_obj调用完了，即上一行函数调用时出现了StopIteration错误，结束循环
            except StopIteration:
                break
            # 从以下两行可以观察到，obj_meta每个目标的元数据有class_id（目标种类的编号）与rect_params（矩形定界框的参数）属性
            # 计数器计数，比如其class_id是0，代表vehicle，就在counter的vehicle键对应的值+1
            obj_counter[obj_meta.class_id] += 1
            # 设置目标源数据的属性rect_params矩形定界框的参数，设置边框颜色的数值如下
            # 定界框的颜色为蓝色，4个数值对应RGBA(red, green, blue, alpha)，1代表拉满即225数值的蓝色调
            # 疑点：修改alpha为1时，运行的定界框没有变化还是蓝色，不清楚定界框的参数是否在这里设置
            obj_meta.rect_params.border_color.set(0.0, 0.0, 1.0, 0.0)
            try:
                # 尝试遍历到l_obj的下一个？这里意会就行
                l_obj = l_obj.next
            #如果目标列表l_obj遍历完了，会得到StopIteration的错误，则跳出该循环（内层循环）
            except StopIteration:
                break

        # 获取一个用于展示的元数据对象。
        # 内存所有权保留在C代码中，因此下游插件（下游插件只能访问C语言内容不能访问python内容）仍然可以访问它。
        # 否则，垃圾收集器将在该探测函数退出时会给它当成垃圾收走。
        # Acquiring a display meta object. The memory ownership remains in
        # the C code so downstream plugins can still access it. Otherwise
        # the garbage collector will claim it when this probe function exits.
        # 从batch_meta批量元数据获取展示用于展示的元数据display_meta
        display_meta = pyds.nvds_acquire_display_meta_from_pool(batch_meta)
        display_meta.num_labels = 1  #未知
        # 将展示元数据的文本参数的第一部分内容，存储为py_nvosd_text_params
        py_nvosd_text_params = display_meta.text_params[0]
        # 设置将在屏幕上展示的文本（运行界面显示的检测情况，可查看第3部分运行结果的截图，左上角的文字）
        # 注意，pyds模块为字符串（即要展示的文本内容）分配了一个缓冲区，垃圾收集器将不会声明内存把它当垃圾收走。
        # 读取此处的display_text字段将返回分配字符串的C地址（而不是直接拿到文本）。所以可以使用pyds.get_string（）获取字符串内容。
        # Setting display text to be shown on screen
        # Note that the pyds module allocates a buffer for the string, and the
        # memory will not be claimed by the garbage collector.
        # Reading the display_text field here will return the C address of the
        # allocated string. Use pyds.get_string() to get the string content.
        # py_nvosd_text_params（上面从展示元数据提取出的第一部分），简单理解为文本参数
        # 设置其属性isplay_text即展示文本，内容为：
“帧序号= ，检测目标数= ，汽车计数= ，行人计数= ”，通过format()方法向花括号内填充数字
        py_nvosd_text_params.display_text = "Frame Number={} Number of Objects={} Vehicle_count={} Person_count={}".format(
            frame_number, num_rects, obj_counter[PGIE_CLASS_ID_VEHICLE], obj_counter[PGIE_CLASS_ID_PERSON])

        # 设置文本参数py_nvosd_text_params的x补偿与y补偿的大小，会影响目标的字符显示位置（以运行界面左上角为原点补偿）
        # Now set the offsets where the string should appear
        py_nvosd_text_params.x_offset = 10
        py_nvosd_text_params.y_offset = 12

        # 设置文本属性py_nvosd_text_params的字体属性，包括字体类别、字号与颜色
        # Font , font-color and font-size
        py_nvosd_text_params.font_params.font_name = "Serif"
        py_nvosd_text_params.font_params.font_size = 10
        # RGBA，其中RGB三色均拉满设为255数值，为白色，alpha设为1，代表一点都不透
        # set(red, green, blue, alpha); set to White
        py_nvosd_text_params.font_params.font_color.set(1.0, 1.0, 1.0, 1.0)

        # 设置文本背景颜色
        # Text background color
        # py_nvosd_text_params文本参数的子属性set_bg_clr（设置背景颜色）设为1，可能代表使用背景，0不使用
        py_nvosd_text_params.set_bg_clr = 1
        # RGBA，其中RGB三色均设为0数值，没有亮光为黑色，alpha设为1，代表一点都不透
        # set(red, green, blue, alpha); set to Black
        py_nvosd_text_params.text_bg_clr.set(0.0, 0.0, 0.0, 1.0)
        # 使用pyds.get_string()获取展示文本，形成字符串格式，在terminal中输出打印出来
        # Using pyds.get_string() to get display_text as string
        print(pyds.get_string(py_nvosd_text_params.display_text))
        # 将展示元数据添加到帧数据中，这样我们就会在展示的视频界面看到添加的展示文字
        pyds.nvds_add_display_meta_to_frame(frame_meta, display_meta)
        try:
            # 这帧完了，还有下一帧
            l_frame = l_frame.next
        # 每一帧都遍历完了，会得到StopIteration的错误，则跳出该循环（外层循环）
        except StopIteration:
            break
    
   # 函数返回值，ok了，代表这个探针函数运行完毕了，没有实际意义
    return Gst.PadProbeReturn.OK

1.3 main函数与运行

main函数的流程并不难理解，但涉及到诸多基于Gstreamer框架的deepstream元素，可参考这篇文章（自己后面会写）了解其原理。

def main(args):
    # 检查输入参数的数量
    # Check input arguments
    if len(args) != 2: #参数指python3的参数，第一个参数是.py文件，第二个参数是视频流.h264文件
        # 如果参数数量不对，输出标注错误如下，告诉你参数应该是 <.py文件名+ 一个视频文件或uri标识>
        sys.stderr.write("usage: %s \n" % args[0])
        sys.exit(1)  # 退出，即终止运行，参数1的含义（可能控制某些文本输出）？

    # Standard GStreamer initialization
    # 标准Gstreamer初始化为空None
    Gst.init(None)

    # Create gstreamer elements
    # Create Pipeline element that will form a connection of other elements
    # 创建Gstreamer元素
    # 创建元素pipeline，将为其他元素间形成连接
    print("Creating Pipeline \n ")  # terminal打印出"创建中"
    pipeline = Gst.Pipeline()  # 创建pipeline

    if not pipeline:  # 如果创建没成功，pipeline会被赋值为None
        # 则执行报错，不能创建pipeline，且程序终止
        sys.stderr.write(" Unable to create Pipeline \n")

    #以下的元素创建代码基本同上，不再过多注释，具体创建方法请见介绍Gstreamer的文章

    # Source element for reading from the file
    print("Creating Source \n ")  # 创建source元素，读取视频文件
    source = Gst.ElementFactory.make("filesrc", "file-source")
    if not source:
        sys.stderr.write(" Unable to create Source \n")

    # Since the data format in the input file is elementary h264 stream,
    # we need a h264parser
    # 因为视频数据是h264格式的，需要h264解析器
    print("Creating H264Parser \n")  #创建h264解码器，解码视频数据
    h264parser = Gst.ElementFactory.make("h264parse", "h264-parser")
    if not h264parser:
        sys.stderr.write(" Unable to create h264 parser \n")

    # Use nvdec_h264 for hardware accelerated decode on GPU
    # 使用nvdec_h264以在GPU上进行硬件加速解码
    print("Creating Decoder \n")  #创建nvdecoder_h264，GPU加速解码
    decoder = Gst.ElementFactory.make("nvv4l2decoder", "nvv4l2-decoder")
    if not decoder:
        sys.stderr.write(" Unable to create Nvv4l2 Decoder \n")

    # Create nvstreammux instance to form batches from one or more sources.
    # 创建nvstreammux实例以将1个或多个数据源打包成批
    # 强迫症想在这里也加一个print("Creating StreamMuxer \n")
    streammux = Gst.ElementFactory.make("nvstreammux", "Stream-muxer")
    if not streammux:
        sys.stderr.write(" Unable to create NvStreamMux \n")

    # Use nvinfer to run inferencing on decoder's output,
    # behaviour of inferencing is set through config file
    # 使用nvinfer在解码器的输出上运行推断，推断行为通过配置文件设置
    # 强迫症想在这里也加一个print("Creating Inferer \n")
    pgie = Gst.ElementFactory.make("nvinfer", "primary-inference")
    if not pgie:
        sys.stderr.write(" Unable to create pgie \n")

    # Use convertor to convert from NV12 to RGBA as required by nvosd
    # 根据nvosd的要求，使用convertor将NV12转换为RGBA （可能是颜色编码方式）
    # 强迫症想在这里也加一个print("Creating Convertor \n")
    nvvidconv = Gst.ElementFactory.make("nvvideoconvert", "convertor")
    if not nvvidconv:
        sys.stderr.write(" Unable to create nvvidconv \n")

    # Create OSD to draw on the converted RGBA buffer
    # 创建OSD以在转化的RGBA缓冲区进行画画，即在原视频上添加一些内容，类似Adobe Pr进行剪辑增加元素
    # 强迫症想在这里也加一个print("Creating OSDdisplay \n")
    nvosd = Gst.ElementFactory.make("nvdsosd", "onscreendisplay")

    if not nvosd:
        sys.stderr.write(" Unable to create nvosd \n")

    # Finally render the osd output
    # 最后渲染OSD的输出
    if is_aarch64():  # 如果你用的是arm64架构的系统
        # 创建1个trasform转化元素
        transform = Gst.ElementFactory.make("nvegltransform", "nvegl-transform")

    print("Creating EGLSink \n")  # 创建1个sink元素
    sink = Gst.ElementFactory.make("nveglglessink", "nvvideo-renderer")
    if not sink:
        sys.stderr.write(" Unable to create egl sink \n")

    # terminal中打印：正在运行文件，%s即为你输入的.h264文件
    print("Playing file %s " %args[1])
    # 为部分元素设置属性
    source.set_property('location', args[1])  # 设置source元素的location属性为你输入的.h264文件
    streammux.set_property('width', 1920)  # 设置streammux的width属性为1920
    streammux.set_property('height', 1080)  # 设置streammux的height属性为1080
    streammux.set_property('batch-size', 1)  # 设置streammux的batch-size批大小属性为1
    streammux.set_property('batched-push-timeout', 4000000)  # 设置batched-push-timeout批延时属性为4million秒
    pgie.set_property('config-file-path', "dstest1_pgie_config.txt")  # 设置pgie的config-file-path配置文件路径为这个txt文件

    # 下面把上述创建的元素都添加到pipeline中
    print("Adding elements to Pipeline \n")
    pipeline.add(source)
    pipeline.add(h264parser)
    pipeline.add(decoder)
    pipeline.add(streammux)
    pipeline.add(pgie)
    pipeline.add(nvvidconv)
    pipeline.add(nvosd)
    pipeline.add(sink)
    if is_aarch64():  # 如果是arm64架构的系统，还要加入transform元素
        pipeline.add(transform)

    # we link the elements together
    # file-source -> h264-parser -> nvh264-decoder ->
    # nvinfer -> nvvidconv -> nvosd -> video-renderer
    # 按照上述顺序，将pipeline中的元素依次连接
    print("Linking elements in the Pipeline \n")
    source.link(h264parser)
    h264parser.link(decoder)

    sinkpad = streammux.get_request_pad("sink_0") # 从streammux元素中拿到sinkpad
    if not sinkpad:
        sys.stderr.write(" Unable to get the sink pad of streammux \n")
    srcpad = decoder.get_static_pad("src")  # 从decoder中拿到srcpad
    if not srcpad:
        sys.stderr.write(" Unable to get source pad of decoder \n")
    srcpad.link(sinkpad)  # 这里srcpad即是decoder的一个枝条，伸出来连接streammux的sinkpad
    streammux.link(pgie)  # 上面一行相当于decoder和streammux的小弟连接起来了，这行又重回streammux进行连接
    pgie.link(nvvidconv)
    nvvidconv.link(nvosd)
    if is_aarch64():  # 如果是arm64架构，则连接时候要把transform元素加上
        nvosd.link(transform)
        transform.link(sink)
    else:  # 不是arm64架构的系统，就直接连接sink就好
        nvosd.link(sink)

    # create an event loop and feed gstreamer bus mesages to it
    # 创建一个事件循环，并向其提供gstreamer总线消息（bus是总线不是公交）
    loop = GLib.MainLoop()  # 创建事件循环
    bus = pipeline.get_bus()  # 从pipeline获取总线
    bus.add_signal_watch()  # 向总线添加信号观察
    bus.connect ("message", bus_call, loop)  # 将总线和循环连起来。bus_call从哪来的？

    # Lets add probe to get informed of the meta data generated, we add probe to
    # the sink pad of the osd element, since by that time, the buffer would have
    # had got all the metadata.
    # 让我们添加探针以获得生成的元数据的通知
    # 我们将探针添加到osd元素的接收器垫
    # 因为到那时，缓冲区已经获得了所有元数据
    osdsinkpad = nvosd.get_static_pad("sink")  # 获取osd的sink垫，存储为osdsinkpad
    if not osdsinkpad:  # 要是没获取到，osdsinkpad就是None
        sys.stderr.write(" Unable to get sink pad of nvosd \n")

    osdsinkpad.add_probe(Gst.PadProbeType.BUFFER, osd_sink_pad_buffer_probe, 0)  # 添加探针（探针是函数）

    # start play back and listen to events
    # 开始播放并收听事件
    print("Starting pipeline \n")
    pipeline.set_state(Gst.State.PLAYING)  # 设置pipeline状态为运行
    try:  # 运行循环，开始播放检测视频
        loop.run()
    except:  # 尝试不成功就跳过，这时应该为视频已经播放检测完了
        pass
    # cleanup
    pipeline.set_state(Gst.State.NULL)  # 设置pipeline状态为空状态

if __name__ == '__main__':  # 如果函数被直接调用而不是在其他文件中作为模块被调用，执行下述代码
    sys.exit(main(sys.argv))

2. 配置解读

在main函数的中间部分，对pgie（是deepstream的nvinfer元素类）进行了属性设置，将'config-file-path'属性设置为"dstest1_pgie_config.txt"，即pgie的配置文件为该txt文件。请注意pgie即为目标检测模型的主体。

该配置文件路径位于deepstream_python_apps/apps/deepstream-test1/，文件内容列于下方。

################################################################################
# SPDX-FileCopyrightText: Copyright (c) 2019-2021 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
# SPDX-License-Identifier: Apache-2.0
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
################################################################################

# Following properties are mandatory when engine files are not specified:
#   int8-calib-file(Only in INT8)
#   Caffemodel mandatory properties: model-file, proto-file, output-blob-names
#   UFF: uff-file, input-dims, uff-input-blob-name, output-blob-names
#   ONNX: onnx-file
#
# Mandatory properties for detectors:
#   num-detected-classes
#
# Optional properties for detectors:
#   cluster-mode(Default=Group Rectangles), interval(Primary mode only, Default=0)
#   custom-lib-path,
#   parse-bbox-func-name
#
# Mandatory properties for classifiers:
#   classifier-threshold, is-classifier
#
# Optional properties for classifiers:
#   classifier-async-mode(Secondary mode only, Default=false)
#
# Optional properties in secondary mode:
#   operate-on-gie-id(Default=0), operate-on-class-ids(Defaults to all classes),
#   input-object-min-width, input-object-min-height, input-object-max-width,
#   input-object-max-height
#
# Following properties are always recommended:
#   batch-size(Default=1)
#
# Other optional properties:
#   net-scale-factor(Default=1), network-mode(Default=0 i.e FP32),
#   model-color-format(Default=0 i.e. RGB) model-engine-file, labelfile-path,
#   mean-file, gie-unique-id(Default=0), offsets, process-mode (Default=1 i.e. primary),
#   custom-lib-path, network-mode(Default=0 i.e FP32)
#
# The values in the config file are overridden by values set through GObject
# properties.

[property]
gpu-id=0
net-scale-factor=0.0039215697906911373
model-file=../../../../samples/models/Primary_Detector/resnet10.caffemodel
proto-file=../../../../samples/models/Primary_Detector/resnet10.prototxt
model-engine-file=../../../../samples/models/Primary_Detector/resnet10.caffemodel_b1_gpu0_int8.engine
labelfile-path=../../../../samples/models/Primary_Detector/labels.txt
int8-calib-file=../../../../samples/models/Primary_Detector/cal_trt.bin
force-implicit-batch-dim=1
batch-size=1
network-mode=1
num-detected-classes=4
interval=0
gie-unique-id=1
output-blob-names=conv2d_bbox;conv2d_cov/Sigmoid
#scaling-filter=0
#scaling-compute-hw=0

[class-attrs-all]
pre-cluster-threshold=0.2
eps=0.2
group-threshold=1

3. 模型运行

运行方法：前往deepstream_python_apps/apps/deepstream-test1/文件夹中，右键打开terminal。或任意位置打开terminal后，输入下述cd指令前往指定文件夹。输入下述python3开头的命令运行。

cd /opt/nvidia/deepstream/deepstream-6.0/sources/deepstream_python_apps/apps/deepstream-test1
python3 deepstream_test_1.py ../../../../samples/streams/sample_720p.h264

terminal中实时输出运行情况，可以观察到输出内容包括：创建Gstreamer框架元素、运行视频流文件、添加元素到pipeline、pipeline中连接元素、开始pipeline、nvinfer及其他元素的运行情况、开始检测视频的每一帧。

Creating Pipeline 
 
Creating Source 
 
Creating H264Parser 

Creating Decoder 

Creating EGLSink 

Playing file ../../../../samples/streams/sample_720p.h264 
Adding elements to Pipeline 

Linking elements in the Pipeline 

Starting pipeline 


Using winsys: x11 
Opening in BLOCKING MODE 
0:00:01.843676554 13884     0x397210f0 WARN                 nvinfer gstnvinfer.cpp:635:gst_nvinfer_logger: NvDsInferContext[UID 1]: Warning from NvDsInferContextImpl::initialize()  [UID = 1]: Warning, OpenCV has been deprecated. Using NMS for clustering instead of cv::groupRectangles with topK = 20 and NMS Threshold = 0.5
0:00:11.222776760 13884     0x397210f0 INFO                 nvinfer gstnvinfer.cpp:638:gst_nvinfer_logger: NvDsInferContext[UID 1]: Info from NvDsInferContextImpl::deserializeEngineAndBackend()  [UID = 1]: deserialized trt engine from :/opt/nvidia/deepstream/deepstream-6.0/samples/models/Primary_Detector/resnet10.caffemodel_b1_gpu0_int8.engine
INFO: [Implicit Engine Info]: layers num: 3
0   INPUT  kFLOAT input_1         3x368x640       
1   OUTPUT kFLOAT conv2d_bbox     16x23x40        
2   OUTPUT kFLOAT conv2d_cov/Sigmoid 4x23x40         

0:00:11.245433645 13884     0x397210f0 INFO                 nvinfer gstnvinfer.cpp:638:gst_nvinfer_logger: NvDsInferContext[UID 1]: Info from NvDsInferContextImpl::generateBackendContext()  [UID = 1]: Use deserialized engine model: /opt/nvidia/deepstream/deepstream-6.0/samples/models/Primary_Detector/resnet10.caffemodel_b1_gpu0_int8.engine
0:00:11.283587505 13884     0x397210f0 INFO                 nvinfer gstnvinfer_impl.cpp:313:notifyLoadModelStatus: [UID 1]: Load new model:dstest1_pgie_config.txt sucessfully
NvMMLiteOpen : Block : BlockType = 261 
NVMEDIA: Reading vendor.tegra.display-size : status: 6 
NvMMLiteBlockCreate : Block : BlockType = 261 
Frame Number=0 Number of Objects=11 Vehicle_count=7 Person_count=4
Frame Number=1 Number of Objects=8 Vehicle_count=6 Person_count=2
Frame Number=2 Number of Objects=7 Vehicle_count=5 Person_count=2
...
Frame Number=1439 Number of Objects=13 Vehicle_count=10 Person_count=3
Frame Number=1440 Number of Objects=14 Vehicle_count=11 Person_count=3
Frame Number=1441 Number of Objects=0 Vehicle_count=0 Person_count=0
End-of-stream

4. 参考文章

（1）if __name__=='__main__' 的作用是当py直接被调用正常运行，如以模块被调用则不运行

（2）sys包的所有函数

（3）gi包GObject introspection官网

（4）pyds官网

（5）在common中对__init__.py的学习

（6）OSD对象存储

（7）视频流中的sink

（8）probe与gallery的概念

（9）python中try: ...except: ...

（10）try:... except:StopIteration错误

（11）garbage collector原理

你可能感兴趣的:(NVIDIA,目标检测,神经网络)

1.动手学习深度学习课程安排及深度学习数学基础 Unknown To Known 动手学习深度学习深度学习人工智能
视频资源B站：动手学习深度学习——李沐目录目标内容将学到什么1.N维数组样例2.访问2维数组元素3.数据操作4.线性代数5.矩阵计算6.自动求导目标介绍深度学习景点和最新模型LeNetAlexNetVGGResNetLSTMBERT…机器学习基础损失函数，目标函数，过拟合，优化实践使用pytorch实现介绍的知识点在真实数据上体验算法效果内容深度学习基础——线性神经网络，多层感知机卷积神经网络——
动手学深度学习V2.0(Pytorch)——10.感知机（激活函数）吨吨不打野动手学深度学习pytorch pytorch 深度学习机器学习
文章目录1.感知机2.多层感知机2.1异或问题2.2单隐藏层2.3激活函数2.3.1logistics函数/sigmoid激活函数2.3.2tanh函数2.3.3sigmoid函数和tanh函数的异同/优缺点2.3.4relu2.4多类分类2.5多隐藏层3Q&A3.1神经网络中一层的定义是什么3.2感知机无法解决XOR问题，多层感知机虽然可以解决，但是还是被SVM替代是为什么?3.3不同任务的激活
H100架构解析与性能优化策略智能计算研究中心其他
内容概要NVIDIAH100GPU作为面向高性能计算与人工智能领域的旗舰级产品，其架构设计与优化策略在计算效率、显存带宽及并行任务处理等方面实现了显著突破。本文将从核心架构创新与典型场景调优两个维度展开：首先解析第三代TensorCore的稀疏计算加速机制、FP8混合精度支持特性及其对矩阵运算的优化效果；其次，针对显存子系统中HBM3堆栈布局、L2缓存分区策略以及数据预取算法的协同优化进行拆解；最
池化的定义与核心思想 code 旭 AI人工智能学习 python numpy 人工智能
一、池化的定义与核心思想定义：池化是卷积神经网络（CNN）中的一种下采样操作，用于降低特征图的空间维度（宽高），保留主要特征。核心目标：减少计算量：缩小特征图尺寸，降低后续层参数规模。增强模型鲁棒性：对微小平移、旋转等变化不敏感。防止过拟合：通过降维减少冗余信息。二、池化的数学公式1.最大池化（MaxPooling）取池化窗口内的最大值：yi,j=max⁡p=0kh−1max⁡q=0kw−1xi⋅
卷积神经网络（笔记01）天行者@ cnn 人工智能深度学习
视觉处理三大任务：分类、目标检测、图像分割CNN网络主要有三部分构成：卷积层（ConvolutionalLayer）、池化层（PoolingLayer）和激活函数一、解释卷积层中的偏置项是什么，并讨论在神经网络中引入偏置项的好处。在卷积神经网络（CNN）的卷积层里，卷积操作本质上是输入数据与卷积核（滤波器）进行逐元素相乘再求和的过程。偏置项（Bias）是一个额外的可学习参数，对于每个卷积核而言，都
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
深度学习：偏差和方差壹十壹深度学习深度学习人工智能 python 机器学习
偏差（Bias）偏差衡量了模型预测值的平均值与真实值之间的差距。换句话说，偏差描述了模型预测的准确度。一个高偏差的模型容易出现欠拟合，即模型无法捕捉数据中的真实关系，因为它对数据的特征做出了错误的假设。特征：高偏差的模型通常是过于简单的模型，无法对数据中的复杂关系进行准确建模。高偏差模型的训练误差和测试误差可能都较高。解决方法：增加模型复杂度：例如增加多项式的阶数、增加神经网络的层数等。使用更多的
目标检测煤烦恼目标检测人工智能大数据 pytorch
1.概念：目标检测是识别图片中物体并确定其位置的多任务技术，面临目标种类数量多、尺度不均、外部环境干扰等问题。这里的数字为置信度2.数据集：VOC数据集分4大类20小类；COCO数据集含20万图像、80个类别、超50万目标标注，平均每图7.2个目标。3.GroundTruth格式：包含类别和边界框坐标，常见的有YOLO（归一化中心点坐标和宽高）、VOC（左上角和右下角坐标）、COCO（左上角坐标和
《 YOLOv5、YOLOv8、YOLO11训练的关键文件：data.yaml文件编写全解》空云风语人工智能 YOLO 机器视觉目标跟踪人工智能计算机视觉 YOLO
走进YOLOv5、YOLOv8、YOLO11的data.yaml在计算机视觉领域的广袤星空中，目标检测无疑是一颗璀璨的明星，它广泛应用于自动驾驶、智能安防、工业检测、医疗影像分析等众多关键领域，发挥着不可或缺的作用。而YOLO系列算法，更是以其独特的“一次看全（YouOnlyLookOnce）”理念和卓越的性能，在目标检测领域中独树一帜，成为了众多研究者和开发者的首选工具。从最初的YOLOv1横空
深度解析：DETR的多尺度特征融合 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
"深度解析：DETR的多尺度特征融合"作者：禅与计算机程序设计艺术1.背景介绍1.1目标检测的挑战与传统方法的局限性目标检测是计算机视觉领域中的一个基本任务，其目标是识别图像或视频中所有感兴趣的目标，并确定它们的位置和类别。传统的目标检测方法，如FasterR-CNN和YOLO，通常依赖于预定义的锚框或候选区域来生成目标proposals。然而，这些方法存在一些固有的局限性：人工先验知识:锚框的设
机器学习(Machine Learning) 七指琴魔御清绝大数据学习
原文链接：http://blog.csdn.net/zhoubl668/article/details/42921187希望转载的朋友，你可以不用联系我．但是一定要保留原文链接，因为这个项目还在继续也在不定期更新．希望看到文章的朋友能够学到更多．《BriefHistoryofMachineLearning》介绍:这是一篇介绍机器学习历史的文章，介绍很全面，从感知机、神经网络、决策树、SVM、Ada
Spike Neural Network Introduction and Research Directions Debug_Snail SNN Neuralnetwork 人工智能 AIGC
1.SNNs是一类神经网络,其中的神经元通过脉冲(spikes)来传递信息,而不是像传统的人工神经网络中那样使用实数值激活。SNNs更接近生物学上的神经系统,因为生物神经元也是通过电信号脉冲来传递信息的。与传统神经网络相比,SNNs具有以下几个特点:更低的功耗-因为只在发生脉冲时才激活神经元,所以整体功耗会比传统神经网络低很多。这使得SNNs很适合应用在对功耗要求非常严格的场景,如边缘计算。时序编
目标检测项目 sho_re 神经网络人工智能 pytorch 目标检测
·识别图片中有哪些物体并且找到物体的存在位置多任务：位置+类别目标种类与数量繁多的问题目标尺度不均的问题遮挡、噪声等外部环境干扰VOC数据集：PASCALVOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛。4大类，20小类VOC2007：9963图片/24640目标VOC2012：23080图片/54900目标·COCO数据集：起源于微软2014
Manus演示案例：英伟达财务估值建模解锁投资洞察的深度剖析 ylfhpy Manus 深度学习人工智能机器学习机器翻译 Manus
在当今瞬息万变的金融投资领域，精准剖析企业价值是投资者决胜市场的关键。英伟达（NVIDIA），作为科技行业的耀眼明星，其在人工智能和半导体领域的卓越表现备受瞩目。Manus凭借专业的财务估值建模能力，深入挖掘英伟达的潜在价值，为投资者提供了一份极具价值的分析报告。Manus在接到为英伟达进行详细财务估值建模的任务后，迅速且有条不紊地开展工作。数据收集是建模的基石，其重要性不言而喻。在收集英伟达公司
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
大语言模型原理基础与前沿双层路由多模态融合、多任务学习和模块化架构 AI智能涌现深度研究 AI大语言模型和知识图谱融合 Python入门实战 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿：双层路由多模态融合、多任务学习和模块化架构关键词：大语言模型、双层路由、多模态融合、多任务学习、模块化架构、神经网络、自然语言处理1.背景介绍大语言模型（LargeLanguageModels，LLMs）已经成为人工智能和自然语言处理领域的重要研究方向。随着GPT-3、BERT等模型的出现，大语言模型在各种任务中展现出了惊人的性能。然而，随着模型规模的不断扩大和应用场景的
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务1.背景介绍1.1问题的由来翻译是跨语言沟通的重要桥梁，随着全球化进程的加速，翻译需求日益增长。传统的机器翻译方法主要依赖于规则和统计方法，如基于短语的翻译、基于统计的机器翻译等。然而，这些方法难以处理复杂的语言现象，翻译质量参差不齐。近年来，随着深度学习技术的快速发展，基于神经网络序列到序列（Sequence-to-Seq
Python第十六课：深度学习入门 | 神经网络解密程之编 Python全栈通关秘籍 python 神经网络青少年编程
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的训练过程掌握防止过拟合的基础策略一、神经网络基础（大脑的数字化仿生）1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和（∑(权重×输入)+偏置）轴突传递电信号激活函数处理输出2.核心组件解析激活函数：神经元的"开关"（如ReLU：max
【大模型开发】Megatron-LM 深度解析：原理、应用与代码实现云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习大模型开发 Hugging Face 大模型生态机器学习 Megatron-LM 并行训练大模型加速
以下内容将从Megatron-LM的基本原理、应用场景、以及其核心代码和实现逻辑三个方面进行深入剖析，并提供示例代码和详细的注释说明，帮助大家对Megatron-LM有一个较为全面的了解。所有内容基于Megatron-LM官方实现（GitHub:NVIDIA/Megatron-LM），并结合大规模模型训练的关键理念进行介绍。一、Megatron-LM简介Megatron-LM是由NVIDIA开源的
基于PyTorch的深度学习——机器学习3 Wis4e 深度学习机器学习 pytorch
激活函数在神经网络中作用有很多，主要作用是给神经网络提供非线性建模能力。如果没有激活函数，那么再多层的神经网络也只能处理线性可分问题。在搭建神经网络时，如何选择激活函数？如果搭建的神经网络层数不多，选择sigmoid、tanh、relu、softmax都可以；而如果搭建的网络层次较多，那就需要小心，选择不当就可导致梯度消失问题。此时一般不宜选择sigmoid、tanh激活函数，因它们的导数都小于1
深度学习与普通神经网络有何区别？是理不是里深度学习神经网络人工智能
深度学习与普通神经网络的主要区别体现在以下几个方面：一、结构复杂度普通神经网络：通常指浅层结构，层数较少，一般为2-3层，包括输入层、一个或多个隐藏层、输出层。深度学习：强调通过5层以上的深度架构逐级抽象数据特征，包含多层神经网络，层数可能达到几十层甚至上百层。例如，ResNet（2015）包含152个卷积层。二、特征学习方式普通神经网络：特征提取通常依赖人工设计，需要领域专家的经验。这意味着在处
神经网络中梯度计算求和公式求导问题 serve the people 日常琐问神经网络机器学习算法
以下是公式一推导出公式二的过程。表达式一∂E∂wjk=−2(tk−ok)⋅sigmoid(∑jwjk⋅oj)⋅(1−sigmoid(∑jwjk⋅oj))⋅∂∂wjk(∑jwjk⋅oj)\frac{\partialE}{\partialw_{jk}}=-2(t_k-o_k)\cdot\text{sigmoid}\left(\sum_jw_{jk}\cdoto_j\right)\cdot(1-\tex
AI 技术引入 RTK（实时动态定位）系统，可以实现智能化管理和自动化运行小赖同学啊人工智能低空经济人工智能自动化运维
将AI技术引入RTK（实时动态定位）系统，可以实现智能化管理和自动化运行，从而提高系统的精度、效率和可靠性。以下是AI技术在RTK系统中的应用实例：一、AI技术在RTK系统中的应用场景1.整周模糊度快速解算问题：RTK的核心是解算载波相位的整周模糊度，传统方法耗时较长。AI解决方案：使用深度学习模型（如卷积神经网络CNN）预测整周模糊度。通过历史数据训练模型，实现快速解算。实例：某无人机公司使用A
基于双向长短期记忆神经网络结合多头注意力机制(BiLSTM-Multihead-Attention)的单变量时序预测机器学习和优化算法多头注意力机制深度学习神经网络人工智能机器学习单变量时序预测 BiLSTM 多头注意力机制
目录1、代码简介2、代码运行结果展示3、代码获取1、代码简介基于双向长短期记忆神经网络结合多头注意力机制(BiLSTM-Multihead-Attention)的单变量时序预测(单输入单输出)1.程序已经调试好，无需更改代码替换数据集即可运行！！！数据格式为excel！2.需要其他算法的都可以定制！注：1️⃣、运行环境要求MATLAB版本为2023b及其以上。【没有我赠送】2️⃣、评价指标包括:R
3.10 项目总结不要不开心了 pyqt 深度学习机器学习数据挖掘人工智能
今天的项目是一个使用PyTorch框架构建和训练神经网络的实例，旨在实现手写数字识别。以下是项目的总结、内容分析以及优化建议：项目总结1.目标：使用神经网络对MNIST数据集中的手写数字进行分类。2.步骤：-数据加载和预处理。-构建神经网络模型。-定义损失函数和优化器。-训练模型并评估其性能。-可视化训练结果。内容分析1.数据加载和预处理：-使用`torchvision.datasets`加载MN
《深度解析DeepSeek-M8：量子经典融合，重塑计算能效格局》程序猿阿伟量子计算
在科技飞速发展的今天，量子计算与经典算法的融合成为了前沿领域的焦点。DeepSeek-M8的“量子神经网络混合架构”，宛如一把钥匙，开启了经典算法与量子计算协同推理的全新大门，为诸多复杂问题的解决提供了前所未有的思路。量子计算，基于量子力学的奇妙特性，如量子比特的叠加与纠缠，展现出了超越经典计算的潜力。量子比特能够同时处于多个状态，实现并行计算，这使得量子计算机在处理某些特定问题时，具备指数级加速
基于YOLOv5的烟雾检测系统：从数据集准备到UI界面实现深度学习&目标检测实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言烟雾是火灾发生的一个重要早期信号。烟雾检测能够在火灾初期及时识别并报警，为火灾的扑灭争取宝贵的时间。因此，烟雾检测的研究一直是计算机视觉领域中的一个热点问题。近年来，随着深度学习技术的发展，目标检测算法被广泛应用于烟雾检测，尤其是基于YOLOv5的目标检测模型，由于其较高的精度和较低的计算开销，已经成为许多实时检测系统的首选模型。在这篇博客中，我们将介绍如何使用YOLOv5模型进行烟雾检测
【深度学习】Adam（Adaptive Moment Estimation）优化算法辰尘_星启机器学习--深度学习深度学习算法人工智能 Adam pytorch python
概述Adam算法结合了动量法（Momentum）和RMSProp的思想，能够自适应调整每个参数的学习率。通过动态调整每个参数的学习率，在非平稳目标（如深度神经网络的损失函数）中表现优异目录基本原理和公式笼统说明：为什么Adam算法可以帮助模型找到更好的参数基本概念动量（Momentum）：跟踪梯度的指数衰减平均（一阶矩），加速收敛并减少震荡。自适应学习率：跟踪梯度平方的指数衰减平均（二阶矩），调整
学习总结项目苏小夕夕学习人工智能深度学习机器学习
近段时间学习了机器学习、线性回归和softmax回归、多层感知机、卷积神经网络、Pytorch神经网络工具箱、Python数据处理工具箱、图像分类等的知识，学习了利用神经网络实现cifar10的操作、手写图像识别项目以及其对应的实验项目报告总结。项目总结本次项目我使用了VGG19模型、AlexNet模型和已使用的VGG16模型进行对比，在已有的条件下，对代码进行更改是，结果展示中，VGG19模型的
【基于国产RK3588-NPU的yolov5的AI智能盒子】贝壳里的沙人工智能
基于国产RK3588-NPU的yolov5的AI智能盒子背景识别效果区别Python版本目标识别实现cmake（c/c++）版本实现背景前面写了一篇关于基YOLOV5实现的AI智能盒子的实现方案，这篇文章着重讲了如何在NVIDIA-英伟达芯片上如何实现目标识别的过程(可能已经被官方屏蔽了)。但是因为中美芯片限制问题，很多朋友联系到我，跟我提了是否可以基于国产芯片来迁移yolov5框架平台？国产芯片
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，