m0_74241524

基于改进Deeplabv3plus的自动驾驶场景分割系统（源码＆教程）

1.研究背景

随着人工智能技术的飞速发展，车辆的自动驾驶离人们的生活越来越近。自动驾驶整个运行流程中首先需要依赖各种车载传感器收集车辆周围的各种环境数据，进而利用各种分析算法分析得到计算机可感知的环境信息，然后利用感知到的信息指导车辆规划决策。然而目前车辆使用的激光雷达等传感器大多成本高昂，不利于自动驾驶车辆的大规模普及。相比较而言，摄像头成本低廉且可以获得大量的周围环境信息，因此，研究基于摄像头的自动驾驶感知算法具有重要的意义。
图像语义分割是自动驾驶感知中最重要的技术之一,利用图像语义分割的结果可以得到车辆的可行驶区域信息、前方障碍物信息等。在深度学习与卷积神经网络在近几年兴起之后，涌现了众多以深度学习为基础的图像语义分割算法，基本都能实现端到端的图像语义分割输出。但目前距离图像语义分割算法真正使用到自动驾驶系统中还存在着一些问题:
(1）许多算法不能实时运行，这无法满足安全性为主的自动驾驶的需求;
(2）自动驾驶场景中场景复杂、种类众多造成训练数据样本不均衡，许多算法对于小样本的检测效果不好。
因此自动驾驶城市场景的图像语义分割还存在许多问题需要解决,本文的研究重点是基于自动驾驶场景中的可实时的图像语义分割算法。

2.图片演示

3.视频演示

基于改进Deeplabv3plus的自动驾驶场景分割系统（源码＆教程）_哔哩哔哩_bilibili

4.Deeplabv3plus简介

DeepLabV3plus 是一个用于语义分割的模型，它提出了一种新的 encoder-decoder 结构，采用 DeepLabv3 作为编码器模块，并使用一个简单而有效的解码器模块。该模型可通过 atrous 卷积（空洞卷积）来控制所提取的编码器特征的分辨率，从而权衡精度和运行时间。此外，该网络还将 Xception 模型用于分割任务，并将 Depthwise Separable Convolution 应用于 ASPP 模块和解码器模块，从而得到更快更强的 encoder-decoder 网络。其网络结构如下：

5.改进方向

替换backbone

DeepLabV3+论文里的backbone是Xception, 我下到的工程里用的是ResnetV2-50和ResnetV2-101。

整体的模型保存为PB有一百多M, 在CPU上的运行时间是1秒多。

为了加快网络速度，将backbone替换为MobileNetV2。

使用深度分离卷积替换普通卷积

ASPP部分和decoder部分的参数数量同样吓人，为此把所有的普通卷积替换为深度分离卷积。

同时ASPP和decoder部分的通道数量也做了一定的删减。

增加一次对底层特征的融合

在做身份证部件解析的时候发现细节切分效果较差。为了改善细节，将1/2大小的特征图和decoder特征进行融合，最终取得了不错的效果。

改进后的网络结构

6.代码实现

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import tensorflow as tf

from src.deeplabv3.nets.config import *
from src.deeplabv3.nets import resnet_utils
from src.deeplabv3.nets.resnet_v1 import bottleneck, resnet_arg_scope

slim = tf.contrib.slim

@slim.add_arg_scope
def bottleneck_hdc(inputs,
               depth,
               depth_bottleneck,
               stride,
               rate=1,
               multi_grid=(1,2,4),
               outputs_collections=None,
               scope=None,
               use_bounded_activations=False):
  """Hybrid Dilated Convolution Bottleneck.
  Multi_Grid = (1,2,4)
  See Understanding Convolution for Semantic Segmentation.
  When putting together two consecutive ResNet blocks that use this unit, one
  should use stride = 2 in the last unit of the first block.
  Args:
    inputs: A tensor of size [batch, height, width, channels].
    depth: The depth of the ResNet unit output.
    depth_bottleneck: The depth of the bottleneck layers.
    stride: The ResNet unit's stride. Determines the amount of downsampling of
      the units output compared to its input.
    rate: An integer, rate for atrous convolution.
    multi_grid: multi_grid sturcture.
    outputs_collections: Collection to add the ResNet unit output.
    scope: Optional variable_scope.
    use_bounded_activations: Whether or not to use bounded activations. Bounded
      activations better lend themselves to quantized inference.
  Returns:
    The ResNet unit's output.
  """
  with tf.variable_scope(scope, 'bottleneck_v1', [inputs]) as sc:
    depth_in = slim.utils.last_dimension(inputs.get_shape(), min_rank=4)
    if depth == depth_in:
      shortcut = resnet_utils.subsample(inputs, stride, 'shortcut')
    else:
      shortcut = slim.conv2d(
          inputs,
          depth, [1, 1],
          stride=stride,
          activation_fn=tf.nn.relu6 if use_bounded_activations else None,
          scope='shortcut')

    residual = slim.conv2d(inputs, depth_bottleneck, [1, 1], stride=1, 
      rate=rate*multi_grid[0], scope='conv1')
    residual = resnet_utils.conv2d_same(residual, depth_bottleneck, 3, stride,
      rate=rate*multi_grid[1], scope='conv2')
    residual = slim.conv2d(residual, depth, [1, 1], stride=1, 
      rate=rate*multi_grid[2], activation_fn=None, scope='conv3')

    if use_bounded_activations:
      # Use clip_by_value to simulate bandpass activation.
      residual = tf.clip_by_value(residual, -6.0, 6.0)
      output = tf.nn.relu6(shortcut + residual)
    else:
      output = tf.nn.relu(shortcut + residual)

    return slim.utils.collect_named_outputs(outputs_collections,
                                            sc.name,
                                            output)

def deeplabv3(inputs,
              num_classes,
              depth=50,
              aspp=True,
              reuse=None,
              is_training=True):
  """DeepLabV3
  Args:
    inputs: A tensor of size [batch, height, width, channels].
    depth: The number of layers of the ResNet.
    aspp: Whether to use ASPP module, if True, will use 4 blocks with 
      multi_grid=(1,2,4), if False, will use 7 blocks with multi_grid=(1,2,1).
    reuse: Whether or not the network and its variables should be reused. To be
      able to reuse 'scope' must be given.
  Returns:
    net: A rank-4 tensor of size [batch, height_out, width_out, channels_out].
    end_points: A dictionary from components of the network to the 
      corresponding activation.
  """
  if aspp:
    multi_grid = (1,2,4)
  else:
    multi_grid = (1,2,1)
  scope ='resnet{}'.format(depth)
  with tf.variable_scope(scope, [inputs], reuse=reuse) as sc:
    end_points_collection = sc.name + '_end_points'
    with slim.arg_scope(resnet_arg_scope(weight_decay=args.weight_decay, 
      batch_norm_decay=args.bn_weight_decay)):
      with slim.arg_scope([slim.conv2d, bottleneck, bottleneck_hdc],
                          outputs_collections=end_points_collection):
        with slim.arg_scope([slim.batch_norm], is_training=is_training):
          net = inputs
          net = resnet_utils.conv2d_same(net, 64, 7, stride=2, scope='conv1')
          net = slim.max_pool2d(net, [3, 3], stride=2, scope='pool1')

          with tf.variable_scope('block1', [net]) as sc:
            base_depth = 64
            for i in range(2):
              with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                net = bottleneck(net, depth=base_depth * 4, 
                  depth_bottleneck=base_depth, stride=1)
            with tf.variable_scope('unit_3', values=[net]):
              net = bottleneck(net, depth=base_depth * 4, 
                depth_bottleneck=base_depth, stride=2)
            net = slim.utils.collect_named_outputs(end_points_collection, 
              sc.name, net)

          with tf.variable_scope('block2', [net]) as sc:
            base_depth = 128
            for i in range(3):
              with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                net = bottleneck(net, depth=base_depth * 4, 
                  depth_bottleneck=base_depth, stride=1)
            with tf.variable_scope('unit_4', values=[net]):
              net = bottleneck(net, depth=base_depth * 4, 
                depth_bottleneck=base_depth, stride=2)
            net = slim.utils.collect_named_outputs(end_points_collection, 
              sc.name, net)

          with tf.variable_scope('block3', [net]) as sc:
            base_depth = 256

            num_units = 6
            if depth == 101:
              num_units = 23
            elif depth == 152:
              num_units = 36

            for i in range(num_units):
              with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                net = bottleneck(net, depth=base_depth * 4, 
                  depth_bottleneck=base_depth, stride=1)
            net = slim.utils.collect_named_outputs(end_points_collection, 
              sc.name, net)

          with tf.variable_scope('block4', [net]) as sc:
            base_depth = 512

            for i in range(3):
              with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                net = bottleneck_hdc(net, depth=base_depth * 4, 
                  depth_bottleneck=base_depth, stride=1, rate=2, 
                  multi_grid=multi_grid)
            net = slim.utils.collect_named_outputs(end_points_collection, 
              sc.name, net)

          if aspp:
            with tf.variable_scope('aspp', [net]) as sc:
              aspp_list = []
              branch_1 = slim.conv2d(net, 256, [1,1], stride=1, 
                scope='1x1conv')
              branch_1 = slim.utils.collect_named_outputs(
                end_points_collection, sc.name, branch_1)
              aspp_list.append(branch_1)

              for i in range(3):
                branch_2 = slim.conv2d(net, 256, [3,3], stride=1, rate=6*(i+1), scope='rate{}'.format(6*(i+1)))
                branch_2 = slim.utils.collect_named_outputs(end_points_collection, sc.name, branch_2)
                aspp_list.append(branch_2)

              aspp = tf.add_n(aspp_list)
              aspp = slim.utils.collect_named_outputs(end_points_collection, sc.name, aspp)
              net = aspp

            with tf.variable_scope('img_pool', [net]) as sc:
              """Image Pooling
              See ParseNet: Looking Wider to See Better
              """
              pooled = tf.reduce_mean(net, [1, 2], name='avg_pool', 
                keep_dims=True)
              pooled = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, pooled)

              pooled = slim.conv2d(pooled, 256, [1,1], stride=1, scope='1x1conv')
              pooled = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, pooled)

              pooled = tf.image.resize_bilinear(pooled, tf.shape(net)[1:3])
              pooled = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, pooled)

            with tf.variable_scope('fusion', [aspp, pooled]) as sc:
              net = tf.concat([aspp, pooled], 3)
              net = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, net)

              net = slim.conv2d(net, 256, [1,1], stride=1, scope='1x1conv')
              net = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, net)
          else:
            with tf.variable_scope('block5', [net]) as sc:
              base_depth = 512

              for i in range(3):
                with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                  net = bottleneck_hdc(net, depth=base_depth * 4, 
                    depth_bottleneck=base_depth, stride=1, rate=4)
              net = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, net)

            with tf.variable_scope('block6', [net]) as sc:
              base_depth = 512

              for i in range(3):
                with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                  net = bottleneck_hdc(net, depth=base_depth * 4, 
                    depth_bottleneck=base_depth, stride=1, rate=8)
              net = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, net)

            with tf.variable_scope('block7', [net]) as sc:
              base_depth = 512

              for i in range(3):
                with tf.variable_scope('unit_%d' % (i + 1), values=[net]):
                  net = bottleneck_hdc(net, depth=base_depth * 4, 
                    depth_bottleneck=base_depth, stride=1, rate=16)
              net = slim.utils.collect_named_outputs(end_points_collection, 
                sc.name, net)

          net = slim.conv2d(net, num_classes, [1,1], stride=1, 
            activation_fn=None, normalizer_fn=None, scope='logits')
          net = slim.utils.collect_named_outputs(end_points_collection, 
            sc.name, net)

          end_points = slim.utils.convert_collection_to_dict(
              end_points_collection)

          return net, end_points

if __name__ == "__main__":
  x = tf.placeholder(tf.float32, [None, 512, 512, 3])

  net, end_points = deeplabv3(x, 21)
  for i in end_points:
    print(i, end_points[i])

7.系统整合

下图源码＆环境部署视频教程＆数据集＆自定义UI界面

参考博客《完整源码＆环境部署视频教程＆数据集＆自定义UI界面》

8.参考文献

[1]郭旭.人工智能视角下的无人驾驶技术分析与展望[D].2017
[2]孙志军,薛磊,许阳明,等.深度学习研究综述[D].2012
[3]陆剑锋,林海,潘志庚.自适应区域生长算法在医学图像分割中的应用[D].2005
[4]丁海勇,王雨轩,毛宇琼,等.基于动态阈值区域分裂合并算法的高分辨率遥感图像分割研究[J].测绘通报.2016,(8).145-146.
[5]Chen, Liang-Chieh,Papandreou, George,Kokkinos, Iasonas,等.DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs.[J].IEEE Transactions on Pattern Analysis & Machine Intelligence.2018,40(4).834-848.
[6]Vijay Badrinarayanan,Alex Kendall,Roberto Cipolla.SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2017,39(12).2481-2495.
[7]Shelhamer, Evan,Long, Jonathan,Darrell, Trevor.Fully Convolutional Networks for Semantic Segmentation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence.2017,39(6).640-651.
[8]Zhang, Xiangyu,Zou, Jianhua,He, Kaiming,等.Accelerating Very Deep Convolutional Networks for Classification and Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2016,38(10).1943-1955.DOI:10.1109/TPAMI.2015.2502579.
[9]Antonio Criminisi,Ender Konukoglu,Jamie Shotton.Decision Forests: A Unified Framework for Classification, Regression, Density Estimation, Manifold Learning and Semi-Supervised Learning[J].Foundations & trends in computer graphics & vision.2011,7(2).
[10]P. Haffner,L. Bottou,Y. Bengio,等.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE.1998,86(11).

你可能感兴趣的:(自动驾驶)

自动驾驶系列—颠覆未来驾驶：深入解析自动驾驶线控转向系统技术学步_技术自动驾驶自动驾驶人工智能机器学习线控系统
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
根据deepseek模型微调训练自动驾驶模型及数据集的思路 ywfwyht 自动驾驶深度学习人工智能自动驾驶人工智能机器学习
以下是使用DeepSeek模型微调训练自动驾驶模型的详细步骤和代码示例。本流程假设你已有自动驾驶领域的数据集（如驾驶指令、传感器数据等），并基于PyTorch框架实现。Step1:环境准备#安装依赖库pipinstalltorchtransformersdatasetsnumpypandasStep2:数据准备假设数据集格式为JSON，包含输入文本（传感器/场景描述）和输出控制指令：//data/
自动驾驶---Motion Planning之参考线Path平滑智能汽车人自动驾驶人工智能
1背景有了由lane_segment插值得到的粗糙参考线，这种参考线是无法输出给下游使用的，需要进一步的处理使得参考线更加平滑，才能供下游控制模块使用。Apollo中共有三种参考线平滑算法，分别为：1.QpSplineSmoother2.SpiralReferenceLineSmoother3.DiscretePointsSmoother目前Apollo中默认配置为最后一种，基于离散点的平滑。这种
自动驾驶---Motion Planning之LaneChange 智能汽车人自动驾驶人工智能
1背景在Apollo中，有比较多的Decider（决策器），上篇博客《自动驾驶---MotionPlanning之Decider》中笔者也大概介绍了每个Deicder的作用。本篇博客笔者主要介绍换道的决策内容，因为在自动驾驶中（严格意义上来讲，目前还属于辅助驾驶），变道的灵活性是用户评价该功能是否好用很重要的一部分，变道迟缓或者激进都是不好的体验，所以本篇博客会结合Apollo中的LaneChan
一文带你了解人工智能：现状、应用、变革及未来展望空青726 人工智能 chatgpt ai 大数据机器学习深度学习创业创新
近年来，人工智能（AI）的发展势头迅猛，它已经渗透到了我们生活的方方面面。从智能手机的语音助手到自动驾驶汽车，从智能家居到医疗诊断，AI正在改变着我们的生活方式。本文将结合时事，为大家介绍当前人工智能的发展形势、在生活中的应用、人工智能的变革以及未来的发展方向。一、人工智能的发展形势1.深度学习：深度学习是当前AI领域的热门话题。通过模拟人脑神经元之间的相互作用，深度学习算法能够从大量数据中提取出
基于A*算法与贝塞尔曲线的路径规划与可视化：从栅格地图到平滑路径生成机器懒得学习 pygame python
引言在机器人导航、自动驾驶和游戏开发等领域，路径规划是一个核心问题。如何高效地找到从起点到终点的最优路径，并且确保路径的平滑性和安全性，是许多应用场景中的关键挑战。本文将介绍一种结合A算法和贝塞尔曲线的路径规划方法，并通过Pygame实现可视化。我们将从栅格地图的加载与处理开始，逐步讲解A算法的实现、贝塞尔曲线的生成，以及如何通过鼠标交互实现动态路径规划。通过本文，你将掌握如何在实际项目中应用这些
《DeepSeek Janus Pro 7B：多模态人工智能大模型部署全攻略》空云风语神经网络人工智能深度学习人工智能
《DeepSeekJanusPro7B：多模态人工智能大模型部署全攻略》引言：开启多模态AI新世界在科技飞速发展的当下，多模态AI已成为人工智能领域中最耀眼的明星，正以前所未有的速度改变着我们的生活与工作方式。从智能语音助手到图像识别系统，从自动驾驶汽车到智能医疗诊断，多模态AI的身影无处不在，它让机器能够理解和处理多种类型的信息，如文本、图像、音频等，从而实现更加智能、高效的交互。DeepSee
优化算法全景解析：从梯度下降到群体智能 welcome_123_ 算法 python 人工智能
一、引言：为什么需要优化算法？在AlphaGo击败人类围棋冠军的背后，在特斯拉自动驾驶系统实时决策的瞬间，在推荐系统精准推送内容的过程中，优化算法始终是推动这些技术落地的核心引擎。无论是机器学习模型的训练，还是复杂系统的参数调优，优化算法的本质是：在给定的约束条件下，找到使目标函数最优的解。本文将深入解析优化算法的核心原理、经典方法、现代进展及实战应用，助你全面掌握这一技术利器。二、优化算法分类图
基于深度学习YOLOv8的海洋动物检测系统（Python+PySide6界面+训练代码）深度学习&目标检测实战项目深度学习 YOLO python 目标检测人工智能开发语言
引言近年来，计算机视觉技术在各行各业中得到了广泛的应用，特别是在智能监控、自动驾驶、医疗诊断等领域。深度学习，尤其是卷积神经网络（CNN）的出现，极大地提高了计算机处理图像和视频的能力。在这一领域，YOLO（YouOnlyLookOnce）系列模型以其高效且准确的目标检测能力，成为了当下最为流行的深度学习模型之一。在海洋生物保护、海洋环境监测等应用中，快速识别和检测海洋动物种类对于科学研究和保护工
无人机技术全解析：从军事靶机到低空经济新引擎 UAV_ckesc 无人机
一、无人机定义与监管体系无人机（UnmannedAerialVehicle,UAV）是指通过无线电遥控设备或自主程序控制装置操纵的无人驾驶飞行器。其核心特征包括：无驾驶舱设计：搭载自动驾驶仪、程序控制装置等设备实现自主飞行分级管理体系：中国民航局将116kg以上无人机及4600m³以上飞艇纳入融合空域管理，微型航拍器由行业协会自治二、百年发展历程1.军事起源阶段（1914-1990）1914年：英
【如何在Apollo中利用JSON/XML/config来减少代码量】勾魂凉皮 json xml
Apollo（百度的自动驾驶开源平台）是一个复杂的大型项目，涉及多个模块的协同工作，如感知、规划、控制、定位等。在这样的大型项目中，减少代码量有助于提高代码的可维护性、可读性和开发效率。使用JSON和XML等配置文件，可以将很多与代码逻辑无关的配置和行为控制从代码中分离出来，从而减少代码量和复杂性。以下是一些Apollo中可以应用的策略，来利用JSON/XML配置文件和其他技术来减少代码量和复杂性
一个AI应用的开发、上线流程解析終不似少年遊* 人工智能 ai应用 ckpt onnx 模型文件部署推理
目录1.模型文件格式1.1CheckPoint(ckpt)文件格式1.2.pth文件格式1.3.mindir文件格式1.4.onnx文件格式2.推理（Inference）2.1.pth(PyTorch模型格式)2.2.mindir(MindSpore模型格式)2.3.onnx(开放神经网络交换格式)2.4实际例子：自动驾驶系统中的推理模块3.APP与网页4.运维中心与本地部署SDK5.RAG（Re
自动驾驶软件：Tesla Autopilot二次开发_18.未来趋势与发展方向 zhubeibei168 电动汽车自动驾驶 opencv 人工智能电动汽车
18.未来趋势与发展方向未来的自动驾驶技术将不断演进，特斯拉的Autopilot系统作为行业领先的技术，也在不断地进行改进和创新。本节将探讨自动驾驶软件领域的未来趋势与发展方向，包括技术进步、法规变化、市场接受度和用户体验等方面。我们将结合特斯拉Autopilot的最新进展，分析未来可能出现的技术和应用。18.1技术进步18.1.1传感器技术的改进传感器是自动驾驶系统的关键组件，未来的传感器技术将
华为 ADS 3.0 与特斯拉 FSD V12：自动驾驶技术的巅峰对决与未来展望中科宁图华为自动驾驶人工智能
一、华为ADS3.0：多传感器融合的卓越代表（一）硬件与技术特色华为ADS3.0智能驾驶系统构建了全面的全息感知体系，融合激光雷达、高清摄像头、毫米波雷达、超声波传感器等多种设备。激光雷达实现环境三维重建和精确测距，在恶劣条件下仍能准确捕捉物体信息；高分辨率摄像头获取视觉信息；毫米波雷达在极端天气下强化对移动物体探测；超声波传感器辅助近距离障碍物检测。GOD网络融合处理多传感器数据，为决策提供坚实
自动驾驶感知系统配置分析——以“8摄像头+1毫米波雷达+12超声波雷达”为例空间机器人自动驾驶人工智能机器学习
自动驾驶感知系统配置分析——以“8摄像头+1毫米波雷达+12超声波雷达”为例1.引言自动驾驶系统依赖于传感器来感知周围环境，并基于此做出实时决策。不同类型的传感器各自有不同的特性，能够应对不同的场景和环境条件。摄像头、毫米波雷达、超声波雷达的组合能够在视觉、距离、速度和障碍物感知等方面提供全面的支持。本章节将详细介绍“8摄像头+1毫米波雷达+12超声波雷达”配置的设计思路、优势、各传感器的参数，以
AUTOSAR从入门到精通-【自动驾驶】高精地图（三）格图素书人工智能算法机器学习
目录前言算法原理高精地图发展历史A.数字地图B.增强型数字地图C.高精地图D.可扩展地图高清地图基础知识TopologicalRepresentationGeometricRepresentationSemanticRepresentationDynamicElementsFeature-BasedMapLayers自动驾驶产业与地图1.1自动驾驶技术1.2地图在自动驾驶中的作用1.3地图的层级1
第二章：9.5 多个输出的分类望云山190 分类数据挖掘人工智能
多标签分类问题多标签分类问题是一种特殊的分类问题，其中每个输入样本可以同时属于多个类别。这与单标签分类问题不同，在单标签分类问题中，每个输入样本只能属于一个类别。例如，在自动驾驶汽车的场景中，一张图像可能同时包含汽车、公交车和行人，因此在这种情况下，每个图像可以有多个相关的标签。构建多标签分类神经网络的方法方法一：独立训练多个神经网络一种方法是将多标签分类问题分解为多个独立的二分类问题。具体来说，
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战 AI知识分享官人工智能 langchain 算法数据挖掘计算机视觉机器学习产品经理
大模型微调实战：精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战，人工智能视频课程-多模态大模型，微调技术训练营，大模型多场景实战，AI图像处理，AI量化投资，OPenCV视觉处理，机器学习，Pytorch深度学习，推荐系统，自动驾驶，训练私有大模型，LLM大语言模型，大模型多场景实战，Agent智能应用，AIGC实战落地，ChatGPT虚拟数字人，Djourney智
自动驾驶技术的未来趋势与挑战分析智能计算研究中心其他
内容概要自动驾驶技术自诞生以来经历了多个发展阶段。最初的研究集中在感知和控制系统的基础构建，随后进入了数据处理和算法的优化阶段，如今，随着人工智能和机器学习技术的快速应用，自动驾驶行业正处于一个前所未有的迅猛发展期。当前，行业内涌现出多种解决方案，各大汽车制造商与科技公司纷纷加大投入，推动这一领域的技术进步。市场需求不断增加，为自动驾驶技术注入活力。城市交通拥堵、环境污染等问题促使人们寻求更加智能
如何从零构建具身智能AI系统？硅基创想家 AI-人工智能与大模型人工智能具身职能 AI智能体
通过这份循序渐进的指南，学习构建能够独立感知、推理和行动的自主AI系统。在人工智能领域，具身智能AI系统正在重新定义自动化和决策流程。这些系统旨在自主运行，模仿人类的推理和行动能力。从自动驾驶汽车到智能虚拟助手，具身智能AI系统正在变革各个行业。在本指南中，我们将详细拆解从零构建具身智能AI系统的过程，涵盖关键组件、工具以及逐步指导，助你开启这一旅程。一、理解具身智能AI系统具身智能AI系统是一种
AI赋能前端开发：解决问题能力的跃迁前端
近年来，人工智能（AI）技术蓬勃发展，深刻地改变着各行各业的工作方式。从自动驾驶到医疗诊断，AI的触角几乎延伸到了社会的每一个角落。而作为互联网时代最前沿的技术领域之一，前端开发也正在经历着AI带来的深刻变革。本文将探讨AI如何提升前端开发人员的分析和解决问题的能力，并最终实现开发效率的显著提升。我们将会重点关注AI写代码工具如何帮助开发者克服挑战。前端开发的痛点与挑战传统的前端开发常常面临诸多挑
天神之眼vs华为智驾天机️灵韵物联网人工智能人工智能具身智能物联网
“天神之眼”和“华为智驾”分别是比亚迪和华为在智能驾驶领域推出的技术方案，两者均代表了国内顶尖的自动驾驶技术水平，但在技术路线、功能侧重和生态布局上存在差异。以下是两者的对比分析：1.技术路线比亚迪天神之眼：基于自研算法：依托比亚迪自主研发的BOS（比亚迪操作系统）和车载计算平台，强调“车端感知+车控”的深度整合。全栈自研：从感知硬件到决策算法均为比亚迪自研，适配其e平台3.0的电动化架构。渐进式
智能驾驶中的感知模块介绍算法自动驾驶
在自动驾驶系统中，感知技术是核心基础之一。感知技术为车辆提供环境信息，使其能够实现对周围环境的理解、分析与决策，从而保证安全性和高效性。通常大家对感知的介绍停留在“眼睛”的作用，但这样的解释太宽泛了例如感知到底是什么？由哪些模块组成？输入输出有什么含义？数据怎么流转的？会经历哪些硬件模块？下面来简单看一下。现在大家不都是在提倡感知规控“端到端”吗？为什么还要拆开介绍？个人理解：完全端到端还有很长一
AI时代的前端工程师：机遇与挑战前端
在飞速发展的科技浪潮中，人工智能（AI）技术正以前所未有的速度改变着我们的生活。从智能家居到自动驾驶，AI的触角已经伸向各行各业，而作为互联网应用的基石——前端开发领域，也正经历着AI带来的深刻变革。本文将探讨AI技术对前端工程师的影响，并分析在AI时代，前端工程师面临的机遇与挑战，以及未来的发展方向。我们关注的重点是AI写代码工具如何改变这个行业。AI对传统前端开发工作的冲击近年来，各种AI写代
DeepSeek 与网络安全：AI 驱动的智能防御一ge科研小菜鸡人工智能运维网络
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能（AI）的快速发展，深度学习技术正渗透到多个领域，从医疗诊断到自动驾驶，再到金融风险控制，AI以其强大的计算能力和数据分析能力改变着传统行业。而在网络安全领域，面对日益复杂和高频率的网络攻击，传统的防御体系正遭遇前所未有的挑战。攻击者利用自动化工具、社会工程学和新型攻击策略，使得传统基于规则和特征匹配的安全手段逐渐失效。在这样
AI赋能人力资源：效率提升新纪元前端
在当今时代，人工智能(AI)技术正以前所未有的速度改变着各行各业。从自动驾驶到智能医疗，AI的触角已经深入到生活的方方面面。而人力资源行业，作为企业发展的基石，也正在经历着AI带来的深刻变革。例如，许多公司已经开始使用AI写代码工具来辅助招聘流程，实现智能匹配候选人，大大提高了效率。然而，在AI浪潮下，如何进一步提升人力资源的整体效率，仍然是一个值得深入探讨的问题。效率提升的瓶颈：传统人力资源的痛
2025最新主流深度学习算法全解析 lucky_syq AI 深度学习算法人工智能
深度学习：开启智能时代的钥匙在当今数字化时代，深度学习无疑是人工智能领域中最为耀眼的明星。它如同一把神奇的钥匙，开启了智能时代的大门，让计算机从简单的数据处理迈向了复杂的智能决策。深度学习通过构建具有多个层次的神经网络模型，使计算机能够自动从大量数据中学习到复杂的模式和特征，从而实现对数据的分类、预测、生成等任务。从语音助手到自动驾驶，从图像识别到自然语言处理，深度学习的应用无处不在，深刻地改变着
深度学习入门：搭建你的第一个神经网络 Evaporator Core 人工智能深度学习 Python开发经验深度学习 python 神经网络
在当今数字化时代，深度学习正以前所未有的速度改变着我们的生活。从语音助手到自动驾驶汽车，从图像识别到自然语言处理，深度学习的应用无处不在。而Python作为一门简洁而强大的编程语言，成为了深度学习领域最受欢迎的工具之一。今天，我们将一起踏上深度学习的旅程，搭建你的第一个神经网络。一、深度学习的魅力深度学习是机器学习的一个分支，它通过模拟人脑的神经网络结构，让计算机能够自动从大量数据中学习规律和特征
均薪23W还缺人，FPGA工程师到底有多重要? 博览鸿蒙 FPGA fpga开发
近两年，随着FPGA行业的快速发展，FPGA工程师的需求量持续增长。FPGA技术在通信、人工智能、自动驾驶、数据中心等领域的广泛应用，使得这一岗位变得尤为重要。尤其是在高性能计算、边缘计算等场景下，FPGA凭借其高并行计算能力和灵活性，成为不可或缺的技术方案。FPGA工程师的核心职责FPGA工程师主要负责FPGA的开发、调试和优化，具体包括：逻辑设计与实现：使用Verilog/VHDL等硬件描述语
计算机视觉算法：开启智能视觉新时代 2501_90175811 计算机视觉
在当今数字化时代，计算机视觉算法正以前所未有的速度改变着我们的生活和工作方式。从人脸识别解锁手机到自动驾驶汽车感知周围环境，计算机视觉算法在众多领域发挥着至关重要的作用。计算机视觉算法旨在让计算机能够“看”和“理解”图像或视频中的内容，就像人类的视觉系统一样。它涉及到多个复杂的技术领域，包括图像处理、模式识别、机器学习等。核心算法与技术图像预处理：这是计算机视觉的第一步，主要包括图像的降噪、增强对
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他