layB

笔记《基于无人驾驶方程式赛车的传感器融合目标检测算法研究及实现》

论文结构

关键字：无人驾驶方程式赛车，相机，激光雷达，目标检测，传感器融合
一、绪论
- 1. 感知技术研究现状
- - 1.1.1 基于相机的目标检测技术研究现状
  - 1.1.2 基于激光雷达的目标检测技术研究现状
  - 1.1.3 基于传感器融合的目标检测技术研究现状
- 2. 本文研究内容
二、目标检测的理论基础
- 2.1 感知系统介绍
- 2.2 深度学习基础
- - 2.2.1 神经网络(Neural Network，NN)
  - 2.2.2 卷积神经网络(Convolution Neural Network，CNN)
- 2.3 传感器标定
三、FSAC赛车的相机目标检测
- 3.1 相机目标检测算法
- - 3.1.1 目标检测算法原理
  - 3.1.2 目标检测算法网络结构
  - 3.1.13 目标检测算法损失函数
- 3.2 相机目标检测算法训练及实现
- - 3.2.1 数据集制作
  - 3.2.2 最优算法模型选取
  - 3.2.3 数据集训练结果分析
  - 3.2.4 最有权重模型选取
基于相机和激光雷达的传感器融合目标检测
- 4.1 传感器融合的目标检测算法
- - 4.1.1 数据预处理
  - 4.1.2 特征提取
  - 4.1.3 候选区域生成
  - 4.1.4 目标检测
  - 4.1.5 损失函数
- 4.2 传感器融合的目标检测算法训练及结果分析
- - 4.2.1 KITTI数据集
  - 4.2.2 数据集训练
  - 4.2.3 实验结果分析
  - 4.2.4 实验结果可视化
FSAC目标检测系统实现
- 5.1 目标检测系统搭建
- 5.2目标检测系统实验结果分析

关键字：无人驾驶方程式赛车，相机，激光雷达，目标检测，传感器融合

一、绪论

1. 感知技术研究现状

1.1.1 基于相机的目标检测技术研究现状

相机传感器获取数据将目标光线信号转化为图像信号。图像包含像素分布、亮度和颜色信息。通过对图像的处理，提取目标的特征信息，以获得目标的类别和位置信息。

基于相机的传统目标检测算法主要分为三个步骤：
1.根据实际情况设置不同尺寸和长度比的窗口，采用滑动窗口对图像数据进行遍历
2.利用手工设计的特征提取器对滑动窗口内的局部区域进行特征提取
3.将提取的图像特征输入到目标检测器中，以获得类别和位置信息

局限性：存在数量庞大的的候选框导致计算量巨大；手工设计的特征提取方法不能适应图像数据多样性，算法鲁棒性差

深度学习能够很大程度提升了基于相机的目标检测算法的速度和准确性。CNN（Convolution Neural Network）采用局部连接和权值共享，一方面减少了权值数量使得网络易于优化，另一方面降低模型复杂程度，减少过拟合的风险。CNN处理具有像素网格的图像数据时优势更明显，直接使用图像作为数据，避免了传统目标检测算法中复杂的特征提取和目标检测过程，可以增强深度学习模型的特征提取能力和泛化能力。基于 CNN 的相机目标检测算法主要有两种。一种是基于候选区域提取的二阶段目标检测算法，如 R-CNN（Region-CNN，基于候选区域的卷积神经网络）算法、Fast R-CNN（Fast R-CNN，基于快速候选区域的卷积神经网络）算法[6]、Faster R-CNN[7]等；另一种是基于回归思想的单阶段目标检测算法，如 YOLO（You Only Look Once,你只需看一次）算法、SSD（Single Shot Multi-Box Detector）算法等。

1.1.2 基于激光雷达的目标检测技术研究现状

激光雷达传感器获取数据：深度图像——>点云。点云：三维坐标（X,Y,Z）、颜色、分类值、强度值和时间等信息。点云具有无序性、稀疏性等特征，这导致点云数据处理的研究成果与图像相比较少。
基于激光雷达的传统目标检测算法主要分为五个步骤：
1.对原始点云数据提取感兴趣区域ROI（Region Of Interest），保留有效区域的点云
2.通过滤波方法降低点云密度同时保留点云的形态特征
3.采用随机采样一致性算法过滤地面点云，保留非地面点云
4.利用欧式聚类算法，将每一帧的点云中的目标物体逐一分开，形成单独的一簇点云
5.对目标物体的点云进行优化，获得三维坐标等特征

常用目标检测算法：二叉树搜索算法、RANSC平面分割算法和欧式聚类算法
局限：但基于激光雷达的传统目标检测算法基于手工设计的特征，算法性能受手工调参等因素的影响，只适应特定的数据集，算法泛化能力较差。
基于深度学习的激光雷达目标检测方法，按照点云数据处理方法，主要分为基于原始点云、基于体素网格与基于多视图这三类目标检测方法
基于原始点云的目标检测：对点云直接3D卷积（PointNet）
基于体素网格点云的目标检测：将原始点云按照空间几何特性划分为具有相邻特性和拓扑特性的三位体素网格，然后对体素网格进行3D目标检测 (VoxNet)
基于多视图的目标检测：将三维点云数据映射到二维平面，根据映射方向不同可以分为前视图（Front View）、鸟瞰图（Bird Eye View）等。（MVCNN）

1.1.3 基于传感器融合的目标检测技术研究现状

相机+LiDAR
相机图像：高分辨率、色彩、纹理信息，成本低；极易受光照影响、天气变化的干扰，特征提取和目标检测的精度大幅下降，且无法提供较为精确的深度信息。
激光雷达传感器：精度高响应快，抗干扰强，成本高，在恶劣的条件下无法正常工作，且获取的点云稀疏无序。
因此单一传感器很难满足复杂场景下的无人驾驶任务。采用多传感器一般使用相机+Lidar
目前传感器融合的方法大多是传统图像目标检测+点云2D目标检测融合在一起。eg:VeloFCN算法，Vote3D算法。而MV3D和AVOD算法应用深度学习对传感器的数据进行融合后再目标检测。MV3D提出一种将图像数据与点云数据进行融合的方法，用点云的Front View 和 BEV 表示三维点云信息，与图像Front View融合，实现3D目标检测。AVOD算法使用点云BEV和FV作为网络数据输入，改进RPN网络架构、添加预测狂几何约束，提升了目标检测准确性和实时性。

2. 本文研究内容

一种基于 YOLOv4 模型的相机目标检测算法。针对真实赛道场景下复杂因素导致锥桶识别和检测效率低下的问题，在真实场景下采集并制作数据集用以算法训练，对算法训练结果进行分析，选取最优权重模型和最优算法模型。

二、目标检测的理论基础

2.1 感知系统介绍

无人驾驶主要由感知、规划、控制三个部分构成。

感知系统的框架主要分为三个部分：特征提取、特征融合、目标检测。

特征提取：图像和点云特征提取网络分别对图像和点云数据进行特征提取获得图像和点云的特征图；
特征融合：候选区域生成网络在点云特征图上候选框，先将候选框分别映射到图像和点云特征图上，在将候选框区域内的图像和点云特征图进行融合；
目标检测：目标检测网络对融合后的特征图进行目标的分类与回归预测。

2.2 深度学习基础

2.2.1 神经网络(Neural Network，NN)

每个神经元接受大量输入后简单的线性加权，再通过非线性的激活函数输出
y=f(z)，y 为模型的输出变量； f ( )为激活函数； z 为模型的中间参数，其定义

xi 为模型的输入变量；wi 为权重值，每个输入变量都赋予一个对应的权重值；b 为偏置值，为达到更好的目标而作调整的偏置项。
将多个神经元组织在一起便形成了神经网络。一般分为输入层，输出层和隐藏层。每一层可以有单个或多个神经元组成，上一层的输出将会作为下一层的输入

2.2.2 卷积神经网络(Convolution Neural Network，CNN)

带有卷积结构的深度神经网络，用以处理具有网格特征的图像数据。卷积结构有三个主要特性：局部感知、权值共享和池化操作，有效减少网络的参数量，缓解模型的过拟合问题。
局部区域内的相邻像素联系较为紧密，而距离较远的像素关联性较差。因此，神经元不必对整幅图像进行全局感知，只需对图像的局部区域进行感知，然后在更深层将局部区域的特征信息融合就可以获得图像的全局特征信息，这就是局部感知。图像中部分特征的统计特性可能与其他部分的特征相同，这表示 CNN 对这部分的特征的学习也可以迁移到其他部分上。不同神经元之间参数的进行共享，有效地减少了需要求解的参数量，这就是权值共享。

CNN 的浅层结构由卷积层、激活层和池化层交替组成，深层结构由全连接层、采样层和最后一层输出层组成。最后一层输出层利用 Softmax 进行目标分类，对目标的候选区域进行目标预测。
（1）卷积层
卷积层通过卷积函数（Convolution Function）对图像矩阵或滤波矩阵做内积的操作。

（2）激活层
激活层通过激活函数（Activation Function）增加模型的非线性表达能力。常见的激活函数主要 Sigmoid、ReLU 和 Mish 等。
（3）池化层
池化层通过池化函数（Pooling Function）使用某一区域内相邻输出的总体统计特征来代替网络在该区域的输出，在保持原有特征的基础上最大限度地将数组的维数变小，实现降维处理，减少参数量。池化操作在形式上与卷积操作相似，但池化操作只关心滤波器的尺寸，不考虑内部的值。池化主要分为最大池化（Max Pooling）和均值池化（Mean Pooling）。最大池化将图像上滤波器对应局部区域内的所有像素点取最大值。均值池化将图像上滤波器对应局部区域内的所有不为 0的像素点取均值。最大池化倾向于保持图像较为显著的特征，而平均池化倾向于保持图像的整体特征。

2.3 传感器标定

相机标定、相机和激光雷达联合标定（空间同步和时间同步）

三、FSAC赛车的相机目标检测

3.1 相机目标检测算法

3.1.1 目标检测算法原理

YOLOv4

以红、黄和蓝三种不同大小颜色的赛道锥桶为例，基于 YOLO v4 模型的相机目标检测算法将包含三种赛道锥桶的输入图像划分成 S×S 个网格，每个网格单元产生 B 个边界框，每个边界框负责检测和识别几何中心落在该边界框内的
目标锥桶的位置和类别信息。
每个边界框预测 5 个参数，分别为：边界框横坐标（bx ）、边界框纵坐标（by ）、边界框高（bh ）、边界框宽（bw ）和置信度（C ）。

主干网络结构借鉴了 CSPNet[35]（Cross Stage Partial Network，跨阶段局部网络），使用 CSP×n 模块，使得网络结构在保持检测精度的同时减少计算量，增强了卷积神经网络的学习能力，降低了计算瓶颈和内存成本。

3.1.2 目标检测算法网络结构

3.1.13 目标检测算法损失函数

3.2 相机目标检测算法训练及实现

3.2.1 数据集制作

3.2.2 最优算法模型选取

3.2.3 数据集训练结果分析

3.2.4 最有权重模型选取

基于相机和激光雷达的传感器融合目标检测

4.1 传感器融合的目标检测算法

AVOD（Aggregate View Object Detection，多视图目标检测）模型的传感器融合目标检测算法
将通过相机采集的图像数据和通过激光雷达采集的点云数据进行融合后，进行特征提取
数据预处理、特征提取、候选区域生成、目标检测和损失函数和目标检测
选取 KITTI 数据集进行算法的训练验证

第一阶段：有特征提取网络和候选区域生成网络组成
第二阶段：3D目标检测网络

第一阶段：
点云数据经过数据预处理生成点云俯视图和 3D 先验框，采用两种同样的特征提取网络进行特征提取得到图像特征图和BEV点云特征图。两类特征图分别经过两个 1×1 卷积层进行降维与裁剪，调整特征图大小后，先将 3D 先验框映射到经过调整的特征图上与先验框区域内的特征融合生成特征张量（Feature Crop），将特征张量进行融合后输入全卷积层生成候选框，利用 NMS 方法保留置信度较高的候选框。
第二阶段：
3D 目标检测网络先将候选框与经过调整的特征图进行融合，再对候选框进行分类和回归预测，获取 3D 预测框的类别和位置信息。

4.1.1 数据预处理

（1）3D 先验框的生成
初始先验框（Anchor Box）生成用以候选区域生成网络的输入数据之一。
选取[-40，40]×[0，70]×[0，2.5]范围（即，激光雷达坐标系中心左右 40 米、前方 70 米且垂直方向上 0 至 2.5 米范围）内的点云数据；然后在每个维度上产生水平和竖直两个方向的先验框；最后，过滤掉空的先验框，得到非空 3D 先验框。
（2）点云数据投影
将点云数据输入到网络前，需要对点云数据进行预处理，以满足特征提取网络的需求。将原始的三维点云数据投影到二维平面上，即将点云数据投影至俯视图上。
首先，设置点云数据的分辨率为每像素 0.1 米。然后，选取[-40，40]×[0，70]范围内的点云数据投影至俯视图上，得到分辨率为 700×800 的黑白图像。为增加点云俯视图内数据的信息含量，将垂直方向上[0，2.5]范围内的点云数据信息平分成五层，将不同层的点云数据信息投影至分辨率为 700×800 的点云俯视图上。最终，与原始点云的俯视图构成 700×800×6 的点云俯视图数据，作为特征提取网络的输入数据之一。

（a）原始俯视图，（b）-（f）为由下到上第1-5层的点云俯视图。目标物体的点云在投影到俯视图时，尺寸变化很小；且俯视图中目标物体分别占据不同的空间，避免了目标遮挡问题。

4.1.2 特征提取

基于 FPN 的特征提取网络。采用大小为 480×1590×3 的图像前视图和大小为 700×800×6 的点云俯视图作为网络的输入进行特征提取，生成高分辨率的特征图。

4.1.3 候选区域生成

候选区域生成网络的作用是将特征提取网络输出的图像和点云特征图进行处理与融合后，生成可能包含目标物体的候选框
（1）特征融合
如果直接从高维特征地图（High Dimensional Feature Map）提取特征张量，会极大地增加数据的存储量和 RPN 网络的计算量。因此，需要先将基于 FPN 的特征提取网路输出的全分辨率特征图经由 1×1 卷积层进行降维处理减少参数和运算量。
然后，调整图像和点云特征图的大小。将预先生成的 3D 先验框映射到经过提调整的图像和点云特征图上，获得两个感兴趣区域（ROI）。使用感兴趣区域对相应的特征图提取特征张量，再将特征张量的双线性经 3×3 大小的卷积层调整以获得等长的特征向量。
（2）候选区域生成
先将经过处理的特征张量按像素进行融合，然后采用 RPN 网络对融合后的特征作张量生成目标候选框，并进行目标候选框的分类和回归预测。最后采用NMS 方法对生成的 3D 候选框进行处理，选取最优的 3D 候选框。RPN 方法不仅在 2D 目标检测中具有良好的性能，而且在 3D 目标检测中也具有优异的性能。

4.1.4 目标检测

（1）3D 边界框编码
3D 边界框的回归点有 8 个，针对 3D 边界框的编码方式主要有 3 种

（a）为 MV3D 算法的编码方式，过于冗杂；（b）为Axis Aligned 算法的编码方式易导致预测框漂移。作者选择编码方式（c），通过10 维（2×4+2）的向量表示 3D 预测框，实现了编码降维处理，有效地减少了参数量和运算量。

（2）预测框生成
经由候选区域生成网络生成的 3D 候选框的数量相比于 3D 先验框，已经低了一个数量级，因此选择将 3D 候选框与原始特征图经调整进行融合。利用全连接层对融合后的特征作物进行预测，输出每个候选框的回归信息、方向估计和类别分类。再采用 NMS 方法（非极大抑制）去除冗余的 3D 预测框在，最终输出置信度较高的 3D候选框。

4.1.5 损失函数

本章损失函数主要分为两个部分，定位损失和分类损失。定位损失采用Smooth L1 函数，分类损失采用交叉熵函数。

4.2 传感器融合的目标检测算法训练及结果分析

4.2.1 KITTI数据集

使用开源自动驾驶数据集 KITTI 数据集。

4.2.2 数据集训练

4.2.3 实验结果分析

4.2.4 实验结果可视化

FSAC目标检测系统实现

5.1 目标检测系统搭建

5.2目标检测系统实验结果分析

前端初学者，该如何开始学习？四六的六前端学习个人开发
前端初学者，该如何开始学习？嗨，作为一个曾经的前端小白，现在也算是入门了，我特别理解刚开始学习前端时的迷茫，所以很愿意和你分享一下我的学习经验。刚开始的时候，得先搞清楚前端技术到底是啥。简单来说，前端就是咱们平常在浏览器里看到的网页那些东西。它主要由HTML、CSS和JavaScript三个部分组成。HTML（超文本标记语言）：作为构建网页内容的基石，HTML以其独特的标签体系定义了网页的基本架构
JavaWeb学习——登录校验灰太狼想上班 JavaWeb基础学习 spring tomcat servlet 后端
JavaWeb学习——登录校验一、功能实现只需要接受请求参数username和password，然后调用接口在数据库表中查询键值匹配的数据项即可二、登录校验登录校验通常分为两步，一是登录标记，二是统一拦截1、会话跟踪会话：用户打开浏览器，访问web服务器的资源，会话建立，知道有一方断开连接，会话结束。在一次会话中可以包含多次请求和响应会话跟踪：一种维护浏览器的方法，服务器要识别多次请求是否来自于同
2025年三个月自学手册网络安全（黑客技术）网安kk web安全安全网络网络安全 python
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航
前端初学者，有哪些适合的学习网站？四六的六前端学习个人开发
对于前端初学者而言，选择合适的学习网站至关重要，以下是一些我知道的优质学习平台，在这里分享给大家：菜鸟教程：该网站以其简洁明了的界面设计和通俗易懂的教程内容而受到广大初学者的欢迎。其前端教程体系涵盖了前端开发的大量入门知识，包括HTML、CSS、JavaScript等基础技术，以及当前主流的前端框架和工具的使用方法，如Vue.js、React、Webpack等。教程内容的讲解方式深入浅出，注重从基
PlanLLM: 首个支持开放词汇与封闭集任务的跨模态视频程序规划框架数据集
2025年1月7号，由杨德杰、赵子敬、刘洋联合提出PlanLLM，一种基于可微调大型语言模型（LLM）的跨模态联合学习框架，用于解决视频程序规划任务。通过引入LLM增强规划模块和互信息最大化模块，PlanLLM突破了现有方法依赖封闭集标签和固定语义描述的限制，实现了对新步骤和任务的泛化能力。该方法在COIN、CrossTask、NIV三个基准数据集上取得显著性能提升，展现了其在弱监督学习中的有效性
机器学习 [白板推导]（三）[线性分类] 神齐的小马机器学习分类人工智能
4.线性分类4.1.线性分类的典型模型硬分类：输出结果只有0或1这种离散结果；感知机线性判别分析Fisher软分类：会输出0-1之间的值作为各个类别的概率；概率生成模型：高斯判别分析GDA、朴素贝叶斯，主要建模的是p(x⃗,y)p(\vec{x},y)p(x,y)概率判别模型：逻辑回归，主要建模的是p(y∣x⃗)p(y|\vec{x})p(y∣x)4.2.感知机4.2.1.基本模型模型：f(x
基于内容分块（CDC）的重删算法详解：原理、实现与优化这个懒人算法
引言在数据爆炸式增长的时代，存储资源优化成为技术领域的重要课题。重复数据删除（Deduplication）技术通过消除冗余数据副本，可将存储需求降低90%以上。其中基于内容分块（Content-DefinedChunking,CDC）算法凭借其对数据局部修改的强适应性，成为企业级备份系统、云存储服务的核心技术。一、CDC算法核心原理1.1动态分块vs静态分块传统固定分块算法将数据按固定大小（如4K
算法-找到字符串中所有字母异位词程序员南飞算法数据结构开发语言 java
力扣题目：438.找到字符串中所有字母异位词-力扣（LeetCode）题目描述:给定两个字符串s和p，找到s中所有p的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。示例1:输入:s="cbaebabacd",p="abc"输出:[0,6]解释:起始索引等于0的子串是"cba",它是"abc"的异位词。起始索引等于6的子串是"bac",它是"abc"的异位词。示例2:输入:s="aba
CSS3学习教程，从入门到精通，CSS3 列表样式语法知识点及案例代码（8）知识分享小能手前端开发网页开发编程语言如门 css3 学习前端 css html5 html Java开发
CSS3列表样式语法知识点及案例代码一、列表样式类型1.list-style-type属性用于指定列表项标记的样式类型。语法格式：list-style-type:;取值说明：对于无序列表（），常见的取值有：disc：实心圆（默认值）。circle：空心圆。square：实心方块。none：无标记。对于有序列表（），常见的取值有：decimal：数字（默认值）。lower-roman：小写罗马数字。
CSS3学习教程，从入门到精通，CSS3 选择器权重问题语法知识点及案例代码（5）知识分享小能手网页开发编程语言如门前端开发 css3 学习前端 html5 html java css
CSS3选择器权重问题语法知识点及案例代码一、选择器权重概述在CSS中，当多个选择器同时匹配同一个元素时，浏览器会根据选择器的权重来决定哪个样式生效。权重高的选择器的样式会覆盖权重低的选择器的样式。二、选择器权重计算规则1.内联样式（InlineStyles）内联样式直接写在HTML元素的style属性中，权重为1000。2.ID选择器（IDSelectors）ID选择器以#开头，权重为100。3
CSS3学习教程，从入门到精通，CSS3 常用文本属性语法知识点及案例代码（6）知识分享小能手前端开发网页开发编程语言如门 css3 学习前端 css html5 javascript web开发
CSS3常用文本属性语法知识点及案例代码一、文本颜色(color)语法:color:;取值:颜色名称:例如red,blue,green等十六进制颜色值:例如#ff0000,#00ff00,#0000ff等RGB颜色值:例如rgb(255,0,0),rgb(0,255,0),rgb(0,0,255)等RGBA颜色值:例如rgba(255,0,0,0.5),rgba(0,255,0,0.5),rgba
CSS3学习教程，从入门到精通， CSS3 样式引入语法知识点及案例代码（2）知识分享小能手前端开发网页开发编程语言如门 css3 学习前端 html5 html 开发语言 css
CSS3样式引入语法知识点及案例代码一、CSS3样式引入方式CSS3样式可以通过以下几种方式引入到HTML文档中：1.内联样式(InlineStyles)语法：直接在HTML元素的style属性中编写CSS代码。优点：优先级最高，方便调试。缺点：不利于维护和复用，代码冗余。案例：这是一个段落。2.内部样式表(InternalStyleSheet)语法：在HTML文档的标签内使用标签定义CSS样式。
HTML 样式与布局初体验：学习进程中的关键节点（一）计算机毕设定制辅导-无忧学长 #HTML html 学习前端
初涉HTML：开启学习之门在当今互联网飞速发展的时代，网页无处不在，它已经成为人们获取信息、交流互动的重要平台。而HTML，作为构建网页的基石，其样式与布局更是决定了网页的呈现效果和用户体验。我最初接触HTML，是源于对网页设计的浓厚兴趣。看着那些设计精美的网页，我不禁好奇，它们背后的代码世界究竟是怎样的？带着这份好奇，我踏上了HTML样式与布局的学习之旅。HTML样式初体验在初步了解HTML后，
HTML 样式与布局初体验：学习进程中的关键节点（二）计算机毕设定制辅导-无忧学长 #HTML html 学习 css
学习中的困难与突破在学习HTML样式与布局的过程中，我也遇到了不少困难，这些困难就像是学习道路上的绊脚石，但也正是在克服它们的过程中，我实现了自我的突破和成长。（一）样式冲突：规则的碰撞样式冲突是我遇到的第一个难题。当使用多个CSS规则来定义同一个元素的样式时，由于选择器的优先级和规则的先后顺序不同，经常会出现样式不符合预期的情况。比如，我在一个项目中，同时使用了外部样式表和内嵌样式来设置按钮的样
ChatGPT智能聊天机器人实现云端源想 chatgpt 机器人
以下是一个从零实现类ChatGPT智能聊天机器人的完整开发指南，包含技术选型、核心代码逻辑和推荐学习资源：—云端平台整理一、技术架构与工具核心模型基座模型：HuggingFaceTransformers库（如GPT-2/GPT-3.5TurboAPI/LLaMA2）轻量化方案：微软DeepSpeed或MetaFairScale（降低显存占用）训练框架PyTorchLightning+Acceler
【面试经验】华为 AI软开计算产品线（面经+时间线） litterfinger 面试华为人工智能
一.岗位：AI软开二.时间线：投递08.09，机试08.28，测评08.29；面试均线上，一面09.12，二面09.27，三面09.29（本来是09.19线下二三面，但由于本人有事推迟）三.一面（50min）自我介绍简单介绍一下传统知识图谱建设和大模型对于知识的构建的差异和整体的趋势聊聊实习经历中的提示工程和sft具体的工作AI的一个发展历史流程和相关算法的引进知识图谱建设的总体流程回顾机试：老鼠
Python学习日记-第二十九天-tcp（客户端）差点长成吴彦祖 python pandas tcp/ip 网络
系列文章目录tcp介绍tcp特点tcp客户端一、tcp介绍Tcp协议，传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC793定义TCP通信需要经过创建连接、传输数据、终止连接三个步骤TCP通信模型中，在通信开始之前，一定要先建立相关的链接，才能发送数据，类似于生活中的“打电话”（注：之前学习的udp，在通信前，不需要建立相关的链接，只需要发送数据即可，类似于“写
如何在GitHub上Clone项目：一步步指南 Fanstay985 github
GitHub作为全球最大的代码托管平台，汇聚了无数开发者的智慧结晶。对于初学者和资深开发者来说，学会如何从GitHub上克隆（Clone）项目是一项基本且重要的技能。本文将详细介绍如何在GitHub上克隆项目的步骤，帮助你轻松将他人的代码库下载到本地进行学习和开发。一、准备工作在开始之前，请确保你已经安装了Git。Git是一个分布式版本控制系统，用于代码的版本管理。如果你还没有安装Git，可以从G
【北上广深杭大厂AI算法面试题】计算机视觉篇...详解目标检测中的多尺度训练和测试? 努力毕业的小土博^_^ AI算法题库人工智能计算机视觉算法深度学习神经网络目标检测
【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度训练和测试?【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度训练和测试?文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...详解目标检测中的多尺度训练和测试?前言多尺度训练核心思想：优点与注意点：多尺度测试核心思想：优点与注意点：综合作用参考示例总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上
MVC/MVP/MVVM框架学习总结（二）每次的天空 mvc 学习 java
上次已经了解到MVC的知识，现在是扩展实现MVP/MVVM的框架改进本身项目MVVM框架即Model-View-ViewModel框架，是一种软件架构设计模式，以下是具体介绍：核心组件Model（模型）：代表应用程序的数据结构和业务逻辑，负责数据的存储、检索、验证和处理，定义业务规则和算法，是应用程序的数据核心。比如在一个电商应用中，商品数据、用户订单数据等的存储和相关逻辑处理都属于Model层。
CURL一文通 calmtho curl 网络
文章目录1.什么是curl2.curl可以发送什么请求3.常见curl发http相关请求怎么写4.curl带上的参数分别有什么，可以怎么用5.进阶用法6.常见错误以及学习指导建议1.什么是curl是利用URL语法在命令行下工作的开源文件传输工具。尤其被广泛应用的在linux系统下。2.curl可以发送什么请求由定义可知道，curl主要应用于网络传输，它支持常用的多种请求，如http,https,f
Python学习第十九天 Leo来编程 Python学习学习 python
Django-分页后端分页Django提供了Paginator类来实现后端分页。Paginator类可以将一个查询集（QuerySet）分成多个页面，每个页面包含指定数量的对象。fromdjango.shortcutsimportrender,redirect,get_object_or_404from.modelsimportUserfrom.formsimportUserFormfromdja
开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用开源技术探险家开源大语言模型-新手试炼深度学习 AI编程 AIGC
一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野，更让我们站在科技发展的潮头，紧跟时代的步伐。Qwen2-VL具有卓越的图像和视频理解能力，以及多语言支持等特性。学习它可以提升我们处理复杂视觉信息的能力，无论是在学术研究中分析图像数据、解读视频内容，还是在实际工作中进行文档处理、解决
【时间复杂度常见的计算】 xihongshi547 算法 leetcode 数据结构
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档时间复杂度的简单介绍前言一、时间复杂度是什么？二、时间复杂度的计算1.基本步骤2.常见的时间复杂度总结前言对于判断一段代码的好坏，取决于该代码运行的时间与占用的空间，也就是时间复杂度与空间复杂度，本章就先讲一下时间复杂度，主要包含常见的时间复杂度的计算。一、时间复杂度是什么？时间复杂度是衡量算法运行效率的一个重要指标，它表示随着输入规
如何配置Kubernetes仪表板dashboard支持http方式并使用ingress-nginx代理访问实践全栈工程师修炼指南云原生落地实用指南运维 docker kubernetes nginx java
公众号关注「WeiyiGeek」设为「特别关注」，每天带你玩转网络安全运维、应用开发、物联网IOT学习！本章目录：配置Kubernetes-dashboard以支持http方式访问原文地址:https://blog.weiyigeek.top/2021/12-1-583.html1.配置Kubernetes-dashboard以支持http方式访问描述:当前默认安装配置的Kubernetes-da
Python常用数据结构我真的不会做啊 python 数据结构开发语言
背景：最近在学习自动化测试，发现基本是用python写的脚本就顺带好好学一学python，准备以后也深入学习一下今天简单的介绍一下python里面常用的数据结构吧Python数据结构原生数据结构原生数据结构元组Tuple()tup1=('Python','Java',1,2)tup2=(9527,)注意：1、使用()、tuple()创建元组，元组可以为空且元素类型可以不同；2、若元组中仅包含一个数
Ollama 基本概念 Mr_One_Zhang 学习Ollama ai
Ollama是一个本地化的、支持多种自然语言处理（NLP）任务的机器学习框架，专注于模型加载、推理和生成任务。通过Ollama，用户能够方便地与本地部署的大型预训练模型进行交互。1.模型（Model）在Ollama中，模型是核心组成部分。它们是经过预训练的机器学习模型，能够执行不同的任务，例如文本生成、文本摘要、情感分析、对话生成等。Ollama支持多种流行的预训练模型，常见的模型有：deepse
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
【动手学深度学习】#1PyTorch基础操作 -一杯为品- 机器学习深度学习人工智能
主要参考学习资料：《动手学深度学习》阿斯顿·张等著【动手学深度学习PyTorch版】哔哩哔哩@跟李牧学AI目录1.1数据操作1.1.1入门1.1.2运算符1.1.3广播机制1.1.4索引和切片1.1.5节省内存1.1.6转换为其他Python对象1.2数据预处理1.2.1读取数据集1.2.2处理缺失值1.2.3转换为张量格式1.3线性代数1.3.1标量1.3.2向量1.3.3矩阵1.3.4张量1.
38份DeepSeek核心资料汇总｜可下载航锦234 人工智能 pdf
资料链接：https://pan.quark.cn/s/b469ed4018ff为了方便大家查找和使用，我们对之前发布过的DeepSeek系列学习资料进行了分类和汇总。内容包括但不限于清北浙DeepSeek课件资料汇总manus学习资料DeepSeek实操变现指南DeepSeek本地部署教学等等点击最上方链接即可保存下载～
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟