一勺汤

OpenMMLab/MMDetection3D Pointpillars点云目标检测

坐标中间的转换

1 齐次坐标概念

概念：齐次坐标就是将一个原本是n维的向量用一个n+1维向量来表示，是指一个用于投影几何里的坐标系统。

引入齐次坐标的目的就是合并矩阵运算中的乘法和加法，即它提供了用矩阵运算把二维、三维甚至高维空间中的一个点集从一个坐标系变换到另一个坐标系的有效方法。

2.把雷达坐标系看成世界坐标系，则世界坐标系中任意一点W，其世界坐标为：

其世界齐次坐标为：

又假设雷达坐标系到相机坐标系的转换矩阵为E，（该矩阵即是外参矩阵，取其英文Extrinsic首字母E），假设其逆矩阵为：

设点W在相机坐标系下的坐标表示为：

其在相机坐标系下的齐次坐标为：

则有：

即：

为消除齐次坐标、简化计算，特令：

则公式变为：

坐标系说明

1）Lidar坐标系

激光雷达坐标系可以描述物体与激光雷达的相对位置，表示为[XL, YL, ZL]，其中原点为激光雷达几何中心，XL轴水平向前，YL轴水平向左，ZL轴竖直向上，符合右手坐标系规则。

2）相机坐标系

相机坐标系可以描述物体与相机的相对位置，表示为[XC, YC, ZC]，其中原点为相机光心 O 点，XC 轴与 x 轴平行，YC 轴与 y轴平行，ZC轴与摄像机光轴平行，与图像平面垂直。

3）图像坐标系

图像坐标系指在图像像素坐标系下建立以物理单位(如毫米)表示的坐标系，使像素尺度具有物理意义，表示为[x, y]，其中原点为相机主点，即相机光轴与图像平面的交点，一般位于图像平面中心，x 轴与 u 轴平行，y 轴与 v 轴平行；

4）像素坐标系

像素坐标系表示为[u, v]，其中原点为图像左上角，u 轴水平向右，v 轴竖直向下；

内参矩阵

设空间中有一点P，若世界坐标系与相机坐标系重合，则该点在空间中的坐标为(X, Y, Z)，其中Z为该点到相机光心的垂直距离。设该点在像面上的像为点p，像素坐标为(x, y)。

f为相机的焦距，相机坐标系下点p与图像坐标系下投影点p(x, y)的坐标关系为：

最终的转换关系为：

图像坐标系与像素坐标系的转换

图像坐标系与像素坐标系为平移转换关系，O1->像素坐标系原点，O->图像坐标系原点；示意图如下：

点O在像素坐标系下的坐标为(Uo,Vo),变换公式为：

式中 dx 和 dy 分别为单个像素在像平面的长和宽，转换为矩阵：

相机到图像

外参矩阵

点云到相机的坐标转换

KITTI点云数据转到图像上的点

y = P2 * R0_rect * Tr_velo_to_cam * x

1. Tr_imu_to_vel为点云上的点到相机坐标系下的点，矩阵大小为3x4，包含了旋转矩阵R和平移向量t，也就是上面提到的外参矩阵。

2. 之后利用0号相机的修正矩阵进行修正：R0修正矩阵3x3；主要是随着时间的偏移，0号相机的坐标可能会有偏差，将其校准，然后后面的投影即可通过内参矩阵和位移完成

3.P2就是相机到图像上点的内参

其中的45.7=0.06f=0.06*707=45，上面的最后一列是相机坐标系的偏移，主要是x轴，y和z轴稍微有点误差。

角度的转换：

在标签文件（label）中，最后一个值为物体前进方向与x轴夹角的弧度值（在相机坐标系下）且以顺时针为正，逆时针为负

举个例子：如上图第一个car数据为例，其前进方向与x轴夹角（也称为yaw角）为-89.9°（-1.57*180/pi）

那么坐标系向雷达坐标系转换后，其raw角就变成了-(r_y + pi/2) ,且在雷达坐标系下，以x轴到y轴方向为正（即逆时针为正，顺时针为负）。则接上一个例子，如图所示，其在雷达坐标系下的yaw角度为-0.1°。

点云相机的坐标转换以及联合标定 - 灰信网（软件开发博客聚合）

激光雷达坐标系、相机坐标系与到图像坐标系之间的转换_灰灰子衿的博客-CSDN博客_雷达相机配准中,因为雷达坐标系转移到相机坐标系后图像怎么配准的

处理点云数据(五)：坐标系的转换_听说你爱吃芒果的博客-CSDN博客_怎么把点云图像转换成坐标轴

kitti数据集在3D目标检测中的入门(二)可视化详解_Studying_swz的博客-CSDN博客_kitti可视化

齐次坐标_寒韩Glory的博客-CSDN博客_齐次坐标

Kitti数据集标签中yaw角在不同坐标系的转换_噗噗噗蒲的博客-CSDN博客_kitti yaw

https://blog.csdn.net/zhulf0804/article/details/125020578

标注

1.标注框移动：

QWEASD 控制框上下、左右、前后移动；

2.标注框转动：

X/Y控制标注框转动，标注时尽量将标注框内显示的箭头指向车头朝向位置；

3.标注框（单面）尺寸调节：

鼠标停留在标注框某个面上后，移动滚轮可调节当前标注框鼠标所在面的大小（前后移动）；

4.标注视野移动：

鼠标点击长按右键并拖动鼠标，能够移动视野区域；

5.标注视野分辨率改变：

鼠标只在标注视野内滚动滚轮则为改变视野分辨率（放大或缩小）；

6.标注设置：

在顶栏找到“Setting==>Change Setting”按钮可对标注内容进行设置（框初始大小，类别数量，标注格式）。

labelCloud 开源三维点云工具标注自制点云数据集（以.bin格式点云为例）_Shawn_1223的博客-CSDN博客

https://blog.csdn.net/jin15203846657/article/details/122949271

视锥

计算近平面和远平面的中心点

计算近平面和远平面的宽度和高度

计算近平面和远平面的角点

从平面的任意三个角计算每个平面，顺时针或逆时针缠绕到指向内(取决于坐标系)

https://www.coder.work/article/6670253

配置文件

https://www.bilibili.com/video/BV14M41167Ct/?spm_id_from=333.788&vd_source=8a6043a22d94a87da35299c0731405

1.Create_data.py

Mmdetection3d支持多个数据集和网络，其数据的主要流程是差不多的，本文档主要选择数据集—KITTI和网络—PointPillars为主介绍数据生成的流程：

根据数据集为KITTI，判断进入KITTI数据集处理的通道；
将KITTI数据集中的图像的路径大小、点云的路径、label等信息生成.pkl文件；
获取相机视角里的点云数据，将数据保存在velodyne_reduced文件中，由于本文档中的数据是使用双目采集的点云信息，因此点云都在相机的视角范围内；
生成3D目标检测真值，也就是将你标注的数据拿出来，比如你在点云中标注了一个人，就将你标注框中的对象拿出来保存至kitti_gt_database文件中；

1.1获取数据集中点云图像路径——kitti.create_kitti_info_file

本文档主要将训练集信息生成pkl，其他训练集，验证集的生成方式大体相同。

1. 传入参数：（root_path：数据集的路径；info_prefix：数据集的类型，是kitti还是lyft数据集，还是s3dis数据等，本文档是kitti数据格式；with_plane=false）

2. 进入kitti.create_kitti_info_file函数后，然后按行读取数据下的ImageSets下存储的训练集、测试集里面的数据，保存list。

3. get_kitti_image_info（data_path：kitti的路径；training=True训练集；velodyne=True使用点云信息；calib=True坐标转换信息；with_plane=with_plane；image_ids=train_img_ids 第2步中获取的训练集ID；relative_path=relative_path是否使用相对路径，是True）获取图像的路径大小、点云的路径、label等信息。

4. 多线程 第17章：使用 concurrent.futures 模块处理并发-ThreadPoolExecutor 多线程并发和 Future 介绍_waitan2018的博客-CSDN博客

    使用一个多线程的方式，通过使用image_ids 从map_func取东西，也就是根据image_ids生成每一个image，label等路径，然后使用map_func函数读取路径，获取信息。

map_func：(idx：训练集中的ID)

image_info：image_idx,path,shape

pc_info： (num_feature:4（x,y,z,r强度），path)

Annotations：获取label信息：get_label_anno（path）name、bbox等8个信息。

calib_info：p0,p1,p2,p3, R0_rect, Tr_velo_to_cam,Tr_imu_to_velo；将image_info、pc_info、Annotations和calib_info放入info中。

5.函数_calculate_num_points_in_gt（data_path:数据的路径；kitti_infos_train：刚刚保存的info信息）用来计算相机视场范围内LiDAR点云的个数。计算剩下点云的个数，把结果更新到annos["num_points_in_gt"]中，后去除数据的时候会用到，设置一个阈值，大于它将点云保存下来。将 Velodyne 坐标中的点 x 投影到左侧的彩色图像中 y，使用公式 y = P2 * R0_rect * Tr_velo_to_cam * x。读取点云以及上面公式需要的数据输入到box_np_ops.remove_outside_points函数中去除图像范围外的点云，保留图像内的点云。

1.2获取相机视场内的点云——kitti.create_reduced_point_cloud

1.读取原先保存的pkl信息

2. _create_reduced_point_cloud(data_path：数据路径； train_info_path：刚刚读取的训练集的pkl路径； save_path) 读取点云后操作和1.1中的第5点相似，保留图像范围内的点云到velodyne_reduced

1.3获取3D目标检测的真值——create_groundtruth_database

判断KittiDataset，形成dataset_cfg的配置文件获取dataset = build_dataset(dataset_cfg)

Compose类根据pipeline读取数据。

2 model主要模块解析

2.1 体素化

函数：self.voxelize(points)

Voxelization(voxel_size=[0.16, 0.16, 4], point_cloud_range=[0, -39.68, -3, 69.12, 39.68, 1], max_num_points=32, max_voxels=(16000, 40000), deterministic=True)

输入：

（1）points，Nx4，原始点云，N表示点云数量，4表示特征维度，特征为坐标x、y、z与反射强度r。

（2）voxel_size：单位体素的尺寸，x、y、z方向上的尺度分别为0.16m、0.16m、4m。

（3）point_cloud_range：x、y、z方向的距离范围，结合（2）中体素尺寸可以得到总的体素数量为432x496x1，可以看到Z方向上只有一个体素。所有体素均表现为柱状。

（4）max_num_points：定义每个体素中取值点的最大数量，默认为32。

（5）max_voxels：表示含有点云的体素最大数量，默认为16000。当数量超过16000时，仅保留16000，当数量不足16000时，则保留全部体素。

（6）deterministic：取值为True时，表示每次体素化的结果是确定的，而不是随机的。

输出：

（1）voxels：Mx32x4，体素中各个点的原始坐标和反射强度，M(M≤16000)个体素

（2）num_points：Mx1，每个体素中点的数量。

（3）coors：体素自身坐标，Mx4，[batch_id, z, y, x]

2.2 体素特征提取VFE（voxel_encoder）

在voxelnet中，体素特征通过SVFE层提取，即连续两层VFE，其中VFE层提取体素特征用的是PointNet网络。而在该Pointpillars源码中，VFE层被进行了简化。

（1）对voxels（Mx32x4）中各个体素的坐标求均值，然后用体素中各个点的坐标减去均值，f_cluster，Mx32x3。

（2）将体素中点的坐标减去体素中心的坐标得到，f_center，Mx32x3。

（3）将上述voxels、f_cluster、f_center进行拼接，features，Mx32x10，并且将体素中没有点的位置的10维特征置为0。每个体素中默认设置了点的数量为32，但是不是所有的体素都有32个点，不足32个点的位置特征用0进行填充。

（4）PFNLayer：features经全连接FC(10, 64)得到Mx32x64维特征x，在体素点云数量上进行最大值池化提取体素的全局特征features，Mx64。

2.3 中间特征提取 middle_encoder

Pointpillars的中间特征提取层将features （Mx64）每一维特征投影到各个体素当中，类似于二维图像，Mx64->432x496x4，即Mx64->214272x64，没有取值的地方像素值取为0。Canvas，64x496x432。

2.4主干网络特征提取

backbone：SECOND

(1) 2.3中out 64x496x432经连续4个3x3卷积（第一个步长为2）：64x248x216，out1

(2) out1 64x248x216经连续6个3x3卷积（第一个步长为2）：128x124x108，out2

(3) out2 128x124x108经连续6个3x3卷积（第一个步长为2）：256x62x54，out3

2.5 上采样拼接 self.neck

分别对out1、out2、out3进行上采样：

out1：64x248x216 -> 128x248x216

out2：128x124x108 -> 128x248x216

out3：256x62x54 -> 128x248x216

拼接out：128x248x216、128x248x216、128x248x216 ->384x248x216 （self.extract_feat

2.6 检测头 self.bbox_head

PointPillars共有3个不同尺寸的anchors(详情见2.2小节), 每个尺寸的anchor有2个角度, 因此共有6个anchors。网络训练了3个类别: Pedestrian, Cyclist和Car。

Anchor3DHead(

(loss_cls): FocalLoss()

(loss_bbox): SmoothL1Loss()

(loss_dir): CrossEntropyLoss(avg_non_ignore=False)

(conv_cls): Conv2d(384, 18, kernel_size=(1, 1), stride=(1, 1))

(conv_reg): Conv2d(384, 42, kernel_size=(1, 1), stride=(1, 1))

(conv_dir_cls): Conv2d(384, 12, kernel_size=(1, 1), stride=(1, 1))

2.7 损失函数

Head的3个分支基于anchor分别预测了类别, bbox框(相对于anchor的偏移量和尺寸比)和旋转角度的类别

分类损失：FocalLoss。

三维目标框回归损失：SmoothL1Loss。

方向损失：CrossEntropyLoss。

【三维目标检测】Pointpillars（二）_Coding的叶子的博客-CSDN博客_pointpillars的backbone secfpn的意思是啥

3D点云 (Lidar)检测入门篇 - PointPillars PyTorch实现_zhulf0804的博客-CSDN博客_lidar入门

【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
旋转目标检测：Deep Spatial Feature Transformation for Oriented Aerial Object Detection【方法解析】沉浸式AI 《AI与SLAM论文解析》人工智能计算机视觉旋转目标检测
DeepSpatialFeatureTransformationforOrientedAerialObjectDetection目录DeepSpatialFeatureTransformationforOrientedAerialObjectDetection摘要关键词引言相关工作旋转对齐模块特征对齐方法旋转对齐模块特征选择模块摘要航空图像中的目标检测在计算机视觉领域引起了广泛关注。不同于自然图像
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
cm3d2 & com3d2 HECUgauss Kiss 经验分享游戏程序
新增一个分类，因为旧做cm3d2有些插件是可以通用的，标注CM3D2的就是理论上旧做也能用的（但我手上没有cm3d2所以只是理论上）网站Hgamewikicom3d2分区CustomMaid3D2-HgamesWiki(anime-sharing.com)https://wiki.anime-sharing.com/hgames/index.php?title=Custom_Maid_3D2中文資
After Effects 教程，如何在 After Effects 中使用3D 摄像机跟踪器效果？ Mac123123
欢迎观看AfterEffects中文版教程，小编带大家学习AfterEffects的基本工具和使用技巧，了解如何在AE中使用3D摄像机跟踪器效果。3D摄像机跟踪器效果可以分析一段视频，并确定用于拍摄镜头的原始相机的精确位置和移动。将使用这种效果将一些文本放置到场景中，使其看起来好像一直处于场景本身的环境中。选择「时间轴」中的「Runway.mov」图层，在「动画」菜单中选择「跟踪相机」。选择特效后
AI人工智能领域知识图谱在文本分类中的应用技巧 AI天才研究院 AI大模型企业级应用开发实战人工智能知识图谱分类 ai
AI人工智能领域知识图谱在文本分类中的应用技巧关键词：知识图谱、文本分类、图神经网络、实体关系抽取、深度学习、自然语言处理、特征融合摘要：本文深入探讨了知识图谱在文本分类任务中的应用技巧。我们将从知识图谱的基本概念出发，详细分析如何将结构化知识融入传统文本分类流程，介绍最新的图神经网络方法，并通过实际案例展示知识增强型文本分类系统的构建过程。文章特别关注知识表示学习与文本特征的融合策略，以及在不同
基于 vue＋Cesium 实现军事标绘之钳击箭头绘制实战
效果图在地理信息系统（GIS）开发中，军事标绘是一个重要的应用场景，其中箭头类标绘（如攻击箭头、钳击箭头）是常用的战术符号。本文将基于Cesium引擎，详细讲解如何实现可交互的钳击箭头绘制功能，支持动态跟随鼠标调整、固定部分标绘区域及自动清理临时标记等特性。一、技术背景与实现目标Cesium简介Cesium是一款开源的3D地理信息引擎，支持高精度全球地形、影像加载及矢量数据可视化，广泛应用于数字地
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
300个网络安全软件和在线工具（归类版）（非常详细），零基础入门到精通，看这一篇就够了_安恒云沙箱网络安全k叔 web安全安全服务器数据库学习
系统下载1、KALI安装版https://pan.quark.cn/s/483c664db4fb2、KALI免安装版https://pan.quark.cn/s/23d4540a800b3、下载所有Kali系统https://pan.quark.cn/s/7d8b9982012f4、KALI软件源https://pan.quark.cn/s/33781a6f346d5、所有Linux系统https
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
「Tokens是胡扯」？Mamba作者炮轰Transformer，揭秘AI模型致命缺陷 | AI早报未来世界2099 AI日报人工智能 transformer 深度学习业界资讯
1、OpenAI疯狂挖角反击！Meta华人科学家+马斯克三员大将集体跳槽2、清华&NTU突破性研究：仅需2张图，AI即可重构3D空间认知3、极智嘉港股上市首日破发！清华系机器人公司市值153亿引关注4、星海图融资超1亿美金！美团、今日资本领投，估值暴涨3倍5、华人团队用RL打造AIAgent，种子轮狂揽1200万美元融资6、Skywork-R1V3.0震撼开源：高考数学142分，多学科推理能力直逼
分辨率、帧率、平均码率、视点数之间的区别与联系 Dream Algorithm 信息与通信视频编解码计算机视觉
这四项参数共同决定了视频内容的清晰度、流畅度、数据量以及3D/VR体验，但它们各自的作用和计算方式不同。以下是详细对比：1.分辨率（Resolution）定义表示视频画面的像素数量，通常以宽度×高度（如1920×1080）表示。例如：4K=3840×2160（约830万像素）16K=15360×14400（约2.2亿像素）影响✅清晰度：分辨率越高，画面越细腻（但受屏幕尺寸影响）。❌数据量：分辨率越
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
【考公资料】2026公考资料大汇总申论+行测（持续更新） sss191s 考公考编考研资料考研面试 pat考试
获取资料方式：复制链接，打开夸克网盘，自动跳转保存。用手机转存，可mian费领取1GB大容量。！！及时转存，文件容易失效！！！2026公考花生十三资料合集https://pan.quark.cn/s/aafb74c7d188【言语】2026雨菲言语全新黄金九讲http://https://pan.quark.cn/s/c1e63d5ae9b2红领巾巾神复盘https://pan.quark.cn/
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
新手入门必备：游戏引擎推荐指南
哈喽，大家好呀，淼淼又来和大家见面啦，在数字娱乐时代，游戏开发已成为许多创意和技术爱好者的梦想之旅。对于刚刚踏足这片神奇领域的“新手小白”来说，选择一个合适的游戏引擎是开启游戏创作大门的关键。游戏引擎是游戏开发的核心工具，它集成了图形渲染、物理模拟、动画系统、音频处理、脚本编程等众多功能，大大简化了游戏开发的复杂度。下面，我们就来为初学者推荐几款易上手、功能强大的游戏引擎。1.Unity3D推荐理
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
2163. 删除元素后和的最小差值咔咔咔的 leetcode c++
2163.删除元素后和的最小差值题目链接：2163.删除元素后和的最小差值代码如下：//参考链接：https://leetcode.cn/problems/minimum-difference-in-sums-after-removal-of-elements/solutions/1247074/qian-zhui-zui-xiao-he-hou-zhui-zui-da-he-yz3dclassS
创业路上的三个骚套路隔壁小歧
https://mp.weixin.qq.com/s?__biz=Mzg5NjExMjYyNQ==&mid=2247483702&idx=1&sn=12120bfb03d8a0fe701fc2081f526484&chksm=c00743a8f770cabe1fcb2b1e723e95f6c457068b6d77dd7f2e275b9aab3b1f1b6d87f8ab48ae&xtrack=1&s
Hadoop与图像识别与处理 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Hadoop与图像识别与处理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在大数据时代，数据的爆炸性增长对数据处理技术提出了新的挑战。图像数据作为一种重要的数据形式，其处理和分析在许多领域中具有重要意义，如医疗影像分析、自动驾驶、安防监控等。然而，传统的图像处理方法在面对海量图像数据时显得力不从心。Hadoop作为一种分
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo