KrMzyc

PointNet 论文阅读

论文链接

PointNet

Abstract

对于点云问题，由于其格式不规则，大多数研究人员将此类数据转换为规则的 3D 体素网格或图像集合。然而，这会导致数据不必要地庞大并导致问题
在本文中，我们设计了一种直接消耗点云的新型神经网络，它很好地尊重了输入中点的排列不变性。我们的网络名为 PointNet，为从对象分类、部分分割到场景语义解析等应用提供了统一的架构。

Intro

提出PointNet的原因

由于点云或网格不采用常规格式，因此大多数研究人员通常将此类数据转换为常规 3D 体素网格或图像集合（例如视图），然后再将其输入深度网络架构。这种数据表示转换使生成的数据变得不必要地庞大，同时还引入了可能掩盖数据自然不变性的量化伪影。

简述PointNet怎么做的

将点云作为输入并输出整个输入的类标签或输入的每个点的每个点段/部分标签。关键使用单个对称函数——最大池化

网络学习一组优化函数/标准，用于选择点云中有趣或信息丰富的点，并对它们选择的原因进行编码。
最终全连接层将这些学习到的最佳值聚合到整个形状的全局描述符中，用于形状分类或用于预测每个点标签（形状分割）
我们的输入格式很容易应用刚性或仿射变换，因为每个点都是独立变换的

文章主要贡献

设计了一种新颖的深度网络架构，适合使用三维的无序点集
展示了如何训练这样的网络来执行 3D 形状分类、形状部分分割和场景语义解析任务
对方法的稳定性和效率提供全面的实证和理论分析
展示了网络中选定神经元计算的 3D 特征，并对其性能进行了直观的解释。

Related Work

点云特征

大多数点云特征都是针对特定任务进行设计的
点特征通常对点的某些统计属性进行编码，并被设计为对某些变换不变，这些变换通常被分类为内在或外在两种，

或者也可以分为局部特征和全局特征

基于三维数据的深度学习

基于容积的卷积神经网络（Volumetric CNNs）—— 容积表示受到数据稀疏性和三维卷积的计算成本的限制
FPNN 和Vote3D 提出了解决稀疏问题的特殊方法 —— 操作仍然在稀疏体积上，对于处理非常大的点云来说是具有挑战性
多视角CNNs（Multiview CNNs）—— 扩展到场景理解或其他三维任务（如点分类和形状补全）非常困难
谱卷积神经网络（Spectral CNNs）—— 仅限于类似有机物的流形网格，如何将其扩展到非等度形状（如家具）并不明显
基于特征的深度神经网络（Feature-based DNNs）—— 受到提取特征的表示能力的限制

在无序数据集上的深度学习

从数据结构的角度来看，点云是一个无序向量集合。点集上进行的深度学习工作并不多。

Problem Statement

输入：无序数据点集， $P_i=(x,y,z|颜色，法线等)$

目标分类任务：深度网络为所有k个候选类别输出k个得分

语义分割任务：输入可以是单个目标用于部分区域分割，或者是从3D场景中的子体积用于目标区域分割

模型会为每个n个点和每个m个语义子类别输出n×m个得分

Deep Learning on Point Sets

$\mathbb {R}^n$ 点集性质

点云是一组没有特定顺序的点
点不是孤立的，相邻点形成一个有意义的子集。模型需要能够捕获附近点的局部结构，以及局部结构之间的组合相互作用
作为一个几何对象，学习到的点集表示对于某些变换应该是不变的

PointNet 架构

如上图所示。分类网络以n个点作为输入，应用输入和特征变换，然后通过最大池化聚合点特征。输出是 k 个类别的分类分数。分割网络是分类网络的扩展。它连接全局和局部特征并输出每点分数。 “mlp”代表多层感知器，括号中的数字是层大小。 Batchnorm 用于 ReLU 的所有层。 Dropout 层用于分类网络中的最后一个 MLP

三个关键模块

最大池化层作为对称函数来聚合来自所有点的信息，局部和全局信息组合结构
两个对齐输入点和点特征的联合对齐网络

无序输入的对称函数

目的：使模型输入排列不变

策略：

将输入排序成规范顺序
将输入视为训练 RNN 的序列，通过排列来扩充数据
通过对称函数来聚合每个点的信息

对称函数 - 输入：n 个向量 - 输出：一个与输入阶数无关的新向量

不足：

在高维空间中实际上不存在稳定的排序，因此，排序并不能完全解决排序问题，并且由于排序问题仍然存在，网络很难学习从输入到输出的一致映射
虽然 RNN 对于小长度（数十个）序列的输入排序具有相对较好的鲁棒性，但很难扩展到数千个输入元素，这是点集的常见大小

解决方案：

对集合中的变换元素应用对称函数来近似定义在点集上的通用函数

$f(\{x_1,...,x_n\})\approx g((h(x_1),...,h(x_n)) \\\\ f:2^{\mathbb{R}^N}\rightarrow \mathbb{R},\ \ h:\mathbb{R}^N\rightarrow\mathbb{R}^K,\ \ g:\underbrace{\mathbb{R}^K \times...\times \mathbb{R}^K}_{n} \rightarrow \mathbb{R}$

实验证实：通过多层感知器网络来近似 h，通过单变量函数和最大池函数的组合来近似 g

局部与全局信息融合

原因：

无序输入对称函数的输出形成一个向量 $f_1,..,f_K]$ ，在形状全局特征上训练 SVM 或多层感知器分类器以进行分类，但点分割需要局部和全局知识的结合

解决方案：

PointNet 论文阅读_第2张图片

计算全局点云特征向量后，我们通过将全局特征与每个点特征连接起来将其反馈给每个点特征
根据组合的点特征提取新的每点特征

联合对准网络

**原因：**如果点云经历某些几何变换（例如刚性变换），则点云的语义标记必须保持不变

方案：

通过迷你网络（T-net）预测仿射变换矩阵，并将该变换直接应用于输入点的坐标（迷你网络本身类似于大网络，由点无关特征提取、最大池化和全连接层等基本模块组成）

PointNet 论文阅读_第3张图片

将该想法扩展到特征空间的对齐

在点特征上插入另一个对齐网络并预测特征转换矩阵以对齐来自不同输入点云的特征
在 softmax 训练损失中添加了一个正则化项，将特征变换矩阵限制为接近正交矩阵
$L_{reg}=||I-AA^T||^2_F$
A 是迷你网络预测的特征对齐矩阵，正交变换不会丢失输入中的信息，因此是理想的

理论分析

普遍逼近

假设 $\Chi \rightarrow \mathbb{R}$ 是一个关于 Hausdorff 距离 $d_H(\cdot , \cdot)$ 的连续集合函数，则 $\forall \epsilon > 0$ 都存在一个连续函数 h 和对称函数 $g(x_1,...,x_n)=\gamma \circ MAX$ ，对于任意的 $S\in \Chi$ 都有下式成立
$|f(S)-\gamma(\underset {x_i \in S}{MAX}\{h(x_i)\})|<\epsilon$
它将 n 个向量作为输入并返回元素级最大值的新向量。关键思想是，在最坏的情况下，网络可以通过将空间划分为大小相等的体素来学习将点云转换为体积表示

瓶颈维度和稳定性

从理论上和实验上我们发现我们网络的表达能力受到最大池化层的维度的强烈影响。

令 $u=\underset {x_i \in S}{MAX}\{h(x_i)\}$ ， $f=\gamma\circ u$ ，则有

$\begin{aligned} &a) \forall S，\exist C_S，N_S \subseteq \Chi，f(T)=f(S)\ \ \ \ \ if\ C_S\subseteq T\subseteq N_S \\\\ &b)|C_S|\leq K \end{aligned}$

表示如果 $C_S$ 中的所有点都被保留，则 $f (S)$ 在输入损坏之前保持不变；对于高达 $N_S$ 的额外噪声点，它也保持不变。
表示 $C_S$ 仅包含有限数量的点，由 K 确定。换句话说， $f (S)$ 实际上完全由小于或等于K个元素的有限子集 $C_S ⊆ S$ 决定

将 $C_S$ 称为 S 的临界点集，将 K 称为 f 的瓶颈维度。

Experiment

应用领域

3D 目标分类

在 ModelNet40 形状分类基准上评估我们的模型。有来自 40 个人造物体类别的 12,311 个 CAD 模型，分为 9,843 个用于训练和 2,468 个用于测试。
我们的模型在基于 3D 输入（体积和点云）的方法中实现了最先进的性能。仅通过全连接层和最大池化，我们的网络在推理速度方面取得了领先优势，并且也可以轻松地在 CPU 中并行化。我们的方法和基于多视图的方法（MVCNN）之间仍然存在很小的差距，我们认为这是由于渲染图像可以捕获的精细几何细节的丢失造成的。

3D 对象部分分割

部分分割是一项具有挑战性的细粒度 3D 识别任务。给定 3D 扫描或网格模型，任务是将零件类别标签（例如椅子腿、杯子手柄）分配给每个点或面
我们对ShapeNet 零件数据集进行评估，该数据集包含来自 16 个类别的 16,881 个形状，总共注释了 50 个零件
评估指标是点上的 mIoU。对于类别 C 的每个形状 S，计算形状的 mIoU
我们观察到平均 IoU 提高了 2.3%，并且我们的网络在大多数类别中都优于基线方法
测试这些方法的稳健性，仅损失了 5.3% 的平均 IoU

场景中的语义分割

部分分割网络可以轻松扩展到语义场景分割，其中点标签成为语义对象类而不是对象部分标签。
在斯坦福 3D 语义解析数据集上进行实验。该数据集包含 Matterport 扫描仪对 6 个区域（包括 271 个房间）的 3D 扫描结果。扫描中的每个点都用来自 13 个类别（椅子、桌子、地板、墙壁等以及杂乱）的语义标签之一进行注释

PointNet 论文阅读_第8张图片

架构设计分析

与其他顺序不变方法的比较

PointNet 论文阅读_第9张图片

我们比较的基线（如图 5 所示）包括将未排序和排序点作为 n×3 数组的多层感知器、将输入点视为序列的 RNN 模型以及基于对称函数的模型
本文实验的对称操作包括最大池化、平均池化和基于注意力的加权和
从每个点特征预测标量分数，然后通过计算 softmax 跨点对分数进行归一化。然后根据归一化分数和点特征计算加权和

输入和特征转换的有效性

PointNet 论文阅读_第10张图片

最基本的架构已经取得了相当合理的结果。使用输入转换可将性能提升 0.8%

鲁棒性测试

PointNet 论文阅读_第11张图片

我们使用与图 5 的最大池化网络相同的架构。输入点被标准化为单位球体
当缺失 50% 的点时，准确率仅下降 2.4% 和 3.8%
如果网络在训练期间发现了异常点，那么它对异常点也具有鲁棒性
评估两种模型：一种在具有 (x, y, z) 坐标的点上进行训练；另一种在具有 (x, y, z) 坐标的点上进行训练加上点密度

你可能感兴趣的:(3D,目标检测,论文阅读)

Demo发布 | ClkLog成功集成Unity3D
前言在Clklog完成ReactNative和uni-app集成Demo后，一个游戏行业新客户提出了使用Unity3D开发的集成问题。对此，我们与客户分别进行了测试。客户使用神策Andriod原生SDK在Android端暴露接口给Unity3D的方式，验证了使用ClkLog进行数据采集的可行性。同时，ClkLog联合合作伙伴对神策Unity3DSDK（安卓端、IOS端、MacOS）进行了深入测试，
【3D模型】【游戏开发】【Blender】Blender模型分享-狮头木雕附导入方法踏雪无痕老爷子资源介绍 3d blender
导入方法：[Blender]如何导入包含纹理的.blend模型文件在3D建模和渲染工作中，Blender是一款功能强大的免费开源软件。很多时候，我们需要导入.blend后缀的模型文件，同时确保纹理（textures）文件夹中的贴图能够正确加载。本文将介绍详细的导入步骤以及可能遇到的问题和解决方案。1.直接打开.blend文件如果你的.blend文件是一个完整的工程文件，包含了模型和纹理，直接打开即
uniapp实现全局拖拽按钮学如逆水，不进则退 uni-app vue.js javascript
要先引入“vue3-draggable-resizable”:“^1.6.5”1.创建DragComponent组件import{ref,onMounted,onUnmounted}from'vue';importVue3DraggableResizablefrom'vue3-draggable-resizable';import'vue3-draggable-resizable/dist/Vue
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
halcon里3d平面度检测程序_激光三角测量法在工业视觉检测上的应用 jiago 王佳东fr
点击上方“3D视觉工坊”，选择“星标”干货第一时间送达激光三角测量法，是工业视觉领域较为常用也是比较容易理解的一种3D检测算法。本文主要从应用层次来阐述，包括相机和激光选型、搭接方式的优劣点分析、软件开发过程中的注意事项等。1.原理及演示将一条单线细激光光线投射到物体表面，由于物体表面高度发生变化，使得激光线发生了弯曲，根据这个线的变形，可以计算出精确的物体表面三维轮廓。如下图所示，基本组成结构有
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
3DXML 与 SOLIDWORKS 格式转换：技术协同及迪威模型方案 3D小将迪威模型联讯软件 SolidWorks模型 UG模型 Rhino模型 SketchUp模型 catia模型 stl模型 stp模型
一、引言在产品设计的前沿领域，3DXML与SOLIDWORKS作为主流格式，虽各有所长，但因格式差异，常成为数据流通与协作的阻碍。对于技术人员和学生党而言，掌握二者间的转换技术，不仅能提升设计效率，更是参与复杂项目协作的必备技能。迪威模型在线转换功能，凭借其先进技术，为这一转换难题提供了高效解决方案。二、3DXML与SOLIDWORKS格式基础（一）3DXML3DXML由达索系统精心打造，其核心压
EmbodiedSAM：在线实时3D实例分割,利用视觉基础模型实现高效场景理解数据猎手小k 3D 实例分割在线实时感知视觉基础模型（VFM）应用
2025-02-12，由清华大学和南洋理工大学的研究团队开发一种名为EmbodiedSAM（ESAM）的在线3D实例分割框架。该框架利用2D视觉基础模型辅助实时3D场景理解，解决了高质量3D数据稀缺的难题，为机器人导航、操作等任务提供了高效、准确的视觉感知能力。一、研究背景随着机器人技术和人工智能的发展，机器人在复杂环境中执行任务（如导航、操作和交互）的能力越来越依赖于对三维（3D）场景的实时、准
初探 Threejs 物理引擎CANNON，解锁 3D 动态魅力伶俜Monster Threejs webgl 前端 3d threejs cannon.js
简介Cannon.js是一个基于JavaScript的物理引擎，它可以在浏览器中模拟物理效果。它支持碰撞检测、刚体动力学、约束等物理效果，可以用于创建逼真的物理场景和交互。参考文档官方示例原理Cannon.js使用了欧拉角来表示物体的旋转，而不是四元数。这使得它在处理旋转时更加直观和易于理解。Cannon.js还支持多种碰撞检测算法，包括离散碰撞检测和连续碰撞检测。Cannon.js还支持多种约束
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
游戏开发引擎对比：Godot、Unity、Unreal与cocos2d的优劣分析 scoone 游戏引擎 godot unity
在游戏开发的世界中，选择合适的游戏引擎是项目成功的关键之一。本文将对比四种流行的游戏开发引擎：Godot、Unity、UnrealEngine和cocos2d，分析各自的优缺点，帮助开发者做出明智的选择。Godot：优点：开源且免费，无商业授权费用。轻量级，适合中小型游戏开发。使用GDScript脚本语言，易于上手。跨平台支持良好。缺点：社区相对较小，资源不如Unity丰富。在3D游戏开发方面不如
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
自动生成二维码（根据文本内容）——CAD c#二次开发山水CAD筑梦人 CAD C#二次开发 c#数据库服务器
用户输入文本内容，运行插件生成二维码（jpg图片格式），扫码即可显示文本内容。※※※也可根据excel文件内容批量一键生成上万个二维码。※※※效果如下：首先需要引用库usingZXing;部分代码如下：publicclass二维码{internalstaticListtempFiles=newList();privatestaticPoint3dcurrentInsertPoint=newPoin
VMware ESXi 8.0U3d 发布下载 - 领先的裸机 Hypervisor esxi
VMwareESXi8.0U3d-领先的裸机Hypervisor同步发布Dell(戴尔)、HPE(慧与)、Lenovo(联想)、IEITSYSTEMS(浪潮信息)、Cisco(思科)、Fujitsu(富士通)、Hitachi(日立)、NEC(日电)、Huawei(华为)、xFusion(超聚变)OEM定制版请访问原文链接：https://sysin.org/blog/vmware-esxi-8-u
VMware ESXi 8.0U3d macOS Unlocker & OEM BIOS 标准版和厂商定制版，已适配主流品牌服务器 sysinside VMware ESXi OEM
VMwareESXi8.0U3dmacOSUnlocker&OEMBIOS标准版和厂商定制版ESXi8.0U3d标准版，Dell(戴尔)、HPE(慧与)、Lenovo(联想)、Inspur(浪潮)、Cisco(思科)、Hitachi(日立)、Fujitsu(富士通)、NEC(日电)定制版、Huawei(华为)OEM定制版请访问原文链接：https://sysin.org/blog/vmware-e
RocketMQ事务消息深度解析：原理、实践与高可用设计千里码！ rocketmq 后端技术 java rocketmq
RocketMQ事务消息深度解析：原理、实践与高可用设计编程相关书籍分享：https://blog.csdn.net/weixin_47763579/article/details/145855793DeepSeek使用技巧pdf资料分享：https://blog.csdn.net/weixin_47763579/article/details/145884039一、事务消息的本质与两阶段提交1.
135.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之数据源基础概念全栈若城 harmonyos从入门到进阶 harmonyos HarmonyOS NEXT 华为性能优化 3d
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之数据源基础概念文章目录HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之数据源基础概念效果演示1.什么是BasicDataSource？2.类的基本结构2.1核心属性3.为什么需要数据
Windows 图形显示驱动开发-WDDM 3.0功能- D3D12 视频编码（二）程序员王马 windows图形显示驱动开发驱动开发
D3D12视频编码回调函数驱动程序实现以下回调函数以支持D3D12视频编码。创建表示视频编码器的驱动程序对象：PFND3D12DDI_CALCPRIVATEVIDEOENCODERSIZE_0082_0会计算D3D运行时需要为驱动程序对象分配的内存量。PFND3D12DDI_CREATEVIDEOENCODER_0082_0创建保存视频编码会话状态的实际视频编码器对象。创建表示视频编码器堆的驱动程
2db多少功率_db与w换算(1db等于多少功率) 不吃酸菜的小贱人 2db多少功率
dBm是功率的单位，1dbm等于1毫瓦，也就是千分之一瓦。1、dBm这是我们接触到.那么10W呢，就是40dBm，也就是说功率下降一半，dBm值下降3dB。功率单位与P(瓦特)换算公式：dBm=30+10lgP(P：瓦)首先，DB是一个纯计数单位：dB=10logX。dB的意义其实再简单不过了，就是把一个很大(后面跟一长串0的.DB是一个比值，是一个数值，是一个纯计数方法，没有任何单位标注。和瓦(
3D-AFFORDANCELLM: HARNESSING LARGE LANGUAGE MODELS FOR OPEN-VOCABULARY AFFORDANCE DETECTION UnknownBody LLM Daily 3d 语言模型人工智能
摘要3D可及性检测是一个具有挑战性的问题，在各种机器人任务中有着广泛的应用。现有方法通常将检测范式制定为基于标签的语义分割任务。这种范式依赖于预定义的标签，缺乏理解复杂自然语言的能力，导致在开放世界场景中的泛化能力有限。为了解决这些限制，我们将传统的可及性检测范式重新定义为指令推理可及性分割（IRAS）任务。该任务旨在根据查询推理文本输出可及性掩码区域，避免了输入标签的固定类别。相应地，我们提出了
【保姆级视频教程（一）】YOLOv12环境配置：从零到一，手把手保姆级教程！| 小白也能轻松玩转目标检测！一只云卷云舒 YOLOv12保姆级通关教程 YOLO YOLOv12 flash attention GPU 计算能力算力
【2025全站首发】YOLOv12环境配置：从零到一，手把手保姆级教程！|小白也能轻松玩转目标检测！文章目录1.FlashAttentionWindows端WHL包下载1.1简介1.2下载链接1.3国内镜像站1.4安装方法2.NVIDIAGPU计算能力概述2.1简介2.2计算能力版本与GPU型号对照表2.2.1CUDA-EnabledDatacenterProducts2.2.2CUDA-Enab
yolov8的第一次实验报告算法宇宙 YOLO 人工智能计算机视觉
1.实验概述实验名称:占道经营目标检测模型实验目标:提高模型的精确率（Precision）和召回率（Recall），使其接近1。实验日期:[2025-01-16]2.数据集数据集名称:[datasets]数据集大小:[2.68Gb]数据集描述:[数据集主要分两个类别：zdjy_ld,zdjy_gd]注释：占道经营流动，占道经营固定3.模型配置3.1基础配置·模型类型:YOLOv8·预训练模型:YO
【css酷炫效果】纯CSS实现3D翻转卡片动画冰夏之夜影 web前端 css 前端
【css酷炫效果】纯CSS实现3D翻转卡片动画缘创作背景html结构css样式完整代码效果图想直接拿走的老板，链接放在这里：https://download.csdn.net/download/u011561335/90490472缘创作随缘，不定时更新。创作背景刚看到csdn出活动了，赶时间，直接上代码。html结构正面内容背面内容...css样式/*容器设置透视*/.card-containe
YOLOv8 的简介及C#中如何简单应用YOLOv8 码上有潜 YOLOv8 YOLO
YOLOv8是YOLO（YouOnlyLookOnce）系列中的最新版本，是一种用于目标检测和图像分割的深度学习模型。YOLO模型以其快速和准确的目标检测性能而著称，广泛应用于实时应用程序中。主要特点高效性：YOLOv8在保持高检测速度的同时，进一步提高了检测精度。端到端训练：可以直接从图像输入端到分类结果输出，简化了训练和部署过程。改进的架构：包括更深的网络结构、更复杂的特征提取方法以及更高效的
使用 WebP 优化 GPU 纹理占用泫凝 javascript 前端
WebP格式相比JPEG/PNG文件更小，可以减少GPU纹理内存占用，提高WebGL/Three.js/3D渲染的性能。为什么WebP能减少GPU内存占用？文件更小→WebP比JPG/PNG压缩率更高，减少纹理上传带宽，提高渲染速度。支持透明度（RGBA）→比PNG更小，适用于UI贴图/透明纹理。减少Mipmaps体积→WebP生成的mipmap纹理占用的GPU内存更少。⚠️但WebP仍然是8-b
Yolov11目标检测(ultralytics) @M_J_Y@ 目标检测 YOLO 目标检测人工智能
Yolov11目标检测（ultralytics）1.克隆仓库2.安装环境依赖3.训练、验证、推理以及onnx模型导出1.克隆仓库从官网下载Yolov11到本地。[email protected]:ultralytics/ultralytics.git2.安装环境依赖pipinstall-e.-ihttps://pypi.mirrors.ustc.edu.cn/simple/3.训练、验证
unity资源加载 qmladm unity unity 游戏引擎
unity资源加载打包的资源Android所有资源打包在unityLibrary\src\main\assets\bin\Data\data.unity3d场景存放在level[n]共享资源存放在sharedassets[n].assetResources文件夹下的资源存放在resources.assetiOS场景存放在Data\level[n]共享资源存放在sharedassets[0].ass
3D 射线方程学习码农客栈_V13427279549 算法 3d 算法
三维射线方程是描述一个从某点出发，并沿某个方向延伸的线段的方程。一、射线1.射线方程的基本形式在三维空间中，射线方程可以用参数化的方式表示为：P(t)是射线上的点，在任意参数t处的位置。P0是射线的起始点（原点），也称为射线的源点(x0,y0,z0)。D是射线的方向向量(dx,dy,dz)，表示射线沿哪个方向延伸。这个向量通常是单位向量，表示方向，但可以是任意长度的向量。t是参数，它表示射线上的位
应用广泛的2.4G无线私有协议射频PA芯片盘点番茄老夫子物联网智能硬件单片机
以下是一些常见的2.4G无线私有协议射频PA芯片推荐：NRF528401：特点：这是一款超低功耗的2.4GHz无线射频SoC芯片。集成了多协议2.4GHz收发器、Arm®Cortex®-M4FCPU和闪存程序FLASH。支持蓝牙BLE、802.15.4和2.4GHz私有协议等多种协议。在1MbpsBLE模式下灵敏度为-95dBm，在125kbpsBLE模式下灵敏度为-103dBm（远距离）。发射功
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他