Michael.CV

论文小结：Part A^2 Net

论文小结：Part A^2 Net
W.P. Xiao, Vision group, SHUSV

	版本	更新时间	更新内容	作者
1	V 1.0	2020.5.8	完成小结的框架细节部分	W.P. Xiao
2

文章目录

Part A^2 Net
- 1 简介
- 2 文章的贡献
- 3 整体框架
- 4 框架细节
- - 4.1 Stage-I: Part-aware 3D proposal generation
  - 4.2 Stage-II: Part location aggregation for confidence prediction and 3D box refinement
  - 4.3 Overall loss
- 5 讨论 & 思考
- - 5.1 什么是intra-object part？
  - 5.2 基于sparse convolution的backbone是怎么实现点级的semantic segmentation的？
  - 5.3 在proposal中每个part的特征融合阶段，为什么要将预测的part locations和semantic part feature的特征维度进行对齐？

Part A^2 Net

这里是Paper，这里是Code

1 简介

这文章标题为《From Points to Parts: 3D Object Detection from Point Cloud with Part-aware and Part-aggregation Network》，简称Part A^2 Net，收录于PAMI 2020。文章一作是来自香港中文大学MMLab实验室的博士Shaoshuai Shi，他比较出名的paper还有PointRCNN、PV-RCNN，都是很出色的工作，刚出来都是state-of-the-art。尤其PV-RCNN在KITTI benchmark的Car类别上已经霸榜很久了。根据Github公布的最新数据，Part A^2 Net目前排在11名的位置（2020年5月9日）。这篇文章是针对之前工作PointRCNN的改进版，起初这篇文章挂在axXiv上时（19年7月份）就引起了笔者的关注，目前这篇文章是作者提交的第三版，内容上更加丰富并且容易理解。这篇文章主要强调的是charge-of-free的intra-object part prediction的重要性，它能够帮助网络更好的了解proposal的形状和位置信息。为此作者提出了一系列改进方法，将part-awre的特征进行有效的融合，最终改善预测性能。

2 文章的贡献

提出了Part A^2网络框架用于点云的三维物体检测，该框架利用免费的intra-object part（对象内部零件）信息学习有区别的三维特征，通过RoI-aware pooling和稀疏卷积有效地聚合零part feature，提高了三维物体检测的性能。
提出了两种3D proposal generate策略，一种是anchor-free，具有更高的内存利用效率，一种是anchor-based，具有更高的recall。
为了消除现有点云RoI pooling操作的模糊性，作者提出了一种可微分的roi-aware点云region pooling操作。实验表明，混合特征表示方法显著地改善了box细化阶段。

3 整体框架

从图3.1可以看出，Part $A^2$ 的整体框架很清晰，分为两个部分。一个是part-aware阶段，这个阶段完成了初步proposal的生成、点云分割、proposal内，点相对位置的预测（后面会解释具体是什么）。另一个是part-aggregation阶段，这个阶段完成了用于refine的特征聚合或者说pooling，以及box refinement，confidence预测。

图3.1 整体框架

4 框架细节

4.1 Stage-I: Part-aware 3D proposal generation

Point-wise feature learning via sparse convolution

作者这里将点云体素化后使用了3D稀疏卷积作为backbone，相比于之前的PointNet++的方法更有效也更高效，回归出来的box召回率也更高。作者这里将点云进行了高密度的voxel划分（5cm x 5cm x 10 cm），使其可以近似的代替原始点云。
Estimation of foreground points and intra-object part locations

这是文章非常核心的一个部分，作者认为segmentation masks有助于网络区分前景点和背景，而 intra-object part locations为神经网络识别和检测三维对象提供了丰富的信息。
- Formulation of intra-object part location
  
  具体公式就不列了（5.1节还有进一步的分析），这里比较好理解。这一步是将proposal内的点转化为intra-object part location，具体呢就是将proposal内的每一个点转化为proposal内的相对坐标。intra-object part location的坐标归一化到0~1区间，表示了点在proposal内的相对位置。
- Learning foreground segmentation and intra-object part location estimation
  
  为了学习foreground segmentation和intra-object part location的预测，作者分别设计了loss函数，这部分还比较常规，具体可见4.3节。
3D proposal generation from point cloud
- Anchor-free 3D proposal generation
  图4.1 Bin-base损失
  这个部分和作者之前的工作PointRCNN比较相似（PointRCNN使用的backbone是PointNet++，它直接将学习到的每个点的feature用来预测3D proposal），这里是将其替代为稀疏卷积的backbone（encoding和decoding）。当然不管backbone是PointNet++也好sparse convolution也好，直接的来预测3D box的中心点是比较困难的，作者指出是因为X，Y的坐标范围比较大，和距离较proposal中心点较远的点来说会引起误导。为此作者提出bin-based center regression loss，当然这个独特的设计在PointRCNN中就已经提出来了。作者对于回归范围比较大的量（X，Y，θ）使用bin-based loss，一般量（z，h，w，l ）使用常规的smooth-L1 loss。要特别注意的是Anchor-free的方法是针对所有前景点进行proposal生成的。
- Anchor-based 3D proposal generation
  
  Anchor-based的方法和SECOND类似就不具体展开。
- Discussion of the two 3D proposal generation strategies
  
  作者指出，Anchor-free的策略通常是对于轻量级和内存高效利用的网络，因为它不需要评估三维空间中每个空间位置的大量anchor。这对于多类别的对象检测的效率更明显，因为在三维对象检测中，不同的类通常需要不同大小的anchor，而anchor-free方案可以共享点向特征，为多个类生成建议。而Anchor-based的proposal生成策略实现了略高的召回率，它用每个类的预定义暗沉覆盖了整个鸟瞰图，但有更多的参数，需要更多的GPU内存。作者其实更倾向Anchor-free的方法。
RoI-aware point cloud feature pooling
- Canonical transformation
  
  作者认为如果将box refinement target在正则坐标系中进行归一化，会更加有利于接下来的box refinement阶段（这个观点最开始是在PointRCNN中提出）。具体操作呢，就是先进行坐标转换，将proposal内点的坐标与proposal中心点的坐标相减，得到一个相对坐标值。然后是进行坐标旋转，将proposal内点的坐标旋转使其与proposal的方向一致。其实这两步加起来就是将proposal在点云的全局坐标系下的坐标转化为在以proposal中心点为原点，x轴或y轴与proposal方向一致的局部坐标系中。
- RoI-aware point cloud feature pooling
  图4.2 RoI-aware point cloud pooling
  如图4.2所示直接将点云做pooling容易引起模棱两可的情况，而具有part感知的pooling方式能有效消除这种情况。不同于PointRCNN中直接简单的将proposal中所有点的特征进行聚合，作者这里将每个proposal划分为14 x 14 x 14的固定数量的voxel（这里的voxel是对proposal内的空间进行体素化与之前对原始点云进行体素化的voxel是不一样的），作者特别说明这个voxel的划分是独立于proposal大小的，也就是说不管proposal的大小，都是划分为这么多voxels。针对每个voxels作者设计了AvePool和MaxPool分别用来聚集point-wise part locations和semantic feature。

4.2 Stage-II: Part location aggregation for confidence prediction and 3D box refinement

Fusion of predicted part locations and semantic part features
- 使用RoIAwareAvgPool模块对每个voxel中点的point-wise part locations求平均值，然后通过sparse convolution layer将AvgPool后的特征维度提升至于semantic feature维度一致。
- 使用RoIAwareMaxPool模块对每个voxel中点的semantic feature求feature-wise的max pooling。
- 将两部分特征concatenate在一起
Sparse convolution for part information aggregation

对于每个3D Proposal，我们需要从该proposal所有内部空间位置聚合上一步获得的fused features ，以实现健壮的3D box评分和refinement。如图3.1右边所示，作者堆叠了几个kernel size为3 x 3 x 3的三维稀疏卷积层，随着感受野的增加，我们可以聚合proposal内的所有part feature。为了节约计算资源和减少参数量，作者在后面还接了一个2 x 2 x 2的max pooling操作，将其降采样至7 x 7 x 7。作者认为，基于稀疏卷积的part-aware aggregate策略，通过从局部到全局的尺度进行特征聚合，可以有效地了解、预测part location的空间分布。
3D IoU guided box scoring

作者以3D IoU作为引导，定义了新的proposal质量评估指标：
$q^{(a)}=\left\{\begin{array}{ll} 1 & \text { if } \mathrm{IoU}>0.75 \\ 0 & \text { if } \mathrm{IoU}<0.25 \\ 2 \mathrm{IoU}-0.5 & \text { otherwise } \end{array}\right.$
其中 $L_{score}$ 的loss函数使用的是binary cross entropy。实验表明，相对于传统的traditional classification based box scoring，3D IoU guided box scoring有轻微的提升。

4.3 Overall loss

$\mathcal{L}_{\text {total }}=\mathcal{L}_{\text {aware }}+\mathcal{L}_{\text {aggregation }}$

整个网络loss由两部分组成，分别是part-aware loss和part-aggregation los。

Losses of part-aware stage-I
$\mathcal{L}_{\text {aware }}=\mathcal{L}_{\mathrm{seg}}+\frac{1}{N_{\mathrm{pos}}} \mathcal{L}_{\mathrm{part}}+\lambda \frac{1}{M_{\mathrm{pos}}} \mathcal{L}_{\mathrm{box}}$
- $\mathcal{L}_{\text {seg}}$ ，点云分割损失，loss函数使用的是focal loss
- $\mathcal{L}_{\text {part}}$ ，part locations回归损失，loss函数使用的是binary cross entropy loss（为什么这里使用的是一个分类损失函数，作者解释是因为part locations的值就在0~1之间）
- $\mathcal{L}_{\text {part}}$ ，3D proposal回归损失，loss函数使用的是smooth-L1
- 其中 $\lambda=2$ ；对于anchor-free的方法（PointRCNN里面的做法）， ${N_{\mathrm{pos}}}={M_{\mathrm{pos}}}=前景点个数$
Losses of part-aggregation stage-II

$\mathcal{L}_{aggregation}=\mathcal{L}_{score}+\frac{1}{T_{pos}}\mathcal{L}_{box\_refine}$

$\mathcal{L}_{\mathrm{box-refine}}=\sum_{\mathrm{res} \in\{x, y, z, l, h, w, \theta\}} \mathcal{L}_{\text {smooth-L1 }}\left(\widehat{\Delta_{\text {res }}(r)}, \Delta_{\text {res }}(r)\right)+\mathcal{L}_{\text {corner }}$

$\mathcal{L}_{\text {score}}$ ，box质量回归损失，loss函数使用的是binary cross entropy loss
$\mathcal{L}_{box\_refine}$ ，3D box proposal回归损失
- $\mathcal{L}_{\text {smooth-L1 }}$ ，中心点、size、角度回归损失（具体参见PointRCNN里面的做法），loss函数使用的是smooth-L1
- $\mathcal{L}_{\text {corner}}$ ，是预测的proposal的8个弯角点与指定的ground-truth的8个弯角点之间的距离，loss函数使用的是smooth-L1
其中 ${T_{\text {pos }}}$ 是正样本的proposal

5 讨论 & 思考

5.1 什么是intra-object part？

图5.1 前景点的对象内部部分位置的说明

作者通篇都在讲free-of-charge的intra-object part predicted的重要性，并且作者提到目前还没有人在这方面进行讨论研究，这也是作为改进版的Part $A^2$ 相比于PointRCNN好的一个主要原因，它更充分的利用了3D proposal 所提供的自然的几何信息。那么intra-object part到底是什么，其实一开始我看挂在arXiv上的第一版（Part-A^2 Net: 3D Part-Aware and Aggregation Neural Network for Object Detection from Point Cloud）时还是有点懵，这个part到底指什么，图上故意吧8个corner标成五颜六色也不知道是想干嘛，感觉有点误导。现在Part-A2 Net被PAMI收录，相比于第一版丰富了很多内容，也更容易理解。如图5.1（现在这个版本加上了坐标轴和标注，这个图一看就很清晰，即使没有颜色标注也知道是啥意思），intra-object part其实就是proposal中每一个点相对于坐标原点在各个坐标轴上的相对位置，每个坐标范围归一化为0~1。这样一种表示方式其实就指示了三维物体表面点的相对位置，隐式的编码三维物体的形状，这个能帮助网络更好的理解proposal的内外空间几何信息。

5.2 基于sparse convolution的backbone是怎么实现点级的semantic segmentation的？

没有看代码这个地方还不太确定，目前猜测可能是用voxelization后的坐标和特征对原点云进行近似，这里前景点可能已经指的是voxel的坐标点了。因为作者这里吧voxelization的size设定的很小（5cm x 5cm x 10 cm），几乎可以与原点云进行近似。

5.3 在proposal中每个part的特征融合阶段，为什么要将预测的part locations和semantic part feature的特征维度进行对齐？

这个地方笔者不是很理解作者这样的做法，进行AvgPool之后每个part locations的维度是3，进行MaxPool之后的semantic part feature维度是c，个人感觉这其实是不影响两部分特征就行拼接的。作者故意通过3D 稀疏卷积将其升维成和semantic part feature维度一样，不知道是否会破坏原有的每个part locations所代表的几何意义。如果是拼接之后再升维似乎更好理解。

---- end ----

【docker】带字体的 OpenJDK 8 Docker 镜像解决方案 ladymorgana 日常工作总结 docker 容器运维
文章目录带字体的OpenJDK8Docker镜像解决方案1.使用官方带字体变体2.自定义构建带字体镜像基于Debian的带字体OpenJDK8镜像基于Alpine的轻量级带字体镜像3.使用第三方维护的带字体镜像4.验证字体是否正常工作5.企业级解决方案推荐方案带字体的OpenJDK8Docker镜像解决方案如果您需要使用带字体的OpenJDK8镜像（特别是为了支持中文显示），以下是几种解决方案：1
前端与UI如何联手，让数字孪生走进现实生活？贝格前端工场前端 ui
数字孪生（DigitalTwin）作为工业互联网的核心技术，正在通过前端技术与用户界面设计的深度协同，从实验室走向大规模应用场景。这种虚实映射系统要求前端框架突破传统二维界面限制，与UI设计思维共同构建三维可视化、实时交互的新型人机界面。本文将从技术融合、系统挑战、交互创新、场景实践和团队协作五个维度，解析数字孪生落地的关键路径。一、技术融合：可视化框架与UI设计工具链的协同进化现代数字孪生系统需
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
设计模式精讲 Day 20：状态模式（State Pattern）在未来等你 23种设计模式精讲设计模式状态模式 Java开发面向对象设计软件架构设计模式实战 Java应用开发
【设计模式精讲Day20】状态模式（StatePattern）文章标签设计模式,状态模式,Java开发,面向对象设计,软件架构,设计模式实战,Java应用开发文章简述状态模式是行为型设计模式中的重要一员，用于管理对象在不同状态下的行为变化。在实际项目中，状态模式能够有效解耦状态逻辑，提升系统的可维护性和扩展性。本文作为“设计模式精讲”系列的第20天，深入讲解了状态模式的核心思想、实现方式和实际应用
Oracle查询超时问题，聊聊思路！ bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)数据库 oracle java
本文收录于《CSDN问答解答》专栏，主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述 Oracle在查询超过6秒的sql都会报Socketreadtimedout。我也根据网上的一些资料，在oracleurl后拼接了oracle.net.CONNECT_T
代理导致虚拟机无法连接网络解决办法
虚拟机使用代理科学上网后，当关闭代理，虚拟机无法连接原来的网络解决方法重启虚拟机网络服务器：ctrl+alt+t打开虚拟机命令终端，依次输入以下指令：sudoservicenetwork-managerstopsudorm/var/lib/NetworkManager/NetworkManager.statesudoservicenetwork-managerstart注：若network-man
【Java】已解决java.sql.SQLRecoverableException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
基于MATLAB/simulink风力发电仿真，双馈风机模型空气动力学模型源码等资深码侬 matlab matlab 开发语言
基于MATLAB/simulink风力发电仿真，双馈风机模型空气动力学模型源码文章目录空气动力学模型双馈风机模型Simulink模型框架示例代码片段1.创建Simulink模型2.空气动力学模型代码3.MPPT控制器代码4.运行仿真总结1.创建Simulink模型2.空气动力学模型代码3.MPPT控制器代码4.运行仿真总结基于MATLAB/Simulink进行风力发电仿真，特别是使用双馈感应发电机
深度学习流体力学【干货】人工智能交叉前沿技术，人工智能深度学习 python 机器学习
深度学习作为一种新兴的机器学习技术，为流体科学的研究提供了新的思路和方法。通过对大量数据的学习和分析，深度学习模型可以自动提取特征和模式，为流体科学中的复杂问题提供解决方案。然而，深度学习在流体科学中的应用还面临一些挑战，需要进一步研究和探索。未来，深度学习与传统流体力学方法的结合将成为流体科学研究的重要方向，多模态数据的融合、模型的可解释性、实时预测和控制等将是深度学习在流体科学中发展的重点。相
【Linux】写时拷贝——干货解析代码程序猿RIP Linux linux 运维服务器
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、写时拷贝核心概念1.什么是写时拷贝？2.COW解决的问题二、写时拷贝工作原理1.内存管理基础结构2.COW工作流程3.页表状态变化图示初始状态（共享只读）子进程写入后（写时拷贝）三、写时拷贝的优势分析1.性能优势对比2.实际性能数据3.资源利用率提升四、内核实现深度解析1.COW核心代码逻辑2.关键数据结构五、应用场景与最
【Linux】环境变量——干货讲解代码程序猿RIP Linux linux
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、环境变量核心概念1.什么是环境变量？2.环境变量的存储结构3.常见环境变量及作用二、环境变量管理命令1.查看环境变量2.设置环境变量3.删除环境变量4.变量操作技巧三、环境变量在编程中的应用1.C语言获取环境变量的三种方式方法1：main函数参数方法2：extern声明environ方法3：getenv获取特定变量2.环境
sda剩余的存储空间分配到sda2根目录（/）
sda8:0080G0disk├─sda18:101M0part└─sda28:2040G0part/sr011:013G0rom步骤1：检查分区布局使用lsblk或fdisk确认剩余空间的位置：sudofdisk-l/dev/sda确保剩余空间紧接在sda2分区之后。步骤2：安装必要工具确保已安装cloud-utils和e2fsprogs：sudoapt-getupdate&&sudoapt-g
git 总结+场景应用放逐者-保持本心，方可放逐工具配置 git git 远程连接 git 标签 git 应用 git 打包迁移 git 版本控制 git 新手应用
文章目录概要（git）git冲突经验之谈git相关操作后续git具体应用回退到指定版本git校验忽略git版本标签管理git代码仓库迁移gitbundle后续git新手应用指南概要（git）一、Git简介Git是一个分布式版本控制系统，用于高效地处理从非常小到非常大的项目版本管理。它允许开发者跟踪文件的更改历史，方便团队协作开发，并且可以在不同分支上进行并行开发。二、基础指令连接（配置）gitco
与客服关于博文收益的对话记录 brooknew 平台规则
我的聊天记录我2025-07-0210:00:58使用qemu运行Linux5.10.168原创高质量VIP文章2025-07-0116:34:49240317016Linux内核GPIO子系统gpioio原创高质量2025-06-1915:57:0239683716111揭秘devres接口：功能深入介原创高质量VIP文章2025-06-1809:05:537070614014我的好几篇博客阅读
DAY 45 Tensorboard使用介绍 HINOTOR_ Python训练营 python 开发语言
目录DAY45Tensorboard使用介绍1.tensorboard的发展历史和原理2.tensorboard的常见操作3.tensorboard在cifar上的实战：MLP和CNN模型作业：对resnet18在cifar10上采用微调策略下，用tensorboard监控训练过程。DAY45Tensorboard使用介绍1.tensorboard的发展历史和原理2.tensorboard的常见操
机器学习中为什么要用混合精度训练十子木机器学习机器学习人工智能
目录FP16与显存占用关系机器学习中一般使用混合精度训练：FP16计算+FP32存储关键变量。FP16与显存占用关系显存（VideoRAM，简称VRAM）是显卡（GPU）专用的内存。FP32（单精度浮点）：传统深度学习默认使用32位浮点数每个参数占用`4字节`例如：1亿参数的模型→约400MB显存FP16（半精度浮点）：每个参数占用`2字节`（直接减半）相同模型→约200MB显存双精度浮点（FP6
6，FreeRTOS临界区代码保护与任务调度器的挂起与恢复自激振荡器 FreeRTOS学习笔记单片机 stm32 嵌入式硬件 freeRTOS FreeRTOS
一、临界区代码保护如果我们想在执行某段代码时不被中断打断，此时需要进行临界区代码保护。在临界区内关闭中断，临界区结束后开启中断。需要注意的是临界区的进入和退出需要成对出现，如果进入两次，那么需要退出两次才可以成功开启中断。注：本实验基于正点原子FreeRTOS教程的学习总结。1..所需API函数介绍taskENTER_CRITICAL函数用来进入临界区。在任务中调用。#definetaskENTE
【大模型学习 | BLIP原理】九年义务漏网鲨鱼 pytorch 人工智能深度学习大模型多模态
BLIP:BootstrappingLanguage-ImagePre-trainingforUnifiedVision-LanguageUnderstandingandGeneration作者指出，现有的视觉-语言预训练（Vision-LanguagePre-training,VLP）模型在语言理解与生成任务上难以同时取得优异表现：一方面，基于编码器（encoder-based）的模型在生成任务
VC Spyglass：工具简介日晨难再 Synopsys #VC Spyglass 数字IC 硬件工程
相关阅读VCSpyglasshttps://blog.csdn.net/weixin_45791458/category_12828932.html?spm=1001.2014.3001.5482传统上，基于仿真的动态验证技术一直是功能验证的核心方式。随着现代SoC设计日益复杂，静态验证技术的引入变得愈发重要。Synopsys的VCSpyglass解决方案提供了下一代综合性的静态验证平台，包括：V
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
高精度相机：工业自动化的“慧眼”，驱动智能制造新未来 lingling009 数码相机
在当今工业4.0时代，自动化技术的飞速发展正重塑制造业格局。作为工业视觉系统的核心组件，高精度相机扮演着“智慧之眼”的角色，帮助企业在复杂环境中实现精准识别与高效操作。迁移科技，自2017年成立以来，已成长为行业领先的3D工业相机和3D视觉系统供应商。凭借在硬件、算法及软件领域的技术积累，我们打造了稳定、易用、高回报的AI+3D视觉解决方案，服务于新能源、汽车、化工、家电、金属制造等行业。本文将聚
D-FINE使用pth权重批量推理可视化图片悠悠海风代码调试深度学习人工智能 python 目标检测计算机视觉
关于D-FINE相关的内容可参考下面这篇博客：论文解读：ICLR2025|D-FINE_d-fine:redefineregressiontaskindetrsasfine--CSDN博客文章浏览阅读949次，点赞18次，收藏28次。D-FINE是一款功能强大的实时物体检测器，它将DETRs中的边界框回归任务重新定义为细粒度分布细化（FDR），并引入了全局最优定位自蒸馏（GO-LSD），在不引入额
结构光相机：重塑工业自动化的“智慧之眼”，驱动智能制造新未来 lingling009 数码相机
一、迁移科技——3D视觉领域的创新引擎迁移科技成立于2017年，凭借结构光相机核心技术，已成为全球领先的3D工业视觉系统供应商。累计融资数亿元，深耕硬件、算法与软件三位一体技术，打造“稳定、易用、高回报”的AI+3D视觉解决方案，服务新能源、汽车、化工等10+行业，赋能工业自动化转型升级。二、结构光相机如何破解工业四大痛点1：高精度定位——汽车装配的“毫米级守护者”痛点：传统2D视觉无法捕捉曲面零
入门pytorch-联邦学习四代机您发多少 pytorch 人工智能 python
本文联邦学习的代码引用于https://github.com/shaoxiongji/federated-learning本篇文章相当于带大家读一遍联邦学习的代码，同时加深了大家对联邦学习和Pytorch框架的理解。这里想简单介绍一下联邦学习。联邦学习说白了，就是假如有NNN个数据拥有者F1,...,FN{F_1,...,F_N}F1,...,FN，他们希望使用这些数据来训练机器学习模型，但是又各
数据结构day2 LZA185 数据结构数据结构
目录一、Makefile二、检测内存泄漏工具：valgrind2.1valgrind介绍2.2具体使用：valgrind./a.out三、顺序存储的优缺点3.1优点3.2缺点四、线性表的链式存储：4.1链式存储简介4.2关于单向链表的c语言描述4.3单项列表的功能函数一、Makefile关于makefile介绍请查看这篇文章：https://blog.csdn.net/weixin_7208634
《脑机接口：意识数字化的奇点何时到来？》 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《脑机接口：意识数字化的奇点何时到来？》展开全景式论述。文章结合2025年最新科研突破与伦理实践，以“技术裂变-意识革命-文明跃迁”为逻辑主线，揭示神经科学与人工智能融合如何重绘人类存在的边界：脑机接口：意识数字化的奇点何时到来？副标题：从神经解码到意识上传，一场重塑人类本质的技术奇袭作者：意识
提名 Apache ShardingSphere Committer，说说方法
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统文章首发在公众号（龙台的技术笔记），之后同步到博客园和个人网站：xiaomage.info就在前几天，收到了ApacheS
WPF 之 exe 单文件打包工具：LibZ 外来物种桌面软件 WPF C#
▪前言在VS开发过程中我们需要不断的编译软件并进行测试，同时VS会自动在项目跟目录的\bin\Debug文件夹里生成一系列文件（包括程序执行的主exe文件）。对于简单WPF程序，我们通常可以直接拷贝[ProjectSub]\bin\Debug下程序主exe文件就可以到其他机子使用了，当然前提是机子要已经装了对应的.NetFormework版本库但是有时候我们会在项目引入其他第三方库（非.Net框架
WPF实现一个播放音乐和视频的应用 code_shenbing WPF wpf 音视频 C#
一、项目准备创建WPF项目在VisualStudio中新建WPFApp(.NETFramework)项目命名为"MediaPlayerApp"添加必要的NuGet包Install-PackageMicrosoft.WindowsAPICodePack-ShellInstall-PackageTagLibSharp二、界面设计1.主窗口XAML(MainWindow.xaml)三、代码实现1.主窗口
欢迎使用Markdown编辑器 Shipley Leo 编辑器
一、Markdown示例源码：@[TOC](这里写自定义目录标题)#欢迎使用Markdown编辑器你好！这是你第一次使用**Markdown编辑器**所展示的欢迎页。如果你想学习如何使用Markdown编辑器,可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。##新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不