skycrygg

M3D-RPN: Monocular 3D Region Proposal Network for Object Detection（2019.7）

摘要

将世界进行三维描述是现代自动驾驶领域的重要部分。目前，昂贵的雷达和立体RGB成像的结合对于成功进行三维目标检测算法至关重要，而单目的方法则大大降低了性能。

我们通过将单目3D检测问题重新定义为一个独立的3D区域提案（region proposal network）网络来缩小差距，利用了2D和3D的视角几何关系，使3D boxes利用在图像空间生成的显著卷积特征。为了解决复杂的3D参数估计，我们还设计了depth-aware卷积层使得局部特定位置的特征开发，从而提高对三维场景的理解。

我们的方法与之前的单目3D检测相比，我们的方法只包含建议的三维区域建议网络，而不依赖于外部网络、数据或多个阶段。M3D-RPN能够明显提高在KITTI数据集上进行的单目3D物体检测以及鸟瞰任务，使用一个共享的多类模型。

1、介绍

3D场景理解对于设计有效的真实世界系统有着重要作用，例如城市自动驾驶和机器人学。目前，对3D检测问题最主流的方法是使用雷达传感器来获取稀疏的深度信息作为输入。相比而言，单目3D检测由于先天缺少深度信息变得更加困难。因此，基于雷达的方法和单目方法效果相差过大。

以前的单目三维检测工作都严重依赖于外部最先进的子网络，他们分别负责点云生成、语义分割、2D检测和深度估计。这种方法的一个缺点是组件学习中固有的脱节以及系统的复杂性。此外，对附加子网络的依赖可能会引入持久性噪声，导致框架上限的有限性。

相比之下，我们提出单独的端到端区域提议网络进行多分类3D物体检测（Figure1），使得2D对象检测执行合理并快速提升效果。二维和三维检测任务目的是最终对对象的所有实例进行分类；而它们在定位目标的维度上有所不同。

图1： M3D-RPN采用单目三维区域方案网络，具有全局卷积（橙色)和局部深度感知卷积(蓝色）来预测多类3D bounding box。

直观上，我们希望2D检测的信息能够对3D检测提供帮助，理想情况下使用一个整体网络而不是单独的部分。因此，我们建议重新构造三维检测问题，使二维和三维空间都使用共享anchors和分类目标

从可靠分类对象的角度来看这样做之后，3D检测器自然能够与其2D对应的性能相当。因此，剩余问题只有在相机坐标空间内进行3D定位。剩下的问题，我们提出了三个关键设计来改进3D估计。

建立3D anchor使其在图像空间起作用，并用其每个3D参数的先验统计量初始化所有anchor，因此每个离散的anchor在3D空间都有很强的先验知识，这基于固定相机视角的一致性以及二维尺度与三维深度之间的相关性。
我们设计了一个新的深度感知卷积层能够学习空间感知的特征，一般来说卷积运算优先对空间不变处操作，以便在图像任何位置检测对象。然而，这一般对低级特征有效，当知道更多深度信息并假定相机场景几何一致时，高级特征也会得到改善
我们使用了后优化算法中的3D->2D投影一致性损失(projection consistency)优化了对θ的方向估计，因此在假设是一个可靠的bounding box同时，修正了不正确的θ

贡献：

建立了一个带有共享2D、3D探测空间的固定单目3D区域提议网络(M3D-RPN)，同时使用先验概率为每个3D参数提供有效初始值；
使用深度感知卷积来提升3D参数估计，使网络能学习更多空间感知的高级特征( spatially-aware high-level)
提供了一个简单的角度估计后优化算法，通过使用3D投影和2D检测改进 θ估计
使用一个单独的多类网络在城市KITTI的单目鸟撖图以及3D检测上取得好成果

2、相关工作

2D检测：

许多工作都是在通用和城市场景中进行2D检测，大多数框架使用的是Faster R-CNN [34] 由于区域提议网络region proposal network (RPN) 对于生成物体提议是一个高效方法。RPN函数作为一个滑动窗口监测器去检测图像每个空间位置存在的物体并与一系列提前定义好的类模板相匹配，称为anchors。尽管RPN被认为是Faster-Rcnn的初级阶段，但是它的有效性常常被用来作为单目多类(single-shot multi-class)检测器。我们的框架建立在RPN的anchors上，并在2D和3D空间起作用，作为单目多分类3D检测器(single-shot multi-class 3D detector)使用。

雷达3D检测：

对于城市场景的3D物体检测的SOTA框架来说使用雷达（LiDAR ）数据作为输入是必要的，主要方法是处理来自雷达点的稀疏点云或者将点云数据投影到2D平面，虽然基于雷达的方法在3D任务表现很好，但是每个效果都取决于从雷达点或直接通过点云处理生成的深度信息的可靠性。因此，该方法~~不适用~~于仅使用相机（camera-only）的应用，也是我们单目三维检测算法的主要改进目标。

只有图像的3D检测:

由于缺乏可靠的深度信息，仅使用图像数据的3D检测本质上是具有挑战性的。基于图像的3D检测方法一般使用一系列子模块来帮助检测。比如，使用立体(stereo)处理的深度估计算法来估计点云，使得给定已知的摄像机投影矩阵后，将三维立方体完全放置在平面上，然后根据立体区的密度和估计的点云进行评分（score）。[7]将这个将这个模型从立体调整到了单目，通过将估计的语义分割、实例分割、位置、空间背景以及形状先验进行结合来代替点云的密度比较。

近期工作：

[28]使用其他目标检测来生成2D提议，然后将修改过的提议经过深层神经网络估计3D维度和取向（orientation）。与我们的网络相似，2D和3D boxes之间的联系被映射到了图像平面然后利用后处理技术求解三维参数。然而，我们的模型直接估计了3D参数并且只优化改进θ，迭代8次就收敛了。

Xu.[40]利用额外的网络估计深度图并使用它估计出类似雷达生成的点云图。然后点云使用单独的2D RPN生成的2D bounding box进行采样。最后，一个R-CNN分类器得到一个包含采样后的点云以及图像特征的输入向量，来估计3D box参数。

与之前的工作相比，我们只使用3D box训练一个单独网络，而不是用一堆额外的子网络、数据并且由多阶段构成。我们是第一个使用单目3D区域建议(M3D-RPN)对2D和3D同时生成提议。理论上M3D-RPN对之前的工作进行了补充，并有可能代替提议生成阶段。我们的方法和之前的方法更详细的对比见图2（Figure2）

图2：Deep3DBox [28]、Multi-Fusion [40] 以M3D-RPN 之间的比较。 Note:先前的工作由多个内部阶段（橙色)和外部网络(蓝色）组成，而M3D-RPN是一个经过端到端训练的单图像网络。

3、M3D-RPN

本架构包含三个关键部分。

描述了我们的多分类3D区域提议网络的总体构造。
概述了深度感知卷积和整体网络体系结构
介绍了一种简单有效的后优化算法，提高了 3D->2D的一致性。如Figure3所示

图3：M3D-RPN概述。所提出的方法包括用于 全局（橙色）和 局部（蓝色）特征提取的并行路径。全局特征使用规则的 空间不变卷积，而局部特征表示 深度感知卷积，如右图所示。 深度感知卷积在行空间 ki（i=1...b）中使用 non-shared卷积核。其中b表示不同核的总数。为了利用两种功能，我们将来自并行路径的每个输出参数进行 加权组合。

3.1、构造

结构的核心是区域提议网络（RPN），首先是在Faster R-CNN针对3D领域提出。区域提议网络充当滑动窗口检测器，它会扫描输入图像的每个空间位置，以查找与预定义anchor模板匹配的对象。然后将匹配从离散anchor回归为估计对象的连续参数

Anchor定义：

为了同时预测2D和3D boxes,每个anchor模板都是使用 [w, h]2D, Zp和 [w, h, l, θ]3D两个空间参数定义的。为了代替anchor并且定义完整的2D/3D box，必须指定出一个共享的中心像素位置[x, y]P。表示2D的参数用来提供像素坐标。我们通过将相机坐标的3D中心位置[x, y, z]3D投影到一个已知投影矩阵P的图像来对深度参数Zp进行编码，如下所示：

θ3D表示观察视角，与在相机坐标系下Y轴旋转相比，观察角度考虑了物体相对于相机视角的相对方向，而不是地面平面的鸟瞰(BEV)。因此，当处理图像特征时观察角度能够更合理的去估计，我们像相机坐标系统所给的一样对其余3D坐标[w, h, l]3D 进行编码。

每个Zp和[w，h，l，θ]3D的平均统计量是分别对每个anchor预先计算的，能够提供很强的先验条件来减少估计3D参数的差别。特别地，对于每个anchor我们对所有匹配到的正确结果进行统计，当真值与相对应的[w, h]2D anchor 的bounding box的intersectionover union (IoU)值大于等于0.5。结果anchor代表了离散模板，其中三维先验可以作为一个有效初始假设，从而假设一个合理一致的场景几何。我们将anchor构造以及预先计算的三维先验表示在图4（Figure4）.

图4：anchor定义和3Danchor的可视化。我们描绘了2D / 3D anchor 定义中的每个参数（左）。当12个anchor被用来投影到图像视角时我们对预估计的3D先验进行可视化（中）。以及鸟撖图（右）。仅用于可视化目的，我们在特定的x3D位置上放置anchor，这是为了查看时能够最小化重叠的部分。

3D检测：

我们的模型对每个anchor预测出特征图c, [tx, ty, tw, th]2D；[tx, ty, tz]P, [tw, th, tl, tθ]3D.其中，Na是anchor的数量，Nc是种类数量，h*w为特征图分辨率。所有的box的输出总数是nb=w*h*na，每个anchor位置用[x, y]P来表示，输出C代表的na*nc*h*w大小的共享分类预测，每一类的大小是na*h*w。输出[tx, ty, tw, th]2D代表的是2D bounding box的转化，统称为b2D，按照[34]做法，bounding box是使用 [w, h]2D对anchor进行转换：

xP、yP代表每个box的空间中心位置

转换后的box b'2D因此被定义为[x, y, w, h]'2D,接下来的七个输出代表着投影中心[tx, ty, tz]P，大小[tw, th, tl]3D，方向（orientation） tθ3D，归纳为b3D。与2D相似，使用参数[w, h]2D, zP, 和 [w, h, l, θ]3D 对anchor进行转换：

因此，b'3D用[x, y, z]‘P和 [w, h, l, θ]‘3D表示，我们对投影的3D中心进行估计而不是相机坐标来更好利用仅基于图像空间的卷积特征。因此，我们将投影的3D中心位置利用公式1从图像空间[x, y, z]'P反投影到相机坐标系下[x,y,z]'3D

损失定义：

我们的结构将网络损失定义为多任务学习问题，包含分类Lc，以及2D、3D box 回归损失 Lb2D,Lb3D。对于每个生成的box，我们检查是否存在于真实值具有至少0.5的IoU。如果满足的话，那么我们对每个box使用最佳匹配的真值生成τ类目标、2D box b^2D和3D box b^3D。如果~~不满足~~， τ被分配给 catch-all背景类，bounding box回归被忽略.。

基于softmax的多项式逻辑损失用于监督定义为：

我们使用一个负的Logistic损失应用于匹配的真值b^2D与转化的b'2D之间的IoU的负物流损失Lb2D，定义为：

其余的3D bounding box参数每次对转化的b3D以及真实变换gˆ3D（对b^3D进行公式3的逆变换）使用平滑L1回归损失进行优化

因此，总体的多任务网络损失L，包含正则化权重λ1 和 λ2

3.2、深度感知卷积

空间不变的卷积已经成为计算机视觉的深层神经网络的主要操作。我们希望网络前几层的低级特征能够合理共享，并且在其他时候不改变对深度或者目标的尺度。我们希望当假定固定相机视角时，与三维场景理解相关的高级特征取决于深度。因此，我们提出深度感知卷积来提高区域提案网络对高层特征的空间感知，如图3。

深度感知卷积层与二维卷积相似，利用一组离散深度就能够学习非共享的权值和特征。我们引入一个超参数 b表示将特征图分割的行条的数量,其中每行学习一个独特的内核 K

实际上,深度感知核让网络学习局部特殊的特征和偏差，理想情况下在城市场景且相机视角固定前提下能够学习出几何关系。例如，高级语义特征，例如对大轮子进行编码来检测一辆汽车，在近深度是有意义的，但在远深度通常不是。类似地，我们希望与3D场景理解相关的特性与它们的行方向的图像位置有关

缺点：使用深度感知卷积会增加内存使用。

3.3、网络结构

我们在主干网络最后连接了两个平行通道。

使用普通卷积，卷积核为空间共享的，作为全局。
单独使用深度感知卷积并作为局部使用。

对于每各通道，我们使用各自的卷积操作并附加提议特征提取层来生成Fglobal和Flocal。每各特征提取层使用3*3卷积核、外围补充一行来生成512个特征并且后面接RELU非线性激活函数。然后将这12个输出连接到每个对应的F的c，[tx，ty，tw，th] 2D，[tx，ty，tz] P，[tw，th，tl，tθ] 3D。每个输出使用1×1内核，并统称为Oglobal和Olocal。为了利用深度感知和空间不变性，我们用学习出的注意度α应用在每个输出融合处，其中I=1...12 如下：

3.4、3D->2D投影优化

我们使用后处理算法(Algorithm1)优化方向参数θ：

算法将2D和3D box作为输入，估计b′2D, [x,y,z]′P , [w,h,l,θ]′3D,以及步长σ,终止β,和衰变γ。然后算法通过θ进行迭代，并且使用L1损失对投影3D box和b′2D进行比较，投影函数定义如下：

其中P−1是在填补 [0, 0, 0, 1],后的反投影矩阵，φ代表[x, y, z]轴的索引，然后我们使用参数ρ = [xmin , ymin , xmax , ymax ]的投影box，以及原始b′2D 去计算L1损失，作为初始，当损失不再增长时使用θ ±σ，用γ衰减过程并且当σ ≥ β时重复进行。

端到端神经网络视频编解码器介绍码流怪侠音视频基础深度学习-PyTorch 神经网络视频编解码人工智能 github DCVC 端到端神经网路音视频
一、技术演进：从模块优化到全局智能的范式跃迁传统编解码器的效率天花板（1990-2017）架构局限：H.264/HEVC依赖手工设计的运动估计、DCT变换、熵编码模块，各模块独立优化导致全局效率损失。高分辨率瓶颈：4K/8K视频普及后，码率与画质矛盾激化，HEVC在VR场景下码率仍需>20Mbps才能保持无伪影画质。端到端神经编解码的爆发期（2017-2024）2017奠基年：Ballé团队提出超
孩子为什么胆小？方鱼为您深度解读孩子的内心世界方鱼爱吃鱼
孩子为什么胆小？其实，我们可以从另一个角度看孩子胆小的问题。儿童教育其实我不喜欢对孩子用“胆小”这个词语，因为这相当于给孩子贴了一个标签。当你觉得孩子是胆小的，那么孩子做某些事情的时候，你会不自觉的想：孩子怎么这么胆小？但是也许你以为的胆小并不是胆小，可能是谨慎，内向，害羞，细心……等等。孩子到水池边去看鱼，不敢走近了。父母想要孩子更近一点看鱼，于是把孩子拽到离水面很近的地方。这时孩子害怕的直往后
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
主流编程语言全景图：从Python到Rust的深度解析万能小贤哥 python rust 开发语言
2024年编程语言生态报告显示，全球开发者使用的语言数量已达260+，但真正主导行业的不到20种。本文带你穿透技术迷雾，掌握8大核心语言的本质差异。一、选择编程语言的黄金标准图表代码二、八大主流语言对比解析1.Python-通用胶水语言特性：动态类型+缩进语法丰富的库生态（20万+包）GIL全局锁限制并发适用场景：python#机器学习示例（TensorFlow）importtensorflowa
linux /unix/centos/ubuntu/redhat命令详解
UNIX概述•UNIX历史•UNIX特点•UNIX原则UNIX历史•UNIX操作系统诞生于60年代末期的Bell实验室•美国电话电报公司(AT&T)在70年代中期开始发行UNIX的非商业许可证•从70年代末开始在市场上出现了不同的UNIX商品化版本UNIX特点•可靠性高•伸缩性强•开放性好•植根于网络•面向数据库使用UNIX基本原则•所有对象,包括硬件都是文件•配置数据以文本形式保存•由短小的单目
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
MAP最大后验估计：贝叶斯决策的优化引擎大千AI助手人工智能 Python #OTHER python 人工智能算法贝叶斯 MAP 概率论条件概率
融合先验知识与观测数据的概率推断方法本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心概念与数学本质MAP（MaximumAPosteriori）估计是贝叶斯框架下的参数估计方法，其目标为：最大化后验概率(P(\theta\midX))，即：[\hat{\theta}{MAP}=\arg\ma
MLE最大似然估计：数据驱动的概率模型参数推断基石大千AI助手人工智能 Python #OTHER 数据挖掘人工智能机器学习算法 MLE 参数估计概率论
从样本中还原未知分布的本质规律本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心思想与数学定义最大似然估计（MaximumLikelihoodEstimation,MLE）是频率学派的参数估计方法，其核心思想为：选择使观测数据出现概率最大的参数值。给定独立同分布样本X={x1,x2,…,xn}
Flink 流处理的核心基石【时间语义、水位线、状态、检查点、反压】 csdn_tom_168 大数据 flink 核心时间语义水位线状态检查点反压
Flink流处理的核心基石【时间语义、水位线、状态、检查点、反压】，这些概念相互协作，构建了Flink高吞吐、低延迟、高容错的实时计算能力。以下是这些核心技术的深度解析及其内在联系：一、五大基石的内在联系驱动触发计算持久化保护恢复时间语义水位线状态管理检查点反压二、核心组件深度解析1.时间语义（TimeSemantics）核心作用：定义事件的时间维度//设置事件时间语义（关键配置）env.setS
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例你喜欢喝可乐吗？ deep learning deploy 深度学习 YOLO 目标检测
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例深度学习模型从开发到部署的完整流程包含需求分析、数据准备、模型训练、模型优化、模型测试和部署运行六大核心环节。YOLOv11作为新一代目标检测模型，不仅延续了YOLO系列的高效实时性能，还在检测精度和泛化能力上取得显著突破，使其成为工业质检、安防监控、自动驾驶等领域的理想选择。本文将详细阐述这一完整流程，并结合YOLOv11的具体实现，提
JUnit 5实验室：单元测试导演养成手册 —— 从单镜头到好莱坞级参数化大片的拍摄指南 zhysunny Java类库 junit 单元测试 java
目录一、片场基础设备：核心注解速成课1.1导演必备三件套1.2高级剪辑技巧二、镜头质量把控：断言与假设的艺术2.1监视器全家福2.2绿幕拍摄原则（假设条件）三、好莱坞级拍摄：参数化测试工厂3.1基础款群演生成器3.2定制化群演阵容3.3动态生成剧本四、特效工作室：高级扩展玩法4.1自定义参数来源4.2片场监听设备五、零NG原则：最佳拍摄实践5.1测试剧本命名法5.2片场隔离原则5.3数字替身管理局
众趣SDK重磅升级：空间物联IOT新视界，赋能实景三维场景深度应用 zhongqu_3dnest 物联网 3d 点云处理人工智能计算机视觉点云扫描
近日，空间数字孪生云服务行业领导者—众趣科技宣布旗下核心产品云服务平台QverseSDK迎来里程碑式升级！本次升级聚焦行业前沿需求，重磅推出IoT设备监控系统、iframe跨平台页面无缝集成、BI数据智能三大解决方案，旨在将三维空间计算能力转化为更强大、更易用的生产力工具，为企业用户和开发者构建下一代空间数字化应用提供坚实底座。一、IoT空间物联，让设备运行尽在掌控痛点解决：告别传统分散的设备管理
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
2018-12-23 岳岳孙孙
起初，写30条觉得好多啊，有这么多感谢自己的吗？真正静下心来，回想2018年，各种小事历历在目，各种幸福和温馨。觉得自己真正的成为了一个有志青年。不仅仅对父母，对丈夫，对兄弟姐妹，对公司，对工作，更对自己。1.真的感觉卓越圈选择了我，没去卓越圈之前，觉得自己是个挺优秀的人，可是真正进入卓越圈，才发现什么样的才是优秀的人，像叶叶，亦轩，雨涵，甜甜，彬彬。。。。所有的人都有自己的闪光点。。。2.201
Java大厂面试实录：从Spring Boot到AI微服务架构的深度技术拷问
第一轮提问面试官：小曾，今天我们主要考察Java后端开发能力，从基础开始。场景：假设你要设计一个电商平台的订单系统，订单量峰值达到每秒1000笔。你会选择哪些技术栈？为什么？场景：订单系统需要高可用，数据库选择MySQL，你会如何优化数据库连接池？场景：订单支付后需要通知库存系统减库存，你会选择哪种消息队列？如何保证消息可靠性？小曾：（搓手）嗯…订单系统，我会用SpringBoot，数据库用MyS
Java大厂面试实录：从电商场景到AIGC的深度技术拷问 remCoding Java场景面试宝典 Java面试 Spring Boot Kafka AI 大厂面试微服务
第一轮提问：电商场景与微服务基础面试官：小曾，请描述一个典型的电商秒杀场景，你会如何设计系统架构？涉及哪些关键技术？小曾：秒杀嘛，主要是高并发，我一般会用SpringBoot搭后端，数据库用Redis做缓存，消息队列用Kafka异步处理订单。具体技术细节……呃，好像没细想。面试官（微笑）：“不错，Redis和Kafka选得对。那如果用户请求量超10万/QPS，你会如何扩容？SpringCloud的
Java大厂面试实录：从Spring Boot到AI微服务架构的深度拷问 remCoding Java场景面试宝典 Java面试 Spring Boot Jakarta EE AI微服务 Kafka Spring Cloud AI面试
第一轮提问：电商场景下的高并发架构面试官：小曾，我们公司电商业务面临“双十一”秒杀场景，需要支持百万级并发，你会如何设计系统架构？请结合SpringCloud和消息队列谈谈方案。小曾：（搓手）额……我会用SpringCloudAlibaba，搞个Nacos做服务注册，网关用Zuul，然后订单服务用SpringBoot+Redis缓存，秒杀请求走消息队列，比如Kafka吧，异步处理，降低峰值压力……
Java大厂面试实录：从Spring Boot到AI微服务架构的全栈技术深度解析 remCoding Java场景面试宝典 Java Spring Boot Spring Cloud AI Kafka Redis Spring Security
场景：互联网大厂Java后端开发面试面试官（严肃）：请先自我介绍，并谈谈你熟悉的技术栈。小曾（略紧张）：我是小曾，毕业于XX大学，擅长Java后端开发，熟悉SpringBoot、SpringCloud、MySQL、Redis等技术。面试官：很好，我们来看第一个场景。假设你要设计一个高并发的电商秒杀系统，你会如何选择技术栈？小曾：秒杀系统对性能要求高，我会用SpringBoot快速搭建，数据库用My
Java大厂面试实录：从Spring Boot到AI微服务架构的深度技术挑战 remCoding Java场景面试宝典 Java Spring Boot Spring Cloud AI Kafka Redis Docker
场景：互联网大厂Java后端开发面试面试官（严肃）：小曾，请简单介绍下你过往的项目经验，特别是你在微服务架构中解决过哪些技术难题？小曾（自信）：我之前参与过电商平台的订单系统重构，将单体应用拆分为SpringCloud微服务架构。我们使用了SpringCloudGateway做网关路由，服务间通过Kafka异步通信，并引入Redis缓存热点数据。面试官：很好，能具体说说你们如何解决订单超卖问题的吗
Java大厂面试实录：从Spring Boot到AI微服务架构的深度技术拷问 remCoding Java场景面试宝典 Java面试 Spring Boot Jakarta EE AI微服务 Kafka Redis Spring AI
场景：互联网大厂Java后端面试面试官（严肃）：小曾，请先简单介绍下你过往的项目经验，侧重于高并发场景下的架构设计。小曾（自信）：我之前做过一个电商秒杀系统，用了SpringBoot和Redis，高峰期支撑了百万QPS。主要靠Redis缓存热点数据，数据库用了分库分表。面试官（点头）：不错，能具体说说缓存雪崩和热点key的解决方案吗？小曾（挠头）：呃...缓存雪崩用了熔断器，热点key的话...好
深度学习：让 AI 拥有 “思考” 能力的核心技术田园Coder 人工智能科普人工智能科普
1.深度学习：突破传统的AI“进阶版”1.1什么是深度学习？深度学习是机器学习的一个分支，它通过模拟人脑神经网络的多层结构，让AI能够自动学习数据中的复杂特征，从而完成更高级的认知任务。例如，传统机器学习需要人类手动提取“猫有尖耳朵、胡须”等特征，而深度学习能直接从原始图片中，自主学习从像素到轮廓、再到整体形态的多层特征，最终实现更精准的识别。这种“自主提取特征”的能力，让深度学习突破了传统AI的
回答悟空，没收入也不放弃凤凰雅雅
这应该跟个人来到自媒体的初衷有关，如果你志在挣钱，那不用等几个月估计就放弃了。如果你擅长撰文乐在其中，顺带挣钱，那你就不容易放弃。如果你迷恋写作，选择自媒体完全为了自我磨炼和展示，有钱与否不甚在意，你会天长地久做下去。
基于pyQt5为前端实现的智能座椅控制系统，集成了人脸识别、语音合成和座椅记忆功能，为用户提供个性化的座椅调节体验，后期可连接智能座椅。渴死的鱼仔 qt 前端开发语言
智能座椅控制系统：基于PyQt5的个性化解决方案界面描述：一、系统概述基于PyQt5开发的智能座椅控制系统，深度融合人脸识别、语音交互与座椅记忆功能，打造个性化舒适体验。系统通过实时用户识别自动调节座椅参数，后期可无缝对接智能座椅硬件，实现"无感式"智能生活场景。二、核心功能模块1.人脸识别引擎高精度识别：基于Dlib库实现亚毫米级人脸特征提取动态管理：支持多人脸特征存储与实时匹配快速响应：毫秒级
PyTorch torch.no_grad() 指南（笔记）拉拉拉拉拉拉拉马 pytorch 人工智能 python 笔记深度学习
PyTorchtorch.no_grad()权威在PyTorch深度学习框架中，高效的显存管理对于训练复杂模型和执行大规模推理任务至关重要。显存不足（OutOfMemory,OOM）错误是开发者经常面临的挑战之一。torch.no_grad()作为PyTorch提供的一个核心工具，能够在推理（inference）和验证（validation）阶段显著优化显存使用并提升计算速度。本报告旨在全面、深入
aocache:AOCache 新增功能深度解析：从性能监控到灵活配置的全方位升级 10km aocache java java aocache 性能分析
最近对aocache进行了重要升级，最新版本0.6.0增加了几项新功能：性能分析日志，AOCache性能分析工具，切入点自定义配置，全局配置，本文详细说明这几项目新功能的作用和使用方式。一、性能分析日志需求背景对于哪些方法适合使用aocache注解提高性能，开始我是凭经验和直觉来判断的。但是对于下面这个方法，凭直觉你觉得用方法缓存能提高性能么？publicStringnext(Stringexpr
【深度学习基础】PyTorch中model.eval()与with torch.no_grad()以及detach的区别与联系？
目录1.核心功能对比2.使用场景对比3.区别与联系4.典型代码示例(1)模型评估阶段(2)GAN训练中的判别器更新(3)提取中间特征5.关键区别总结6.常见问题与解决方案(1)问题：推理阶段显存爆掉(2)问题：Dropout/BatchNorm行为异常(3)问题：中间张量意外参与梯度计算7.最佳实践8.总结以下是PyTorch中model.eval()、withtorch.no_grad()和.d
苹果UI 设计蒙小萌1993 ui cocoa macos
不同平台不同框架以下是对iOSUIKit核心组件（AppDelegate、UIWindow、UIViewController、UIView、UINavigationController）的深度解析，依据Apple官方文档的设计哲学和实现原理：核心组件关系与架构或者通常为点击手机应用图标UIApplicationAppDelegateUIWindowrootViewControllerUITable
解析直返APP的优势:为何它成为用户的首选氧惠帮朋友一起省
直返的返利高低取决于具体的直返平台和商品，不同的平台和商品可能会有不同的返利比例和规则。但是，一般来说，直返的返利相对较高，因为直返平台通常会直接向消费者提供返现或优惠券等形式的返利，而不需要消费者进行额外的操作或满足特定的条件。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h