weixin_36662031

《《《翻译》》》三维目标检测

原文名称：Three-Dimensional Object Detection and Layout Prediction using Clouds of Oriented Gradients

原文链接：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Ren_Three-Dimensional_Object_Detection_CVPR_2016_paper.pdf

摘要
我们开发了新的表示和算法，用于在杂乱的室内场景中三维物体检测和空间布局预测。传统上，RGB-D图像是通过三维点云的局部几何特征来描述的。我们提出了一个面向梯度的云（COG）描述符，它把物体类别的2D外观和3D姿态联系起来，从而精确地模拟透视投影如何影响感知的图像边界。我们还提出了一种“曼哈顿体素”表示，它更好地捕捉了普通室内环境的3D房间布局几何。有效的分类规则是通过一个结构化的预测框架来学习的，该框架能够解释假设的3D长方体与人类注释的交叉-重叠，以及方位估计误差。类别和布局之间的上下文关系通过级联的分类器捕获，导致整体场景假说具有改进的准确性。
我们的模型仅从带注释的RGB-D图像中学习，没有CAD模型的好处，但是它的性能大大超过SUN RGB-D数据库上的最新水平。避免CAD模型允许更容易地学习许多对象类别的检测器。
1。介绍
过去十年中，用于2D图像的语义理解的算法取得了重大进展[6，29]。室内（家庭或办公室）环境的图像，通常高度杂乱，并具有实质性的遮挡，对现有的模型特别具有挑战性。深度传感器技术的最新进展大大降低了标准RGB图像中存在的模糊性，使得场景布局预测[22、13、41]、支持表面预测[34、8、10]、语义解析[11]和对象检测[36]得以突破。为了训练和评价室内场景理解方法，已经构建了越来越多的带注释的RGB-D数据集[30、21、34、35]。
已经开发了广泛的语义3D场景模型，包括基于低级体素表示的方法[20]。概括广泛用于2D检测的边界框，对象实例的3D大小、位置和方向可以通过边界长方体（凸多面体）来描述。几种方法将长方体模型拟合到RGB或RGB-D数据[17、16、40]，但是没有任何语义的、高层次的场景理解。其他工作已经使用CRF对通过自底向上分组[25]检测到的长方体进行分类，或通过与“滑动”位置中的已知CAD模型匹配[36]在3D中直接检测到对象。
最近几篇论文已经使用CAD模型作为用于室内场景理解的附加信息，通过学习对象形状[39]的模型或基于外观匹配的幻觉替代视点[1,24,23]。因此这些方法通常只关注少数类别（通常，只是椅子[1]）。此外，基于示例的方法[36]可能由于需要将每个示例与每个测试图像匹配而计算效率低下。不清楚需要多少CAD模型才能忠实地捕获对象类。
为了对室内场景的空间布局进行建模，许多方法都采用正交的“曼哈顿”结构[4]，并且目的在于推断3D结构的2D投影。在[22]和[15]的基础上，Hedau等人。[12]使用结构化模型来重新排列布局假设，Schwing等。_33_提出了一种有效的积分表示法，以有效地探索成指数分布的许多布局建议，以及Zhang等。[41]合并深度线索。联合建模对象可以提高布局预测精度[13，32]，但是以前的工作集中在受限的环境（例如，几乎总是与墙壁对齐的床）上，并且可能不能概括为更杂乱的场景。其他工作已经使用点云数据直接预测3D布局[25，35]，但是对RGB-D深度估计中的误差敏感。
简单的场景解析算法可以独立地检测每个类别，即使在非最大值抑制后也会引入许多误报。以前的工作已经使用相当精细的、人工设计的启发式来修剪错误检测[36]，或者联合使用CAD模型和布局线索来建模场景[9]。在本文中，我们展示了一个级联的分类框架[14]可以用来学习对象类别和总体房间布局之间的上下文关系，从而视觉上独特的对象导致更高质量的整体场景解释。

我们提出了一个只使用RGB-D注释学习多个对象类别的检测器的通用框架。在第2节、引入一种新的面向梯度云（COG）特征，将三维物体姿态与二维图像边界牢固地联系起来。我们还引入了一种新的曼哈顿体素表示三维房间布局几何。然后，我们使用结构化预测框架（Sec.3)学习将3D长方体假设与RGB-D数据对齐的算法和级联分类器(Sec.4)合并来自其他对象实例和类别的上下文线索以及整个3D布局。在第5节我们使用最近引入的大型SUN-RGBD数据集[35]来验证我们的方法，其中我们以比最先进的CAD模型检测器更高的精度检测更多的类别[36]。
2。三维几何及外观建模
我们的对象检测器是从SUN-RGBD数据集[35]中面向3D的长方体注释中学习的，其中包含10335个RGB-D图像和19个标记的对象类别。我们将每个长方体离散成6×6×6的(大)体素网格，并提取这些63=216个单元的特征。体素维度被缩放以匹配每个实例的大小。我们使用标准描述符描述观测深度图像的三维几何，并提出了一种新的RGB外观的朝向梯度云（COG）描述符。我们提出了曼哈顿三维空间布局几何体素模型。
2.1。物体几何学：三维密度和方向
点云密度以3D长方体注释或检测假设为条件，假设体素“包含Ni”点。我们使用透视投影来寻找图像中每个体素的轮廓，并计算凸区域的面积Ai。体素`然后等于φa i`=Ni`/Ai'的点云密度特征。归一化对场景中物体的深度变化具有鲁棒性。我们通过局部体素区域进行归一化，而不是像某些相关工作[36]中那样通过长方体中点的总数进行归一化，以对部分对象遮挡提供更强的鲁棒性。
对于垂直于3D表面的矢量，已经提出了各种表示，例如自旋图像[19]。与[36]中一样，我们在每个体素内建立法线方向的25元直方图，并且通过拟合其15个最近邻的平面来估计每个3D点的法线方向。这个特征φb i通过局部3D方向的图案捕获长方体i的表面形状。
2.2。定向梯度云
定向梯度直方图（HOG）描述符[5]是许多有效目标检测方法的基础[6]。由于普通物体产生的强遮挡轮廓，边缘是室内场景理解的一个非常自然的基础。然而，梯度方向当然是由三维物体方向和透视投影确定的，所以在2D图像坐标中天真地提取的HOG描述符普遍性较差。为了解决这个问题，以前的一些工作已经使用3DCAD模型来幻觉边缘，这些边缘从各种合成观点来看都是可以预期的[23，1]。其他工作限制性地假设物体的部分是非平面的，以便图像扭曲可用于对齐[7]，或者所有物体具有与房间[13]的全球“曼哈顿世界坐标”对齐的3D姿态。HOG描述符[3,31]的一些先前的3D扩展假定给出了完整的3D模型或网格模型。在最近的独立研究[37]中，3D长方体假设被用于从深度卷积神经网络中聚集标准2D特征，但是这些特征和3D对象定向之间的关系没有建模。我们的定向梯度云（COG）特征精确地描述了具有复杂3D几何形状的物体的3D外观，如RGBD摄像机以任何方向捕捉到的。

梯度计算 我们通过将滤波器[1，0，1]，[1，0，1]T应用到未平滑的2D图像的RGB通道来计算梯度。跨颜色通道的最大响应是x和y方向上的梯度（dx，dy），具有相应的幅度pdx2+dy2。
三维定位仓 标准HOG描述符[5]使用均匀间隔的梯度箱，其中0_是水平图像方向。如图2所示，这会为处于不同姿态的对象产生非常不一致的描述符。
对于每个长方体，我们构造了九个三维定向箱，这些定向箱与沿水平轴垂直放置的半圆盘中的0_180_均匀间隔。然后，我们使用透视投影来找到相应的2D边框。对于位于给定3D体素内的每个点，我们将其无符号2D梯度累积在相应的投影2D定向框中。为了避免对具有非平面几何形状的物体不稳定的图像处理操作，我们使用弯曲直方图盒来累积标准梯度，而不是通过扭曲图像来匹配固定方向盒。
归一化和混叠 我们双线性地插值相邻方向盒之间的梯度大小[5]。为了标准化长方体i中体素的直方图φc i`i'，我们然后将

设置为系数大于0。考虑到所有的方位和体素，COG特征的维数为63×9=1944。

2.3。房间布局几何学：曼哈顿体素
给定RGB-D图像，场景解析不仅需要对象检测，还需要房间布局（地板、天花板、墙壁）预测[12、22、41、32]。这种“自由空间”的理解对于机器人导航等应用至关重要。以前很多方法把房间布局预测看成是2D标注任务[2,33,41]，但是2D中的小错误会导致3D布局预测中的巨大误差。简单的RGB-D布局预测方法[35]通过将平面拟合到观测点云数据来工作。我们提出了一个更精确的基于学习的方法来预测曼哈顿几何。
标准房间的正交墙可以通过长方体[27]表示，我们可以通过标准体素离散化定义几何特征（图3，左下）。然而，因为角体素通常包含两个壁的交集，所以它们然后混合具有非常不同方向的3D法向量。此外，这种离散化忽略了假设长方体之外的点，并且可以匹配具有壁状结构的房间的子集。
我们提出一个新的曼哈顿体素（图3，右下角）离散化三维布局预测。我们首先把地板和天花板之间的垂直空间离散成6个相等的箱子。然后，我们使用0.15m的阈值将墙壁附近的点和虚拟布局的内部和外部的点分开。进一步使用对角线在房间角落处分割箱子，整个空间被离散为12×6=72个箱子。对于每个垂直层，区域R1：4模拟场景内部，其点云分布在图像之间变化很大。区域R5：8模型点靠近假定的曼哈顿墙结构：R5和R6应该包含正交的平面，而R5和R7应该包含平行的平面。区域R9:12捕捉在预测布局之外的点，这可能是由透明表面上的深度传感器误差产生的。

3。学习检测长方体和布局
对于训练图像Ii中标注的一些长方体Bi中的每个体素，我们有一点云密度特征、25个表面法向直方图特征和9个COG外观特征。我们基于特征的长方体i的整体表示是。利用SUN-RGBD数据集[35]中提供的重力方向，通过如图1所示的带注释的方位对准长方体。类似地，对于布局假设Mi中的每个曼哈顿体素，我们计算点云密度和表面法线特征，以及

3.1.物体立方体的结构预测
对于每个对象类别c，使用包含该类别的可见实例的图像，我们的目标是学习预测函数hc：I_B，该函数将RGB-D图像I映射到3D边界框B=(L，θ，S)。
这里，L是长方体的三维中心，θ是长方体的方向，S是长方体沿其方向确定的三个轴的物理尺寸。我们假设物体有一个通常支撑它们的基座，因此θ是相对于地面的标量旋转。
给定类别c的训练示例，我们使用具有边际重标度约束的结构支持向量机(SVM)目标[18]的ns.公式：

这里，φ(Ii，Bi)是定向长方体假设的特征Bi给定RGB-D图像Ii，Bi是基本真值注释边界框，Bi是可能的替代边界框集合。对于具有多个实例的训练图像，如同之前关于2D检测的工作[38]一样，我们多次将图像添加到训练集中，每次都删除其他实例中包含的3D点的子集。
给定一些基真长方体B和估计长方体B，我们定义以下损失函数：

这里，IOU(B，B)是长方体的3D相交的体积，除以它们的3D结合的体积。当IOU(B，B-)接近1且方位误差θ-θ-=0时，损耗最小。如果位置或方向错误，损失接近1。我们用截平面法求解方程（1）的损耗敏感目标[18]。我们还用基于标准二进制SVM的具有硬负挖掘的检测器进行了实验，但是发现损失敏感的S-SVM分类器更精确（参见图5），并且在处理大量负长方体假设方面也更有效。

长方体假设我们用离散的3D世界坐标以滑动窗口的方式预计算候选长方体的特征，具有16个候选方向。我们使用训练边界框的经验统计量来离散长方体大小：{0.1，0.3，0.5，0.7，0.9}宽度分位数，{0.25，0.5，0.75}深度分位数和{0.3，0.5，0.8}高度分位数。然后评估体素大小、3D位置和方向的每个组合。
3.2。曼哈顿布局的结构化预测
我们再次使用方程（1）的S-SVM公式来预测曼哈顿布局长方体M=（L，θ，S）。损耗函数(M，M)与等式(2)相同，只是我们使用[35]中IOU的“自由空间”定义，并且说明方向仅是可识别的模90_旋转。因为布局注释不一定具有曼哈顿结构，所以地面真值布局被认为是具有最大自由空间IOU的长方体假设。
布局假设我们预测楼层和天花板为沿重力方向的三维点的0.001和0.999分位数，并将方向离散成0_和180之间的18个均匀间隔角。然后，我们提出布局候选，它捕获所有3D点的至少80%，并且由最远和最近的3D点界定。对于典型的场景，有5000-20000个布局假设。有关更多细节，请参阅补充材料。
4。空间语境的级联学习
如果探测器是在Sec.3是针对每个类别独立应用的，可能存在许多误报，其中大对象的“块”被检测为较小对象（参见图4）。宋等。[36]通过启发式降低对于大图像段上的小检测的置信度得分来减少这种误差。为了避免这种必须经常调整到每个类别的手动工程，我们建议直接学习不同类别的检测之间的关系。由于房间几何形状也是物体检测的重要线索，我们结合曼哈顿布局假说来理解整个场景[35，25]。通常，空间关系的结构化预测是通过无向马尔可夫随机场（MRF）[26]实现的。如图4所示，这通常导致完全连通的图[28]，因为每对对象类别之间存在关系。一个极具挑战性的MAP估计（或能量最小化）问题必须在每次训练迭代以及针对每个测试图像解决，因此学习和预测是昂贵的。
我们建议将级联分类[14]用于3D场景中上下文关系的建模。在这种方法中，“第一阶段”检测如在Sec.3成为“第二阶段”分类器的输入特征，该分类器估计对长方体假设正确性的置信度。

这可以解释为具有隐藏变量的有向图形模型。对第一阶段变量进行边际化可以恢复标准的、完全连接的无向图。然而，至关重要的是，级联表示效率更高：训练分解为每个节点（对象类别）的独立学习问题，并且通过快速局部决策序列可以实现最优测试分类。
对于一对重叠的检测边界框Bi和Bj，我们表示它们的体积为V(Bi)和V(Bj)，它们的重叠体积为O(Bi，Bj)，它们的结合体积为U(Bi，Bj)。我们通过三个特征来表征它们的几何关系：

为了建立物体布局上下文[25]的模型，我们计算了长方体Bi到布局M中最近壁的距离D(Bi，M)和角度A(Bi，M)。

第一级检测器为每个类别提供最可能的布局假设以及一组检测（在非最大抑制之后）。对于具有置信度得分zi的边界框Bi，可能存在若干类别c∈{1，.…，C}。设i c为具有最大置信度zi c的类别fai i的实例，通过zi的二次函数、S1:3(i，i c)、A(Bi，M)和D(Bi，M)的径向基展开式来创建边界框Bi的特征i。第二阶段布局候选对象和对象长方体之间的关系被类似地建模。有关详细信息，请参阅补充材料。
由于级联的有向图形结构，每个第二级检测器可以独立地学习。目的是简单的二进制分类：候选检测是真阳性还是假阳性？在训练期间，如果每个类对地面真值实例的交-合得分大于0.25，则每个检测到的类的边界框被标记为“true”，并且是这些检测中最大的。我们训练一个具有径向基函数（RBF）核的标准二进制SVM。

使用验证数据选择带宽参数γ。虽然我们使用RBF核用于所有报告的实验，线性SVM的性能只是稍微差一点，并且级联分类仍然为更可伸缩的训练目标提供有用的性能增益。
为了训练第二阶段布局预测器（图4中的底部节点），我们将对象布局特征与来自Sec.2.3，再次利用S-SVM训练对自由空间IOU进行优化。在测试期间，给定在第一阶段滑动窗口搜索中发现的一组长方体，我们将第二阶段级联分类器应用于每个长方体Bi，以获得新的上下文置信分数zi0。然后，用于精确回忆评估的总置信度得分为zi+zi0，以说明几何和COG特征的原始信念以及上下文线索的校正能力。第二阶段布局预测由第二阶段S-SVM分类器直接提供。
5。实验
我们在SUN RGB-D数据集[35]上测试了我们的级联模型，并与最先进的滑动形状[36]长方体探测器和[35]中的基线布局预测器进行了比较。旧的NYU深度数据集[34]是SUN RGB-D的子集，但是SUN RGB-D改进了注释和许多新图像。由于与先前的工作不同，我们不使用CAD模型，因此我们很容易学习和评估10种对象类别的RGBD外观模型，其中5种多于[36]。对象长方体和3D布局假设的生成和评估，如前几节所述。
我们使用交点合并和基本真值长方体注释来评估检测性能，并且当分数高于0.25时，我们认为预测框是正确的。为了评估布局预测性能，我们使用人工注释计算自由空间交集。我们提供了几个比较来证明我们的场景理解系统的有效性，以及外观和上下文特征的重要性。

我们仅用几何特征（Geom）和添加COG特征（Geom+COG）来训练检测器。对于所有对象类别的检测精度都有非常明显的提高（参见表1和图5中的精度-召回曲线）。仅基于噪声点云的目标检测器是不完善的，并且RGB图像包含互补信息。
HOG与COG 为了验证COG特征的有效性，我们还使用Na_ve2D桶提取每个3D长方体的HOG特征，并训练检测器(Geom+HOG)。由于固定的2D桶不与3D物体姿态的变化对齐，因此该特征的信息量较少，并且检测性能比使用校正后的COG桶进行透视投影时差得多。我们将学习到的COG特征可视化到图6的不同类别中。我们可以看到许多描述性的外观提示，例如每个对象的定向外部边界，以及沙发、椅子、厕所和浴缸的空心区域。
立体体素与曼哈顿体素 我们使用自由空间IOU[35]来评估布局预测算法的性能。使用标准立方体体素，我们的性能（72.33）与启发式SUN RGB-D基线（73.4，[35]）类似。结合曼哈顿体素和结构化学习，性能提高到78.96，证明了这种改进的离散化的有效性。此外，如果我们还结合了来自检测对象的上下文线索，则得分提高到80.23。我们在图7中提供了一些布局预测示例。
语境的重要性 为了证明级联分类器有助于修剪假阳性，我们使用来自第一级分类器的置信度得分以及来自第二级分类器的更新置信度得分(Geom+COG+Context-5)来评估检测。如表1和图5所示，添加上下文级联明显提高了性能。此外，当建模更多的对象类别（Geom+COG+Context-10）时，性能将进一步提高。这个结果证明，即使少量的对象是主要的兴趣，建立更广泛的场景的模型可以是非常有益的。
我们在图8中显示了一些有代表性的检测结果。在第一幅图像中，我们的椅子检测器被弄混了，沙发上起了火，但是在其他检测到的边框的上下文提示的帮助下，这些假阳性被去除了。对于跨越所有对象类别的固定阈值，我们有与滑动形状基线一样多的真实检测，同时产生较少的假阳性。
全景理解 通过捕获对象对之间的上下文关系，以及对象与整个3D房间布局之间的关系，我们的级联分类器使我们能够执行总体场景理解的任务[35]。我们通过对所有第二阶段对象建议应用相同的阈值（根据验证数据调整）来生成单个全局场景假设，并选择最高得分的布局预测。我们报告由表2中的[35]定义的精度、召回和IOU评估度量。在每种情况下，我们显示出比基线明显的改进。
计算速度该算法在MATLAB中实现，大部分运行时间用于特征计算。对于典型的室内图像，我们的算法将花费10到30分钟来计算一个对象类别的特征和曼哈顿体素离散化，以及2秒来预测3D长方体和布局假设。这种速度可以以各种方式显著提高，例如利用积分图像进行特征计算[36]或使用GPU硬件进行并行化。
6。结论
提出了一种基于RGB-D图像的三维长方体检测和曼哈顿房间布局预测算法。使用我们新颖的3D外观COG描述符，我们训练了针对10个对象类别的精确的3D长方体检测器，以及学习上下文线索以修剪假阳性的级联分类器。我们的场景表示直接从RGB-D数据中学习，没有外部CAD模型，并且可以推广到许多其他类别。
这项研究部分得到了ONR奖编号N00014-13-1-0644的支持。

References
[1] M. Aubry, D. Maturana, A. Efros, B. Russell, and J. Sivic.Seeing 3D chairs: Exemplar part-based 2D-3D alignment using a large dataset of CAD models. In CVPR, 2014.
[2] J. Bai, Q. Song, O. Veksler, and X. Wu. Fast dynamic programming for labeling problems with ordering constraints.In CVPR, pages 1728–1735. IEEE, 2012.
[3] N. Buch, J. Orwell, and S. A. Velastin. 3D extended histogram of oriented gradients (3dhog) for classification of road users in urban scenes. In BMVC, 2009.
[4] J. M. Coughlan and A. L. Yuille. Manhattan world: Compass direction from a single image by Bayesian inference. In ICCV, volume 2, pages 941–947. IEEE, 1999.
[5] N. Dalal and B. Triggs. Histograms of oriented gradients for human detection. In CVPR, volume 1, pages 886–893. IEEE, 2005.
[6] M. Everingham, L. Van Gool, C. K. I. Williams, J. Winn, and A. Zisserman. The PASCAL Visual Object Classes Challenge 2012 (VOC2012) Results.
[7] S. Fidler, S. Dickinson, and R. Urtasun. 3D object detection and viewpoint estimation with a deformable 3D cuboid model. In NIPS, pages 611–619, 2012.
[8] D. F. Fouhey, A. Gupta, and M. Hebert. Unfolding an indoor origami world. In ECCV, pages 687–702. Springer, 2014.
[9] A. Geiger and C. Wang. Joint 3D object and layout inference from a single RGB-D image. In German Conference on Pattern Recognition (GCPR), 2015.
[10] R. Guo and D. Hoiem. Support surface prediction in indoor scenes. In ICCV, pages 2144–2151. IEEE, 2013.
[11] S. Gupta, R. Girshick, P. Arbelaez, and J. Malik. Learning ´ rich features from RGB-D images for object detection and segmentation. In ECCV, pages 345–360. Springer, 2014.
[12] V. Hedau, D. Hoiem, and D. Forsyth. Recovering the spatial layout of cluttered rooms. In CVPR, pages 1849–1856. IEEE, 2009.
[13] V. Hedau, D. Hoiem, and D. Forsyth. Thinking inside the box: Using appearance models and context based on room geometry. In ECCV, pages 224–237. Springer, 2010.
[14] G. Heitz, S. Gould, A. Saxena, and D. Koller. Cascaded classification models: Combining models for holistic scene understanding. In NIPS, pages 641–648, 2009.
[15] D. Hoiem, A. Efros, M. Hebert, et al. Geometric context from a single image. In CVPR, volume 1, pages 654–661. IEEE, 2005.
[16] Z. Jia, A. Gallagher, A. Saxena, and T. Chen. 3D-based reasoning with blocks, support, and stability. In CVPR, pages 1–8. IEEE, 2013.
[17] H. Jiang and J. Xiao. A linear approach to matching cuboids in RGBD images. In CVPR, 2013.
[18] T. Joachims, T. Finley, and C.-N. J. Yu. Cutting-plane training of structural SVMs. Machine Learning, 77(1):27–59, 2009.
[19] A. E. Johnson and M. Hebert. Using spin images for efficient object recognition in cluttered 3D scenes. PAMI, 21(5):433– 449, 1999.
[20] B.-s. Kim, P. K. Kohli, and S. Savarese. 3D scene understanding by voxel-CRF. In ICCV, 2013.
[21] K. Lai, L. Bo, X. Ren, and D. Fox. A large-scale hierarchical multi-view RGB-D object dataset. In ICRA, pages 1817– 1824. IEEE, 2011.
[22] D. C. Lee, M. Hebert, and T. Kanade. Geometric reasoning for single image structure recovery. In CVPR, pages 2136– 2143. IEEE, 2009.
[23] J. J. Lim, A. Khosla, and A. Torralba. FPM: Fine pose partsbased model with 3D CAD models. In ECCV, pages 478– 493. Springer, 2014.
[24] J. J. Lim, H. Pirsiavash, and A. Torralba. Parsing IKEA objects: Fine pose estimation. In ICCV, 2013.
[25] D. Lin, S. Fidler, and R. Urtasun. Holistic scene understanding for 3D object detection with RGBD cameras. In ICCV, pages 1417–1424. IEEE, 2013.
[26] S. Nowozin and C. H. Lampert. Structured learning and prediction in computer vision. Foundations and Trends in Computer Graphics and Vision, 6(3–4):185–365, 2011.
[27] L. D. Pero, J. Guan, E. Brau, J. Schlecht, and K. Barnard. Sampling bedrooms. In CVPR, pages 2009–2016. IEEE, 2011.
[28] A. Rabinovich, A. Vedaldi, C. Galleguillos, E. Wiewiora, and S. Belongie. Objects in context. In ICCV, 2007.
[29] O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A. C. Berg, and L. Fei-Fei. ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.
[30] B. C. Russell and A. Torralba. Building a database of 3D scenes from user annotations. In CVPR, pages 2711–2718. IEEE, 2009.
[31] M. Scherer, M. Walter, and T. Schreck. Histograms of oriented gradients for 3D object retrieval. In Europe on Computer Graphics, Visualization and Computer Vision, 2010.
[32] A. G. Schwing, S. Fidler, M. Pollefeys, and R. Urtasun. Box in the box: Joint 3D layout and object reasoning from single images. In ICCV, pages 353–360. IEEE, 2013.
[33] A. G. Schwing, T. Hazan, M. Pollefeys, and R. Urtasun. Efficient structured prediction for 3D indoor scene understanding. In CVPR, pages 2815–2822. IEEE, 2012.
[34] N. Silberman, D. Hoiem, P. Kohli, and R. Fergus. Indoor segmentation and support inference from RGBD images. In ECCV, pages 746–760. Springer, 2012.
[35] S. Song, L. Samuel, and J. Xiao. SUN RGB-D: A RGB-D scene understanding benchmark suite. In CVPR. IEEE, 2015.
[36] S. Song and J. Xiao. Sliding shapes for 3D object detection in depth images. In ECCV, pages 634–651. Springer, 2014.
[37] S. Song and J. Xiao. Deep sliding shapes for amodal 3D object detection in RGB-D images. In CVPR, 2016.
[38] A. Vedaldi and A. Zisserman. Structured output regression for detection with partial occulsion. In NIPS, 2009.
[39] Z. Wu, S. Song, A. Khosla, X. Tang, and J. Xiao. 3D shapenets for 2.5D object recognition and next-best-view prediction. arXiv preprint arXiv:1406.5670, 2014.
[40] J. Xiao, B. C. Russell, and A. Torralba. Localizing 3d cuboids in single-view images. In NIPS, 2012.
[41] J. Zhang, C. Kan, A. G. Schwing, and R. Urtasun. Estimating the 3D layout of indoor scenes and its clutter from depth sensors. In ICCV, pages 1273–1280. IEEE, 2013.

探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
别再为通信发愁！机床厂PROFIBUS DP转EtherNet/IP网关应用指南，低成本实现智能升级 JIANGHONGZN PROFIBUS DP 工业通讯协议网关 ETHERNET/IP
在现代机床制造工厂中，设备间的无缝通信是实现高效、柔性生产的关键。西门子PLC（如S7-300/1500系列）作为核心控制器广泛采用PROFIBUSDP现场总线，而高端机器人系统（如FANUC、KUKA）则普遍支持EtherNet/IP协议。在这类异构网络共存的环境中，协议转换网关成为打通数据壁垒的核心枢纽。网关的核心作用与工作流程角色定位：网关作为“翻译官”，部署在西门子PLC（PROFIBUS
PROFIBUS DP转EtherNet/IP网关：精密医疗器械粘合密封的质量守护者 JIANGHONGZN PROFIBUS ETHERNET/IP DP 协议网关工业通讯机器人
在医疗器械制造领域，精密部件（如输液器接头、植入体密封壳）的粘合与密封工艺对可靠性和一致性要求近乎苛刻。这类工艺通常由高速、高精度的涂胶机器人执行，而其精准动作离不开与核心控制系统（如西门子PLC）的无缝数据交互。当产线中同时存在西门子PROFIBUSDP网络与支持EtherNet/IP的机器人时，专用协议转换网关便成为确保“数据血液”畅通的关键设备。网关的核心角色：协议翻译与无缝桥接此类网关设备
PHP ADODB 1.99版手册中文翻译
PHPADODB1.99版手册中文翻译(Tripc)感谢记事PHPADODB1.99版手册中文翻译翻译作者：Tripc------------------ADODBPHP在资料库的支援上是很令人称道的，几乎所有的知名资料库系统都有对应的函数群支援，而且支援的很完整。但很不幸的，每一群资料库支援函数无论在名称或叁数结构上，都有很大的差异，这使得PHP的系统开发者在面临更换资料库时，总会觉得痛苦万分。
【超详细】S905L3B机顶盒固件刷机包已root-adb-带影视桌面- yantaohk 嵌入式硬件云计算边缘计算
本线刷包为S905L3B的通用版本，桌面友好，无流氓软件，纯净系统（自带一个应用管家，非系统应用，可以删除），系统已root，开adb，安卓9，遥控器正常使用，可以看电视电影，看是S905L3B的芯片，都可以刷既然机顶盒芯片为S905L3B的，，闲鱼10多20块一个，刷了到处卖，接通宽带就行。卖给用户看电视电影香得很！此文所有用到的软件，和底包、刷机工具，均在以下网盘内，可自行选择下载使用：通过网
SpringBoot整合百度翻译API全攻略在Spring Boot项目的pom.xml文件中添加必要的依赖 2501_92020556 dubbo
整合百度翻译API到SpringBoot项目注册百度翻译开发者账号在百度翻译开放平台（http://api.fanyi.baidu.com）注册账号，创建应用获取APIKey和SecretKey。这两个参数是调用翻译API的必要凭证。添加Maven依赖在SpringBoot项目的pom.xml文件中添加必要的依赖，包括HTTP客户端和JSON处理库：org.apache.httpcomponent
Gen AI：重塑未来的创造力工具箱一杯酒zpy 人工智能
目录页一、GenAI工具箱助力大学生涯1.通用GenAI工具2.GenAI科研辅助1.文献阅读与论文写作2.数据分析与可视化3.AI翻译工具二、GenAI办公、学习助手1.PPT制作2.表格制作3.AI思维导图4.AI办公5.AI图像处理6.AI视频处理7.AI音频处理8.AI编程工具9.AI搜索引擎说明：网盘资源密码获取：关注微信公众号【土木岛】，后台回复文件框中提示的对应关键词自动发送。点击查
A基础语法.java 是紫焅呢 26字母学习：java入门篇 java 开发语言青少年编程后端 visual studio code android
前言：Java是一种广泛使用的编程语言，以其“一次编写，到处运行”的特性而闻名。它具有强大的功能和丰富的类库，适用于各种应用场景，从桌面应用程序到大型企业系统，再到移动应用开发。目录一、Java的基本结构万物皆对象的源头二、变量和数据类型数据的小窝和它的性格三、运算符数字间的小心机四、控制流语句程序的指挥棒五、方法功能的魔法盒六、面向对象Java的灵魂所在七、异常处理程序的急救箱八、Java集合框
基于Transformer实现机器翻译 yyyyurina. transformer 机器翻译深度学习
目录一、前言1.1什么是Transformer?1.2Transfomer的基本结构1.2Transformer的重要组成部分1.2.1位置编码（PositionalEncode）1.2.2自注意力机制（Self-Attention）1.2.3多头注意力（Multi-HeadAttention）1.2.4位置感知前馈层（Position-wiseFFN）1.2.5残差连接与层归一化二、AutoDL
vLLM（Virtual Large Language Model）框架：一个开源的高性能推理和服务的框架彬彬侠大模型 vLLM 高性能推理 PagedAttention python 大模型
vLLM（VirtualLargeLanguageModel）是一个开源的高性能推理和服务的框架，专为大语言模型（LLM）设计，旨在优化推理速度、内存效率和吞吐量。它通过创新的内存管理和调度技术（如PagedAttention）解决了传统LLM推理中的内存瓶颈和性能问题，广泛应用于对话系统、文本生成、实时翻译等场景。以下是对vLLM框架的详细介绍，包括其核心特性、工作原理、架构、优势、局限性以及使
Github/Copilot 学生认证详细步骤 nomoremorphine github copilot
Github学生认证详细步骤文章目录Github学生认证详细步骤1、注册github2、完善profile3、双重认证two-factorauthentication（必须）4、完善支付信息billingandplans5、学生认证5.1学信网获取学籍验证信息5.2通过翻译软件将学籍信息照片翻译为英文5.3使用手机拍照学籍信息照片(无法上传相册)6、确认完成认证1、注册github非学校邮箱注册的
不用公式！用生活例子讲透Transformer，大模型为何强大九章云极DataCanvas 技术干货人工智能
想象一下，你现在是个翻译员，手头有一本厚厚的英文书，要把它翻译成中文。这可不是个轻松活儿！以前的翻译方法（老派翻译官：RNNs）过去，我们的电脑（也就是老模型，比如RNNs）是这样翻译的：就像一个超级认真的翻译官，他会逐字逐句地读英文书。他读到一个英文词时，会琢磨这个词之前讲了什么，以及他到现在为止记住了多少内容，然后才决定怎么翻译。这种方法有两个大毛病：太慢，不能分工合作：就像一个翻译官，他必须
DPDK之（七）—— support for vhost-user学习笔记何进哥哥 DPDK vhost DPDK
转地址：http://www.lai18.com/content/1851237.htmlX86体系早期没有在硬件设计上对虚拟化提供支持，因此虚拟化完全通过软件实现。一个典型的做法是通过优先级压缩（RingCompression)和二进制代码翻译（BinaryTranslation)相结合，VMM在特权级ring0,Guest操作系统在非特权级ring1,Guest应用程序在ring3。由于Gue
入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15% hyperai
在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持，已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域，LVLMs通过对TB级文本语料的学习，在机器翻译、文本摘要、情感分析等任务上达到专业级水准，其生成的学术摘要甚至能精准提炼医学文献的核心结论。然而当
代码随想录|图论|05岛屿数量（深搜DFS） Paper Clouds 图论深度优先算法数据结构 leetcode
leetcode:99.岛屿数量题目题目描述：给定一个由1（陆地）和0（水）组成的矩阵，你需要计算岛屿的数量。岛屿由水平方向或垂直方向上相邻的陆地连接而成，并且四周都是水域。你可以假设矩阵外均被水包围。输入描述：第一行包含两个整数N,M，表示矩阵的行数和列数。后续N行，每行包含M个数字，数字为1或者0。输出描述：输出一个整数，表示岛屿的数量。如果不存在岛屿，则输出0。思路遇到一个没有遍历过的节点陆
PDF 问答工具对比 - 询问有关 PDF 的任何问题 ComPDFKit pdf PDF AI PDF问答
很好，我研究了面向普通用户、以英语支持为重点的顶级PDF问答AI工具。我将通过准确性、速度、价格、隐私和第三方集成等标准，对基于Web和可下载工具进行比较。最终的文章将包含一个对比表以便更清晰地呈现。顶级PDF问答AI工具借助AI技术的PDF问答工具让您可以上传PDF文件并通过对话方式提问其内容。这些工具无需手动阅读，而是会对文档进行索引，并使用自然语言处理模型从文本中提取答案、摘要或翻译。它们可
从零开始理解零样本学习：AI人工智能必学技术 AI学长带你学AI 学习人工智能 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、跨模态映射、语义空间、AI泛化能力、大模型、少样本学习、数据效率摘要：传统AI需要“见多识广”才能识别新事物，但现实中很多场景（如稀有物种、冷门物品）缺乏足够数据。零样本学习（Zero-ShotLearning,ZSL）就像AI的“推理翻译官”，能让机器通过“文字描述”理解“没见过的图片”。本文将用“认新单词”的生活故事，一步步拆解零
初学者指南：直观理解MCP协议架构，从快递站到智能助手的“万能接口” 码力金矿 MCP 人工智能 python 架构 apache 数据分析数据挖掘人工智能 windows python
引言：为什么你需要了解MCP协议？想象你是一名快递员，每天需要处理不同品牌的包裹：有的用红色标签，有的用蓝色标签，还有的用二维码。传统方式是为每个品牌单独学习包装规则，而MCP协议就像一个“通用翻译器”，让所有包裹都能用同一套流程处理。在AI领域，MCP（模型上下文协议）正是这样的“翻译器”，它让大模型能无缝连接数据库、API、工具等外部资源，告别“数据孤岛”。一、MCP核心架构：快递站的“三角色
AI API、AI 聊天助手，两大服务助力应用智能化转型融云人工智能
网络效应、转换成本——这些一度定义了我们这个时代商业逻辑的规则，在AI时代迅速崩塌。创新性功能被无差别克隆包围，差异化优势在底层能力翻新中消散……更别说那些决策迟缓、行动无法言出法随的“后来者”，注定与市场窗口擦身而过。唯快不破，迅速更新认知并在执行中进化才是AI时代创业的正确姿势。专注业务创新，底层交给融云。融云推出一站式AI云服务，提供开箱即用的大模型API服务，“模型多、上线快、性能好、成本
Python 实现 ZeroMQ 的三种基本工作模式赛博Cookie ZeroMQ Python python 网络通信 zeromq 队列
技术博客：https://github.com/yongxinz/tech-blog同时，也欢迎关注我的微信公众号AlwaysBeta，更多精彩内容等你来。简介引用官方说法：ZMQ（以下ZeroMQ简称ZMQ）是一个简单好用的传输层，像框架一样的一个socketlibrary，他使得Socket编程更加简单、简洁和性能更高。是一个消息处理队列库，可在多个线程、内核和主机盒之间弹性伸缩。ZMQ的明确
《仿盒马》app开发技术分享-- 回收金查询页面（48） typescript
技术栈Appgalleryconnect开发准备上一节我们实现了查看当前账号下的预收益，以及当下收益，并且展示了已完成订单的列表，现在我们可以针对收益来做更多的内容了，在之前的开发中我们在个人中心页面实现了一个静态的金额展示，后续我们将会在这里展示当前账号的总金额，点击当前账号金额进入回收金查询页面，在这个页面我们将会对该账号的回收金进行一系列的操作功能分析要想实现回收金页面，首先我么要在首页进行
华为Pura 70怎么语音翻译？语音翻译详解 C_19870 华为经验分享
在智能手机功能日益丰富的今天，语音翻译已成为许多手机用户的重要需求之一。华为Pura70，作为华为系列中的一款高端机型，其内置的语音翻译功能在准确性和便捷性上都表现出色。本文将详细介绍华为Pura70在语音翻译方面的表现、操作步骤，并探讨其他可实现语音翻译操作的软件，特别是“同声传译王”。华为Pura70手机在语音翻译时的表现华为Pura70内置的语音翻译功能凭借其先进的语音识别和翻译技术，为用户
Vue项目i18n国际化多语言切换方案实践冲浪的鹏多多 Vue vue.js javascript ecmascript 前端前端框架
文章目录1.前言2.i18n插件概述3.安装与基础配置3.1.安装VueI18n3.2.初始化I18n实例3.3.在组件中使用翻译内容4.动态切换语言5.复杂场景应用5.1.动态文本插值5.2.复数处理6.优化与扩展6.1.代码分割与按需加载6.2结合浏览器语言自动设置1.前言Vue项目国际化能让应用适应不同地区用户需求。本文将围绕Vue项目国际化，借助官方提供的VueI18n插件，介绍，讲解安装
《仿盒马》app开发技术分享-- 回收订单状态修改与展示（44） typescript
技术栈Appgalleryconnect开发准备上一节我们实现了订单列表页，但是我们的订单列表又分为很多的订单状态，我们在订单列表页取出的数据是所有的数据，订单的状态我们还需要进行一些操作，如果都在一起，对用户来说非常的不友好，所以我们需要把它修改为不同状态下展示不同的列表，同时我们实现订单的取消，以及已取消订单的列表查看功能分析想要在一个页面中展示多个订单页面，我们需要先把主页面的布局更换位ta
NLP市场规模将破千千亿，哪些岗位会成为新风口？ duolapig 人工智能
近年来，自然语言处理（NLP）技术在全球范围内掀起了一场“语言革命”。从智能客服到机器翻译，从情感分析到内容生成，NLP正以惊人的速度重塑人类与机器的交互方式。艾媒咨询数据显示，2023年中国NLP市场规模已达660亿元，预计2027年将突破千亿大关。这一数字背后，不仅是技术迭代的加速，更是一场深刻的人才需求变革。在AI大模型浪潮的推动下，新的职业风口正在形成，而这场变革的核心逻辑，是技术与产业融
GitHub 趋势日报 (2025年06月22日) qianmoQ GitHub 项目趋势日报 (2025年)github
由TrendForge系统生成|https://trendforge.devlive.org/本日报中的项目描述已自动翻译为中文今日获星趋势图今日获星趋势图624LLMs-from-scratch523ai-engineering-hub501n8n320data-engineer-handbook243gitingest217edit188claude-code172NotepadNext语言分
GitHub 趋势日报 (2025年06月24日) qianmoQ GitHub 项目趋势日报 (2025年)github
由TrendForge系统生成|https://trendforge.devlive.org/本日报中的项目描述已自动翻译为中文今日获星趋势图今日获星趋势图433edit358Web-Dev-For-Beginners301typst216SpaghettiKart175ai-engineering-hub136Telegram131isle-portable121leaked-system-pr
GitHub 趋势日报 (2025年06月23日) qianmoQ GitHub 项目趋势日报 (2025年)github
由TrendForge系统生成|https://trendforge.devlive.org/本日报中的项目描述已自动翻译为中文今日获星趋势图今日获星趋势图390suna387system-prompts-and-models-of-ai-tools383Web-Dev-For-Beginners370edit262void240SpaghettiKart180typst137ComfyUI语言分
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

《《《翻译》》》三维目标检测

你可能感兴趣的:(翻译,包围盒)