fish小余儿

Mean Shift Segmentation Assessment for Individual Forest Tree Delineation from Airborne Lidar Data

Abstract

机载激光雷达已广泛用于森林表征，以促进森林生态和管理研究。由于森林的复杂性和多样性，随着越来越高的点密度的可用性，从机载激光雷达点云中描绘单棵树(ITD)已经成为一个流行但具有挑战性的主题。ITD的一个重要步骤是分割，为此研究了各种方法。其中，一种久经考验的图像分割方法，均值漂移，已经被直接应用到3D点上，并且已经显示出有希望的结果。然而，在核形状、适应性和权重方面，实现该算法的人之间存在差异。本文详细评估了用于机载激光雷达数据分割的均值漂移算法，以及树冠探测对分割结果有效性的影响。来自三个不同数据集的结果显示，冠状核（crown-shaped kernel）始终比其他变体产生更好的结果(高达7%)，而权重和适应性并不保证改进。

Keywords: 个体树检测；3D聚类；机载激光扫描；点云

1. Introduction

森林生态系统是食物、水、木材、调节气候、洪水、水质以及生物多样性和娱乐等服务的重要提供者[1]。在当前人类发展和气候变化的条件下，森林的可持续适应和管理变得至关重要。遥感技术已广泛用于森林调查和监测，以支持森林管理[2]。在各种遥感技术中，激光扫描或光探测和测距(lidar)由于其独特的优势，即能够穿透树叶并捕捉树木结构和地面，已经引起了特别的兴趣[3]。

激光雷达已经集成到各种平台中，以在不同的尺度上研究森林，包括星载卫星(例如，全球生态系统动力学调查)[4]，机载系统(例如，直升机或飞机)[5]，无人驾驶飞行器(UAV)[6]，地面移动平台(例如，车辆，背包，手持设备)[7]，以及地面固定三脚架[8]。这些激光雷达系统中的每一个都可以生成在覆盖范围、点密度、视野和精度方面具有不同特征的点云，使它们最适合不同的用途。

机载激光雷达或机载激光扫描(ALS)系统通常由三个主要组件组成:用于绝对定位的全球导航卫星系统(GNSS)接收器、用于定位和定向的惯性测量单元，以及以3D点的形式通过距离和角度测量地面的激光扫描仪[9，10]。它们通常安装在飞机上，用于大范围覆盖，同时保持良好的(厘米)级精度。点密度取决于几个因素，如扫描仪测量速率和扫描机制、飞行高度和速度、条带宽度和条带重叠，因此它可能从每平方米少于1个点到每平方米超过50个点不等。但总的来说，随着机载激光扫描仪的发展，最大点密度越来越高。

由于点密度有限，早期研究主要集中在林分水平的特征，如机载激光雷达数据中的林冠覆盖和高度[11–13]。现在，点密度足够高，可以在每棵树上捕捉足够数量的点，因此，单棵树的检测或描绘(ITD)，包括树的位置、大小、形状和数量，已经引起了相当大的关注[5，14–16]。垂直分布、地上生物量和其他次要特性可以从这些精确的划界参数中推导出来。因此，ALS越来越多地被用于景观或区域尺度的精确森林制图和监测[10]。

虽然机载激光雷达ITD是森林研究的一个重要研究课题，但由于森林结构及其组成的复杂性和异质性，它仍然是一个挑战。ITD的主要困难是树分割，这是将所有的点分割成代表单个树的簇的步骤。树木分割有两种主要策略:基于栅格和基于点[17，18]。早期的方法大多采用第一种策略，将3D点云转换为树冠高度模型(CHMs)，一种光栅图像，然后使用2D图像处理技术(如局部极大值、区域生长和分水岭)检测树顶[5]。第二种策略直接基于3D点分割树[14，19]。例子包括基于规则的距离和高度阈值[16，20，21]，基于体素[22]，基于图[23]和基于核[24]的方法。一些人试图结合这两种策略来分别检测树顶和树干，然后在体素空间中进行分割[25]。直接基于3D点云的分割方法被证明优于基于2D光栅转换的分割方法，例如CHM，尤其是对于多层森林[14，19]。其中一种三维方法，均值漂移，一种经典的2D聚类方法，可以很容易地适用于三维场景，已经引起了直接三维点云分割的相当大的关注[24，25]。

均值漂移已成功地应用于计算机视觉和图像处理中，用于特征空间的模式搜索。该模式是密度函数的最大值，并且通过移动由核确定的加权平均值来迭代地定位，因此命名为均值移动。核可以很容易地扩展到3D中，因此可以直接从3D点计算平均值。对于不同类型的树木条件，如多层温带[24]和热带森林[26]，混合物种城市树木[27]和北方针叶林[28]，它已经显示出有希望的结果。然而，有一些因素需要考虑，如内核形状，大小和重量，以更好地实现它来分割树木。

由于文献中对核函数和权重的深入分析不够，本文旨在对机载激光雷达数据的ITD均值漂移算法进行详细评估，以阐明这些变化对性能的影响。

2. Related Work

由 Fukunaga 和 Hostetler [29] 提出，将原始均值漂移算法应用于聚类和数据噪声过滤。 Cheng [30] 进一步证明它对聚类和全局优化是有效的。然后它被广泛用作特征空间图像分割的鲁棒方法[31]。此外，它被广泛用于非刚性目标的实时跟踪[32]。由于其在图像分割方面的明显进步，均值偏移很快被应用于遥感图像[33-35]。例如，Huang 和 Zhang [33] 使用具有自适应带宽的均值偏移来通过支持向量机 (SVM) 提取基于对象的高维高光谱图像城市分类特征。

Maschler 等人 [36] 两次将均值偏移应用于机载高光谱图像：首先区分矮树和高树，其次分割单个树冠，对温带森林进行分类。

Melzer [37] 率先采用 Mean Shift 进行 ALS 点云分割，通过该方法可以区分城市地区的电力线和植被。 Yao 等人 [38] 将均值漂移与归一化切割相结合，对城市地区的 3D 机载激光雷达数据进行分割和分类。 Lee 等人 [39] 使用均值漂移分割从综合机载激光雷达点云和航空正射影像中提取海岸线。

表 1 列出了机载激光雷达数据中树木分割均值漂移的用法，以及研究中使用的设置。 Ferraz 等人 [40] 首先使用均值偏移在 3D 中对森林垂直结构进行分层。选择以圆柱形实现的 Epanechnikov 内核，并凭经验选择三个离散的内核带宽将森林分层为三层。然后使用该算法提取单个树 [24]。由于内核形状和水平分量与垂直分量之间的比率是固定的，因此只有一个参数需要调整，即内核带宽。 Ferraz 等人 [26] 随后采用该方法检测热带森林内不同层的个体树冠。基于先前的方法，自适应均值偏移 3D 分割 (AMS3D) 使用定义树高和树冠之间关系的异速生长函数提出了宽度和深度。带宽模型自适应异速生长函数；例如，它会随着内核在更高的树上向上移动而增加。

表 1. 报告的用于树分割的均值漂移的变化。

Yao 等人 [41] 还使用具有水平高斯分布的圆柱核来使用固定带宽提取点的局部密集模式。那些局部模式被有意地过度分割，并且特征是从那些分割的集群中导出的，然后通过测量集群在空间分布和特征方面的相似性，通过归一化切割进行分组。对该方法进行了进一步研究，以估计温带森林中 5 m 以下的再生覆盖率 [42]。圆柱形内核的半径和高度均独立设置，并进一步测试了半径和高度的灵敏度。

除了森林树木，均值漂移算法也被 Xiao 等人应用于城市树木 [27]。为了适应一般的树形，树冠模型，即 Pollock 模型，可以从圆锥体到椭圆体变化, 被提议作为均值偏移核。此外，采用连续自适应均值漂移 (CamShift) 概念，假设较高的树木具有较宽的树冠，并且会受益于更大的带宽。因此，带宽被设置为以恒定比率连续适应树高，这对树的大小、形状和物种不敏感，正如实验中发现的那样。

Hu等人[43]进一步证明了自适应均值漂移对个体树识别的优势。不是使用异速生长函数，而是首先通过固定带宽均值偏移对点进行粗略分割，并通过在不同高度的多层上生长的迭代区域来估计树冠大小。然后，在第二轮均值偏移分割中，使用不同的树冠大小来指导内核带宽。与之前的研究一样，选择了球形内核而不是圆柱形内核。通过首先检测树干来改进分割和定位结果，以补充自适应均值偏移分割 [44]。

除了单色波长激光雷达点，该算法也被 Dai 等人[28] 用于多光谱机载激光雷达数据，他们首先只在空间域对树木进行分割，然后使用 SVM 检测那些被欠分割的，然后考虑到多光谱域，通过第二轮均值偏移分割对其进行细化。圆柱核遵循与[24]中相同的设计，除了在核的较高点上增加了额外的权重，引导核向上移动。

总之，均值漂移算法一直是一种流行且有效的方法，用于从不同类型森林的机载激光雷达数据中分割单株树木。然而，在内核形状、内核大小的适应性和权重方面存在差异。因此，本文将着重于对算法进行系统评估，以更好地了解不同配置和数据条件下的性能。

3. Materials and Methods

从原始机载激光扫描数据中描绘单个林木的完整工作流程如图 1 所示。首先，对原始点云进行预处理以准备分割。对地面点进行分类，然后对地上点进行归一化以避免影响从分割步骤中的地形起伏。此外，1 m 以下的点被认为是噪声，因此被过滤掉。接下来，使用基于点的分割方法均值偏移将整个点云分割成单独的树。本文将重点介绍使用均值漂移评估树木分割，这是影响后续树木参数提取的重要步骤。其他代表性方法，例如标记控制的分水岭分割 [15]，也用于比较。然后对于每个段，提取树参数，例如位置 (x, y)、高度 (h)、最长树冠传播 (l) 和最长树冠交叉传播 (l’)。最后，根据现场测量验证提取，以便评估均值漂移算法变体的准确性。

图 1. 根据机载光探测和测距（激光雷达）数据描绘单个林木的工作流程。

3.1. Test Data

本研究使用三种类型的地块来测试树木分割方法：a) 综合生成的混合落叶林地，b) 单一栽培针叶林，c) 两个混合针叶树种和落叶树种的森林地块。

合成数据集(图2)由开源软件HELIOS [45]模拟。使用合成数据的主要优势包括:a)准确了解树木位置和树冠参数，b)控制树木的数量和种类。将四个物种，黑tupelo (Nyssa sylvatica Marshall)、檫木(Sassafras albidum)、柽柳(Larix laricina (Du Roi) K.Koch)和垂柳(Salix babylonica L .)，输入到RIEGL LMS-Q780模拟器中，以模拟随机位于100m×100m正方形(1公顷)上的50棵树。它们的高度分别为27.891米、24.351米、22.116米和13.599米。

图 2. HELIOS 模拟的合成数据（以米为单位）。 (a) 鸟瞰图的树模型和模拟数据，(b) 透视图。总共有 50 棵树，有四种不同高度的树。红点代表树顶

除了合成数据外，实验还使用了位于伊丽莎白女王森林公园（英国阿伯福伊尔）的单一栽培种植园的机载激光扫描 (ALS) 数据集（每平方米 8.4 个点）（图 3(a)）。这些数据由英国自然环境研究委员会机载研究机构于 2014 年 8 月使用徕卡 ALS50 扫描仪收集。该地块种植于 1965 年，由黑松 (Pinus contorta Dougl.) 组成。树木参数，包括 45 棵树的位置和高度，在实地活动期间进行了调查。树的位置由树底部的全站仪测量，而高度则使用顶点测压计 [46] 测量。记录的平均树高为 16.18 米，标准偏差为 2.12 米。请注意，整个地块包含的树木要多得多，但仅测量了覆盖不同树木大小和密度的这个子集以进行验证。理想情况下，如果采用有效的树木勾画方法，只需对一小块地块进行地面测量以验证该方法并选择参数或配置，然后将其应用于整个区域而无需进一步调整参数。

除了合成数据之外，实验还使用了位于伊丽莎白女王森林公园(英国阿伯福伊尔)的单一种植林的机载激光扫描(ALS)数据集(每平方米8.4个点)(图3(a))。这些数据是由英国自然环境研究委员会机载研究设施在2014年8月使用徕卡ALS50扫描仪收集的。该地块种植于1965年，由黑松组成。).在实地调查期间，调查了树木参数，包括45棵树的位置和高度。通过全站仪在树的底部测量树的位置，同时使用顶点高度计测量树的高度[46]。记录的平均树高为16.18米，标准偏差为2.12米。请注意，整个地块包含更多的树木，但只测量了覆盖不同树木大小和密度的子集进行验证。理想情况下，给定一个有效的树木描绘方法，只需要对一小块地进行地面测量，以验证该方法并选择参数或配置，然后将其应用于整个区域，无需进一步调整参数。

图3。实验数据(单位为米)。(A)英国苏格兰阿伯福伊尔森林的一块土地。(b)来自国际基准的图B1。(c )根据国际基准描绘B2。红点代表地面测量的树顶

两个地块的最终数据（地块 B1 图 3b 和 B2 图 3c，每平方米约 8 个点）取自国际基准 [22]。它们都有混合物种，包括挪威云杉 (Picea abies L.)、欧洲赤松 (Pinus sylvestris L.)、绒毛桦 (Betula sp. L.) 和白杨 (Populus tremula L.)。地块 B1 主要由挪威云杉 (80%) 组成，平均树高为 16.8 m，标准差为 6.4 m。地块 B2 有大约 55% 的挪威云杉，平均树高为 16.1 m，标准差为 7.31 m。两个地块都有多个冠层，即主导、共同主导、中间和抑制。 ALS 数据是在 2004 年 6 月使用 Optech 2033 机载扫描仪收集的。使用地面激光扫描仪 (TLS) Faro LS880HE 收集现场测量值。树木的位置和高度是根据 TLS 数据手动测量的。

3.2. Methods

3.2.1. Pre-processing

树上的点的Z坐标还包含地形的海拔，当参数与树的高度相关时，地形的海拔会影响分割。常见的程序是相对于地面标准化高程。机载光探测和测距(lidar)数据的地面分类是一个经过充分研究的主题[47]，有专有和免费的开源软件可用于地面过滤。这里采用lastools(https://rapidlasso.com/lastools/)来识别地面点，这些地面点用于归一化其他点，以便树的底部处于零高度，并且Z坐标对应于树的高度。经过地面过滤后，可以在地面上观察到额外的点，这些点是由林下植被(如草或小灌木)产生的。由于这些点不是感兴趣的，并且会影响分割，因此应用1 m的缓冲区来过滤掉这些点，如Wang等人所建议的[22]。这个高度缓冲区可以根据所研究森林的垂直结构而变化。如果林下植被更高，更大的缓冲区可能更合适[28]。剩余的点被认为是在感兴趣的树上，并且将被分割。

3.2.2. Mean Shift Segmentation

均值偏移已广泛用于特征空间中的图像聚类，可以是多维的。本节将解释均值偏移对 3D 点云分割的不同适应。给定 n 个点 $\mathrm{x}_{\mathrm{i}}$ 的激光雷达数据， $\ldots, n$ 在 3D 空间中，均值偏移向量可以导出为多元核密度估计器的梯度，如下所示：

其中 g(−) 定义内核配置文件，h 是确定内核大小的带宽参数。向量 vh(x) 是加权平均值之间的差值，使用核作为权重，点 x 是核的中心，指向密度最大增加的方向，因此密度的模式可以通过用向量翻译内核（窗口）来迭代地达到。 [30,31] 可以参考更多细节。该算法已根据内核形状、大小和权重进行调整，以最适合树分割。

核形状：3D中最简单的核形状是球体[42]，它适应不同的形状以更好地分割树，例如圆柱体[24]。 Pollock 模型也被用作内核，因为该模型代表可以通过额外参数 [27] 调整的冠形。

该模型定义如下：

其中 x = (X, Y , Z) 相对于模型中心，a 是冠圆在 XY 平面上的半径，b 是沿 Z 轴的半径，m 是冠形参数。当m = 1时，模型是一个圆锥体，当m增加到2时，它变成一个椭球体。将测试这三种内核形状，球体，圆柱体和Pollock模型，以确定它们对树分割的影响。

内核大小：已经表明，可以使用不同的内核大小来分割不同大小和树冠不同层的树[24]，但内核大小的设置大多是基于反复试验的。 Cylinder 和 Pollock 模型内核分别具有两个沿水平轴和垂直轴的带宽/大小参数 (a, b)。最常见的是，两个带宽参数 b/a 之间的比率在移位过程中保持固定，并且只调整一个。另一种方法是根据树的高度调整内核大小，假设较高的树有利于较大的内核，而较短和较小的树有利于较小的内核。这种方法被称为连续自适应均值偏移（Camshift）[27]。在测试中，内核大小（带宽）在两个方面进行测试，即，（1）水平带宽的影响（a ∈ [2, 3, 4, 5, 6, 7, 8, 9]），以及两个带宽参数之间的比率 (b/a ∈ [1, 1.5, 2, 2.5, 3])，以及 (2) 内核是否连续适应树的高度（Y 或 N）。

内核权重：除了内核的形状之外，还可以对内核应用不同的加权策略，包括 XY 平面中的权重、Z 中的权重，或者只是没有任何权重的扁平内核。水平内核权重，例如高斯函数 [24]，将更多的权重放在中心点上，这意味着内核倾向于更少地移动，这将导致更多的孤立点作为独立的集群。垂直内核权重，例如内核中较高点的权重，将导致内核向上移动以收敛于树的顶部 [28]。 Pollock 核的垂直高度权重 $\frac{\mathrm{Z}-\mathrm{Z}_{\min }}{\mathrm{Z}_{\max }-\mathrm{Z}_{\min }}$ 和水平高斯权重的组合可以表示如下：

其中，对于 XY 中的正态分布权重，λ 设置为 0.5，对于仅在身高中的权重，λ 设置为 0。由于树的主导方向是沿垂直轴的，因此高度加权应有助于水平分离树。因此，它将与高斯权重和平核（无权重）进行比较，以测试其对分割的影响。

除了内核配置之外，在实现用于分割的均值偏移算法时，一种严格但耗时的做法是计算每个点的偏移。另一种做法是随机选择种子点来计算偏移。在移动过程中被内核覆盖的所有其他点将被分配与种子点相同的模式/簇。这两个实现也将进行速度和准确性评估测试。

3.2.3. Other Segmentation Methods

为了进行比较，还实施了 Dalponte 等人 [49] 的更新方法。考虑到相邻像素的垂直高度差，使用移动窗口来定位局部最大值，而不是使用分水岭，然后将其用作区域增长的“初始区域”。最终区域由凸包近似，并被视为树冠。此外，对[22]中的基准数据提出的基于点的方法进行了测试，以进行进一步比较。首先对点云进行体素化，并提出一些结构元素用于树顶检测，这些结构元素受基于树木形态特征的某些规则约束。

3.2.4. Tree Crown Parameter Extraction

四个树冠参数（位置、高度、最长树冠传播和最长树冠交叉传播）在每个研究的处理变体之后为分段树提取。可以简单地从最高点取高度 [26]。将从分割点中提取树冠位置以评估分割步骤。

识别树冠位置有两种主要策略。第一种是简单地将最高点的位置作为树的位置，这是基于树的顶部就是树所在的假设。当一棵树有明显的峰顶并且笔直直立时，这通常是正确的。第二种策略是在 2D 或 3D 中将几何形状拟合到牙冠上的点，这应该对异常值更稳健。为了识别树冠位置和传播，首先通过计算二维中所有树点周围的凸包来确定树冠底部。凸包上点的平均高度可以认为是冠高[27]。然后可以通过对这些点拟合椭圆来确定冠部位置、最长传播和最长交叉传播，其中椭圆中心是冠部位置，两个半轴代表两个冠部传播。本文将评估这两种策略，以研究冠参数提取对分割验证的影响。

3.3. Validation and Assessment Criteira

在实践中，通常通过检查分割树的位置来验证分割。这就是为什么还研究了树定位方法的影响。除了水平位置外，树木的高度也会受到分割的影响，尤其是当树冠是多层的或分割方法是 3D 时。因此，将从分段树冠中提取的树顶（由位置和高度组成）与地面测量值进行了比较。尽管分割是在点级别处理的，但验证是在对象级别进行的。

为了确定一棵树是过度分割还是分割不足，遵循 [22] 提出的标准。一般来说，如果从地面测量的树顶在 3D 中的某个范围（例如 2 m）内只有一个分段树顶，则该分段被认为是正确的（标记为匹配）。如果在此范围内有多个线段或没有线段，则树要么被过度分割，要么被分割不足。当所有被测试的树都具有 ground truth 时，例如在模拟数据中，精度、召回率和 F1-score 可以计算如下：

其中TP（True Positive）为匹配数，FP（False Positive）为评估范围内或评估范围外的过分割数，FN（False Negative）为欠分割数。

水平位置精度和高度精度由均方根误差 (RMSE) 评估，均方根误差分别根据检测到的树顶和地面测量值之间的水平和垂直距离计算得出。

4. Experiments and Results

4.1. Results of Simulated Data

进行了大量实验以测试均值漂移方法的不同配置和参数。由于参数设置有许多可能的组合，因此报告了产生更好结果的组合。模拟数据的分割结果如表 2 所示。球核的最终 F1 分数通常低于其他两种核形状，圆柱形和波洛克形。这两个内核的最佳结果都在 b/a = 2.5、高度加权、内核不自适应、带宽 a = 4 的配置下。一般来说，Pollock 模型内核在两者匹配方面产生了更好的结果（回忆一下) 和精度，导致更高的 F1 分数。根据测试，性能最好的 Pollock 模型冠参数为 1.5，无论其他参数的设置如何，这意味着该参数只需要测试一次。

表 2. 模拟数据在各种设置下使用均值漂移的树分割结果。测试了三种内核形状：球形、圆柱形和波洛克模型，通过改变水平带宽a、垂直带宽比b/a、XY、Z或None中的权重、自适应性（Y或N).列出了较高的匹配、过分割、欠分割、精度和 F1 分数的结果。每个内核的最高 F1 分数以粗体突出显示。

在树冠是否被椭圆定位的条件下，采用表现最好的内核 Cylinder3 和 Pollock4 提取树冠参数。此外，还提供了从其他比较方法生成的片段中提取的冠参数以供比较。结果如图 4 所示，其中真正的树顶标记为红色点，检测到的树顶为蓝色。可以看出，对于大多数树木，可以在附近找到检测到的树顶，同时使用 Cylinder 内核（图 4a）和 Pollock 内核（图 4b）。但是，很少有树木没有检测到附近的树顶。主要原因是模拟树的位置是随机的，在这种情况下，树之间的间隙可能比真实树图中的小得多。树冠缠绕在一起，因此很难分开。分水岭方法产生更糟糕的结果（图 4c），因为靠近的树木聚集在一起。当两种方法的核和搜索半径都设置得较小时，可以获得更高的匹配率（召回率），但这会导致更多的错误检测，从而降低 Precision 和最终的 F1-score。

图 4. 三种方法模拟数据的分割和树顶检测结果（以米为单位）：(a) Mean shift with Cylinder kernel； (b) 使用 Pollock 核的均值漂移； (c ) 标记控制的分水岭法。红色点表示真正的树顶，蓝色点表示检测到的树顶。

树冠参数提取结果如表 3 所示。当使用 Pollok 核通过顶点（而不是树冠拟合的椭圆中心）定位树冠时，实现了最高的匹配率和均值偏移精度。冠定位结果之间存在明显差异，最高点的位置更高。这是因为模拟的树模型是完全直立的，所以最高点就是真正的树顶所在的位置。树木位置的 RMSE (RMSE_xy) 的方差相当小，但树高的 RMSE (RMSE_h)，当位于拟合树冠中心时，与最高点相比更大，而树冠分布的 RMSE ( RMSE_l 和 RMSE_l’) 较小。这意味着那些额外匹配的树具有精确的树高估计，但树冠分布不太精确。比较的区域增长方法显示出最好的精度和召回（匹配），因此总体 F1 分数最高。位置和高度的差异具有相似的幅度，但树冠传播要差得多，因为它仅近似于平均树冠直径，这与最长的树冠传播不同。

表 3. 模拟数据的树顶检测结果。使用椭圆中心 (Center) 或顶点 (Top)，与分水岭 (Mk+WS)、区域增长 (RegGrow) 和基于体素的规则 (Vox + Relu）方法。最佳结果以粗体突出显示。检测到的树冠的位置、高度和蔓延的精度分别由 RMSE 表示

4.2. Results of Aberfoyle Forest

Aberfoyle 森林的树木分割结果如表 4 所示。请注意，地面测量的树木并未涵盖数据中的所有树木，只能确定匹配率（召回率）。因此，没有给出精度和 F1-Score。精度与错误检测有关，可以反映过度分割。 Cylinder 和 Pollock 内核都实现了最佳匹配率。 Sphere 内核产生的匹配率略低，但分割不足率也较低。 Cylinder 和 Pollock 内核在内核大小自适应高度的设置下都产生了相似的结果，无论是否对高度加权，这与模拟数据不同。所以重量对这个特定数据的影响不是很大，这可能是由于地面测量不太准确。请注意，带宽值也不同于我们对模拟数据的带宽值，因此应测试每个数据集的最佳设置。

表 4. Aberfoyle 森林在各种设置下使用均值漂移的树木分割结果。

同样，性能最佳的 Cylinder 和 Pollock 内核用于提取树冠参数。 Cylinder 和 Pollock 核的匹配率非常相似，但 Cylinder 核（图 5a）产生的树比 Pollock 核（图 5b）多得多。一些检测到的点彼此太近而不能成为单独的树，这是由于广泛的分支和分散的点造成的。分水岭方法（图 5c）产生的树木较少；可以看出，许多树梢没有被检测到。

图 5. 三种方法对 Aberfoyle 森林的分割和树顶检测结果（以米为单位）：(a) Mean shift with Cylinder kernel； (b) 使用 Pollock 核的均值漂移； © 标记控制分水岭法。红色点表示真正的树顶，蓝色点表示检测到的树顶。

从数量上看，如表 5 所示，当冠位于 Cylinder 和 Pollock 内核的拟合椭圆中心时，均值偏移实现了最高匹配率，这与模拟数据相矛盾。正如模拟数据所解释的那样，如果树木是单层的、完全笔直的并且噪音较少，则最高点能更好地代表树顶。对于真实的树图，这些条件不成立，因此树冠拟合给出了更好的结果。值得注意的是，ground truth 是在树底测量的，但真实的树木通常有一定的倾斜度，因此会影响树冠位置的评估。当冠居中时，过分割率和分割不足率也较低。在均值偏移模型中，树位置的最小 RMSE (RMSE_xy) 来自树冠居中时的 Pollock 内核，这也产生了较小的树高 RMSE (RMSE_h)。这同样适用于 Cylinder 内核。与其他方法相比，图 5c 中反映的最低匹配率是从分水岭方法中获得的。此外，与 Cylinder 内核和比较方法相比，Pollock 内核生成最低的冠价差 RMSE（RMSE_l 和 RMSE_l’）。

表 5. Aberfoyle 森林的树冠检测结果。与分水岭 (Mk+WS)、区域生长 (RegGrow) 和基于体素的规则 (Vox+Relu) 相比，最好的 Cylinder 和 Pollock 内核设置经过测试以使用椭圆中心 (Center) 或顶点 (Top) 提取冠部位置规则）方法。最佳结果以粗体突出显示。检测到的树顶的位置、高度和树冠分布的准确性分别由 RMSE 与ground truth相比显示。

4.3. Results of Benchmark Data

两个基准图（[22] 中的 B1 和 B2）的分割结果如表 6 所示。由于ground truth并未涵盖地块中的所有树木，因此只能确定匹配率（召回率）。因此，没有提供精度和 F1-Score。

表 6. 基准图在各种设置下使用均值偏移的树分割结果。

对于图 B1，当内核具有自适应性时，Sphere 内核产生与 Cylinder 内核相似的匹配结果。然而，当内核被设置为固定时，它们都被 Pollock 内核超越。对于图 B2，Sphere 核产生的匹配率与 Pollock 核一样好，优于 Cylinder 核。 Pollock 内核在非自适应（固定）情况下（例如对于模拟数据）对这两个图都表现最佳。请注意，为两个图生成更好结果的带宽值略有不同。尽管如此，表现最佳的 Pollock 内核具有相同的带宽、比率和适应性设置。 Z 中的加权对结果的影响不一致，因为与没有加权相比，匹配率会增加和减少。两个地块的 Pollock 模型树冠参数根据经验设置为 2。这意味着相同的参数设置可以应用于两个地块，这表明参数设置适用于其自己地块之外的更大区域。

图 6 描绘了分割结果和检测到的树顶（蓝点）以及ground truth（红点）。使用 Cylinder 和 Pollock 内核的均值偏移方法能够检测不同层的树顶。 Pollock 内核比 Cylinder 内核检测到更多的树顶，并且两个地块的匹配率更高，同时保持较低的过分割率。分水岭方法能够检测到一些优势树和大约一半的共同优势树，但不能检测到中间树或被抑制的树。它还显示出在数据边缘检测不到树木的趋势。最终检测到的树木数量甚至低于作为树木子集的地面实况。

在两种定位策略下，将树冠位置和高度与ground truth进行比较，以证明对树木分割评估的影响。最终的分割和验证结果如表 7 所示。以拟合椭圆为中心的树冠提高了两个图中两个内核的树冠匹配率。分水岭和区域生长方法的匹配率相当低，这是由于地块是多层的，而基于栅格的方法捕获较低层的能力较差。无论树冠是否局部化，均值偏移方法的位置 (RMSE_xy) 和高度 (RMSE_h) 的 RMSE 略有不同，它们通常优于两种基于栅格的方法。

表 7. 基准图的树顶检测结果。与分水岭 (Mk+WS) 和区域生长 (RegGrow) 方法相比，使用椭圆中心 (Center) 或顶点 (Top) 来测试最佳核设置以提取树冠。最佳结果以粗体突出显示。检测到的树顶的位置和高度的准确性分别通过与地面实况（RMSE_xy、RMSE_h）相比的均方根误差显示

图 6. 基准图的分割和树顶检测结果（前两行：图 B1，后两行：图 B2）来自三种方法（以米为单位）：（a，d）使用圆柱核的均值偏移； (b,e) 使用 Pollock 内核的均值偏移； (c,f) 标记控制的分水岭法。红色点表示真正的树顶，蓝色点表示检测到的树顶。

如 [22] 中所示，在基准数据上测试了更多的个体树描绘方法。与其他方法的比较如表 8 所示。均值偏移在图 B1 中表现最好，但在图 B2 中优于 FGI 方法。

表 8. 与 [22] 中的方法相比，基准图的均值偏移 (MS) 树检测结果。

4.4. Computing Costs

单个地块的计算时间并不显着，但对于具有更高激光雷达点密度的更大研究区域，计算时间可以成为选择分割方法时考虑的因素。Aberfoyle plot 用于测试分割速度，因为它具有最大的覆盖范围（106 m x 88 m），树木更多，点密度更高。记录了在每个点和随机种子点上使用固定和自适应内核进行迭代的均值偏移的计算成本。此外，还记录了分水岭和区域生长方法的计算时间以供比较。

表 9 显示了在 64 位笔记本电脑系统上使用 Intel Core i7-6700HQ CPU 在 MATLAB R2018a 中运行的均值偏移和分水岭的计算时间，以及在 R 中的区域增长。当内核设置为自适应时，时间加倍。此外，当为每个单独的点计算偏移时，成本大约高出八倍。使用不同的内核形状和权重时也存在细微差异，但与报告的设置相比可以忽略不计。选择随机种子点时，每次运行的分割结果都会有所不同。平均而言，匹配率比在每个点上计算的匹配率低 5% 到 10%。分水岭方法虽然产生最低的匹配结果，但明显快于均值漂移。区域增长方法的性能始终优于分水岭方法，并且花费的时间稍长，但仍然比均值漂移快得多。

表 9. 与分水岭和区域增长相比，当核对于随机种子点或每个点是固定的 (MS_fix) 或自适应的 (MS_adaptive) 时，均值偏移的计算时间（以秒为单位）。

5. Discussion

均值漂移算法在三个不同的机载激光雷达数据集上进行了测试。生成最佳结果的设置在数据中略有不同。然而，可以根据测试提出某些建议。

作为内核的 Pollock 模型为所有三个数据集产生了最好的结果。这证明了这样的假设，即整合冠形的内核将有助于冠分割。虽然还有一个参数需要调整，即冠形，但只需要在一个数据子集上测试一次，即使数据是混合物种。例如，对于基准数据，为同一森林中的两个地块设置了相同的树冠形状 (m = 2)。 Cylinder kernel 也为所有测试数据产生了良好的结果，类似于之前研究中展示的结果 [26,28]。有两个要测试的内核带宽参数（a 和 b），如果比率 (b/a) 是预定义的 [24]，它们可以减少到一个。球形内核是最简单的，但除了基准图 B2 之外，它产生的结果最差。鉴于 Cylinder 内核并不复杂，建议首先尝试直接使用 Cylinder。 Pollock 内核将是首选，因为它可以通过稍微多一些参数调整来获得更好的结果。

使内核适应树冠大小被认为是均值漂移的有效改进。但是，是否使内核连续自适应（例如树高）取决于结果所证明的数据。考虑到连续自适应会花费两倍的计算时间，而且不一定产生更好的结果，建议使用固定内核。这种适应性是基于较高的树木具有较大的树冠尺寸的假设，这对于混合物种森林可能并非如此。一种可能的改进是使内核适应个体树冠大小而不是高度。已经尝试从异速生长近似值 [26] 或冠检测 [42] 中提取冠尺寸的信息。在这两种情况下，内核都适应了额外步骤生成的目标冠尺寸。

在某些情况下，垂直方向的加权被证明是有益的，但并非总是如此。核中较高的点具有较高的权重，这有助于核向上移动，从而使移位可以收敛到树的顶部。本文将权重归一化为[0, 1]，因此最高点的权重为1，最低点的权重为0。可以设计其他类型的权重策略，例如[28]中的权重策略。水平面上的加权并没有像假设的那样改善结果，因此没有在表中列出。高斯函数对中心点附近的点（即均值）施加更大的权重，而对核边界附近的点施加更小的权重，因此如果中心区域之外的点不够多，核就不太可能发生偏移的内核。因此，在对每个特定数据实施之前，应进一步研究高度或 XY 平面的加权。

评估冠定位是因为冠顶用于验证分割结果。冠顶可以简单地由分段冠的最高点决定。但是树木的位置可能不准确，因为真实的树木通常不会完全笔直向上。另一种方法是用椭圆拟合分段的牙冠，并以椭圆中心作为牙冠位置。在这方面结果各不相同。当简单地使用最高点作为树顶时，模拟数据的结果显示出明显的优势，提供更好的分割结果和更低的 RMSE，而 Aberfoyle 数据的结果则相反，当用椭圆拟合树冠时，更好的分割结果和更低的 RMSE .这是因为第一个模拟数据是完全直立的树木，树冠几乎对称，而第二个模拟数据来自人工林，其中大多数树木自然倾斜，并且具有更多样化的树冠结构。基准数据在拟合树冠时也显示出更好的分割结果，因此建议对真实森林进行树冠检测树冠拟合。当冠位置的准确地面真实情况可用时，可以进一步评估定位精度本身，这可能很难通过现场测量或其他传感技术 [50]。

比较标记控制的分水岭方法在模拟数据上表现良好，精度特别高。同样，基于栅格的区域增长方法对模拟数据产生了最好的结果。然而，两种基于点的方法都优于两者。对于这样一个简单的单层图，基于栅格的方法有望获得良好的性能。然而，它显然难以处理更自然的数据，尤其是多层基准图。优点是它们非常快，因此对于结构不那么复杂的森林仍然值得尝试。尽管本文的重点是对 mean shift 方法本身的全面评估，但与其他基于栅格和点的方法的比较证明了这种评估的价值，因为 mean shift 能够产生有竞争力的结果。

ITD 的均值偏移分割还有其他可能的改进。例如，Pollock 模型冠参数可以根据先验知识或其他数据源的分类进行自适应。基于栅格的方法可以与均值偏移相结合，以近似估计树冠大小，然后将其输入内核。此外，可以采用分层方法，类似于 [28]，其中数据在两轮中通过均值偏移进行分割。第一轮将原始数据分割成看似合理的个体树。然后使用预训练的分类器来检测过度分割和欠分割的树，这些树通过第二轮均值偏移分割进行细化，并使用从分类中得出的适当参数设置。由于这些方法需要均值漂移算法以外的额外步骤，因此它们被认为超出了本文的范围，本文重点关注方法本身的评估。

6. Conclusions

本文对机载激光雷达数据中单个树木描绘的均值漂移算法进行了全面的性能评估。考虑的三个主要因素是内核形状、内核大小适应性和内核权重。他们在三个不同的数据集、一个模拟数据、一个英国森林数据和一个来自芬兰的基准数据中进行了评估。

结果表明，用作均值漂移核的 Pollock 模型可以改进分割，尽管有一些参数需要微调。另一方面，在其他研究中常用的 Cylinder 内核可以在保持简单性的同时产生良好的结果。连续自适应策略适用于某些数据，但由于冠结构的复杂性可能不可靠，同时也很耗时。建议针对不同的数据集测试高度加权，而应谨慎进行水平加权。最后，验证结果可能会受到地面实况质量的影响，因为无论是地面调查还是其他数据源都很难确定真正的树冠位置。

通过与标记控制分水岭和区域生长这两种基于栅格的方法进行比较，证明了均值漂移的有效性，这两种方法在单层数据上表现良好，并且速度非常快。在未来的工作中，将研究通过引入额外的步骤（例如集成基于点和基于栅格的方法）来进一步改进分割工作流程。

论文链接：https://www.mdpi.com/2072-4292/11/11/1263/pdf?version=1559037802

你可能感兴趣的:(3D实例分割,算法,树木分割,聚类)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring