fish小余儿

RetinaNet与点云聚类耦合的深度学习个体树分割方法研究

ABSTRACT

人类活动的增加对全球森林资源造成了严重干扰，如何准确识别单株树木已成为森林资源调查的重要任务。为了得到准确的个体树木数量，本文以针叶林和针阔混交林为实验样本，以数字正射影像图和机载激光雷达点云为研究数据。我们提出了一种基于RetinaNet模型和PCS算法的深度学习单树分割方法，通过在地块（具有高、中、低密度）进行比较分析（经典分水岭算法和层堆叠算法）。实验结果表明，本文提出的方法可以解决高密度森林中单棵树的分割问题，提高其自动化程度。与Watershed算法和Layer stacking算法相比，F-Measure分别提高了6%-29%和7%-20%。也就是说，本文提出的单棵树分割结果不仅可以提高单棵树分割的精度，而且可以保持较高的检测率，可以满足单棵树提取的准确性和高效率，从而满足现代林业调查的需要。

INDEX TERMS： 深度学习，单棵树分割，机载激光雷达，数字正射影像图，计算机图形学。

I. INTRODUCTION

森林作为最重要的自然资源之一，在人类的发展和生存中具有不可替代的作用。随着城市化和工业化的加速，森林资源的过度利用造成了森林生态系统的严重失衡，对全球碳循环产生了相当大的影响[1]。个体作为森林的基本单位，快速准确的获取树木信息可以为监测和管理森林资源提供有效的保障[2]。传统的单株木调查方法是手工进行的，劳动强度大、周期长、成本高，难以满足调查时效性的需要[3]。

机载激光雷达是一种新兴的主动遥感技术，具有非常高的距离分辨能力、抗干扰能力和树冠穿透能力，可以快速准确地获取多次回波信息，尤其是森林空间的三维坐标信息[4]。机载激光雷达在林业调查中的应用，可以获得森林面积的地形特征，以及树木的三维结构特征，如树高、冠层直径、冠层面积等，为森林生长提供数据支持模型和生物量估计[5]。因此，单棵树分割提出了一个基本步骤来准确估计树木的三维结构参数[6]。

现有的个体树分割方法可以分为两类。第一类是通过基于树冠高度模型(CHM)[7]的数字高程模型和数字表面模型获得的，以局部最大CHM中的最高点作为树顶，用于个体树分割。例如，分水岭算法[8]基于CHM进行个体树分割，具有移动窗口的最大值[9]和多级分割[10]。然而，在CHM变换过程中需要进行插值，这容易导致信息的丢失，因为CHM只能保留地表高程信息，从而覆盖低植被。导致一些小树无法准确提取，影响分割结果的准确性[11]，[12]。另一类是基于归一化的点云方法，通过计算海量的3D点云，对树顶点进行聚类。与CHM分割方法相比，这类方法不需要插值生成光栅图像，避免了单个树木信息在格式转换过程中的信息丢失，如K-means聚类[13]，点云分割(PCS)[14]和层堆叠算法[15]等。目前，随着计算机技术的飞速发展，它已经逐渐成为单株树木提取研究的主流[16]。然而，在密集复杂的森林环境中，通过上述方法进行的单木分割存在较多的过分割和欠分割现象[17]、[18]。

针对上述问题，Sun等[19]完善了K-means聚类算法，提高了单棵树分割的准确率，但效果并不明显。数字正射影像图（DOM），作为无人机遥感的产物，精度高，现状强，可广泛应用于测绘、林业等领域[20]。深度学习是近年来的研究热点，在图像特征提取和目标识别方面表现良好。其中，基于深度学习框架结合高分辨率多源遥感数据的目标检测已得到广泛应用[21]，如船舶检测[22]、建筑物选择[23]、汽车检测[24]等。

现有的单棵树分割方法如果遇到各种复杂的森林环境，很多都会涉及到复杂的参数设置，从而降低了方法的自动化程度。深度学习通过多层次的框架进行计算，结合高分辨率DOM可以大大提高准确性和自动化程度。在此基础上，本文提出了一种基于深度学习和点云聚类的单棵树分割方法，结合机载LiDAR点云和DOM，可以提取出准确的单棵树，为深入开发提供参考和帮助。林业调查领域的无人机遥感与深度学习方法研究。

本文的研究目标主要包括：（1）利用无人机采集机载LiDAR数据和DOM； (2) 用DOM训练深度学习检测模型，提取DOM中的树冠作为有效mask，提高DOM利用率；(3)结合机载雷达数据，采用局部最大值法计算mask内对应点云的最大高程作为初始树顶点，以减弱个别树过分割现象的发生； (4)用PCS算法从树的顶点开始迭代计算，提取个体树的分割和个体树的结构参数，对分割现象下的个体树进行优化，提高个体树分割的准确性；(5)评估本文提出的方法的单棵树分割性能，并将其与两种经典分割算法进行比较，包括分水岭算法和层堆叠算法。

II. MATERIALS AND METHODS

A. DATA

本文所用激光雷达数据于2020年6月在吉林省长春市获取。地理位置如图1所示，采用大疆无人机搭载R250机载激光运动测量系统进行测量，飞行高度为500m，飞行高度为500m。飞行速度120km/h，激光扫描视场角70°，单向覆盖面积750m2，相机视地覆盖范围500m×668m。

为保证方法的可靠性，选择针叶林、针阔混交林作为两个研究区，其中针叶林主要覆盖松树等树种，针阔混交林主要覆盖松树等树种。杨树和松树。机载激光雷达测量采集的数据包括点云数据、DOM数据（像素大小为0.1×0.1m）和测区惯性测量单元数据。

在研究区内，相应地布置了高密度、中密度和低密度三个样地，并在每个样地上设置了编号桩。在针叶林中，将样地按密度等级从低到高划分为样地1、样地2、样地3，然后以同样的方式对针阔混交林进行区划，将这些样地编号为样地图4、图5和图6。通过在每个样本字段中找出它们，验证了单个树分割数量的准确性。并且在每个样地中，通过激光测高仪测量了可以识别为编号的单棵树，以及每棵树的高度和冠层宽度。

图1. 研究地点。

B. METHODS AND ACCURACY

研究方法如图2所示。首先，无人机搭载机载LiDAR和摄像头采集现场数据，获取DOM和原始点云。然后，对点云进行过滤和归一化，得到归一化的点云。其次，利用深度学习中的RetinaNet模型检测DOM中的个体树冠，提取个体树冠的轮廓作为mask。之后，以树冠mask为初始树顶点，提取归一化点云的局部区域最大值，最后作为种子点，通过PCS算法进行单棵树的分割，得到相应的结果。

图 2. 建议方法的工作流程。

1）基于深度学习的DOM个体树检测

深度学习是机器学习的一个重要分支，强调从连续层学习[25]。分类[26]、检测[27]、分割[28]是计算机理解图像的三个层次。其中，分类是指将DOM的结构转化为树木的信息，分割是指对DOM的像素点的描述，检测侧重于树木的位置信息以及DOM中的类别信息。

RetinaNet是Facebook AI团队在2018年提出的一种新的单阶段目标检测工具，用于解决密集检测问题[29]。其结构如下图所示：

根据图3，ResNet[30]、特征金字塔网络（FPN）[31]和2个全卷积网络（FCN）[32]、[33]的组成，RetinaNet可以解决误分和漏分严重不平衡的问题在DOM个体树检测中，以改进的交叉熵Focal Loss作为损失函数。

在主干网络中，ResNet是基于卷积神经网络提取个体树的有效特征，FPN负责通过ResNet形成个体树的多尺度特征，其中对特征图集进行增强，得到多尺度区域信息。RetinaNet的最大优势在于它可以通过焦点损失消除交叉熵（CE）计算[34]。

公式（1）是一种传统的神经网络CE损失函数，在图形的检测和分类中得到了广泛的应用。

$\begin{cases}-\log (p) & y=1 \\ -\log (1-p) & \text { otherwise }\end{cases} \quad\quad\quad\quad(1)$

其中， $\in\{\pm 1\}$ 表示ground-truth；预测单个树样本的概率属于 1。简单来说，可以用 $p_t$ 代替 $p$ ，因此：
$p_t= \begin{cases}p & y=1 \\ 1-p & \text { otherwise }\end{cases} \quad\quad\quad\quad(2)$

为了消除个体树样本的不平衡选择，我们引入了权重因子 $\alpha$ ；同理，我们定义 $\alpha_t$ 如下：
$\alpha_t= \begin{cases}\alpha & y=1 \\ 1-\alpha & \text { otherwise }\end{cases} \quad\quad\quad\quad(3)$
定义 $\alpha_t$ 后，CE损失函数可写为：
$E\left(p_t\right)=-\alpha_t \log \left(p_t\right) \quad\quad\quad\quad(4)$
平衡CE可以解决单个树样本在一个阶段的错误分类和漏分类之间的不平衡，无法区分单个树样本检测的难易程度，因此模型在训练中可能会出错[35]。因此，我们引入了超参数 $\gamma$ 如下：

$L\left(p_t\right)=-\left(1-p_t\right)^\gamma \log \left(p_t\right) \quad \gamma \in(0, \quad 5) \quad\quad\quad\quad(5)$
式中，当 $p_t$ 接近1时，FL接近于0，因此，我们可以推测单个树样本可能是一个容易分类的样本，即损失的贡献值会更小。相反，如果 $p_t$ 接近0，FL接近1，这意味着损失的贡献值将保持不变（与CE相比），从而指导模型识别更复杂的个体树样本，有效提高模型的准确率检测单个树样本。

将公式（4）和（5）结合起来，得到 RetinaNet [36] 的最终损失函数如下：
$L\left(p_t\right)=-\alpha_t\left(1-p_t\right)^\gamma \log \left(p_t\right) \quad\quad\quad\quad(6)$
其中， $p_t$ 代表准确率， $t$ 代表平衡因子， $\gamma$ 代表焦点参数。

2）基于点云PCS算法的个体树分割

基于点云聚类，以树顶与归一化点云中的最高点之间的一定距离作为树顶点，进行距离的迭代计算[37]，进行单棵树的分割，原理如图所示图4。

PCS算法首先需要设置一个二维的欧式距离作为阈值，然后将归一化的点云从最高点到最低点进行分割。如果点云与目标树顶部的水平距离大于设定的阈值，则该点将被确定为另一棵树。反之，将确定到目标树。如图4所示，树1为目标树，A点为最高点。由于 $\mathrm{d}_{\mathrm{AB}}$ 大于设定的阈值，B被确定为树2的顶点。由于 $\mathrm{d}_{\mathrm{AC}}$ < 阈值 < $\mathrm{d}_{\mathrm{BC}}$ ，点C属于树1。因此，依次进行迭代计算，直到完成单独的树分割。

3) 准确度评估方法

为了评估本文提出的方法在森林单棵树分割中的表现，我们在统计中选择F-Measure值，并以准确率和检测的召回率作为评估指标对三种单棵树分割方法进行定量评估 [38]，公式表示如下：

$\text { Precision }=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FP}} \quad\quad\quad\quad(7)$

$\text { Recall }=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}} \quad\quad\quad\quad(8)$

$\mathrm{F}-\text { Measure }=2 \times \frac{\text { Precision } \times \text { Recall }}{\text { Precision }+\text { Recall }} \quad\quad\quad\quad(9)$

根据公式，真阳性（TP）是正确的个体树分割数；误报（FP）是单个树错过的点数；假阴性（FN）是单个树的过度分割次数，即错误分割； F-measure是准确率和召回率的加权平均值。 Precision表示单棵树提取的准确率，recall反映了所提方法的检测能力，F-measure表示单棵树分割的整体准确率。

表 1. 训练样本数据集信息。

图 4. PCS算法原理。

III. EXPERIMENTS AND ANALYSES

A. 实验设计

1) 建立模型和训练样本

该模型在Windows 10的PyTorch框架下运行，CPU为Inter-i9-9900K处理器，GPU为NVIDIA GTX 1080Ti，内存为16GB，通过Python编程训练和测试。

本文以单棵树为目标。由于研究区的杨树在高分辨率图像中具有两个不同的特征，因此将杨树根据其特征设置为T1和T2，对应的类值为11和22。松树为类别T，类别值为1，在正射影像图中标记树冠，即根据图像中树冠的特征，将目标范围连接到与图像边缘平行的表面上，进行深度学习。导出训练数据时，图片格式为JPG，块大小为256×256，stride X为128，stride Y为128，元数据格式为Pascal Visual Object Classes，旋转角度参数为30◦。为了提高训练模型的泛化能力和鲁棒性，选择水平旋转的样本来增加样本量。训练样本导出后的图像数据集信息如表1所示：

分区标记图像和标签以9:1的比例随机分为训练集和测试集。在分类中，根据复杂度（强度和尺度变化）将图像平均分配到训练集和测试集，以保证实验的有效性。非最大抑制和预测概率的阈值为0.1。

2) RETINANET 模型单棵树检测

训练样本和RetinaNet网络用于模型训练，RetinaNet训练参数如下图所示：

(a) 设置batch-size值为16，即每张训练图片为16。

(b) 设置 epochs 为 20，即应用于训练模型的数据集通过神经网络向前和向后传输 20 次。

(d) 设置比率设置为 (0.5, 1, 和 2)，表示矩形锚框。

(e) 采用 Resnet34 作为训练新模型的框架。预配置的神经网络，即训练模型网络的深度为34层。

通过上述参数训练目标检测模型，模型的损失函数如图5所示：

图 5. 损失函数模型。

图5(a)为单针阔叶林的检测模型损失函数，图5(b)为针阔混交林的检测模型损失函数。从图5可以看出，随着模型的不断学习过程，训练样本的损失函数是向下的，训练精度是向上的，说明我们的模型是一个全局优化过程。分别是前 100 个周期，因为 RetinaNet 模型在处理对象分类中的压倒性样本时表现出不兼容，因此其梯度主要由这些容易分类的样本决定。在训练中，神经网络遇到了一些受光学因素影响的批次样本，例如图像失真、变形或椒盐噪声等，破坏了模型的学习效率，导致回归损失函数值出现剧烈波动。针叶林模型经过50个周期，针阔混交林模型经过100个周期后，训练样本的准确率和损失收敛，拟合能力强，可以完成单棵树的DOM检测。

使用RetinaNet模型检测单个树DOM。通过随机选择部分检测结果，公式（7）用于评估准确性。结果如图6所示。

图6(a)显示了在针叶林中随机选取的验证样本，单木检测的精度为96%。图6 (b)显示了在针阔混交林中随机选择的验证样本，单木检测的精度为87%。基于深度学习的单株树检测算法具有较高的精度，但该方法主要基于计算机图形学中的技术。误分和漏分误差受光学因素的影响，如气溶胶、能见度和太阳入射角等，利用激光雷达获得的点云可以对其影响进行衰减。为此，本文提出了一种基于深度学习的DOM图像单木检测算法，结合PCS点云单木分割方法，提高单木分割的准确性。

3) PCS个体树分割

在深度学习的检测中，会出现错误分割，包括过分割和欠分割。针对过分割问题，对过滤后的点云进行归一化处理，以减弱地形对后续单木分割的影响。由于研究区域内的所有树木都高于2m，2m以下的点云被隔离，不参与后续的单棵树分割，这可以减少单棵树分割中过分割的发生。对于欠分割，PCS算法是用深度学习提取的树冠mask切割归一化的点云，得到树冠点云簇，计算每个点云簇的最大高度作为树顶点。以树木顶点间的最小2D欧氏距离为阈值，开始点云分割，获取单棵树的位置、树高和树冠直径。分割结果如图7所示。

B.结果分析

不同密度和树种的单木分割精度评价结果如表2所示。所有样本的平均准确率为90.5%，检测率的平均准确率为98%，表明该算法在提高准确率和检测率的前提下，具有较好的全检率。

表 2.不同物种和密度下个体树分割精度的深度学习模型评估。

图 7. 单个树分割的结果（a-针叶林、b-针叶和阔叶混交林）。

F-measure是一个相对平衡的精度指标。在低密度和高密度样地中，不同树种的总体精度相似。但在中密度样地中，针阔混交林的总体精度高于针叶林。AVE F-Measure是低密度样地96%、中密度样地94%、高密度样地93%的异地平均精度。因此，本文提出的方法可用于高精度的单木分割。

本文测试了两种常用的单棵树分割方法，即Watershed算法和Layer stacking算法，并以F-Measure作为评价指标对本文方法进行比较。分水岭算法是基于分水岭结构进行图像分割，以CHM为被水覆盖的自然地形。图像中每个像素的灰度值代表该点的高度，每个受局部极小值影响的区域称为集水盆地，每个盆地的边界称为分水岭。在每个最小区域的表面上开一个小孔，让水涌出并淹没周围的区域。那么每个受影响的最小区域就是图像中对应于同源盆地的区域。层堆叠算法是一种基于点云的个体树分割方法。将整层的森林点云以1 m的高度间隔切片，将每一层的树点云分开。然后，K-means 聚类方法是将每一层的点云聚类，形成一个堆叠图形。最后设置一个固定窗口，确定堆叠图中的局部最大值作为树的中心进行分割。由于这两种算法在单棵树分割时都需要设置阈值来减弱过分割和欠分割，避免陷入局部区域。分别计算了不同树种和密度下阈值为0.8～4.1的6个样地的结果。

图8显示了三种F-measures与单个树分割方法之间的样条表的比较，表明了不同阈值的Watershed算法和Layer stacking算法的平均精度。在针叶林（样地1∼3）和针阔混交林（样地4∼6）中，两种常用算法的分割精度随着阈值的变化而波动较大，其中分水岭算法达到了最优分割阈值为1.4时的精度，当阈值为1.7时，Layer stacking算法达到最优的单棵树分割精度。在平均准确率方面，所提方法的性能优于其他两种方法，论文中所有样本地块均高于0.9，最低和最高准确率分别为0.91和0.96，而另一论文中的两种方法只有0.14和0.92。随着森林结构复杂度的增加，三种方法的平均准确率下降。因此，在密集复杂的森林环境中，高精度的单棵树分割仍然是一项艰巨的挑战。

表3给出了不同分割算法和阈值下高密度针阔混交林样地6的精度、检出率和平均精度的具体值。表中，随着阈值的不断变化，Watershed算法和Layer stacking算法的准确率也在不断变化。在样地6中，当阈值为1.7时，分水岭算法取得了最优的分割效果，精度为0.88，检测率为0.96，平均精度为0.92。

图 8. 三种单独的树分割方法的平均准确度比较。

表 3 高密度针阔混交林不同阈值精度对比

Layer stacking算法的精度在阈值大于等于1.7后是稳定的，没有随着阈值的变化而变化。由于本文算法不受阈值影响，其准确率始终保持在90%以上。从以上数据分析可知，两种常见的单棵树分割算法由于阈值因素的影响，准确率不稳定。经过多次实验，发现两种算法的最高准确率（图8）也低于本文提出的算法，在研究领域具有较高的分割准确率。

在将提取的单木与野外调查数据匹配之后，参照提取的单木结构参数(树的高度和树冠直径)来评估精度。在实验中，来自样地1至6的正确检测的个体树用于参与计算，换句话说，具有遗漏或错误分类点的个体树将不参与精度分析。提取的单木结构参数统计结果如下:树高和冠幅的估计值与实测地面值的平均相对误差分别为1.97%和1.01%，均方根误差(RMSE)分别为0.452m和0.4052m。线性回归方程用于拟合数据集。图9(a)显示了实地估计和测量高度的散点图。图9(b)显示了田间估计和测量的冠层直径的散点图。经计算，概率检验的P值小于0.01，因此相关 $\mathrm{R}^2$ 可以作为树高和冠幅的精度指标。对于估计的树高， $\mathrm{R}^2$ =0.9742，线性回归的斜率接近1，具有较高的拟合效果。对于估算的树冠直径， $\mathrm{R}^2$ =0.9329，相关性强，精度高。

表 4. 各种方法与最佳阈值的准确性比较。

图 9. 单个树参数的参数散点图。

IV. DISCUSSION

以DOM和LiDAR点云作为研究数据，结合RetinaNet检测模型和深度学习中的PCS算法作为单棵树的分割方法，有别于现有的单棵树分割方法，包括分水岭算法和层堆叠算法。分水岭算法可以将点云转化为带有灰度信息的CHM，CHM中不同的灰度值用来表示高程信息。单个树的分割是通过数学形态学[39]进行的。然而，分水岭算法仅限于冠层形状规则的树种，在塔形或伞形树冠分割中表现良好。另外，点云变换的CHM需要插值，在CHM中可能会出现图像噪声和信息丢失，导致单棵树的过分割和欠分割，需要高斯滤波器通过设置最优阈值来平滑CHM。从而提高了分割的精度。通过深度学习中的检测模型对DOM进行检测，避免点云变换的CHM信息缺失。

层堆叠算法采用自上而下的区域增长聚类方法。通过分析点云的空间分布特征，找到树的顶点作为种子点，结合多种距离阈值进行迭代计算，实现树的个体分割。然而，Layer stacking算法很难处理高密度的森林。例如，具有紧密分布的树冠的两棵高度相似的树可能被错误地识别为一棵树，导致单个树分割不足。此外，具有许多分支的大树可能会被错误地检测为多棵树，从而导致过度分割[40]。通过激光雷达点云和DOM的相互验证，采用RetinaNet模型的思路，避免了不断切换阈值的过程，大大提高了算法的自动化程度。

表 4 给出了分水岭算法和层堆叠算法在最优阈值条件下与本文算法的分割精度对比结果。与其他两种算法相比，该算法在低密度样本中的精度提高了4%-23%，检测率提高了4%-15%，平均准确率提高了7%-18%。在中等密度地块中，精度和检出率分别提高了6%-39%和0-29%。在高密度样品中，精密度、检出率和平均准确率分别提高了6%-13%、6%-32%和10%-22%。在样图3中发现，本文算法的精度低于Layer stacking算法，因为Layer stacking计算的检测率只有0.68，即在100棵树的情况下，Layer stacking算法只能检测到68棵树，68棵树中有94%被正确检测。然而，所提出的算法检测到96棵树，正确率为88%。因此，Layer stacking算法在牺牲检测率的情况下提高了精度，而提出的算法在保持高检测率的情况下具有较高的精度。基于分割后的单棵树点云，提取森林三维结构参数的树高和冠层直径，结合实测数据进行精度分析。树木高度与冠层直径的相关性R2均大于90%，具有较高的精度，满足了现代林业对森林结构参数调查的需要。

适当的数据处理方法可以提高单棵树分割的准确性。根据得到的单棵树分割结果，可以进一步计算和提取其他森林结构参数，如森林冠层密度、叶面积指数和森林蓄积量[41]。此外，利用机载激光雷达数据与多源遥感数据相结合，提取森林结构参数，可以进一步提高森林参数结果的准确性，也是一个重要的研究方向。本研究主要研究针阔混交林，主要包括松树和杨树树种。在高分辨率遥感影像中，树冠形状比较规则。我们通过该算法提取了大部分个体树，但仍然存在一些欠分割和过度分割（DOM和LiDAR点云无法检测到与高冠层完全重叠的低冠层）。因此，如何准确提取此类具有高冠层重叠的单棵树将是未来的研究热点。

V. CONCLUSION

为了提高单株树木分割的准确率，我们提出了一种基于RetinaNet模型和PCS算法的深度学习单株树木分割方法:首先，采用RetinaNet模型检测DOM中的单株树木树冠作为mask；其次，采用mask对LiDAR点云进行聚类，通过局部区域最大化的方法获得每棵树树冠的最大高程点作为单株树的初始种子点；最后，以种子点为指导，用PCS算法进行单木分割。我们利用不同森林环境下的6块样地进行精度分析，得出以下结论:

(1)研究了低、中、高三种样地密度下的单木分割精度。获得了较高的准确率(总体准确率> 90%)和检测率(总体召回率> 95%)。原因是高分辨率的DOM (0.1 × 0.1m)具有丰富的空间信息，与LiDAR点云的三维空间特征互补，在单木分割中具有更高的精度和更高的检出率。

(2)由于RetinaNet模型只需在研究区域内选取训练样本即可获得高精度的检测结果，不需要随着森林密度的变化设置各种阈值，从而大大提高了单木分割的自动化程度。

(3)本文提出的方法实现了高精度的单木分割，解决了高密度森林环境下郁闭度分布的分割问题，降低了欠分割和过分割的发生频率。

论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9535121

REFERENCES

[1] W. Chen, X. Hu, W. Chen, Y . Hong, and M. Yang, ‘‘Airborne LiDAR remote sensing for individual tree forest inventory using trunk detectionaided mean shift clustering techniques,’’ Remote Sens., vol. 10, no. 7, p. Jul. 2018.

[2] S. Xu, N. Ye, S. Xu, and F. Zhu, ‘‘A supervoxel approach to the segmentation of individual trees from LiDAR point clouds,’’ Remote Sens. Lett., vol. 9, no. 6, pp. 515–523, 2018.

[3] X. Chen, K. Jiang, Y . Zhu, X. Wang, and T. Y un, ‘‘Individual tree crown segmentation directly from UAV-borne LiDAR data using the PointNet of deep learning,’’ Forests, vol. 12, no. 2, p. Jan. 2021.

[4] P . Wang, Y . Q. Xing, C. Wang, and X. H. Xing, ‘‘A graph cut-based approach for individual tree detection using airborne LiDAR data,’’ J. Univ.Chin. Acad. Sci., vol. 36, no. 3, pp. 385–391, 2019.

[5] E. Næsset, ‘‘Predicting forest stand characteristics with airborne scanning laser using a practical two-stage procedure and field data,’’ Remote Sens.Environ., vol. 80, no. 1, pp. 88–99, 2002.

[6] W. Dai, B. Yang, Z. Dong, and A. Shaker, ‘‘A new method for 3D individual tree extraction using multispectral airborne LiDAR point clouds,’’ ISPRS J. Photogramm. Remote Sens., vol. 144, pp. Oct. 2018.

[7] J. Hyyppa, O. Kelle, M. Lehikoinen, and M. Inkinen, ‘‘A segmentationbased method to retrieve stem volume estimates from 3-D tree height models produced by laser scanners,’’ IEEE Trans. Geosci. Remote Sens., vol. 39, no. 5, pp. May 2001.

[8] M. Q. Zhao, ‘‘Research on image segmentation algorithm based on watershed algorithm,’’ M.S. thesis, Xi’an Univ. Posts Telecommun., 2020.

[9] X. S. Liu, J. W. Huang, and H. B. Ju, ‘‘Research progress in the methods and applications of individual tree crown’s automatic extraction by high spatial resolution remote sensing,’’ J. Zhejiang F orestry College, vol. 27, no. 1, pp. 126–133, 2010.

[10] N. Wang, J. Min, J. L. Guo, and N. He, ‘‘On the remote sensing classification of tree species based on multi-scale feature transfer learning,’’ J. Ezhou Univ., vol. 28, no. 2, pp. 93–97, 2021.

[11] W. J. Li, R. R. Wang, W. Shi, and T. T. Su, ‘‘Crown extraction method of individual tree based on multi-spectral image of UA V ,’’ J. Fujian Agricult.Forestry Univ. Natural Sci. Ed., vol. 49, no. 5, pp. 639–645, 2020.

[12] F. Z. Liu, H. Liu, and T. Y un, ‘‘Individual tree crown separation using the improved watershed method,’’ J. F orestry Eng., vol. 5, no. 5, pp. 109–116, 2020.

[13] L. N. Huo and X. L. Zhang, ‘‘Individual tree information extraction and accuracy evaluation based on airborne LiDAR point cloud by multilayer clustering method,’’ Scientia Silvae Sinicae, vol. 57, no. 1, pp. 85–94, 2021.

[14] L. Jing, B. Hu, J. Li, and T. Noland, ‘‘Automated delineation of individual tree crowns from LiDAR data by multi-scale analysis and segmentation,’’ Photogramm. Eng. Remote Sens., vol. 78, no. 12, pp. 1275–1284, 2012.

[15] E. Ayrey, S. Fraver, J. A. Kershaw, Jr., L. S. Kenefic, D. Hayes, A. R. Weiskittel, and B. E. Roth, ‘‘Layer stacking: A novel algorithm for individual forest tree segmentation from LiDAR point clouds,’’ Can. J.Remote Sens., vol. 43, no. 1, pp. 16–27, 2017.

[16] Z. Y . Li, Q. W. Liu, and Y . Pang, ‘‘Review on forest parameters inversion using LiDAR,’’ Nat. Remote Sens. Bull., vol. 20, no. 5, pp. 1138–1150, 2016.

[17] P . H. Li, X. Shen, J. S. Dai, and L. Cao, ‘‘Comparisons and accuracy assessments of LiDAR-based tree segmentation approaches in planted forests,’’ Scientia Silvae Sinicae, vol. 54, no. 12, pp. 127–136, 2018.

[18] Y . Lin, H. W. Ji, and Q. Ye, ‘‘Research on method of extracting single tree characteristics from LiDAR point,’’ Comput. Meas. Control, vol. 25, no. 6, pp. 142–147, 2017.

[19] G. Sun, Y . Xin, and C. Yan, ‘‘Estimating single tree height based on improved K-means algorithm,’’ F orest Eng., vol. 35, no. 6, pp. 31–35, 2019.

[20] H. M. Zhang, ‘‘Application and practice of digital orthophoto map,’’ Jiangxi Cehui, no. 3, pp. 53–54, 2015.

[21] C. X. Gao and N. Sang, ‘‘Deep learning for object detection in remote sensing image,’’ Bull. Surveying Mapping, no. S1, pp. 108–111, 2014.

[22] P . Y . Shao, X. Q. Lv, P . P . Huang, W. Xu, and Y . F. Dong, ‘‘Research on the robustness of SAR image ship detection algorithms based on deep learning,’’ in Proc. China High Resolution Earth Observ. Conf., 2020, p. 18.

[23] P . P . Zhu, S. P . Li, L. Q. Zhang, and Y . Li, ‘‘Multitask learning-based building extraction from high-resolution remote sensing images,’’ J. GeoInf. Sci., vol. 23, no. 3, pp. 514–523, 2021.

[24] J. J. Lie, L. Guo, Z. H. Liang, Y . Li, and Z. T. Su, ‘‘UA V image vehicle detection based on RetinaNet model,’’ China Sci. Technol. Achievements, vol. 20, no. 20, pp. 49–50, 2019.

[25] K. X. Chen, Z. L. Zhu, X. M. Deng, C. X. Ma, and H. A. Wang, ‘‘Deep learning for multi-scale object detection: A survey,’’ J. Softw., vol. 32, no. 4, pp. 1201–1227, 2021.

[26] Y . L. Wan, X. W. Zhong, H. Liu, and Y . R. Qian, ‘‘Survey of application of convolutional neural network in classification of hyperspectral images,’’ Comput. Eng. Appl., vol. 57, no. 4, pp. 1–10, 2021.

[27] Y . L. Yang, H. Huang, Y . M. Hu, D. Z. Wang, and Y . B. Li, ‘‘Automatic detection method of road diseases based on LeNet convolutional neural network,’’ Internet Things Technol., vol. 11, no. 1, pp. 47–50, 2021.

[28] P . Huang, Q. Zheng, and C. Liang, ‘‘Overview of image segmentation methods,’’ J. Wuhan Univ. Natural Sci. Ed., vol. 66, no. 6, pp. 519–531, 2020.

[29] T.-Y . Lin, P . Goyal, R. Girshick, K. He, and P . Dollar, ‘‘Focal loss for dense object detection,’’ IEEE Trans. Pattern Anal. Mach. Intell., vol. 42, no. 2, pp. Feb. 2020.

[30] Y . Zhang, Z. M. Zhao, X. Y . Wang, H. Q. Feng, and J. Lin, ‘‘Construction of green tea recognition model based on ResNet convolutional neural network,’’ J. Tea Sci., vol. 41, no. 2, pp. 261–271, 2021.

[31] T. N. Quang, S. Lee, and B. C. Song, ‘‘Object detection using improved bidirectional feature pyramid network,’’ Electronics, vol. 10, no. 6, p. Mar. 2021.

[32] P . Yang, G. Zhang, L. Wang, L. Xu, Q. Deng, and M.-H. Yang, ‘‘A partaware multi-scale fully convolutional network for pedestrian detection,’’ IEEE Trans. Intell. Transp. Syst., vol. 22, no. 2, pp. Feb. 2021.

[33] Q. Yao, J. L. Gu, J. Lv, L. J. Guo, J. Tang, B. J. Yang, and W. G. Xu, ‘‘Automatic detection model for pest damage symptoms on rice canopy based on improved RetinaNet,’’ Trans. Chin. Soc. Agricult. Eng., vol. 36, no. 15, pp. 182–188, 2020.

[34] G. W. Liu, C. X. hang, B. Li, Y . Yang, and W. S. Zhang, ‘‘Detection of birds’ nest in catenary based on improved RetinaNet model,’’ J. Data Acquisition Process., vol. 35, no. 3, pp. 563–571, 2020.

[35] X. T. Deng, T. Y . Cao, Z. Fang, and Y . F. Zheng, ‘‘Research on detection of people with camouflage pattern via improving RetinaNet,’’ Comput. Eng.Appl., vol. 57, no. 5, pp. 190–196, 2021.

[36] Z. L. Tan and X. C. Chen, ‘‘Application research of RetinaNet image recognition technology in coal mine target monitoring,’’ Mining Saf. Environ.Protection, vol. 47, no. 5, pp. 65–70, 2020.

[37] Q. L. Yang, ‘‘Comparison of airborne LiDAR single wood segmentation methods and analysis of influencing factors,’’ M.S. thesis, Xinjiang Univ., Ürümqi, China, 2018.

[38] C. C. Chen, X. Li, and H. Y. Huang, ‘‘3D segmentation of individual tree canopy in forest nursery based on drone image-matching point cloud,’’ Trans. Chin. Soc. Agricult. Machinery, vol. 49, no. 2, pp. 149–155, 2018.

[39] L. Geng, M. Z. Li, W. Y . Fan, and B. Wang, ‘‘Individual tree structure parameters and effective crown of the stand extraction base on airborn LiDAR data,’’ Scientia Silvae Sinicae, vol. 54, no. 7, pp. 62–72, 2018.

[40] C. Y . Zhao, Y . Q. Xing, D. Huo, Y . T. Jiao, and H. T. Y ou, ‘‘Key technologies of three-dimensional geometric reconstruction of larch crown shape based on LiDAR data,’’ J. Northwest F orestry Univ., vol. 30, no. 2, pp. 186–190, 2015.

[41] J. J. Liu, ‘‘Individual tree recognition and individual tree structure parameters extraction based on UA V imagery,’’ M.S. thesis, Zhejiang A&F Univ., Hangzhou, China, 2020. Accessed: Apr. 26, 2021.

你可能感兴趣的:(3D实例分割,深度学习,聚类,人工智能,实例分割)

景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
Echarts map3D 禁止鼠标滚轮缩放程序媛小白白 javascript 前端 vue echarts
Echartstype为map3D在使用时发现会存在鼠标滚轮缩放的情况zoomSensitivity属性本质上是是否开启map3D的缩放和平移所以也可以禁止鼠标滚轮缩放的情况zoomSensitivity:false,//是否开启缩放和平移/鼠标滑动缩放禁止禁用这个属性就可以实现map3D禁止鼠标滚轮缩放的需求了
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
echarts map3D区域颜色单独设置浪漫不敌风月 echarts echarts 前端 3d
效果图：实现：用的是map3D，之前试了下geo3d因为版本问题不好控制（地图上字体颜色都没法设置）只需要在series的data中加上你要标色的区域名称和颜色即可。此效果实现的是无图例着色。series:[{type:"map3D",//系列类型name:"map3D",//系列名称map:"yuhang",//地图类型。data:[{name:"鸬鸟镇",itemStyle:{color:"#
【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
Roblox 开源 AI 3D 生成模型，游戏开发迎来智能化变革 Yvette-W IT职业圈人工智能 3d 游戏
如果说过去的3D游戏开发需要建模师一笔一划地雕刻细节，如今AI的加入正在彻底改变这一模式。Roblox最新发布的3D生成AI模型——Cube，允许开发者用简单的文本指令，快速生成3D物体。更重要的是，Roblox还开放了Cube的开源版本，这意味着不仅Roblox开发者，任何游戏开发团队甚至个人创作者，都可以利用这项技术来提升创作效率。这一突破不仅能让游戏开发变得更快、更简单，也让AI在3D生成领
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
WHAM 人体3d重建部署笔记 AI算法网奇深度学习宝典 3d 笔记
目录依赖项：mmpose的依赖项：demo脚本WHAM:ReconstructingWorld-groundedHumanswithAccurate3DMotion2024依赖项：pipinstallmmposemmpose的依赖项：mmcv>=2.0.0,=3.0.0,=0.4.0,<1.0.0demo脚本Youcantrywithoneexamplarvideo:pythondemo.py--
C++和标准库速成(十一)——简单雇员系统梦醒沉醉 C++20 c++
目录1.雇员记录系统2.Employee类2.1Employee模块接口文件2.1.1实现细节2.1.2完整代码2.2Employ模块实现文件2.2.1实现细节2.2.2完整代码2.3Employee测试文件3.Database类3.1Database模块接口文件3.1.1实现细节3.1.2完整代码3.2Database模块实现文件3.2.1实现细节3.2.2完整代码3.3Database测试文件
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
CAD二次开发踩过的坑我的sun&shine CAD二次开发 c++
CAD二次开发踩过的坑CAD二次开发踩过的坑一、3D图形编译不过二、智能指针三、多文档操作规范流程四、CAD系统变量（参数）大全五、细节注意CAD图纸在软件中出现许多连接线线怎么关闭C++try无法展开无调试信息：重新生成变量已被优化掉,因而不可用两个列表中选中第一个再选第二个时第一个的选中见了预览时无法找到k3DDrawing无法缩放：静态框的通知打开intersectWith无法求交点对话框老
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL