fish小余儿

Deep learning based segmentation for automated training of apple trees on trellis wires

ABSTRACT

由于其果实产量和质量高，以及在修剪和收获过程中适用于机器人操作，格子式结果墙培训系统正在成为现代苹果园的标准配置。在美国 PNW 地区将幼小的苹果树训练成格架训练树冠系统的常见做法是，人工选择树枝，然后将其绑在 6 或 7 层的水平格架线上。由于熟练劳动力的减少和劳动力成本的迅速增加，对苹果树进行这些现代果园建筑的人工培训变得越来越具有挑战性，因此使用传感和机器人技术的自动化培训可能是一种替代解决方案。分割树干、树枝和网格线是自动化树训练操作的关键步骤。在这项研究中，开发了一种基于深度学习的语义分割方法来自动执行此分割任务。使用 Kinect V2 传感器获取目标树木的 RGB 和点云数据。然后使用简单和前景 RGB 图像来训练基于卷积神经网络 (CNN) 的分割网络 (SegNet)，以分割主干、分支和格子线。具有一些共同特征的树干和树枝相互分割，简单 RGB 图像的精度分别为 0.82 和 0.89，前景 RGB 图像的精度分别为 0.91 和 0.92。类似地，具有与树干和树枝截然不同的特征的网格线在简单和前景 RGB 图像中的分割精度分别为 0.92 和 0.97。获得的结果表明，与简单 RGB 图像相比，所开发的语义分割技术在前景 RGB 图像上的性能更好。在前景-RGB 图像中识别分割区域边界的准确度（由边界-F1 分数表示）对于主干、分支和网格线分别为 0.93、0.89 和 0.91。这些结果显示了采用基于深度学习的语义分割在果园环境中自动化苹果树训练的巨大潜力。

1. Introduction

图 1. 苹果树训练过程示意图；未经训练的树 (a) 被手动训练为正式架构 (b)；而 © 描述了经过训练的树到格子结构的示例（红线代表格子线）。（为了解释这个图例中对颜色的引用，读者可以参考本文的网络版本。）

华盛顿州是美国新鲜市场苹果产量的主要州，占全国产量的 60% 以上（USDANASS，2017）。与传统果园相比，现代棚架苹果园通常具有提高产量和果实品质的潜力。树木训练操作的目的是用矮树创建所需的狭窄树冠结构，同时也为这些树木提供强大的支持（如果没有格子系统的支持，树木将无法容纳其上种植的水果数量）。因此，培训操作有助于改善通过树冠的光线拦截和空气流动，从而提高产量和果实质量。因此，这种训练有素的狭窄果园系统提供更简单的树冠，可以促进更高的劳动效率，更容易进行机械化或机器人操作，并带来更高的盈利能力（Weber，2000 年；Whiting，2018 年）。树训练是创建这种树结构的基本操作之一，它需要在不同的生长阶段将选定的分支水平连接到网格线（图 1）。一个典型的过程包括两个主要步骤：（i）根据果园工人的经验选择靠近网格线的分支（根据分支基部直径及其相对于网格线的位置，图 1a）； (ii) 抓住选定的树枝并将它们绑在网格线上（图 1b）。由于这种树木培训程序目前由半熟练工人手动执行，因此该操作劳动强度大且成本高。在过去十年中，尤其是在过去几年中，商业果园主越来越难以获得足够的劳动力来完成这项任务，这表明特种作物生产的劳动力总体短缺（Brady 等人，2016 年）。为了保持苹果（和其他果树）产业的可持续发展，必须通过采用创新的机器人解决方案来实现树木培训等劳动密集型田间作业的自动化（Hertz 和 Zahniser，2013 年）。

1.1. Related work

近年来，关于收割等农田作业自动化的各种研究已经发表（Baeten 等人，2008 年；Bulanon 和 Kataoka，2010 年；Ji 等人，2012 年；Amatya 等人，2016 年；Silwal 等人，2017 年；Fu 等人al, 2019) 和修剪（Elfiky 等人，2015 年；Karkee 和 Adhikari，2015 年；Chattopadhyay 等人，2016 年；Akbar 等人，2016 年；Schupp 等人，2017 年；He 和 Schupp，2018 年）。大多数这些系统使用基于机器视觉的技术来识别目标树冠对象（例如苹果、树枝）以进行自动化操作。例如，Karkee 等人 (2014) 为机器人修剪重建了苹果树的 3D 骨架； Wu 等人 (2014) 使用条带编程重建了山核桃树的 3D 结构； Elfiky 等人（2015）使用基于骨骼估计的树木几何特征进行机器人修剪；和 Amatya 等人 (2016) 使用贝叶斯分类器确定了樱桃树的树枝，用于自动收获樱桃。同样，在机器人训练中，树干和树枝的分割和识别是迈向自动化操作的第一步。除了树枝和树干的分割之外，为训练而系在树枝上的格子线的分割也很重要。因此，苹果树和格子线的树干和树枝的分割对于映射所有树枝至关重要和树冠中的格子线，选择所需的树枝与格子线捆绑/训练，并提供自动树训练操作所需的 3D 位置信息。

上述关于检测/分割果树树枝的研究通常使用传统的机器视觉技术，由于环境和树冠条件的显着变化，特别是由于光照变化和背景物体的存在，这些技术在野外条件下的应用往往受到限制（Amara 等等人，2017 年）。很少有研究试图通过使用行间平台（隐藏背景物体）和人造光来克服这些挑战。例如，Botterill 等人 (2017) 为修剪机器人使用了行间平台和人造光。使用跨行平台和人造光本身就具有挑战性，这限制了许多机器人/自动化农业作业在商业果园中的使用。或者，低成本 RGB-D（红、绿、蓝和深度）相机的可用性使得使用深度信息过滤掉背景物体成为可能，从而避免了对空中平台和人造光的需求。关于使用 RGB-D 相机准确检测水果的研究已有报道（Nguyen 等人，2016 年；Tao 和 Zhou，2017 年；Perez 等人，2017 年；Gan 等人，2018 年；Gené-Mola 等人，2019 年；Lin 等人, 2019 年；Yu 等人，2019 年）和植物表型应用（Chéné 等人，2012 年；Zhang 和 Grift，2012 年；Hoffmeister 等人，2016 年；Santos 和 Rodrigues，2016 年；Narvaez 等人，2017 年；Mack 等人， 2018 年；以及 Milella 等人，2019 年）。尽管深度信息的使用消除了对用于背景抑制的跨行平台的需求，但对不同光照条件的敏感性以检测所需物体仍然是一个挑战。在这种多变的照明条件下，使用传统的机器视觉技术从所需对象中对对象进行子分类/分类，其检测/分割精度仍然受到很大限制。这个问题要求有必要使用 RGB-D 信息以及最先进的机器视觉技术（例如深度学习），以便在实际条件下成功进行自动化/机器人操作。

近年来，人工智能（包括基于深度学习的对象检测和分类技术）已被证明可以提高识别室内和室外环境中对象的鲁棒性和准确性（Girshick 等人，2014 年；Makantasis 等人，2015 年；Noh等人，2015 年）。目标检测和分类技术在农业应用中的性能受到可变环境条件的限制。基于深度学习的技术可以解决这些局限性，并且由于其高稳健性和准确性而优于传统的图像处理技术（Kamilaris 和 Prenafeta-Boldú，2018 年）。在农业中，深度学习技术在检测水果和树枝方面的应用很少见（Sa 等人，2016 年；Bargoti 和 Underwood，2017 年；Chen 等人，2017 年；Rahnemoonfar 和 Sheppard，2017 年；Liu 等人，2019 年）。Botterill 等人 (2017) 使用三角特征匹配算法 3D 重建葡萄树冠层，并使用人工智能网络在受控照明条件下（使用人造光）决定修剪的分支，并固定背景，这限制了其在实时现场条件。 Zhang 等人 (2018) 检测到已经使用 R-CNN（基于区域的卷积神经网络）在果壁结构中训练过的苹果树枝，该网络后来用于开发自动振动收割机。该技术对未经训练的树缺乏适用性，由于树的结构更加复杂和多变，这对检测和分类提出了更多挑战。此外，他们的技术在检测分支段以获得树的完整结构后需要额外的处理步骤，例如曲线拟合。在这项工作中，除了分支和主干部分之外，还需要分割出格子线。

基于卷积神经网络 (CNN) 的 SegNet 专为语义分割而设计，可以根据图像的形状、外观和空间关系区分图像中存在的不同像素类别，以实现准确的对象分割（Badrinarayanan 等人，2017 年）。与其他深度学习方法相比，语义分割的这一特征使其更强大，可以根据空间准确地分割出图像中外观不同的区域（例如树干/树枝与格子线）以及外观相似的区域关系（主干与分支）。除了分割区域，语义分割还保留了图像场景的边界信息，有助于减少实时应用的图像后处理，例如从树枝到格子线的机器人训练。在之前的一项研究中，作者开发了一种基于 CNN 的算法来分割未经训练的树的树干和树枝（Majeed 等人，2018 年）。然而，网格线的分割比分割树干和树枝更具挑战性，需要更多的图像来训练网络（Kamilaris 和 Prenafeta-Boldú，2018）。与其他类别（主干和分支）相比，网格线非常细，导致此类像素数量明显减少。在这种类别分布不均匀的情况下，分割精度很容易受到主导类别的影响（Badrinarayanan 等人，2017）。 Madaan 等人 (2017) 综合生成了大量图像（67、702 张图像）来分割用于飞行器自主导航的传输线。由于网格线分割对于自动/机器人苹果树训练至关重要，一些数据增强和类平衡技术可能有助于更有效地为网络提供各种数据以提高学习性能（Krizhevsky 等人，2012 年）。因此，本研究旨在开发一种由数据增强技术支持的改进方法，并使用 RGB-D 信息在不同光照条件下（即晴天、阴天和夜晚）真实地准确分割苹果树冠的树干、树枝和格子线。支持田间条件下自动苹果树训练的时间。

1.2. Goals and objectives

本研究的总体目标是研究一种基于深度学习的系统，该系统可以有效地分割出苹果树冠层中的树干、树枝和格架线，以便在商业果园环境中进行自动树木训练。具体目标是：（i）使用颜色和深度信息以及基于深度学习的语义分割技术分割出树干、树枝和网格线； (ii) 仅使用颜色 (RGB) 信息（简单 RGB 图像）以及颜色 (RGB) 和深度信息（前景 RGB 图像）来比较网络性能。从这项研究中获得的结果将为开发自动化苹果树培训系统奠定基础。

2. Materials and methods

2.1. Experimental field

在这项研究中，使用了商业果园（Prosser，WA）中密集种植、未经训练的一岁（第一片叶子）苹果树（Geneva® G.41 砧木上的‘Envy’）的图像（图 2a）。树木是独立的，并被训练成 V 型格架果园架构（图 2b），其中格架线的水平层间隔约。 50厘米。树距和行距分别为45厘米和330厘米，平均树高约200厘米。

2.2. Image acquisition

未经训练的休眠苹果树的 RGB 图像和 3D 点云数据于 2018 年 1 月使用安装在图像采集平台（图 2b）上的 Kinect V2 传感器（Microsoft Corporation，Redmond，WA）获取，并使用 Matlab® 2017b 实现软件（Mathworks，Natick，MA）。传感器距离地面的高度为 1.10 m，传感器与树行中心之间的距离为 1.10 m。在整个图像采集过程中，高度和距离保持不变。 Kinect V2 可以使用其深度和 RGB 传感器获取 RGB、深度和点云数据。 Kinect V2 的深度（70.7 × 60°）和 RGB（84.1 × 53.8°）传感器的视野不同，这对共同配准两种类型的信息提出了挑战。然而，在点云数据中，深度和RGB信息已经映射到一起，这使得利用深度信息对RGB图像进行背景去除变得方便简单。由于这种简单性，与 RGB 图像一起获取了分辨率为 1920 × 1080 像素的点云数据。在不同光照条件下（即晴天和阴天，以及使用发光二极管或 LED 灯的夜间），总共获得了 509 张随机选择的树木的 RGB 图像和点云数据集（图 2c-e）。白天图像是在上午 9:00 到 11:00 之间收集的，夜间图像是在下午 5:00 到 6:00 之间收集的。图 3a 显示了使用 Kinect V2 获取的 RGB 图像的示例。

2.3. Image pre-processing

目标树的 RGB 图像也可能在背景中包含许多其他树和网格线，这可能会降低分割精度（图 3a）。然而，可以使用深度信息移除这些背景对象，因为目标树木比背景中的树木更靠近传感器。从点云数据中提取 RGB 图像中每个像素的深度信息。然后使用 1.30 m 的距离阈值去除任何超出阈值距离的物体。图 3b 显示了背景去除后的示例图像，其中可以清楚地看到目标树和网格线。

图 2. (a) 本研究中使用的年轻（一岁）商业果园； (b) 实验场和图像采集系统示意图；以及在不同光照条件下收集的示例图像，即（c）晴天； (d) 多云； (e) 夜间使用 LED（发光二极管）灯。

2.4. SegNet for semantic segmentation

SegNet（基于编码器-解码器的深度卷积网络）（Badrinarayanan 等人，2017 年）架构专为像素级语义分割而设计。这能够根据类之间存在的外观、形状和空间关系有效地分割区域。该网络由编码器（编码器深度为 5）和相应的解码器组成，随后是最终的像素级分类层。编码器网络有 13 个卷积层，对应于 VGG16 的初始 13 个卷积层（Simonyan 和 Zisserman，2014）。对于 SegNet，丢弃了 VGG16 的全连接层以保留高分辨率的编码器特征图并显着减少参数数量。图 4 显示了 SegNet 分割苹果树干、树枝和网格线的总体过程和训练架构。

图 3. (a) Simple-RGB 图像示例； (b) 使用 1.30 m 的深度阈值去除背景后相应的前景-RGB 图像。

每个编码器通过使用滤波器组执行卷积生成一个特征映射集。随后对这些特征图进行批量归一化，然后使用 ReLU（整流线性单元）(f(x) = max(0,x)) 层应用激活函数，以提高学习过程的速度并确保之间的映射输入和输出空间。最后，为了实现稳健的分类，使用步幅为 2 的 2×2 窗口进行最大池化，然后进行 2 倍子采样以实现更多的平移不变性（Badrinarayanan 等人，2017）。此外，在所有编码器和解码器上选择每个卷积层的 3 × 3 恒定内核大小和步长 1，这有助于将特征映射深层中的像素追溯到输入图像。

SegNet 中的每个编码器都有一个相应的解码器网络，用于使用最大池索引对来自其相应编码器的输入特征图进行上采样。然后将这些特征图与解码器滤波器进行卷积，以从最大池中生成的稀疏特征图中产生密集特征。每个解码器过滤器中的通道数与上采样特征图的数量相同。在解码器过滤器的每个卷积层生成的密集特征图在将它们馈送到 ReLU 层之前进行批量归一化。归一化后，最后一个解码器末尾的这些密集特征表示被馈送到分类层（soft-max）。最后，使用 soft-max 分类层确定每个像素属于特定类别的概率。

2.5. Network training and testing

由于数据集较小（356 张训练图像和 153 张测试图像），使用迁移学习方法（导入预训练网络，然后使用新数据集进行微调）在实现稳定模型的同时获得相对准确的结果，避免网络陷入局部最小值 (Chen et al, 2017)。在这项研究中，来自预训练 VGG16 模型的编码器权重，在 ImageNet 数据库（Simonyan 和 Zisserman，2014）上训练，由于其更高的对象定位和分类能力而被初始化。通过替换 soft-max 分类层并微调网络以从未经训练的苹果树树冠图像中分割树干、树枝和格子线来进行迁移学习。

图 4. 用于在休眠季节分割苹果树冠层中的树干、树枝和网格线的 SegNet 的说明性流程图和总体架构。

表 1 每个目标类别中图像像素的百分比以及分配给这些类别的相应权重。

使用 Matlab® 中的像素级标记对总共 509 张图像进行了手动标记，其中 356 张随机选取的图像 (70%) 用于训练，其余图像（153 张图像，30%）用于测试。每张图片都被标记为背景、树干、树枝和网格线四类。除了树干、树枝和格子线（例如，背景树和格子线、贴纸和棋盘）之外，图像中存在的所有对象都被标记为背景类的一部分。每个类代表其在图像中的相应区域，需要对其进行分割。为了满足所用计算环境（NVIDIA GeForce GTX 1080 GPU）的要求，每张图像及其各自的标签都被缩小到 960 × 540 像素。

表 1 描述了每个类中的像素比例（使用图像数据集中属于每个类的像素数计算），表明背景具有最大（95.6%）的像素比例，格子线类具有最少（0.3%） )，这可能会导致对优势阶级的偏见，从而影响学习过程。为了尽量减少这个问题，使用了中频类别平衡，其中分配给每个类别的权重是通过将类别频率中位数除以完整训练数据集上的类别频率来确定的（Badrinarayanan 等人，2017），表示为：

其中 c 表示特定类别（背景、主干、分支或网格线），而 median_freq 是频率的中值。表 1 提供了计算出的类别权重。

为了提高网络的准确性和性能，可以使用数据增强，通过反射、平移和其他变换人工生成更多的训练样本 (Krizhevsky et al, 2012)。本研究在左/右方向使用随机反射技术，在 X/Y 方向随机平移 ± 10 个像素，以生成训练样本的变化。在训练过程中，每张图像在被馈送到网络进行训练之前被随机反射和/或翻译。这种技术有两个优点：（i）网络被引入到训练数据的更多变化中，因此最小化了训练数据过度拟合的机会； (ii) 每个时期的图像总数保持不变（356 张训练图像），因此网络总训练时间不会增加。

需要优化各种训练参数以提高分割性能。固定动量为 0.9 的随机梯度下降 (SGD) 算法用于在训练过程中帮助收敛网络（Keskar 等人，2016），而交叉熵损失用作训练网络的目标函数（Long 等人，2015） ).经过多次试错运行后，初始学习率、最小批量大小和最大纪元分别设置为 0.001、1 和 100。在每个训练时期之前，训练数据的顺序是随机的。

2.6. Performance evaluation

基于区域的（全局准确度、类别准确度、归一化混淆矩阵和联合交集 (IoU)）和基于轮廓的（边界-F1）测量均用于评估网络性能。全局精度定义为在测试数据集中正确分类的像素的百分比，而类别精度（等式（2））是通过对所有可用类别的分类像素进行平均来测量的。 IoU (Eq. (3)) 表示所有类并集的平均交集，也称为 Jaccard 指数。这些基于区域的措施没有评估分割区域边界的准确性，而这对于这种自动树训练操作来说是一个非常重要的措施。此外，IoU 测量是严格的，因为它惩罚误报并且它有利于区域平滑而不是边界精度（Csurka 等人，2004）。因此，在本研究中，还分析了边界-F1 分数（等式（6）），它提供了预测和地面真实类边界之间基于 F1 测量的准确性。

4. Conclusions

本研究的目标是创建一种方法，可以有效地分割出苹果树冠层中的树干、树枝和格架线，以便在果园环境中将苹果树枝自动训练为格架线。这项研究发现，使用简单 RGB 图像和基于深度学习的语义分割技术，可以成功地将树干、树枝和网格线从背景中分割出来。使用前景-RGB 图像（使用距离阈值去除背景）训练的网络可以提高分割的准确性。从这项研究中得出的一些具体结论包括：

使用基于深度学习的语义分割技术和彩色 (RGB) 图像，在果墙苹果园（休眠季节）中成功分割了树干、树枝和格子线。使用这种技术，平均精度为 0.89，IoU 为 0.52，Boundary-F1 为 0.81。
与没有去除背景的图像相比，使用去除背景的 RGB 图像 (Foreground-RGB) 在平均准确度 (0.94)、IoU (0.58) 和 Boundary-F1 (0.92) 得分方面有显着提高。这项工作（包括网格线）使用有限数量的训练图像 (356) 实现的分割精度水平表明，可能没有必要使用大量合成图像来训练深度学习模型。
分析测试数据集中的单个图像表明，基于深度学习的语义分割可以在白天和夜间的真实果园环境中使用。通过增加类似条件下训练图像的数量和/或通过预处理这些图像去除镜面反射率，可以进一步改善在夜间条件下获取的图像的分割结果。

在未来的研究中，将通过估计树冠结构所需的基本参数（包括树枝基部直径和树枝基部位置以及与格架线的距离）来选择最佳树枝进行树木训练。这些选定树枝的位置信息可由机器人机器用于自动树木训练操作。

企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
实现网页中CSS图片3D旋转效果 Kiki-2189
本文还有配套的精品资源，点击获取简介：CSS是一种用于定义文档呈现方式的技术，通过CSS3的3D转换功能，能够在二维平面上展示三维对象，让网页元素具有立体感。本文详细介绍了实现CSS图片3D旋转效果所需的CSS属性，如transform,perspective,transition,以及:hover选择器，并提供了一个简单的代码示例。同时，文章也提到了兼容性问题以及提供回退方案的重要性。1.CSS
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
炫酷3D圆环动态照片墙：打造个性化展示新体验姚芝舒
炫酷3D圆环动态照片墙：打造个性化展示新体验【下载地址】3D圆环动态照片墙HTML文件本资源提供了一个精美的3D圆环动态照片墙HTML文件，用户可以通过鼠标自由拖拽照片墙，实现动态展示效果。该文件在某社交平台爆火，内置了30张高质量的JPG图片，用户只需在浏览器中直接打开即可体验，操作简单易上手。效果精致，适合用于个人展示或简单玩乐项目地址:https://gitcode.com/open-sou
使用CSS和HTML实现3D图片环绕效果码力无边-OEC css html 3d web 前端
使用CSS和HTML实现3D图片环绕效果在本篇博客中，将介绍如何使用HTML和CSS实现一个3D图片环绕效果。这个效果不仅具有视觉吸引力，而且具有高度的互动性，鼠标悬停时动画会暂停。接下来将一步步讲解这个效果的实现过程。1.效果2.页面结构与布局首先，我们来看一下HTML的基本结构。该效果的核心是一个元素，它包含了多个图片的，每个div中都设置了不同的背景图片。HTML代码：3D图片环绕效果</
html 照片环 - 图片的动态3D环绕 das白 #javascript html 3d javascript 照片环 3D环绕
html照片环-图片的动态3D环绕引言一、源码二、图转base64参考链接引言效果展示：一、源码原始图片的base64编码字符太多了，博客放不下，将图片缩小后的加入html的源码如下：猫咪body{background-color:black;text-align:center;color:#FFF;}.jc{/*设置宽*/width:140px;/*设置高*/height:200px;/*设置背
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
使用html+css+jquery实现3D轮播图 mini_055 jquery html css
还是先来看看效果图：通过效果图我们先理一下思路：首先就是需要几张图片，但只有一张是显示在我们眼前的第二步：把一张图片分成几等份，这样点击转换的时候就会分开转第三步：就是实现点击按钮切换下一张。HTML部分HTML部分首先我们需要一个盒子显示图片，然后在盒子里装入图片，你想装几张图片就可以写几个li,除了图片我们还需要一个按钮来点击。一个li的图片效果如图所示：div是当你点击下一张的时候一个div
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
Python/Java/Php/C#/Go/C/C++这几个主力语言，谁到底真的不行 dotNET跨平台 java c#开发语言
1.前言阿里最近又进行了史诗级的大裁员，IT行业肉眼可见的持续性衰退与没落。当潮水退却，才能看出谁在裸泳。作为当今计算机编程界的几大主力语言，谁才真正的裸泳者呢？2.描述1.Python:Python作为一款解释性的动态语言，它很早就诞生了。它的第一个发行版1991年出世，比Java还要早四年。可惜命运不济，一直没有大的作为。到了2014年人工智能的风口悄然兴起，Python一路高歌猛进。到了20
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（含模型描述及示例代码） nantangyuxi MATLAB 含模型描述及示例代码算法 matlab 神经网络大数据人工智能深度学习机器学习
目录MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（多指标，多图）1项目背景介绍...1项目目标与意义...2项目挑战...3项目特点与创新...5<
【Linux命令大全】Linux虚拟化技术终极指南：从KVM到容器的深度解析全息架构师 Linux 前沿技术与应用 linux 运维服务器
【Linux命令大全】Linux虚拟化技术终极指南：从KVM到容器的深度解析行业洞察：全球90%的云服务基于Linux虚拟化技术！掌握这些技能可提升500%的资源利用率！本文包含180+配置案例，40张架构图，企业级虚拟化方案全公开！前言：为什么虚拟化是云计算的基础？在现代数据中心中，我们面临的核心虚拟化挑战：硬件资源的高效分割近原生性能的追求安全隔离的保障混合负载的调度跨平台的兼容性惊人数据：A
量子机器学习前沿：量子神经网络与混合量子-经典算法软考和人工智能学堂人工智能 #深度学习 Python开发经验量子计算
1.量子计算基础1.1量子比特与量子门importnumpyasnpfromqiskitimportQuantumCircuit,Aer,executefromqiskit.visualizationimportplot_histogram#单量子比特操作演示defsingle_qubit_demo():qc=QuantumCircuit(1)qc.h(0)#Hadamard门创建叠加态qc.rz
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro