深蓝学院

点云上的卷积神经网络及其部分应用

本次公开课由李伏欣老师主讲，李伏欣老师是美国俄勒冈州立大学助力教授，公开课主要介绍了涵盖3D点云领域的研究，并重点介绍了李老师近期的最新工作内容。

公开课回放链接：https://www.shenlanxueyuan.com/open/course/33

本次分享首先介绍了最近几年的两篇经典论文中3D点云识别的工作，详细介绍PointNet++与PointNet；接着由传统CNN入手，逐渐引入PointConv；最后将结合PointConv介绍了李老师团队最近的工作内容。

课程开始，李伏欣老师介绍了点云CNN的一些背景。

点云上做CNN的工作和点云上其他操作有些不同，点云CNN更偏重于识别的任务，目前市面上已经有了很多深度传感器，可以直接获得周围物体的深度数据，例如Velodyne LiDAR等，随着深度传感器的普及，日后深度传感器在我们日常生活中将会变得更加普遍。我们都知道深度学习在2D图像识别中有了飞跃性的发展，研究点云CNN的目的就是使深度学习在点云上的应用更加广泛。

常见的三维表示形式有很多种，常见的表示形式为点云、Mesh、Volumetric和RGBD等，Mesh可以更好地表示物体表面信息，Volumetric是将三维空间转换成网格的表示形式，RGBD则在传统RGB图相中增加了一个深度维度的信息，但只能看到一个视角的信息。而为什么我们要研究点云的CNN呢？因为不管是LiDAR、结构光还是TOF等深度传感器，都是直接获得的点云信息，而其他的三维表示都是由点云生成的。

同时我们还可以把RGB的信息贴到点云数据中去，这样在空间表示中不仅仅有物体的三维信息，还有物体的颜色信息。常见的点云往往都是稀疏的，而在土木工程领域中会应用到一种强大的扫描仪，获得数量庞大的点云数据用于还原物体信息，可以表示详细的空间信息。

1 研究现状

点云CNN为什么难做？从2D图像中出发，例如，可以用image(i-1,j-1)表示像素image(i,j)的邻域信息来表示图像中具体的位置信息，但是不能保证在点云中相同的相对位置处存在点云数据。于是可以把这个问题转成volumetric convolution来进行点云的CNN，那么有的Voxel有特征点，有的Voxel并没有特征点，有点的Voxel可以找到该点的邻域进行计算。将这种方法应用到点云中，近些年研究学者发现利用矩阵稀疏性可以起到提高计算速度的作用，精度和速度近些年已经取得了相当不错的结果。

提到点云深度学习就一定离不开PointNet和PointNet++两篇经典的点云神经网络处理方法。PointNet中常用的有两种操作：1x1 convolution 和Max-pooling，然而只有这两种操作实际上对3D识别来讲是远远不够的。PointNet提取特征的方式是对所有点云数据提取了一个全局的特征，显然，这和目前流行的CNN逐层提取局部特征的方式不一样。

受到CNN的启发，紧接着同一批作者发表了PointNet++，就更接近了传统的CNN，相较于PointNet，它能够在不同尺度提取局部特征，通过多层网络结构得到深层特征。

PointNet++由以下几个关键部分构成：Sampling（采样层），Grouping（组合层），PointNet（特征提取层）。

首先，在网络处理时对输入点的数据点进行采样，采样后的结果中每一个点所构成其局部的点进行组合，方便后面连接PointNet的局部特征提取，由于Max-pooling的影响，每组特征点最后只输出一个点。

对提取的特征点再根据每个点所构成的局部点进行组合，得到的结果进行sampling连接PointNet。由Sampling、Grouping和PointNet三层组成了类似卷积层的结构，可以应用这种结构进行分类和分割。

PointNet++作者使用的采样算法是farthest point sampling（最远点采样），相对于随机采样，这种采样算法能够更好地覆盖整个采样空间，包括点云数据特征信息和边角信息，这些都是随机采样所无法具备的。

虽然PointNet已经足够优秀，但是PointNet缺少邻域信息，与传统意义上通过周围邻域得到卷积结果十分不同，这也很难直接应用于后面的点云CNN中。

例如这里有一个最简单的边缘检测的任务，在边缘处两边的颜色不同，为了检测出边缘，我们至少需要考虑两个点的颜色信息才能判断出是否存在边缘。而PointNet除了Max Pooling以外，剩下的所有操作都只对单点进行，很难直接应用到Corner Detection等任务中去，因此我们迫切需要真正意义上的点云CNN。

2 CNN 到PointConv

为了引入点云CNN，首先我们来回顾一下传统的CNN。对于2D图片来说，某个位置的输出，不仅与该位置的输入有关，还与此位置周边位置的输入有关，不同位置的输入，具有不同的权重。下图中X(i,j,k)可以看做图像的原始像素，W为卷积核，G为邻域。卷积是一个加权求和的操作，由于位置坐标的像素值是固定值，卷积核上所有作用点以此作用于原始图像像素，并通过线性叠加把所有的作用结果累加，即是图像卷积的输出。

可以通过连续域考虑，此时W就不是权重矩阵而是一个函数，那么由于点云位置是随机的，不同位置的权重应该不同，这样可以把权重函数W抽象成为一个关于三维坐标的函数。由于所有操作都可微，通过深度学习不断学习，由Δi, Δj, Δk作为输入的权重值作为函数的输出结果，这也是最初很重要的一种想法。下图中W和X为连续的函数，（i,j,k）为三维参考坐标，(Δi, Δj, Δk)为该点邻域的相对坐标，由于卷积本质上是一个加权求和的操纵。如果某些位置的采样点比较密集，而某些位置的采样点比较稀疏，最终的计算结果主要受到采样密集的位置的点的影响。考虑到点云是非均匀采样的传感器，为了补偿不均匀采样，需要用点云逆密度对学到的权重进行加权，该模块主要目的是处理点云采样不均的情况。这样我们可以把PointConv描述为：

3 PointConv 与深度学习

PointConv的主要工作是在原有通过1层隐藏层替换权重函数W的基础上，在添加了一层隐藏层和KDE。这样网络的基本结构就可以描述为：通过寻找点云的K nearest neighbor获得K×3的坐标，做两层全连接网络，得到K×（Cin×Cout）的W，与复制Cout份的输入特征Fin运算，便可以得到1×Cout维的一个点的输出特征。完整的PointCov网络结构图如下所示：

李老师团队之前提交过一篇论文，但由于不知道之前已有团队做过相同的工作而被拒。在他们的工作中由于每个点都需要计算K×Cin×Cout维的权重值， PointConv 实现起来内存消耗大、效率低，很难形成大型的卷积网络结构。李老师发现通过更改了上图中蓝框里求和的顺序可以保证在结果不变的基础上，极大降低内存。假设MLP最后一层的输入为M，M与计算的逆密学习到的权重加权得到的结果Fin直接相乘，而把最后一层全连接层放到最后。看似只是简单的调整顺序，却可以省去复制Cout次的操作，也不用得到K×（Cin×Cout）很大的Tensor，有效的降低了参数的数据量，避免每次卷积都要产生巨大的权重值的问题。

实验结果证明原结构大概需要8G内存，优化过后大概只需要占用100M，极大的节省了内存占用率，为后面构建大规模网络奠定了基础，这样一个PointConv layer就可以完整的对应到一层普通卷积层，优化过后的网络结构为：

当然，我们还可以来定义PointDeconv，在之前的PointNet++中，Deconvolution主要是通过插值的方法来实现的。例如在下层有了一个k邻域，上层的点直接做插值来实现。而有了Pointconv以后可以在每次插值加入一层Pointconv，这样PointDeconv 由两部分组成：插值和 PointConv。首先，使用一个线性插值算法来得到精细层的特征的初始值，再在精细层上进行一个 PointConv 进行优化特征，从而获得较高精度的特征值。

有了PointConv和PointDeConv，便可以根据传统的卷积神经网络结构搭建一个U-Net网络，用于点云的分类任务。如下图所示，将所有的点先通过PointConv得到非常少的点，再通过一系列PointDeConv点数逐渐增多直至回到初始的点数，再对每个点进行1×1的卷积，便得到了点云的U-Net。

为了验证PointConv可以替代真正的卷积效果，李老师团队将CIFAR-10替换成了点云，在5层和19层的实验中发现，PointConv的准确度高于近期出现的PointCNN和SpiderCNN 的点云深度学习网络，接近甚至高于传统卷积神经网络框架。

同时李老师团队也在ModelNet、ShapeNet和ScanNet上与更多的点云深度学习网络结果进行对比，在ModelNet40和ShapeNet提高的精度不是很高，但是在真实的室内扫描数据集ScanNet却提高了很大的精度。

在4层PointConv的基础上就达到了55.6%的精度，显著的高于ScanNet、PointNet++、SPLAT Net和Tangent Convolutions，近期李老师通过搭建更多层的PointConv已经达到了66.6%的精度。这些结果足以证明PointConv在点云深度学习中可以替代传统的卷积层。

4 最近工作

4.1 PointPWC-Net

根据上述提到的PointConv的有效性，可以把许多2D的工作进行推广，扩展到点云的应用，例如在计算机视觉中的运动估计。而在运动估计中最重要的环节就是配准，传统方法中的SIFT等方法是可以轻松实现，但是随着深度学习的推广，如何在物体一直运动的情况下有效匹配像素点成为了深度学习运动估计的难题。

最直接的想法就是在相邻两帧之间分别做CNN，得到W×H×D维的特征，在使用Cost Volume的方法用于像素匹配，Cost Volume方法的基本原理为：在W×H×D的特征中，每一个特征计算对应到另一个特征d×d邻域2范式，得到了W×H×D×d×d的匹配信息。尽管得到的匹配信息可能会很大，但是可以获得更好的配准效果。那么如何将配准问题运用到点云上呢？

大体思路为：在相邻的两帧点云Point Cloud1和Point Cloud2作为输入连接PointConv layer得到Point Feature1 和Point Feature2，设以第一帧为target，则在Point Feature1有N个点的基础上取k邻域，计算的N×K维的Point Cost Volume，在连接PointConv layer后与贴到Point Feature1上便可以得到相关的运动信息。

但是完整的实现还是需要完成许多细节，其中最重要的为coarse-to-fine，李老师的团队根据2D里的optic follow中有一个很好的方法PWC-Net，实现了3D 点云上的coarse-to-fine。原PWC-Net方法中是将输入图像变小（例如16×16），在两个16×16的基础上计算Cost Volume，之后应用16×16得到的运动结果，先对第一帧的32×32的图像进行移动，在和第二帧的32×32进行匹配计算Cost Volume，以此类推，把所有层的结果加在一起，便可以得到最终的计算结果。这样每次计算的Cost Volume取的邻域并不会很大，计算新的Cost Volume时，可以直接应用上一次的运动结果。

在李老师团队最新的工作PointPWC-Net中，因为有PointConv的存在，可以将PWC-Net中的downsample用PointConv替代，upsample用PointDeConv的方法替换，在Warping layer中，假设得到的输入运动估计为（Δi, Δj, Δk），与原有输入点（i, j, k）相加即可得到输出（Δi+i, Δj+j, Δk+k）。这样我们可以得到点云中的运动估计。点云里的Cost Volume可以把像素坐标值转换为点云数据，由于图像中的d×d是一个dense矩阵，而点云是找K nearest neighbor，得到的Cost Volume的大小就直接去取决于K取值的大小为N×K。

在测试中与之前许多工作进行对比，由于ICP假设物体是刚性不变的，所以相较于ICP， PointPWC-Net有较大的提升。而与其他深度学习网络对比，由于大量使用了Max pooling操作，致使了很多特征点丢失，PointConv可以替换CNN层的优势便体现出来，在许多开源数据集上的表现十分良好。

4.2 IGOS:Integarted-Gradient Optimized Saliency

另外李老师团队介绍了另一个非常有意思的工作：如何清楚的知道CNN中是那些Feature起到了至关重要的作用呢？那么需要优化一个mask，对输入图像进行blur，将blur过后的图像重新放到之前CNN网络中预测，使预测的准确度尽可能的较低。例如在预测口琴的图像中，原图像的分类精度在99.9%，如果对人的嘴和手部与口琴接触的地方进行blur，得到的结果就只有11.9%，相反，如果我们只显示嘴部和手部与口琴接触的图像，分类预测的精度达到了81.9%。

李老师团队同时将这个有趣的工作推广到了点云中，但是与2D图像不同的是，2D图像可以通过blur进行操作就可以把图像的特征给去掉了，而点云中如果直接删除特征点，会在某些分类器中出现问题。基于上述问题，李老师团队提出了一种点云smooth方法，对部分点云进行smooth逐渐变成一个球，来起到2D图像blur的作用。这样在smooth的操作下将2D中优化mask的工作推广到了点云。例如人的点云图像分类中，如果把人的头部smooth掉后，人的点云分类精度就从原来的0.79降到了0.15，便可以了解到人的头部在点云分类起到了至关重要的作用。

5 讨论

在公开课的最后，李老师给到了我们一些学习深度学习的建议。点云与深度学习结合的应用范围十分广泛，例如三维重建、运动估计等，要想学好深度学习，首先需要学好机器学习的理论知识，例如Overfitting是什么等基础问题，写一写简单的SVM代码。

在对机器学习有了一定的认识之后，再开始学习深度学习，深度学习本身没有很难的知识点，难就难在做实验，例如如何提高精度、怎样对数据初始化可以得到较好的结果等。多学习别人在深度学习中使用的各种技巧，对提高深度学习代码精度有很大的帮助。很多时候自己写一个深度学习的网络不如直接下载一个开源的深度学习网络的代码，在现有的基础上对原工作进行修改。

写在最后

本篇文章是根据李老师的课程分享进行的相关整理，由于篇幅有限，不能做到详尽整理。了解公开课具体内容课可点击https://www.shenlanxueyuan.com/open/course/33获取原公开课视频。

[Qi et al. CVPR 2017] C. Qi et al. PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation. CVPR 2017
[Wu, Qi and Fuxin 2019] W. Wu, Z. Qi, L. Fuxin. PointConv: Deep Convolutional Networks on 3D Point Clouds. CVPR 2019
[Graham et al. 2018] B. Graham and L. van der Maaten. Submanifold Sparse Convolutional Networks. CVPR 2018
[Choy et al. 2019] C. Choy, JY. Gwak, S. Savarese. 4D Spatio-Temporal ConvNets: Minkowski Convolutional Neural Networks. ICCV 2019
[Qi et al. NeuRIPS 2017] C. Qi et al. PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space. NeuRIPS 2017
[Su et al. 2018] H. Su et al. SPLATNet: Sparse Lattice Networks for Point Cloud Processing. CVPR 2018
[Xu et al. 2018] Y. Xu et al. SpiderCNN: Deep Learning on Point Sets with Parameterized Convolutional Filters. ECCV 2018
[Li et al. 2018] Y. Li et al. PointCNN: Convolution On X-Transformed Points. NeuRIPS 2018
[Jia et al. 2016] X. Jia et al. Dynamic Filter Networks. NeuRIPS 2016
[Simonovsky 2017] M. Simonovsky, N. Komodakis. Dynamic edgeconditioned filters in convolutional neural networks on graphs. CVPR 2017
[Wang et al. 2018] S. Wang et al. Deep parametric continuous convolutional neural networks. CVPR 2018
[D. Sun et al. 2018] D. Sun et al. PWC-Net: CNNs for Optical Flow Using Pyramid, Warping, and Cost Volume. CVPR 2018
[Wu et al. + Fuxin arXiv:1911.12408] W. Wu et al. PointPWC-Net: A Coarse-to-Fine Network for Supervised and Self-Supervised Scene Flow Estimation on 3D Point Clouds. arXiv:1911.12408
[Ziwen et al. + Fuxin arXiv:1911.10415] C. Ziwen et al. Visualizing Point Cloud Classifiers by Curvature Smoothing. arXiv:1911.10415
[Z. Qi, S. Khorram, L. Fuxin, AAAI 2020] Zhongang Qi, Saeed Khorram, LI Fuxin. Visualizing Deep Networks by Optimizing with Integrated Gradients. AAAI, 2020

Python库 - Mayavi 司南锤 PYTHON库 python 开发语言
Mayavi是一个用于科学数据可视化的Python库，特别适用于三维数据的可视化。基于VTK（VisualizationToolkit）库，提供了简单易用的接口来创建复杂的三维图形。Mayavi可以用于绘制各种类型的三维图形，如点云、曲面、体积数据等，并且支持交互式操作。文章目录安装Mayavi基本概念基本用法1.创建一个简单的三维图形2.绘制点云3.绘制等值面4.交互式操作高级用法1.使用模块和
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
基于CNN-BIGRU-Attention模型的功率预测（模型详解及代码复现）清风AI 深度学习算法详解及代码复现深度学习人工智能算法机器学习计算机视觉 cnn 神经网络
整体架构基于CNN-BiGRU-Attention模型的功率预测模型是一种融合了卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(Attention)的深度学习架构。这种混合模型旨在充分利用CNN的局部特征提取能力、BiGRU的长序列处理能力以及Attention机制的关键特征突出能力，从而提高功率预测的准确性和可靠性。模型的整体架构主要包括以下几个关键组件：输入层：设计的输入特
文生图图生视频文生视频人工智能AI工具节选行思理 AI 人工智能文生图文生视频图生视频数字人
1、MidjourneyAI图像和插画生成工具，官网地址：Midjourney中文站,MJ中文站-专业AI绘图网站2、StableDiffusion一种基于扩散技术的深度学习文本转图像模型，演示地址：StabilityAI3、通义万相阿里云通义大模型旗下的AI创意作画与视频生成平台，官网地址：通义万相_AI创意作画_AI绘画_人工智能-阿里云4、PhotoStudioAI模特AI商品图及视频一键生
ChatGPT-4o引领医学革命：临床科研创新与效率的新纪元小艳加油教程语言类人工智能数据分析 ChatGPT-4o 临床医学
2024年5月12日，更强版本的ChatGPT-4o上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。因此，帮助广大临床医学相关的医院管理人员、医生、学生、科研人员更加熟练地掌握ChatGPT-4o在临床医学日常生活、工作与学习、课题申报、论文选题、实验方案设计、实验数据统计分析与可视化等方面的强大功能，同时更加系统地学习人工智能（包括传统机器学习、深度学习等）的基础理
Manus：通用型Agent的技术革新与多元应用场景蚂蚁质量其他 python 深度学习
一、Manus前沿洞察Manus，作为Monica团队匠心打造的全球首款通用型Agent产品，名称源于拉丁文“mensetmanus”，意即“手”，深刻寓意着知识与行动的深度融合。其核心理念独树一帜，旨在为大语言模型（LLM）赋予“手”的能力，使其借助工具调用与任务执行，将抽象知识转化为切实可行的实际操作，开启人工智能应用的崭新时代。二、精巧技术架构Manus的技术架构兼具高度灵活性与卓越扩展性，
AIGC从入门到实战：ChatGPT+Midjourney，绘出中国古风意境之美杭州大厂Java程序媛 DeepSeek R1 &AI人工智能与大数据 java python javascript kotlin golang 架构人工智能
AIGC从入门到实战：ChatGPT+Midjourney，绘出中国古风意境之美关键词：AI生成内容(AIGC),ChatGPT,Midjourney,中国古风,创意设计,艺术表达1.背景介绍1.1问题由来人工智能生成内容（ArtificialIntelligenceGeneratedContent,AIGC）作为AI技术的重要分支，近年来在视觉、音乐、文本等多个领域取得了显著进展，引领了内容创作
人工智能引领技术革命：ChatGPT与深度学习的突破性进展撒旦骑路西法，大战吕布国内外安全资讯人工智能
在全球科技快速发展的今天，人工智能（AI）正以前所未有的速度渗透到各个行业，成为推动社会变革的重要力量。特别是在自然语言处理（NLP）领域，OpenAI的ChatGPT凭借深度学习技术的持续突破，展现了AI在理解、推理、对话生成等方面的惊人进步。本文将深入探讨ChatGPT及深度学习的最新突破，以及它对不同行业的深远影响。1.ChatGPT：AI语言模型的革新者1.1什么是ChatGPT？Chat
《即梦牵手DeepSeek，AI创作领域的变革与未来》空云风语人工智能人工智能
《即梦牵手DeepSeek，AI创作领域的变革与未来》开篇：科技融合，梦想启航在当今科技飞速发展的时代，人工智能（AI）无疑是最为耀眼的领域之一。新的技术和创新不断涌现，推动着AI行业的边界持续拓展。近期，AI领域又迎来了一个令人瞩目的大事件：即梦正式接入DeepSeek，这一强强联合的举措，犹如一颗投入湖面的巨石，激起千层浪，在整个AI行业引发了广泛关注和热烈讨论。即梦，作为字节跳动旗下极具创新
大模型与Java的深度融合：现状、实践、挑战与未来软件职业规划 java 开发语言
一、引言：大模型与Java的交汇近年来，大模型技术在人工智能领域迅速崛起，成为推动智能应用发展的核心力量。与此同时，Java作为一种历史悠久且广泛应用于企业级开发的编程语言，凭借其强大的生态系统、跨平台特性和稳定性，一直是软件开发领域的中流砥柱。随着大模型技术的普及，Java与大模型的结合成为了一个备受关注的热点话题。这种结合不仅为Java开发者带来了新的机遇，也为大模型的落地应用提供了更广阔的场
深入探索Deeplearning4j（DL4J）：Java深度学习的全面指南软件职业规划 java 深度学习开发语言
一、DL4J框架概述Deeplearning4j（DL4J）是一个开源的深度学习框架，专为Java和Scala设计，运行在Java虚拟机（JVM）上。它由Skymind公司开发并维护，旨在将深度学习技术应用于大规模商业应用。DL4J支持多种深度学习模型，包括卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等。自2014年首次发布以来，DL4J已经成为Java深度学习领域的
Web3 DApp 测试指南 m0_51192916 web3 DApp
Web3DApp测试个人总结Web3DApp（去中心化应用）前端开发与传统Web2应用存在显著不同。由于DApp依赖智能合约、区块链RPC交互、钱包签名等技术，其测试方式也有别于传统前端测试。本指南系统介绍Web3DApp前端的测试方法，包括功能测试、兼容性测试、安全测试、性能测试，让你快速上手Web3DApp测试。1.Web3DApp基础知识1.1什么是Web3DApp？Web3DApp（Dec
电机的声音数据进行AI分析鹿屿二向箔人工智能
对电机的声音数据进行分析，尤其是当数据来源于加速度传感器时，涉及到的不仅仅是声音分析，还包含了振动分析。这类问题通常可以归类于机械故障诊断或预测性维护领域。以下是一些适合处理这种类型数据的人工智能模型和方法：1.特征工程+传统机器学习模型在直接应用深度学习之前，通常首先会进行特征提取。对于振动信号（即使通过加速度传感器采集），常用的方法包括计算频域特征（如傅里叶变换后的频谱）、时域特征（如均方根值
大规模语言模型构建流程人工智能技术笔记语言模型人工智能自然语言处理
大规模语言模型1.大语言模型大规模语言模型（LargeLanguageModels，LLM），也称大语言模型，是一种由包含数百亿以上参数的深度神经网络构建的语言模型，通常使用自监督学习方法通过大量无标注文本进行训练。2.预训练语言模型受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型精调的预训练范式影响，自然语言处理
Python简介 Gao_xu_sheng python 开发语言
Python前言Python一直是一门优秀的编程语言，不仅简洁、易用，而且功能强大，它能做到的事情太多了，既可用于开发桌面应用，也可用于做网络编程，网络爬虫，还有很重要的领域就是AI大模型开发。近年来，随着人工智能（AI）和机器学习（ML）领域的迅猛发展，Python在这些前沿技术中扮演了至关重要的角色，特别是在构建和训练大规模机器学习方面。Python拥有丰富的库和框架，这些工具极大地促进了AI
深度解析DeepSeek：从技术架构到实战应用 YY...yy ai DeepSeek
一、引言：为什么选择DeepSeek？在2025年人工智能领域竞争白热化的今天，DeepSeek以其超低训练成本（仅为GPT-4o的1/20）和业界领先的推理能力，成为全球开发者关注的焦点。据权威数据显示，DeepSeek-V3在多语言编程和数学推理任务中的表现已超越Llama-3.1等主流模型4，而其最新发布的DeepSeek-R1更是在苹果应用商店美区免费榜冲至第六名6。二、技术架构解析2.1
vscode 都有哪些大模型编程插件魔王阿卡纳兹 IT杂谈开源项目观察 vscode ide 编辑器
VSCode中有许多基于大模型的编程插件，这些插件通过集成人工智能技术，显著提升了开发者的编程效率和体验。以下是一些主要的大模型编程插件及其功能：GitHubCopilotGitHubCopilot是由OpenAI开发的插件，能够根据代码上下文自动生成代码建议，支持多种编程语言。它与VSCode的集成使得开发者可以在熟悉的开发环境中直接利用AI功能，提高代码生成和调试的效率。DevChatDevC
DeepSeek大模型技术解析：从架构到应用的全面探索小涂Ss 架构人工智能语言模型 AI大模型 DeepSeek agi ai
一、引言在人工智能领域，大模型的发展日新月异，其中DeepSeek大模型凭借其卓越的性能和广泛的应用场景，迅速成为业界的焦点。本文旨在深入剖析DeepSeek大模型的技术细节，从架构到应用进行全面探索，以期为读者提供一个全面而深入的理解。官网：https://www.deepseek.com/1、DeepSeek大模型简介DeepSeek大模型是由北京深度求索人工智能基础技术研究有限公司开发的一款
Manus全球首个通用Agent，Manus AI：Agent应用的ChatGPT时刻 ππ记录人工智能 chatgpt Manus详细介绍 Manus介绍 Manus详细应用 Manus教程 Manus详情介绍
文章目录前言ManusAI:全球首个通用AgentManusAI:技术架构与创始人经历AIAgent的实现框架与启示AIAgent的发展预测行业风险提示前言这是一篇关于ManusAI及其在通用人工智能领域的应用和前景的报告，主要介绍了ManusAI的产品定位、功能、技术架构、创始人经历以及AIAgent的发展预测和实现框架。以下是对这些核心内容的简要概述：Manus全网最全资料（持续更新）链接：h
新一代 AI 软件Manus 将重新将AI市场大洗牌 CircuitWizard 人工智能
Manus是一家专注于手部追踪、虚拟现实（VR）和增强现实（AR）技术的公司，其新一代AI软件结合了先进的机器学习和计算机视觉技术，致力于提升人机交互的自然性和效率。以下是关于Manus新一代AI软件的详细介绍及其核心功能：1.核心技术与创新Manus的AI软件基于以下技术突破：高精度手部追踪：通过深度学习算法和摄像头/传感器数据，实时捕捉手部骨骼、关节和肌肉的细微动作，精度可达亚毫米级，支持复杂
眼见不一定为实，孙悟空教你AI换脸换声的技术原理及如何用火眼金睛识别新型诈骗非知名人士人工智能
话说俺老孙自从大闹天宫归来，闲来无事，忽闻人间兴起一门奇术——所谓“换脸换声”。听说那乃现代科学家利用人工智能之奥秘，将人脸、声音通通变换得跟戏法似的，让人真假难辨。俺老孙心生好奇，便跃上筋斗云，直奔这科技之都，打算探个究竟。今就由俺老孙来给你们摆一摆，这换脸换声究竟是咋回事，就像俺大闹天宫时施展变化，变化无穷，妙趣横生！话说那日俺老孙正在花果山上闲逛，忽然听见猪八戒捧着一部闪闪发光的“小机灵”—
在 PiscTrace 上使用 YOLO 进行预测与 MiDaS 景深补偿：体验纯视觉自动驾驶的数据分析那雨倾城 PiscTrace 人工智能计算机视觉图像处理自动驾驶 YOLO 视觉检测
随着自动驾驶技术的不断发展，视觉感知系统逐渐成为车辆感知的核心组件。PiscTrace作为一款支持高效视图处理的桌面应用，集成了先进的计算机视觉工具，如YOLO目标检测模型和MiDaS景深估计模型，能够为纯视觉自动驾驶的实现提供强大的支持。通过这两个模型的结合，PiscTrace可以提供高精度的目标识别与环境感知功能，帮助用户进行实时的驾驶数据分析，为决策系统提供宝贵的数据支持。本文将详细介绍如何
解锁数据之美：Python 创意可视化的 10 种高阶玩法与技术深度解析 tekin Python 高阶工坊 Python 编程秘籍库信息可视化 Python 创意可视化
在数据爆炸的时代，静态图表已难以满足信息传递的需求。本文深入剖析Python数据可视化的前沿技术与创意方向，结合Matplotlib、Plotly、Dash等主流库，通过交互式仪表盘、3D动态图形、地理信息融合等案例，展示如何将冰冷的数据转化为具有故事性的视觉叙事。文章不仅提供代码实现，还探讨技术原理与设计思维，帮助读者构建从数据到洞察的完整能力链。目录一、交互式仪表盘：动态数据的实时对话技术核心
专业英语程序员爱德华英语专业英语
文章目录一、计算机1.计算机基础(1)计算机组成原理(2)计算机网络(3)数据库(4)编译原理(5)离散数学2.软件开发(1)编程词汇(2)开发术语(3)Linux(4)软件3.就业领域(1)职场(2)芯片(3)自动驾驶(4)嵌入式硬件4.深度学习(1)论文(2)深度学习DL(3)计算机视觉CV(4)自然语言处理NLP(5)推荐系统(6)计算机图形学二、数学三、机械、材料四、医药五、英美计量单位一
LLM大模型安全概述 LLM教程安全人工智能 chatgpt embedding langchain llama
引言2022年底以来，以ChatGPT为代表的大模型飞速发展，正在成为#驱动新质生产力发展#的新动能、人类探索未知的新工具.在显著提升人工智能(artificialintelligence,AI)模型通用理解和生成能力的同时，也带来了前所未有的安全风险.大模型的能力与风险生成式大模型因其强大的智能能力和巨大的应用潜力吸引了众多研究者和企业的关注.从智能能力的角度来看，研究人员观测到：当训练数据和参
python版本更新历史_Python3 是否已经完成了取代 Python2 的历史进程？ wongzo python版本更新历史
最新情况：搞web开发之类的还是用py2的多，但搞数据科学现在基本都py3了，之前不推荐py3是因为它不支持一些3D绘图库，但现在一些机器学习库刚出来的新版有的只支持py3，所以搞数据的还是用py3吧。--------------------------------照目前的情形看，哪怕python3退出历史舞台了python2还会活的好好的！官方倒是想让py2早死早超生，然而天不遂人愿，1：由于p
Linux Shell脚本-分隔符问题瑞琪姐 linux 学习服务器
工作中写shell脚本时遇到读取文件并按分隔符解析每行数据，分隔符单独一行，导致通过地址参数登录数据库报错，需要将分隔符写入循环条件中。分隔符单独一行：#!/bin/bashora_data(){#设置分隔符IFS='|'#读取文件中的每一行#读取客户号变更文件并创建临时表导入clientno.txt文件格式：序号|新客户号|旧客户号whileread-rfield1field2field3do#
golang坐标转换 gomap3d库研志必有功 golang 坐标转换天文
gomap3dGo语言实现的多坐标系转换库，支持天文学/航天领域常用坐标系转换gomap3d特性支持7种坐标系互转：站心坐标系(AER)东北天坐标系(ENU)地心地固坐标系(ECEF)地心惯性坐标系(ECI)大地坐标系(WGS84)支持多种参考椭球体：WGS-84CGCS2000月球火星精确天文计算：儒略日计算格林威治恒星时ECI/ECEF时变转换安装gogetgithub.com/PingPon
基于FPGA的图像中值滤波Verilog实现及MATLAB辅助验证 CodeWG fpga开发 matlab 开发语言
基于FPGA的图像中值滤波Verilog实现及MATLAB辅助验证图像处理是计算机视觉和图像识别领域的重要组成部分。其中，中值滤波是一种常用的图像去噪方法，广泛应用于图像增强、边缘检测和特征提取等任务中。本文将介绍基于FPGA的图像中值滤波Verilog实现，并通过MATLAB进行辅助验证。首先，我们需要了解什么是中值滤波。中值滤波是一种非线性滤波器，它的原理是将图像中每个像素的灰度值替换为该像素
Deepseek r1回答：人工智能的本质是什么？给人类社会带来的意义是什么？相比于之前的互联网革命，这一轮的人工智能革命的特点和异同点有哪些？强化学习曾小健 Deepseek原理与使用人工智能
嗯，用户问的是人工智能的本质、对社会的意义，以及和互联网革命的比较。首先得拆解这三个问题，逐个分析。用户可能对AI有一定了解，但想深入理解其核心和影响。可能需要从技术、社会、历史角度切入。先想AI的本质。本质是什么？是模拟人类智能，还是数据处理？可能需要提到机器学习、深度学习，尤其是神经网络。但本质可能更深层，比如自主决策、模式识别。还要区分弱AI和强AI，现在都是弱AI，专注于特定任务。然后是意
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

点云上的卷积神经网络及其部分应用

1 研究现状

2 CNN 到PointConv

3 PointConv 与深度学习

4 最近工作

4.1 PointPWC-Net

4.2 IGOS:Integarted-Gradient Optimized Saliency

5 讨论

写在最后

相关文章

你可能感兴趣的:(人工智能,3D点云,计算机视觉,卷积神经网络)

点云上的卷积神经网络及其部分应用

1 研究现状

2 CNN 到PointConv

3 PointConv 与 深度学习

4 最近工作

4.1 PointPWC-Net

4.2 IGOS:Integarted-Gradient Optimized Saliency

5 讨论

写在最后

相关文章

你可能感兴趣的:(人工智能,3D点云,计算机视觉,卷积神经网络)

3 PointConv 与深度学习