湘粤Ian

论文超详细精读|五千字：ResGCN/DenseGCN

文章目录

前言
总览
一、 Introduction
- 背景
- 主要贡献
二、Related Work
- 目前主要应用场景
- 目前困难与解决
三、Methodology
- 3.1 Representation Learning on Graphs（图的表示学习）
- 3.2 Residual Learning for GCNs（GCN的残差学习）
- 3.3 Dense Connections in GCNs (GCN的密集连接)
- 3.4 Dilated Aggregation in GCNs（GCN的膨胀聚集）
四、Experiments
五、Conclusion and Future Work

前言

笔者从人工智能小白的角度，力求能够从原文中解析出最高效率的知识。
之前看了很多博客去学习AI，但发现虽然有时候会感觉很省时间，但到了复现的时候就会傻眼，因为太多实现的细节没有提及。而且博客具有很强的主观性，因此我建议还是搭配原文来看。

请下载原文《DeepGCNs: Can GCNs Go as Deep as CNNs?》搭配阅读本文，会更高效哦！

总览

首先，看完标题，摘要和结论，我了解到了以下信息：
1.提出了成功训练深度GCNs的新方法。借鉴了CNN的概念，特别是残差(residual)/密集(dense)连接和扩张(dilated)卷积，并将它们适应于GCN架构。
2.使用这些新概念构建了一个非常深的56层GCN，并展示了它如何显著提高点云语义分割任务中的性能(与最先进的技术相比增加3.7%的mIoU)。

一、 Introduction

背景

1.CNN成功的一个关键原因是它能够设计和可靠地训练非常深入的CNN模型。相比之下，如何恰当地训练深度GCN体系结构尚不清楚。
2.CNN局限性：在一个GCN中叠加更多的层会导致常见的渐变消失问题。这意味着通过这些网络的反向传播会导致超平滑，最终导致图顶点的特征收敛到相同的值。
由于这些限制，大多数最先进的GCNs不超过4层。
3.作者采用了成功训练深度CNN的概念，主要是残余连接、密集连接和扩展卷积。
作者展示了如何将这些层合并到一个图形框架中，并对这些添加对深度GCNs的准确性和稳定性的影响进行了广泛的分析。
4.为了展示这些层适应性，作者将它们应用到流行的点云语义分割任务中。
我们表明，添加残差连接和密集连接以及扩展卷积的组合，可以成功训练56层深度的GCN。这个非常深的GCN将具有挑战性的S3DIS点云数据集的最新水平提高了3.7%。

主要贡献

1.将残差(residual)/密集(dense)连接和扩张（dilated ）卷积应用于GCNs。
2.作者在点云数据上进行了大量的实验，展示了这些新层对训练深度GCNs的稳定性和性能的影响。使用点云语义分割作为实验平台。
3.展示了这些新概念如何帮助构建56层GCN，这是当时最大程度上最深的GCN架构，并在S3DIS数据集上实现了近4%的最新性能提升。

训练结果如上：

(左)展示了有7、14、28和56层的GCNs的训练损失，有和没有残余连接。本文注意到，在没有残余连接的情况下，添加更多的层会导致更高的loss。
(右)相比之下，训练带有残余连接的GCNs在所有深度都能获得一致的稳定性。

二、Related Work

无法系统地、可靠地处理这些非欧几里和距离数据。为了克服cnn的缺点，GCNs为非欧氏数据处理提供了非常合适的解决方案，这大大增加了人们对使用GCNs进行各种应用的兴趣。

目前主要应用场景

1.社交网络：图表表示个人之间基于共同利益/关系的联系。这些联系是非欧氏的，高度不规则。GCNs有助于更好地估计社交网络图顶点之间的边缘强度，从而导致个体之间更准确的连接。
2.计算机视觉：在场景图生成中，对象之间的语义关系是用图来建模的。该图用于检测和分割图像中的对象，也用于预测对象对之间的语义关系。
3.重建图像：场景图还有助于反向过程，在给定场景的图形表示的情况下重建图像。
4.模拟人体关节的动作识别：在视频中，图形也被用于模拟人体关节的动作识别。
5.3D点云处理：特别是点云的非结构化特性对系统研究提出了表征挑战。

目前困难与解决

主要困难：梯度消失和感受野有限。

解决：
1.梯度消失：ResNet通过增加各层输入输出之间的残差连接，可以缓解梯度消失的问题。
2.DenseNet将这个想法更进一步，还添加了跨层连接。
（dilated）扩展卷积是一种较新的方法，通过增加感受野而不损失分辨率，已经带来了显著的性能提高，特别是在像语义分割这样的图像到图像翻译任务中。
3.本文展示了如何利用为CNN引入的概念，主要是残差/密集连接和扩张卷积，来训练深的GCNs。本文将Wang等人的工作扩展到更深的GCN，从而显著提高其性能。在点云语义分割任务上的大量实验验证了这些思想在一般图场景中的有效性。

三、Methodology

3.1 Representation Learning on Graphs（图的表示学习）

1.GCN框架函数

聚合函数：用于编译来自顶点邻域的信息
更新函数：对聚合信息执行非线性转换，以计算新的顶点表示。

2.GCN具有固定的图结构，并且只在每次迭代中更新顶点特征。与具有固定图结构的GCNs相比，动态图卷积(允许图结构在每一层发生变化)可以学习更好的图表示。
例如，

ECC(边条件卷积)[34]使用动态边条件滤波器来学习边比权矩阵。
EdgeConv[42]在每一个EdgeConv层之后查找当前特征空间中最近的邻居来重建图。

3.当考虑更深层的GCNs时，动态改变GCNs中的邻居有助于缓解过平滑问题，并导致有效更大的感受野。
本文框架中，作者建议在每层的特征空间中通过扩展 $k - NN$ 函数重新计算顶点之间的边缘，以进一步增加感受野。

3.2 Residual Learning for GCNs（GCN的残差学习）

扩展深层架构的困难：堆叠多层图卷积会导致反向传播的高度复杂性。因此，大多数最先进的GCN模型通常不超过3层深。

实现：在原来的图学习框架中，学习了底层映射 $F$ ，它将图作为输入，输出一个新的图表示。

本文提出了一个图残差学习框架，通过拟合另一个映射 $F$ 来学习一个底层映射 $H$ 。 $\mathcal{G}_l$ 被 $F$ 变换后，进行逐点相加得到 $G_{l+1}$ 。
残差映射 $F$ 学会将一个图作为输入，并在下一层输出残差图表示 $G_{res l+1}$ 。
$W_l$ 为 $l$ 层的可学习参数集。此残差模型称为ResGCN。

3.3 Dense Connections in GCNs (GCN的密集连接)

1.GCNS DenseNet中的密集连接：为了利用层之间的密集连接，从而改善了网络中的信息流，并使层之间的特征能够有效地重用。本文将类似的思想应用于GCN，以便利用来自不同GCN层的信息流。

运算符 $\mathcal{T}$ 是将输入图 $\mathcal{G}_0$ 与所有中间GCN层输出密集融合的逐顶点级联函数。为此， $\mathcal{G}_{l+1}$ 由来自先前层的所有GCN过渡组成。此密集模型称为DenseGCN。
2.DenseGCN的增长率：等于输出图的维度 $D$ (类似于CNN的DenseNet)。例如，如果 $F$ 产生 $D$ 维顶点特征，其中输入图 $\mathcal{G}_0$ 的顶点是 $D_0$ 维的，则 $\mathcal{G}_{l+1}$ 的每个顶点特征的维度是 $D_0+D×(l+1)$ 。

3.4 Dilated Aggregation in GCNs（GCN的膨胀聚集）

有学者提出将膨胀卷积作为对密集预测任务(例如，语义图像分割)应用连续池化层的替代方案。实验表明，使用膨胀卷积聚集多尺度上下文信息可以显著提高语义分割任务的准确性。原因是扩张可以在不损失分辨率的情况下扩大感受野。作者认为，扩张也有助于加深GCNS的感受野。因此，作者将膨胀聚集引入GCNS。作者使用一个膨胀的 $k - NN$ 在每一个GCN层之后寻找膨胀的邻域，并构造一个膨胀的图。特别地，对于以扩张 $k - NN$ 和 $d$ 为扩张率的输入图 $\mathcal{G}=(\mathcal{V}，\mathcal{E})$ ，扩张 $k - NN$ 通过跳过每 $d$ 个邻域返回 $k \times d$ 邻域内的 $k$ 个最近邻域。根据预定义的距离度量确定最近的邻居。实验中，使用当前层的特征空间中的 $\mathcal{l}_2$ 距离。

GCNS的膨胀聚集。在网格中排列的结构化图形(例如2D图像)和一般结构化图形上的膨胀卷积的可视化。(上)2D卷积，核大小为3，膨胀率为1、2、4(从左到右)。(下)扩张率为1、2、4的动态图形卷积(从左至右)。

四、Experiments

提出了ResGCN和DenseGCN来处理GCNS的消失梯度问题。为了扩大感受野，作者为GCNS定义了一种扩张的图卷积算子。为了评估框架，作者在大规模点云分割任务上进行了广泛的实验，证明了其方法显著地提高了性能。此外，作者还进行了一项全面的消融研究，以显示框架的不同部分的影响。

提出了点云语义分割的GCN体系结构。(左)框架由三个块组成：GCN骨干块(输入点云的特征变换)、融合块(全局特征生成和融合)和MLP预测块(点标签预测)。(右)作者研究了三种类型的GCN骨干块(PlainGCN、ResGCN和DenseGCN)，并使用了两种层连接(ResGCN中使用的顶点相加或DenseGCN中使用的顶点拼接)。

五、Conclusion and Future Work

1.本文研究:如何将经过验证的有用概念(residual连接、dense连接和dilated卷积)从CNN引入GCNS，并回答了这个问题：如何使GCNS变得更深？
2.三个主要贡献：Res，Dense，Dilated。通过在GCNS中加入跳跃（residual）连接，可以缓解训练难度（梯度消失），这是阻碍GCNS深入的主要问题。此外，膨胀的图形卷积有助于在不损失分辨率的情况下获得更大的感受野。
3.具体实验：即使在最近邻较少的情况下，深度GCNS也能达到较高的点云语义分割性能。ResGCN-56在这项任务中执行得非常好，尽管它只使用8个最近邻居，而ResGCN-28使用16个最近邻居。作者还对ResGCN-151进行80个epochs的训练；该网络收敛得很好，取得了与ResGCN-28和ResGCN-56类似的结果，但只有3个最近邻。

你可能感兴趣的:(计算机视觉,CV论文精读,骨架动作识别,深度学习,神经网络,cnn,人工智能,卷积神经网络)

通用人工智能的多层次提示词架构 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
通用人工智能的多层次提示词架构关键词通用人工智能（AGI），多层提示词架构，人工智能设计原则，算法原理，系统架构设计，应用案例摘要本文将深入探讨通用人工智能（AGI）的多层次提示词架构，阐述其背景、核心概念、设计原则和实现方法。我们将逐步分析这一架构在不同领域的应用，并展望其未来的发展方向。通过本文，读者将了解如何构建能够模拟人类智能的多层次提示词系统，并思考其在实际应用中的潜力与挑战。目录第一部
半导体、芯片、人工智能、智能驾驶汽车的趋势不爱原创的Yoga 人工智能汽车
1.市场增长与需求汽车半导体市场：预计到2025年，中国汽车半导体市场仍将保持稳健增长态势，AI和能源将成为未来最重要的两大变革因素。2023年中国汽车电子芯片行业市场规模约为820.8亿元，预计2024年有望增至905.4亿元左右。随着新能源汽车和智能化的快速发展，一些新的半导体技术在中国汽车领域迅速应用，如集中式架构和高性能处理器需求正日益增加。AI芯片市场：随着AI技术的不断普及和应用场景的
Minimax 开源的 4 百万超长上下文模型百态老人人工智能大数据笔记
MiniMax开源4百万超长上下文模型MiniMax开源模型概述2025年1月15日，MiniMax发布并开源了MiniMax-01全新系列模型，这一举措在人工智能领域引发了广泛关注。该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax作为大模型六小强（或六小虎）企业之一，其推出的这一系列模型有着诸多独特之处。这一系列模型的开源是Min
程序员创业公司的技术栈选择与性能优化 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《程序员创业公司的技术栈选择与性能优化》概述本文旨在探讨程序员创业公司在选择技术栈和进行性能优化方面的策略与实践。随着技术的不断进步和市场的快速变化，技术栈的选择和优化成为创业公司成功的关键因素。正确的技术栈选择不仅能够提升系统的性能和可扩展性，还能降低开发成本和维护难度。关键词技术栈选择性能优化创业公司云计算数据库微服务人工智能区块链边缘计算摘要本文首先分析了技术栈选择的重要性以及创业公司在技术
AI人工智能深度学习算法：高并发场景下深度学习代理的性能调优 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度学习代理的兴起近年来，随着人工智能技术的飞速发展，深度学习在各个领域都取得了显著的成果。特别是在自然语言处理、图像识别、语音识别等领域，深度学习模型的性能已经超越了传统方法。为了更好地将深度学习技术应用于实际场景，深度学习代理应运而生。深度学习代理是一种将深度学习模型封装起来，并提供对外接口的服务。它可以接收来自客户端的请求，将请求数据输入到深度学习模型中进行推理，并将推理结
AI生成PPT：智能技术重塑演示文稿创作的新篇章 mhjidfoi 人工智能
在快节奏的商业与学术环境中，演示文稿（PPT）作为信息传递与观点展示的重要工具，其质量与效率直接关系到演讲者的说服力和观众的接收度。近年来，随着人工智能（AI）技术的飞速发展，AI生成PPT的应用正逐渐从科幻概念转变为现实工具，为演示文稿的创作带来了革命性的变革。本文将深入探讨AI生成PPT的工作原理、优势、挑战以及未来展望，为您揭示这一智能技术的无限潜力。一、AI生成PPT的工作原理AI生成PP
零门槛一键生成PPT，利用人工智能快速提高办公效率（无需第三方插件） beautycountry88 powerpoint 人工智能
人工智能技术的发展正以惊人的速度改变着我们的世界，今天给大家介绍下利用ChatGPT快速生成PPT的方法，它能够帮助你一键生成PPT内容和漂亮的PPT文档，无需繁琐的设计和排版，只需要与ChatGPT交流，你就能轻松拥有一份令人赞叹的演示文稿。什么是ChatGPT？它是基于人工智能技术的语言模型，能够理解和生成自然语言。与传统的PPT制作方式不同，ChatGPT通过与你进行对话，理解你的需求和要点
探索AloT（人工智能物联网）：未来智能设备的核心驱动力为也科技人工智能物联网边缘计算目标检测 iot
探索AloT（人工智能物联网）：未来智能设备的核心驱动力随着物联网（IoT）技术的飞速发展，人工智能（AI）也在各行各业中找到了应用的空间。两者的结合，诞生了一个崭新的技术领域——AloT（ArtificialIntelligenceofThings，人工智能物联网）。AloT不仅仅是AI与物联网技术的简单融合，它更是推动智能设备进化和物联网产业向更高层次发展的关键力量。今天，我们就来深入探讨Al
Python中实现多层感知机（MLP）的深度学习模型 Echo_Wish Python 笔记从零开始学Python人工智能 python 深度学习开发语言
深度学习已经成为机器学习领域的一个热门话题，而多层感知机（MLP）是最基础的深度学习模型之一。在这篇教程中，我将向你展示如何使用Python来实现一个简单的MLP模型。什么是多层感知机（MLP）？多层感知机（MLP）是一种前馈神经网络，它包含一个输入层、一个或多个隐藏层以及一个输出层。每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非
深度学习-92-大语言模型LLM之基于langchain的模型IO的模型调用皮皮冰燃深度学习深度学习语言模型 langchain
文章目录1Model的输入输出2langchain支持的模型3调用Ollama模型3.1设置环境变量3.2大语言模型LLM(OllamaLLM)3.2.1生成文本补全3.2.2流式生成文本补全3.3聊天模型(ChatOllama)3.3.1内置的消息类型3.3.2HumanMessage和SystemMessage3.3.3元组方式构成消息列表3.3.4stream流式3.4文本嵌入模型(Olla
静态代理和动态代理学习都要好好的O java基础 java 动态代理静态代理
静态代理学习:目标对象和代理对象共同实现的接口packagestaticproxy;publicinterfaceTargetInterface{//说话的方法publicvoidsay();//吃饭的方法publicvoideat();}目标类packagestaticproxy;//目标对象publicclassTargetimplementsTargetInterface{@Override
深度学习基础18（多层感知机代码实现） NDNPOMDFLR 深度学习深度学习 python 经验分享人工智能神经网络
多层感知机的从零开始实现现在自己实现一个多层感知机。为了与之前softmax回归获得的结果进行比较，将继续使用Fashion-MNIST图像分类数据集importtorchfromtorchimportnnfromd2limporttorchasd2lbatch_size=256train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)
人工智能与量子计算：未来编程的碰撞与共鸣大梦百万秋知识学爆量子计算
引言：编程的“摩尔定律”快到尽头了？曾几何时，摩尔定律曾预言着计算能力的飞速发展——每两年，晶体管的数量翻倍，处理器的速度也在跟着疯狂增长。这个定律引领了数十年的技术革命，推动了今天的智能手机、超级计算机和现代互联网的诞生。然而，摩尔定律的黄金时代正逐渐走向尾声。传统的硅基芯片工艺遇到了物理极限，无法再轻易实现持续的性能翻倍。此时，新的计算范式开始崭露头角——量子计算与人工智能（AI）的结合，正在
AI Agent：深度解析与未来展望码事漫谈 c++人工智能
一、AIAgent的前世：从概念到萌芽（一）早期探索AIAgent的概念可以追溯到20世纪50年代，早期的AI研究主要集中在简单的规则系统上，这些系统的行为是确定性的，输出由输入决定。随着时间的推移，AI逐渐能够处理不确定性，1990年代机器学习的兴起为AIAgent的发展奠定了基础，神经网络技术的突破为深度学习的发展提供了可能。（二）技术突破2017年后，大语言模型（LLM）的出现推动了AIAg
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【人工智能】Python常用库-Keras：高阶深度学习 API IT古董深度学习人工智能 Python 人工智能 python 深度学习
Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。Keras的发音为[ˈkerəs]，类似于“凯拉斯”或“克拉斯”。这个名字来源于希腊语κέρας(kéras)，意思是“角”或“角质物”。这个词与深度学习的灵感来源——大脑的神经网络结构有一定联系。Kera
深度求索DeepSeek V2.5-1210发布：AI代码生成器迎来全新升级 2401_89759264 人工智能前端
深度学习技术日新月异，而强大的AI代码生成器也随之不断进化。今天，我们将聚焦于深度求索团队发布的DeepSeekV2.5-1210版本，这款标志着DeepSeekV2系列收官之作，为我们带来了令人惊喜的Post-Training能力提升和备受期待的联网搜索功能。这篇文章将深入探讨DeepSeekV2.5-1210的各项改进，以及其开源带来的深远影响。DeepSeekV2系列的研发历程与V2.5-1
DCGAN - 深度卷积生成对抗网络：基于卷积神经网络的GAN 池央生成对抗网络 cnn 深度学习
深度卷积生成对抗网络（DCGAN，DeepConvolutionalGenerativeAdversarialNetwork）是生成对抗网络（GAN）的一种扩展，它通过使用卷积神经网络（CNN）来实现生成器和判别器的构建。与标准的GAN相比，DCGAN通过引入卷积层来改善图像生成质量，使得生成器能够生成更清晰、更高分辨率的图像。DCGAN提出了一种通过卷积结构来提高图像生成效果的策略，并在多个领域
南京大学苏州校区学生代表团到访合合信息，开启“沉浸式”人工智能企业行人工智能图像识别程序员
为进一步深化校企合作，探索产业科技拔尖创新人才培养新模式，近期，南京大学苏州校区师生代表到访上海合合信息科技股份有限公司（以下简称“合合信息”，股票代码：SH688615）。此次活动设置了展厅讲解、技术交流、模拟面试等多个体验环节，旨在增强学生对人工智能及商业大数据技术在实际应用中的理解和认识，引导学生系统性开展职业规划，提升职业胜任力。图说：南京大学苏州校区学生代表团到访合合信息合影留念合合信息
【Node.js] ADFVBM 面试学习路线阿里巴巴 node.js
一、概述Node.js是一个基于ChromeV8引擎的JavaScript运行环境，使用了一个事件驱动、非阻塞式I/O模型，让JavaScript运行在服务端的开发平台，它让JavaScript成为与PHP、Python、Perl、Ruby等服务端语言平起平坐的脚本语言。官网地址：https://nodejs.org/zh-cnNode.js学习路线：JavaScript基础语法+Node.js内
深度学习从入门到精通：全面指南 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《深度学习从入门到精通：全面指南》文章目录《深度学习从入门到精通：全面指南》文章关键词文章摘要引言第一部分：深度学习基础入门第1章：深度学习概述1.1深度学习的基本概念1.2深度学习的发展历程1.3深度学习的基本原理神经网络前向传播反向传播第2章：深度学习框架入门2.1TensorFlow入门TensorFlow环境搭建TensorFlow基本数据结构2.2PyTorch入门PyTorch环境搭建
ECCV 2024 | CC-SAM：用于超声图像分割的跨特征注意力和上下文的SAM 小白学视觉计算机顶会论文解读人工智能 ccf-a ECCV 计算机顶会深度学习
论文信息题目：CC-SAM:SAMwithCross-featureAttentionandContextforUltrasoundImageSegmentationCC-SAM：用于超声图像分割的跨特征注意力和上下文的SAM作者：ShreyankNGowda和DavidA.Clifton论文创新点变分注意力融合模块（VariationalAttentionFusionModule）：作者提出了一
反转字符串中的单词 II：Swift 实现与详解网罗开发 Swift vue.js
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
第十九周：SSD（Single Shot MultiBox Detector） L-含光承影目标跟踪人工智能计算机视觉
SSD（SingleShotMultiBoxDetector）摘要Abstract1引言2SSD框架2.1设计理念2.2训练2.3预测3创新与不足总结参考摘要本篇博客介绍了SSD（SingleShotMultiBoxDetector），这是一种基于全卷积网络的单阶段目标检测模型。与双阶段检测模型（如FasterR-CNN）相比，SSD在保持较高检测精度的同时，显著提升了检测速度，使其更适用于实时检
AIGC视频生成模型：Meta的Emu Video模型好评笔记 #Meta AIGC-视频 AIGC 机器学习人工智能 transformer 论文阅读深度学习面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
【Python】已解决ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
【粉丝福利社】Python OpenCV从入门到精通愚公搬代码愚公系列-送书福利社 python opencv 开发语言
标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家等。近期荣誉2022年度博客之星TOP2，2023年度博客之星TOP2，2022年华为云十佳博主，2023年华为云十佳博主，2024年华为云十佳博主等
实时离线AI字幕生成与翻译功能在智能眼镜上的应用展望花生糖@ AIGC学习资料库 VLC播放器 AI AIGC 方案技术 AI眼镜
随着人工智能（AI）技术的不断进步，实时字幕生成和翻译功能正逐渐从传统的云服务走向本地设备，为用户提供了更为便捷、私密且广泛适用的服务。特别地，当这些先进的AI能力被集成到诸如智能眼镜这样的穿戴式设备中时，它们可以极大地改善用户体验，并开拓一系列全新的应用场景。技术框架概述VLC播放器近期推出的基于AI的实时字幕生成和翻译功能，标志着一个重要的里程碑。这项创新不仅限于视频播放器内部，而是为整个智能
【Python】已解决：ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
一文洞悉AI技术架构：大模型、智能体与应用场景大模型玩家人工智能架构数据库深度学习 pytorch transformer ai
人工智能（AI）的发展，正以前所未有的速度重塑我们的世界。从能与人对话的大语言模型到自动驾驶、精准医疗，AI的背后究竟隐藏着怎样的技术奥秘？本篇文章将为您深度剖析一套先进的AI技术架构，从基础设施到应用层，每一层都充满了惊喜和启发。读完本文，您不仅能看懂AI的底层逻辑，还能掌握其对各行业变革的潜力与方向。一、基础设施层：AI技术的坚实地基基础设施层是AI技术架构的“地基”，为整个系统提供计算能力和
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他