北_清

ResNet——图像识别中的深度残差学习

论文题目：Deep Residual Learning for Image Recognition
论文地址：https://arxiv.org/pdf/1512.03385.pdf
发表于：cvpr,2016

前言

CNN分类网络自Alexnet的7层发展到了VGG的16以及19层，后来更有了Googlenet的22层。然而深度CNN网络达到一定深度后再一味地增加层数并不能带来进一步地分类性能提高，反而会导致网络收敛变得更慢。ResNet 深度残差网络，通过建立前面层与后面层的“短路连接”（shortcuts /skip connection），有助于训练过程中梯度的反向传播，从而能训练出更深的CNN网络。

在ImageNet数据集上，ResNet的深度高达152层——比VGG网络深8层，但仍然具有较低的复杂度。在ImageNet测试集上达到了3.57%的误差，该结果在ILSVRC 2015年分类任务中获得了第一名。在ILSVRC&COCO 2015竞赛中获得图像网检测、ImageNet定位、COCO检测和COCO分割任务的第一名。

文章目录

一、研究动机

二、论文创新点

三、相关工作

1、残差表示（Residual Representations）

2、快捷连接（Shortcut connections）

四、主要内容

1、残差学习（Residual Learning）

2、恒等映射（Identity Mapping by Shortcuts）

3、网络架构（Network Architectures）

五、实验设置

六、实验结果

1、评估18层和34层的简单/残差网络

2、更深的Residual结构(改为了瓶颈结构)的探究

一、研究动机

传统的堆叠网络有两个缺点：（1）网络难以收敛，梯度消失或梯度爆炸在一开始就阻碍网络的收敛。传统解决方法为标准初始化和中间标准化层。这使得数十层的网络能通过具有反向传播的随机梯度下降（SGD）开始收敛。（2）当更深的网络能够开始收敛时，暴露了一个退化问题：随着网络深度的增加，准确率达到饱和然后迅速下降。并且这种下降不是由过拟合引起的，在适当的深度模型上添加更多的层反而会导致更高的训练误差。

假设训练了一个浅层网络，在其后面直接添加多层恒等映射层而构成一个深层网络，这个深层网络不会比浅层网络差，但是在合理的时间内实现不了。因此不是所有的系统都很容易优化，即深层网络不容易被优化，不一定能达到更好的效果。残差结构的提出的目的即为解决上述退化问题，以及网络优化难的问题。

在使用20层和56层“普通”网络在CIFAR-10上的训练错误（左）和测试错误（右）如上图所示。可见较深的网络训练误差越大，同时测试误差也越大。

二、论文创新点

提出了一个残差学习框架，以简化深层网络的训练。它通过使用多个有参层来学习输入输出之间的残差表示，而非像一般CNN网络（如Alexnet/VGG等）那样使用有参层来直接尝试学习输入、输出之间的映射。实验表明使用一般意义上的有参层来直接学习残差比直接学习输入、输出间映射要容易得多（收敛速度更快），也有效得多（可通过使用更多的层来达到更高的分类精度）。

三、相关工作

1、残差表示（Residual Representations）

在图像识别中，VLAD是一种对字典的剩余向量进行编码的表示，Fisher向量可以表示为VLAD的概率版本。它们都是图像检索和分类的强大的浅层表示。对于向量量化，对残差向量的编码比编码原始向量更有效。

在低级视觉和计算机图形学中，为了求解偏微分方程，广泛使用的多重网格方法将系统重新定义为多个尺度上的子问题，其中每个子问题负责更粗糙和更细尺度之间的残差解。多重网格的另一种选择是分层的基础预处理，它依赖于表示两个尺度之间的残差向量的变量。已经证明，这些解比不知道解的剩余性质的标准解收敛要快得多。一个良好的重新配方或预处理可以简化优化的过程。

2、短路连接（Shortcut connections）

短路连接的实践和理论已经被研究了很久。训练多层感知器（MLPs）的早期实践是添加一个从网络输入连接到输出的线性层。一些中间层直接连接到辅助分类器，用于解决梯度消失或者爆炸的问题。通过短路连接也可以来实现中心层响应、梯度和误差传播。一个“初始”层可以由一个短路分支和几个更深的分支组成。

同时，Highway 网络提供了门功能的短路连接。这些门依赖于数据，并且有参数，而我们的恒等短路连接是无参数的。当门控捷径“关闭”（接近零）时，Highway网络中的层代表非残差函数。相反，我们的公式总是学习残差函数；恒等式捷径永远不会关闭，所有的信息总是被传递，有额外的残差函数需要学习。此外，Highway网络没有证明精度随着极端深度的增加而增加。

四、主要内容

1、残差学习（Residual Learning）

将H(x)视为一个底层映射，以适合于几个堆叠的层，x表示第一层的输入。如果假设多个非线性层可以渐近近似复杂函数，则等价于假设它们可以渐近近似残差函数，即H(x)−x（假设输入和输出具有相同的维数）。因此，我们不是期望堆叠的层近似于H(x)，而是显式地让这些层近似于一个残差函数F(x)=H(x)−x，原始函数成为F(x)+x。虽然这两种形式都能够渐近地近似所需的函数，学习的容易性是不同的。

如果添加的层可以被构建为恒等映射，更深模型的训练误差应该不大于它对应的更浅版本。退化问题表明，求解器在用多个非线性层逼近恒等映射时可能存在困难。对于残差学习重构，如果恒等映射是最优的，求解器可以简单地将多个非线性层的权值推向零，以接近恒等映射。

在实际情况下，恒等映射不太可能是最优的，但重新表述可能有助于解决问题的先决条件。如果最优函数更接近于一个恒等映射，而不是一个零映射，那么求解器应该更容易找到参照一个恒等映射的扰动，而不是学习该函数作为一个新的函数。我们通过实验表明，学习到的残差函数一般的响应较小，这表明恒等映射提供了合理的预处理。

2、恒等映射（Identity Mapping by Shortcuts）

我们每隔几个堆叠层就采用残差学习。一个构建块如上图所示。在形式上，我们考虑一个定义为：

函数F(x)表示要学习的残差映射。对于上图中有两层的例子，是F=W2σ(W1x)，其中σ表示ReLU激活函数，操作F+x通过短路连接和元素级加法来执行。短路连接既不引入额外的参数，也不增加计算复杂度。这不仅在实践中很有吸引力，而且在比较普通网络和残差网络时也很重要，可以公平地比较同时具有相同数量的参数、深度、宽度和计算成本的普通/残差网络。

X和F的尺寸在上述公式中中必须相等。如果不是这种情况，可以通过短路连接执行线性投影Ws，以匹配以下尺寸：

3、网络架构（Network Architectures）

用两个设计规则来设计残差网络：（i）对于相同的输出特征图尺寸，层具有相同数量的滤波器；（ii）如果特征图尺寸减半，则滤波器数量加倍，以便保持每层的时间复杂度，通过步长为2的卷积层直接执行下采样。

下图中的右两个网络以全局平均池化层和具有softmax的1000维全连接层结束。左：作为参考的VGG-19模型。中：顺着VGG网络思维继续加深其层次而形成的一种VGG朴素网络，共有34个含参层。右：与上述34层朴素网络相对应的Resnet网络，主要由残差单元来构成。

在普通网络的基础上，插入短路连接，将网络转化为对应的残差版本。当输入和输出具有相同尺寸时，可以直接使用恒等短路连接（下图右实线）。当维度增加时（下图右虚线），考虑两个选项：（i）短路连接仍然执行恒等映射，额外填充零输入以增加维度。此选项不会引入额外的参数；（ii）投影短路连接用于匹配维度（由1×1卷积完成）。对于这两个选项，当短路方式跨越两种大小的特征图时，以2的步幅执行。

五、实验设置

在训练过程中，图像被调整大小，其较短的边在[256,480]之间进行随机采样，用于尺度增强。24×224裁剪是从图像或其水平翻转中随机采样，并逐像素减去均值，使用标准颜色增强。在每次卷积后和激活之前，采用批处理归一化（BN）。初始化权重，并从零开始训练所有的普通/残差网络。我们使用的是批大小为256的SGD方法。学习率从0.1开始，当误差趋于稳定时除以10，模型训练高达60×104次迭代。我们使用的权重衰减为0.0001，动量为0.9。不采用dropout。

在测试中，为了比较学习，采用标准的10-crop测试。为了获得最好的结果，采用全卷积形式，并在多尺度上对分数进行平均（图像归一化，短边位于{224, 256, 384, 480, 640}中）。

六、实验结果

论文一共提出5种ResNet网络，网络参数统计表如下。下采样由conv3_1、conv4_1和conv5_1 执行，步幅为2。

1、评估18层和34层的简单/残差网络

下面是在ImageNet上训练的结果。细曲线表示训练误差，粗体曲线表示中心作物的验证误差。左图：18层和34层的普通网络。右图：18层和34层的ResNets。在这个图中，残差网络与普通的网络相比没有额外的参数。

2、更深的Residual结构(改为瓶颈结构)的探究

对于更深的网络，由于担心能够负担的训练时间，对于每个残差函数F，使用3层的堆栈，而不是2层。三层分别是1×1、3×3和1×1卷积，其中1×1层负责减少和增加（恢复）尺寸，使3×3层成为输入输出尺寸更小的瓶颈结构块。下图中两种设计具有相似的时间复杂度。无参数的短路连接对于瓶颈体系结构尤为重要。如果将图5（右）中的短路连接替换为投影，则时间复杂度和模型大小增加了一倍。

你可能感兴趣的:(神经网络,神经网络,人工智能,深度学习)

自动驾驶系统研发系列—追尾风险不再隐形：解密后碰撞预警系统（RCW）的技术与应用学步_技术自动驾驶系统研发自动驾驶人工智能机器学习 RCW
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
python3+TensorFlow 2.x 基础学习（一）刀客123 python学习 tensorflow 学习人工智能
目录TensorFlow2.x基础1、安装TensorFlow2.x2、TensorFlow2.x基础概念2、1EagerExecution2、2TensorFlow张量（Tensor）3、使用Keras构建神经网络模型3、1构建Sequential模型3、2编译模型1、Optimizer（优化器）2、Loss（损失函数）3、Metrics（评估指标）3、3训练模型3、4评估模型3、5预测4、使用
自动驾驶系列—自动驾驶MCU架构全方位解析：从单核到多核的选型指南与应用实例学步_技术自动驾驶自动驾驶单片机架构 MCU
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
2025数学建模美赛——神经网络预测模型详解前程算法屋数学建模教程数学建模神经网络人工智能
2025数学建模美赛——神经网络预测模型详解一、神经网络预测模型基础1.1、神经网络概述神经网络是一种模拟人脑神经元工作方式的计算模型，它由大量的节点（或称为神经元）组成，这些节点通过连接权重相互连接。这种模型能够进行复杂的非线性数据处理，通过调整连接权重，可以从数据中学习到复杂的模式和关系。神经网络的基本结构包括输入层、隐藏层和输出层。输入层接收外部数据，隐藏层对数据进行处理，输出层则给出模型的
你知道吗？其实这些都是AI——智能聊天机器人贫苦游商人工智能机器人机器学习 AIGC 制造
智能聊天机器人AI：优化用户体验的智能助手在现代的数字化生活中，智能聊天机器人已经成为许多中国社交平台上不可或缺的一部分。这些机器人通过人工智能技术的支持，为用户提供各种互动服务，从回答常见问题到提供个性化建议，极大地提升了用户体验和平台的服务质量。智能聊天机器人AI的核心在于其强大的自然语言处理能力。通过分析用户的输入文本，这些系统能够理解用户的意图，并生成相应的回复。例如，当用户在购物平台上询
分享当下最热门的AI工具合集香橙薄荷心人工智能人工智能
1、ChatGPTChatGPT一个基于人工智能技术的虚拟助手，旨在为用户提供信息、解答问题和协助完成各种任务。我能够处理多种主题，包括但不限于科学、技术、文化、历史等领域。我的目标是为您提供准确、及时的帮助，以提升您的工作和生活效率这个，可免费使用GPT-3.5和GPT-4.0模型~推荐指数：⭐⭐⭐⭐⭐链接：点击直达>>>2、ChatGAIChatGAI是一个基于人工智能技术的语言模型，旨在理解
信息学/计算机系各种网站（学习资源、常用工具及其他）一只贴代码君命令大全-干货合集学习 dubbo java 开发语言算法 c++
大学指南上海交通大学生存手册中国科学技术大学人工智能与数据科学学院本科进阶指南USTC不完全入学指南大学生活质量指北科研论信息搜集AI信息搜集USTC飞跃网站计算机保研技术新闻HackerNewsTheHackerNewsTechCrunchArsTechnicaMITNews技术博客日更技术雷达学习资源CS清华计算机系学生科协技能引导文档菜鸟教程北大CS自学指南OpenSourceSociety
2024年人工智能领域发生了哪些事儿？全球AI大事件1至12月盘点人工智能aigc
2024年，对人工智能（AI）而言是激动人心的一年。这一年不仅见证了AI技术的全面突破，也深刻改变了社会生活的方方面面。从金融到医疗、从教育到娱乐，AI的深度渗透无处不在。显然，这项技术已经从概念走向普及，并开始重新定义我们的未来。一月：人机交互技术的崭新开端2024年1月30日：Neuralink脑机接口植入Neuralink宣布，首名人类成功接受脑机接口芯片植入手术。这项手术由机器人完成，芯片
第84期 | GPTSecurity周报 aigc
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
未来商贸物流：人工智能与大数据的深度融合呆码科技临沂软件开发软件开发商贸物流科技人工智能
未来商贸物流：人工智能与大数据的深度融合在当今数字化浪潮汹涌澎湃的时代，商贸物流行业正站在变革的十字路口，而人工智能与大数据宛如一对闪耀的双子星，为其照亮前行的道路，深度融合之下，一个全新的未来画卷正徐徐展开。智能预测需求：精准把握市场脉搏传统的商贸物流往往依赖过往经验和粗略的市场调研来预估货物需求，这就如同在迷雾中摸索，充满不确定性。而如今，借助大数据的海量存储与超强分析能力，以及人工智能的深度
从文字到思维：呆马GPT在人工智能领域的创新之旅呆码科技 gpt 人工智能
引言生成式预训练变换器（GenerativePre-trainedTransformer，简称GPT）领域是人工智能技术中的一大革新。自OpenAI推出第一代GPT以来，该技术经历了多代发展，不断提升模型的规模、复杂度和智能化程度。GPT模型通过在大规模数据集上进行预训练，学习语言的统计规律和世界知识，然后在特定任务上进行微调，以适应不同的应用需求。GPT领域的发展推动了自然语言处理（NLP）技术
小米Vela操作系统开源：AIoT时代的全新引擎 lilu8888888 开源前端
小米近日正式开源了其物联网嵌入式软件平台——Vela操作系统，并将其命名为OpenVela。这一举动在AIoT（人工智能物联网）领域掀起了不小的波澜，也为开发者们提供了一个强大的AI代码生成器和开发平台。OpenVela项目源代码已托管至GitHub和Gitee，采用Apache2.0开源协议，这意味着全球开发者都可以参与其中，共同推动物联网技术的进步。……Vela操作系统基于开源实时操作系统Nu
智源社区AI周刊：Hinton预测破解大脑机制时间；Gary Marcus批判追捧深度学习风潮；谷歌发布Imagen... 智源社区机器学习人工智能深度学习编程语言大数据
汇聚每周必看AI观点、研究和各类资源，不错过一条重要资讯！欢迎扫码订阅，获取邮件推送。观点“我们会在未来的五年内破解这些（人脑的）程序......现有的一切人工智能，都是建立在与大脑高层次上所做的事情完全不同的基础上......假设有数十亿的参数，这些神经元间的权重在大量训练实例的基础上去调整，会发生奇妙的事情。大脑是如此，深度学习也是如此。但问题在于，如何获得调整参数的梯度......目前我的信
深度探索 DeepSeek-R1：国产大模型的AGI雏形与创新进展微凉的衣柜科技头条 agi 人工智能
随着人工智能技术的飞速发展，国内外企业纷纷发布了一系列创新的大模型，推动了AGI（通用人工智能）领域的探索。近期，DeepSeek-R1这一模型的发布引起了广泛关注，它不仅标志着国产大模型在智能化上的一次重大突破，还提出了全新的训练方法，解决了过去依赖大量人类数据的问题。本篇文章将详细介绍DeepSeek-R1的核心优势、技术创新以及实际应用案例，揭示它在AGI领域的潜力。1.DeepSeek-R
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争 xidianjiapei001 AI-人工智能与大模型人工智能 AI DeepSeek 大模型
这家公司打造出了一款成本更低且颇具竞争力的聊天机器人，其使用的高端计算机芯片数量少于谷歌和OpenAI等美国巨头企业，这凸显出芯片出口管制的局限性。圣诞节次日，一家名为DeepSeek的中国小型初创公司推出了一款新的人工智能系统，其性能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。仅此一点就堪称一个里程碑。但这个名为DeepSeek-V3系统的研发团队称，他们迈出了更大的一步。在一篇解释该技
学习AI职场应用技能的意义 Mieux718 学习人工智能
在智能化浪潮下，“人工智能+”通识必修课的普及，其核心并非在于培养人工智能领域的专家，而是旨在构建全民AI素养的基石。学习AI是可以让学生借助其技术力量，为各自的专业领域插上创新的翅膀。除了高校外，越来越多的企业也开始关注AI对企业业务的帮助，职场中掌握AI也变得越来越重要。随着人工智能技术的发展，许多行业都在引入相关技术和应用，人工智能应用场景已深度融入办公流程、项目管理、项目运营、客户服务等工
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
2024人工智能AI+制造业应用落地研究报告汇总PDF洞察（附原数据表）拓端研究室人工智能
原文链接：https://tecdat.cn/?p=39068本报告合集洞察深入剖析当前技术应用的现状，关键技术创新方向，以及行业应用的具体情况，通过制造业具体场景的典型案例揭示人工智能如何助力制造业研发设计、生产制造、运营管理和产品服务的全流程智能化升级。在此基础上对制造业人工智能的未来发展趋势进行展望，以期为相关政策制定者以及行业从业者提供决策支持，共同助力我国制造业在人工智能时代的转型升级和
基于RBF神经网络的在线学习算法 fanxbl957 人工智能理论与实践神经网络学习算法
基于RBF神经网络的在线学习算法一、引言随着信息技术的飞速发展，数据的产生速度日益加快，传统的批量学习算法在处理大规模、实时更新的数据时面临着诸多挑战。在线学习算法作为一种可以实时更新模型的学习方式，逐渐受到广泛关注。RBF（径向基函数）神经网络作为一种强大的神经网络模型，以其良好的函数逼近能力和非线性处理能力，为在线学习提供了一种有效的工具。本文将深入探讨基于RBF神经网络的在线学习算法，包括其
Open AI GPT大模型深度解析：通往智能的里程碑 xziyuan 人工智能 gpt
大模型——OpenAIGPT大模型介绍人工智能技术的快速发展引发了对智能系统和应用的巨大需求。多模态大模型已经成为了人工智能领域的重要研究方向之一。OpenAI作为一家全球领先的人工智能公司，在推动人工智能技术的边界上发挥着重要作用，其在大模型方面的研究和应用也是一直处于领先地位。本文将介绍OpenAI多模态大模型的研究成果和应用，探讨其在人工智能领域的重要性和影响力，以及给世界带来的可能性。1.
# AI计算模式神经网络模型深度神经网络多层感知机卷积神经网络循环神经网络长短期记忆网络图像识别、语音识别、自然语言轻量化模型和模型压缩大模型分布式并行 EwenWanW AGI 人工智能神经网络 dnn
AI计算模式AI技术发展至今，主流的模型是深度神经网络模型。近20年来，神经网络模型经过多样化的发展，模型总体变得越来越复杂和庞大，对硬件设备的计算速度、存储能力、通信速度的要求越来越高。尽管学者已经提出了许多方法优化模型结构，降低模型的参数量，但是伴随着人们对AI能力的要求越来越高，模型变得更大是不可避免的。原先单CPU可进行模型的训练与推理，如今需要使用GPU、TPU等设备，并通过分布式并行的
AI Agent：一场智能革命的开始机器人openai区块链
在当今科技日新月异的时代，AI（人工智能）技术正以前所未有的速度改变着我们的生活和工作方式。其中，AIAgent作为AI领域的一个新兴分支，正逐渐展现出其巨大的潜力和价值。本文将深入探讨AIAgent的发展现状、核心优势以及未来的发展方向，带您领略这一前沿技术的无限魅力。一、AIAgent的发展现状：技术突破与广泛应用近年来，随着大数据、云计算和机器学习等技术的飞速发展，AIAgent的技术水平得
多层感知机和神经网络的区别_情感分析之多层全连接神经网络 weixin_39653766 多层感知机和神经网络的区别
全连接神经网络全连接神经网络是一种最基本的神经网络结构，英文为FullConnection，所以一般简称FC。FC的准则很简单：神经网络中除输入层之外的每个节点都和上一层的所有节点有连接。上图是一个双隐层的前馈全连接神经网络，或者叫多层感知机(MLP)。它的每个隐层都是全连接层。它的每一个单元叫神经元。多层感知机在单层神经网络的基础上引入了一到多个隐藏层(hiddenlayer)。隐藏层位于输入层
python面试情景题_50道python笔试面试真题大集合我是史迪仔 python面试情景题
Python爬虫人工智能100GBweb爬虫数据分析人工智能视频免费领题目后面有50道题答案领取方式哦1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量利用global修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两
AI人工智能代理工作流 AI Agent WorkFlow：在金融领域中的应用 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：在金融领域中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgentWorkFlow,金融风险管理,自动化投资决策,数据驱动策略生成,量化交易系统1.背景介绍1.1问题的由来随着金融市场全球化和技术的飞速发展，金融机构面临着日益复杂的业务挑战。从风险管理和投资决策到客户关系管理
快手可灵视频生成大模型全方位测评人工智能llm
快手视频生成大模型“可灵”（Kling），是全球首个真正用户可用的视频生成大模型，自面世以来，凭借其无与伦比的视频生成效果，在全球范围内赢得了用户的热烈追捧与高度评价。截至目前，申请体验其内测版的用户数量已突破70万大关，累计生成的视频作品更是高达700万。可灵在持续创新的道路上也从未停下脚步，在七月份举办的世界人工智能大会（WAIC）期间，可灵再次迎来重大升级。新功能包括上线web端、基础模型效
AAAI2024论文解读|Memory-Efficient Reversible Spiking Neural Networks-water-merged paixiaoxin 文献阅读论文合集脉冲神经网络可逆架构内存效率深度学习训练优化 AAAI
论文标题Memory-EfficientReversibleSpikingNeuralNetworks内存高效可逆脉冲神经网络论文链接Memory-EfficientReversibleSpikingNeuralNetworks论文下载论文作者HongZhang,YuZhang内容简介本文提出了一种可逆脉冲神经网络（RevSNN），旨在降低脉冲神经网络（SNNs）在训练过程中对中间激活和膜电位的内
深入详解神经网络的基础知识、工作原理以及应用【一】猿享天开人工智能基础知识学习深度学习神经网络人工智能
目录引言1.神经网络基础1.1感知器模型1.2多层感知器（MLP）示例：2.前馈神经网络（FeedforwardNeuralNetworks,FFNN）2.1结构与特点2.2训练过程2.3优化方法3.卷积神经网络（CNN）3.1基本概念3.2层类型3.3网络架构3.4应用领域3.5示例代码示例描述：4.循环神经网络（RNN）4.1基本概念4.2RNN结构4.3应用领域4.4示例代码示例描述：5.深
AI人工智能代理工作流AI Agent WorkFlow：智能代理在金融系统中的应用 AGI大模型与大数据研究院大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：智能代理在金融系统中的应用1.背景介绍1.1金融系统的重要性金融系统是现代经济的核心支柱,它确保资金在不同经济实体之间的有效流动和分配。一个高效、可靠的金融系统对于促进经济增长、维护金融稳定和满足社会资金需求至关重要。然而,金融系统也面临着诸多挑战,例如复杂的监管要求、日益增长的交易量、网络安全风险等。1.2人工智能在金融领域的应用近年来,人工
8.2 从看图识字到智能解读：GPT-4 with Vision 开启多模态 AI 新纪元少林码僧 AI大模型应用实战专栏人工智能 chatgpt
从看图识字到智能解读：GPT-4withVision开启多模态AI新纪元引言：AI的多模态跃迁随着人工智能技术的快速发展，我们正迈入一个新的智能交互时代。传统的AI模型主要聚焦于文本处理，而多模态AI模型如GPT-4withVision（GPT-4V）则能够同时处理图像和文本。GPT-4V是OpenAI推出的多模态版本，它不仅能理解图片，还能结合文字对图片内容进行深入分析。这项技术为教育、创意、医
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他