怎么全是重名

MnasNet: Platform-Aware Neural Architecture Search for Mobile（2019）

文章目录

Abstract
- 存在的挑战
- 给出方法
- 实验支撑
Introduction
- 目前的困境
- 给出的方法
- 主要贡献
Related Work
Problem Formulation
Mobile Neural Architecture Search
- Factorized Hierarchical Search Space
- Search Algorithm
Experimental Setup
Results
- ImageNet Classification Performance
- Model Scaling Performance
- COCO Object Detection Performance
Ablation Study and Discussion
- Soft vs. Hard Latency Constraint
- Disentangling Search Space and Reward
- MnasNet Architecture and Layer Diversity
Conclusion

原文链接
源代码

Abstract

存在的挑战

为移动设备设计卷积神经网络(CNN)具有挑战性，因为移动模型需要小而快，并且准确。尽管在设计和改进移动cnn方面已经付出了巨大的努力，但当有如此多的架构可能性需要考虑时，手动平衡这些权衡（准确性和延迟）是非常困难的

给出方法

在本文中，我们提出了一种自动移动神经架构搜索(MNAS)方法，该方法明确地将模型延迟纳入主要目标，以便搜索可以识别在准确性和延迟之间实现良好权衡的模型。
以往延迟是通过FLOPS（不准确的代理）来考虑的，而我们的方法通过在移动电话上执行模型直接测量现实世界的推理延迟

为了进一步在灵活性和搜索空间大小之间取得适当的平衡，我们提出了一种新的分层搜索空间，它鼓励整个网络中的层多样性

实验支撑

实验结果表明，我们的方法在多个视觉任务上始终优于最先进的移动CNN模型。在ImageNet分类任务上，我们的MnasNet在Pixel手机上以78ms的延迟实现了75.2%的top-1准确率，比MobileNetV2[29]快1.8倍，精度提高0.5%;比NASNet[36]快2.3倍，精度提高1.2%，我们的MnasNet在COCO对象检测方面也比MobileNets实现了更好的mAP质量

Introduction

目前的困境

随着CNN模型变得越来越深，越来越大，它们也变得越来越慢，需要更多的计算，因此很难部署到计算资源有限的平台如移动设备和嵌入设备
因此，最近的研究都集中在设计和改进移动CNN模型上，通过减少网络深度和使用更便宜的操作，如深度卷积和群卷积
然而，设计一个资源受限的移动模型是具有挑战性的:人们必须仔细平衡准确性和资源效率，这导致了一个非常大的设计空间。

给出的方法

我们提出了一种用于设计移动CNN模型的自动神经结构搜索方法

上图显示了我们的方法的概述，与以前的方法的主要区别在于延迟感知的多目标奖励和新的搜索空间。
我们的方法基于两个主要思想：
首先，我们将设计问题表示为一个多目标优化问题，同时考虑CNN模型的精度和推理延迟，此前方法用FLOPS来近似延迟，而我们是在移动设备上测量真实的延迟，该想法是受到FLOPS通常是一个不准确的代理的观察的启发：例如，MobileNet[11]和NASNet[36]具有相似的FLOPS，但它们的延迟差异很大（所以要勤于观察，善于发现）
其次，我们观察到以前的自动化方法（只搜索少数复杂的单元格，然后重复堆叠相同的单元格）排除了对计算效率很重要的层多样性。为了解决这个问题，我们提出了一种新的因式分层搜索空间，它允许层即使在架构上不同，但仍然能在灵活性和搜索空间大小之间取得适当的平衡

上图总结了MnasNet模型和其他最先进的移动模型之间的比较，显示了MnasNet模型的优越性

主要贡献

介绍了一种多目标神经结构搜索方法，该方法优化了移动设备上的准确性和真实世界的延迟。
提出了一种新的分解层次搜索空间，以实现层的多样性，同时在灵活性和搜索空间大小之间取得适当的平衡。
在典型的移动延迟约束下，我们在ImageNet分类和COCO目标检测上展示了新的最先进的精度。

Related Work

提高CNN模型的资源效率是一个活跃的研究课题，然而常用方法都与基线模型相关联，并不专注于学习CNN操作的新组合

另一种常见的方法是直接手工制作更高效的移动架构:SqueezeNet[15]通过使用更低成本的1x1卷积和减小滤波器尺寸来减少参数和计算的数量;MobileNet[11]广泛使用深度可分离卷积来最小化计算密度;ShuffleNets[33,24]利用低成本群卷积和信道shuffle;Condensenet[14]学习跨层连接群卷积;最近，MobileNetV2[29]通过使用资源高效的倒残差和线性瓶颈，在移动尺寸模型中获得了最先进的结果。不幸的是，考虑到潜在的巨大设计空间，这些手工制作的模型通常需要大量的人力

与我们的工作密切相关的是MONAS[12]， DPP-Net [3]， RNAS[34]和Pareto-NASH[4]，它们在搜索cnn时试图优化多个目标，如模型大小和准确性，但它们的搜索过程在CIFAR等小任务上进行优化
相比之下，本文针对现实世界的移动延迟约束，并专注于更大的任务，如ImageNet分类和COCO目标检测

Problem Formulation

我们将设计问题描述为一个多目标搜索，旨在寻找具有高精度和低推理延迟的CNN模型。此前方法用FLOPS来近似延迟，而我们是在移动设备上测量真实的延迟，然后将真实世界的推理延迟合并到我们的目标中，从而考虑直接的现实世界推理延迟
给定模型m，设ACC(m)表示其在目标任务上的准确率，LAT(m)表示在目标移动平台上的推理延迟，T为目标延迟。一种常见的方法是将T视为硬约束，并在此约束下最大化精度：
然而，这种方法只能最大化单个度量，而不能提供多个帕累托最优解
我们使用自定义加权乘积法来逼近Pareto最优解，优化目标定义为：

w是权重因子，定义为：
其中α和β是特定于应用程序的常数。考虑两个模型，M1延迟为l，精度为a，M2延迟为2l，精度为（1+5%）a，要让M1和M2得到相同的奖励，即a*(l/T)^β = (1+0.05)a*(2l/T)的β次方，可解得β≈-0.07，因此我们使用α = β = - 0.07
从上图中我们可以看到，在硬约束（top）条件下，当测量延迟大于目标延迟T时，我们会严厉惩罚目标值，以阻止模型违反延迟约束。而软约束条件下并不会

Mobile Neural Architecture Search

Factorized Hierarchical Search Space

定义良好的搜索空间对于神经结构搜索非常重要，然而，大多数先前的方法只搜索少数复杂的单元格，然后重复堆叠相同的单元格。这些方法不允许层多样性，而这对于实现高精度和低延迟至关重要。
因此，我们引入了一种新的分解层次搜索空间，它将CNN模型分解成独特的块，然后分别搜索每个块的操作和连接，从而允许在不同的块中使用不同的层架构。我们的直觉是，我们需要搜索基于输入和输出形状的最佳操作，以获得更好的精确延迟权衡。例如，cnn的早期阶段通常处理大量数据，因此对推理延迟的影响要比后期阶段大得多。
形式上，考虑一种广泛使用的深度可分离卷积[11]核，表示为四元组(K,K,M,N)，它将大小为(H,W,M) 的输入转换为大小为(H,W,N)的输出，其中(H,W)为输入分辨率，M,N为输入/输出滤波器大小。乘加的总次数可以描述为：H ∗ W ∗ M ∗ (K ∗ K + N)

根据输入分辨率和过滤器大小，网络层被分成许多预定义的框架，称为块。每个块包含可变数量的重复相同层，如果输入/输出分辨率不同，则只有第一层具有步幅2，而所有其他层具有步幅1。对于每个块，我们搜索单个层的操作和连接以及层数N，然后同一层重复N次(例如，layer4-1到4- N4是相同的)。来自不同块的层(例如，层2-1和层4-1)可以是不同的。

上图显示了我们的搜索空间的基线架构，我们将CNN模型划分为一系列预定义的块，逐渐降低输入分辨率并增加过滤器大小。每个块都包含可变数量的重复相同层（layer4-1到4- N4是相同的），其操作和连接由每个块的子搜索空间决定。具体来说，块i的子搜索空间由以下选项组成:
•卷积运算ConvOp:常规conv (conv)、深度conv (dconv)和移动倒瓶颈conv[29]。
•卷积核大小KernelSize: 3x3, 5x5。
•挤压和激励比率:0,0.25。
•skip操作SkipOp:池化、身份残留或没有skip。
•输出滤波器大小F i。
•每个块的层数N i。
ConvOp, KernelSize, SERatio, SkipOp, F i决定了层的架构，N i决定了该层将为块重复多少次。

我们的分解层次搜索空间在平衡层的多样性和总搜索空间的大小方面具有明显的优势。假设我们将网络划分为B个块，每个块有一个大小为S的子搜索空间，每个块平均有N层，那么我们的总搜索空间大小将是S^B（因为来自同一块的不同层是重复的），平面逐层搜索空间大小为S的(B*N)次方。典型的情况是S = 432,B = 5,N = 3，其中我们的搜索空间大小约为10的13，平面逐层搜索空间大小为10的39

Search Algorithm

我们使用强化学习方法为我们的多目标搜索问题找到帕累托最优解
我们将搜索空间中的每个CNN模型映射到一个令牌列表，这些令牌由强化学习代理基于其参数θ的一系列动作a 1:T确定。我们的目标是最大化预期奖励:
m是由作用a 1:T决定的抽样模型，R(m)是由自定义加权乘积法（式2）定义的目标值
如图所示，搜索框架由三个部分组成:基于循环神经网络(RNN)的控制器，用于获取模型精度的训练器，以及用于测量延迟的基于手机的推理引擎。我们遵循众所周知的采样-评估-更新循环来训练控制器。
在每一步中，1.控制器首先使用其当前参数θ对一批模型进行采样，通过基于其RNN的softmax logits预测一系列令牌。2.对于每个采样模型m，我们在目标任务上训练它得到它的准确率ACC(m)，3.并在真实手机上运行它得到它的推理延迟LAT(m)。然后我们用等式2计算奖励值R(m)。在每一步结束时，通过使用邻域策略优化(Proximal Policy Optimization)最大化公式5定义的期望奖励来更新控制器的参数θ[30]。重复采样-求值-更新循环，直到达到最大步数或参数θ收敛

Experimental Setup

在本文中，我们直接在ImageNet训练集上执行架构搜索，但训练步骤较少(5个epoch)。作为一种常见的做法，我们从训练集中随机选择50K图像作为固定的验证集。为了确保准确度的提高来自我们的搜索空间，我们使用了与NASNet[36]相同的RNN控制器

Results

ImageNet Classification Performance

我们的Model在精度和速度上都展示了优越的性能，但需要注意到的是这里作者的MnasNet模型都是使用了SE块

该实验证实了即使未使用SE块，MnasNet性能依旧优于其他Model

Model Scaling Performance

两种常见的缩放技术：一是使用深度乘法器修改滤波器大小。例如，0.5的深度乘法器将每层中的通道数量减半，从而减少延迟和模型大小。二是在不改变网络的情况下减小输入图像的大小

图5通过改变深度乘法器和输入图像大小，比较了MnasNet和MobileNetV2的模型缩放性能。当我们将深度乘法器从0.35更改为1.4时，推理延迟也从20ms更改为160ms。如图5a所示，对于每个深度乘法器，我们的Mnas-Net模型始终比Mo- bileNetV2获得更好的精度。同样，我们的模型对输入尺寸的变化也很稳健，并且在从96到224的所有输入图像尺寸上始终优于MobileNetV2(精确度提高了4.1%)，如图5b所示

除了模型缩放之外，我们的方法还允许为任何延迟目标搜索新架构。例如，一些视频应用程序可能需要低至25毫秒的延迟。我们可以缩小基线模型，或者搜索专门针对此延迟约束的新模型

在表4中，我们的MnasNet已经在相同的缩放参数下优于Mo-bileNetV2，但我们通过针对22ms延迟约束的新架构搜索进一步提高了准确性

COCO Object Detection Performance

Ablation Study and Discussion

Soft vs. Hard Latency Constraint

当α = 0，β = - 1时，延迟被视为硬约束，因此控制器倾向于更多地关注更快的模型以避免延迟惩罚。另一方面，通过设置α = β = -0.07，控制器将目标延迟视为软约束，并尝试在更宽的延迟范围内搜索模型。它在目标延迟值75ms周围采样更多模型，但也会探索延迟小于40ms或大于110ms的模型，这允许我们在单个架构搜索中从Pareto曲线中选择多个模型，如表1所示

Disentangling Search Space and Reward

该实验分别验证了所提出的搜索空间和多目标奖励对性能的影响，然后将两者结合起来，实现了更高的准确率和更低的延迟，表明了我们的搜索空间的有效性

MnasNet Architecture and Layer Diversity

MnasNet-A1模型架构如上图所示，MnasNet使用3×3卷积和5×5卷积，之前的移动模型仅使用3×3卷积

表6只重复单一类型的层(固定的内核大小和扩展比例)，验证了层多样性对性能的重要性

Conclusion

本文提出了一种自动神经结构搜索方法，用于使用强化学习设计资源高效的移动CNN模型。主要思想是将平台感知的真实延迟信息整合到搜索过程中，并利用一种新的因式分层搜索空间来搜索具有准确性和延迟之间最佳权衡的移动模型
证明了该方法可以自动找到比现有方法更好的移动模型，并在典型的移动推理延迟约束下，在ImageNet分类和COCO对象检测上取得了新的最先进的结果
实验分别展示了提出的搜索空间和多目标奖励对性能的影响，并且两者结合实现了更高的准确率和更低的延迟，再一次表明了我们的搜索空间的有效性
由此产生的MnasNet架构证实了层多样性的重要性，这将指导我们设计和改进未来的移动CNN模型

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$