黄小米吖

[Transformer]AutoFormerV2:Searching the Search Space of Vision Transformer

AutoFormerV2:搜索VisionTransformer的搜索空间

Abstract
Section I Introduction
Section II Approach
- Part 1 Problem Formulation
- Part 2 Basic Search Space
- Part 3 Searching the Search Space
- Part 4 Searching in the Searched Space
Section III Analysis and Discussion
Section IV Experiments
- Part 1 实验细节
- Part 2 Ablation Study
- Part 3 Image Classification
- Part 4 Vision and Vision-Language Downstream Tasks
Section V Related Work
Section VI Conclusion

from 石溪大学，中山大学，中科院自动化所，微软亚研院 
 NIPS2021

Paper
Code待开源

Abstract

Vision Transformer在诸多视觉任务中展现了强大的表征能力，也吸引了越来越多的目光来设计更有效的Transformer结构。本文提出使用NAS来自动化设计Transformer结构，但是不仅搜索网络结构还会搜索搜索空间，核心思想是使用权重共享超网权重，然后根据计算出的E-T误差来逐步进化每个搜索维度。此外本文还根据搜索空间的搜索过程提出了通用ViT的一些设计指南并进行分析，可以促进对Vision Transformerd的理解。
  本文搜索到的结果（S3）在 ImageNet上的表现优于最近被提出的模型如Swin,DeiT和ViT；本文还验证了S3在目标检测、语义分割和VQA领域方面的有效性，即证实了也适用于下游视觉和视觉语言任务。

Section I Introduction

ViT优于其强大的建模和捕获长程依赖的关系在视觉领域备受关注，提出了许多SOTA网络如ViT,DeiT在诸多任务上可以与CNN 媲美，也有诸多研究这尝试设计更有效的网络架构来进一步提升ViT的性能。 NAS作为一种强大的自动化搜索技术，已经在许多方面优于人工设计的结果。NAS的关键是搜搜空间的设计，因为它决定了搜索过程中结构的性能边界，本文已经观察到搜索空间的高进对许多SOTA模型可以进一步提升性能，许多研究人员在CNN的空间设计进行了大量努力但是对Transformer这方面的关注还没有进行有效的探索。 本文提出S3(Search the Search Space)搜索搜索空间的方法会自动定义搜索空间的一些可变尺寸。
   本文试图回答一下两个问题：

（1）如何有效且高效的定义一个搜索空间？ 
（2）如何在不借助先验知识的情况下自动将有缺陷的搜索空间变换到一个更好的空间？ 
对于第一个问题，本文提出一种叫做E-T误差的指标来评估搜索空间的质量，然后通过一次one-for-all的训练对超网进行高效计算，E是关注整体质量的一种误差经验分布函数，T则会衡量搜索空间顶部结构的质量。本文与AutoFormer类似依旧是训练一个超网然后获得大量训练良好的子网络，性能估计使用代理实现。
对于第二个问题，如何将有缺陷的搜索空间自动变为好的，可以参照Fig 1.本文将搜索空间分为深度、嵌入维度、MLP Ratio,窗口大小、头数、Q-K-V维度等，并且逐步进化每个维度来构造更好的搜索空间。本文还建立可不同维度的进化趋势来指导搜索空间的设计。
 本文观察到一些实验现象，可以作为设计指导方针：
  （1）第三阶段是最重要的阶段增加block的数量可以提升性能； 
  （2）浅层应该使用较小的窗口，深层使用较大的窗口 ；
  （3）MLP Ratio最好随着网络深度的增加而逐渐增加 ；
  （4）Q-K-V的维度可以小于嵌入维度并不会带来性能下降
   本文希望这些观察结果可以帮助ViT结构的人工设计以及搜索空间的设计。
   

本文的贡献总结如下： 
    （1）本文提出一种ViT搜索空间的设计方法-S3,还提出一种新的搜索pipeline可以最小化人工的参与，此外还提供了进行ViT架构设计的分析和指导方案，可以用于未来的架构搜索和设计；
     （2）在ImageNet的实验验证了本文提出的搜索空间设计方法的有效性，可以提升搜索结果的性能；优于近期提出的ViT和Swin.
     此外在下游任务如目标检测、语义分割、VQA等任务的优越表现也证明了其在下游任务上的有效性。

Section II Approach

Part 1 Problem Formulation

绝大多数NAS方法搜可以看做是一种带约束的优化问题： 

W指的是网络的权重，L则是损失函数，Dval和Dtrain分别代表验证损失和训练损失，g代表计算成本，c代表具体的约束 理想情况下搜索空间A会包含所有可能的结构，但是实际A通常是一个子空间，毕竟算力有限。
本文的创新在于打破了常规搜索空间是固定的这一限定，将上述带约束的优化问题分成3个步骤：
Step 1:在特定约束下搜索最优的搜索空间

Q则是评价搜索空间的指标 M代表最大的搜索空间尺寸
  Step 2:遵循one-shot NAS的方法将搜索空间编码成supernet并优化权重
  

Step 3:在超网训练较好的情况下来通过对子网排序选择最优的子网结构
   

Part 2 Basic Search Space

本文按照ViT，Swin-T的设置来搭建基础结构，研究会将输入切patch并且进行嵌入+展平，然后送入Transformer Encoder进行处理，最后经过全连接层获得分类结果。 Encoder包含4个stage会逐渐降低输入分辨率；每一个阶段中的block拥有相同的嵌入维度，因此每一个stage i就有两个搜索维度：block的数目di和嵌入维度hi。
      每一个模块搜由WSA+FFN组成，但并不要求每一个block长得一样，即每一个block可以拥有不用的window-size,head numbers,MLP ratio,Q-K-V ratiod等。

Part 3 Searching the Search Space

Space Quality Evaluation 
       首先看如何对搜索空间的质量进行评估。对于搜索空间A，本文使用E-T误差来评价A的质量，分别代表预期的错误率和top的错误率。 此外就是常规的计算成本函数g和计算资源约束c.
       其中使用N个随机抽样框架的平均错误率近似期望误差，top错误率则是前50个候选框架的平均错误率代表着搜索空间的性能上限。
        One-for-all Supernet RegNet
        会训练上百个模型但只训练较少epoch，使用他们的误差作为性能评估的代理，但是本文是将搜索空间编码成超网然后采取与AutoFormer类似的训练方法，这样训练的好处就是只需要训练一个超网就能一次获得成百上千的子网络并且性能评估是十分准确的。

Searching the Search Space 搜索空间的搜索分两步进行： 
（1）超网优化；
 （2）空间进化
 

Step 1：对于搜索空间A的第i次迭代，会将其编码为超网。
采取sandwich training来优化超网权重，分别采样最大的和最小的和两个中等规模的结构来计算梯度更新权重。 
Step 2:首先将搜索空间A分别成各个搜索维度和4个不同的阶段,这样搜索空间就会变成所有可搜索维度和4个阶段这些子空间的笛卡尔积：  

对于某一个子空间，会搜索其所有可搜索的值，然后计算当前设定下的E-T误差，然后估计E-T误差与参数选择之间的关系用线性函数
来拟合。
 这样就可以获得任意一个子空间的定义：

通过设定进化开始的阈值来决定什么时候进行搜索空间的进化。

Part 4 Searching in the Searched Space

当搜索空间搜索完毕，就可以在给定的搜索空间内继续进行NAS。整个搜索过程分2个步骤：
 
（1）超网训练此时不施加资源约束 ；
（2）进化搜索
在资源约束下进行 超网的训练与AutoFormerV1类似会从每次迭代中随机抽取最大、最小、中等的随机架构来更新权重。
优化的目标是提升分类精度的同时最小化模型的大小和FLOPs.需要注意的是ViT中没有任何BN因此进化要比大多数CNN更快。

Section III Analysis and Discussion

本节对搜索空间的搜索过程进行讨论从而希望能为Transformer架构设计和NAS搜索空间的设计提供指引。为了最少使用先验知识，本文为不同stage设置相同的搜索空间，Fig 2,Fig3展示了详细的搜索空间和进化过程。

Fig 2每一行代表不同stage每一列代表不同的搜索维度，dot代表最终这一维度的搜索结果，FIG2可以看出每一个维度的变化趋势。
 

The third stage is most important and increasing blocks in the third stage leads to better performance 
  从Fig 2可以看出第三阶段是最重要的，从step 0到steo 2有明显提升；本文也在一些CNN网络中发现第三阶段一般会有更多block。另一方面也能看到stage1,2,4的block较少，说明这些阶段应该包含更少的层。
   Shallower layers should use a small window size while deep layers should use a larger one
   从Fig 2最后一行可以看出，window size会在stage1减少size,stage3增大size，说明浅层倾向于window size更小，深层次使用更大size的window。
   本文认为是Transformer随着深度加深增加了其聚焦区域的大小，为了验证这一点本文还可视化了注意力图，参见Fig 4.
   

注意力图中可以看到最大的注意力（数值最大）会随着层次的加深而扩大范围（平均距离增大），代表聚焦的区域也在扩大，这为我们之前的假设提供了坚实的证据。 
Deeper layer should use larger MLP ratio
 更深的层次应该使用更大的MLP ratio，传统的设计中一般所有的层其MLP Ratio都相同，但是Fig 2的第三行说明浅层应该用更小的MLP ratio，较深的层使用较大的MLP ratio.
  Q-K-V dimension should be smaller than the embedding than the emnedding dimension
   原始Transformer中，Q-K-V的尺寸与嵌入维度相同，但是从Fig 2第二行、第三行可以看出Q-K-V的维度组好比嵌入维度要小，两者的差距在更深层次找那个更为明显。本文的推测是深层中许多head有相似的特征，因此一个相对较小的Q-K-V维度可以具有较大的视觉表征能力。

Section IV Experiments

Part 1 实验细节

搜索的维度包括：  整个空间每个stage迭代3次 
  超网的训练遵循DeiT的训练策略会在16块V100上训练300epoches

Part 2 Ablation Study

Effectiveness of once-for-all supernet training 
 为了验证超网训练的有效性，被窝呢随机采样了10个网络直接继承超网权重然后与微调之后或者从头训练之后的结果做对比，参见Fig 5.可以看到直接继承超网权重额可以与后两者达到差不多甚至更好的性能，说明了本文的超网采样以及性能预测代理的准确性。
 

Effectiveness of search space evolution
   本文还测试了搜索空间进化的有效性。首先进行的实验是从搜索空间中随机抽取1000个子网继承权重然后绘制其误差分布图，参见Fig 6,可以看到进化2次后的空间质量整体明显优于原始和进化了1次的；第二个实验是使用进化算法搜索每个空间中的top结构
   Table5展示了在二次演化的空间中的top结构比a,b中的top结构更好这些结果证明了空间进化的有效性。

Part 3 Image Classification

本文将搜到的模型与其他SOTA模型在ImageNet上的表现进行了对比参见Table 1. 可以看到本文搜索到的模型S-（T/S/B）分别取得了82.1%/83.7%/84%的top-1精度；并且和其他CNN或Transformer模型比在FLOPs和网络参数接近的情况下性能更优越，特别是在小参数量时更是略优于Efficient-B7(AutoFormerV1这里没有超过EfficientNet).

Part 4 Vision and Vision-Language Downstream Tasks

本文还将搜索到的结果迁移到其他下游视觉任务，如目标检测、语义分割和VQA任务上。 
Table 2是目标检测的结果，Table 3是语义分割的结果，Table 4是VQA的结果。 
在目标检测试验中，随着model size和FLOPs的增大S3-S,S3-B的性能超过了ResNeXt-101,并且也优于对应的Swin网络。 
在实例分割实验中S3一直优于对应的ResNet,DeiT网络；本文还尝试着借助转置卷积搭建一个DeiT的层次结构但性能并没有得到改善。 
在VQA实验中实验结果显示选择S3-T作为骨干网路可以比ResNet-101作为骨干获得2%的精度提升。 上述实验都证明了搜索到的模型具有良好的泛化性，也证明了搜索空间设计的有效性。

Section V Related Work

Vision Transformer Transformer
最初用于NLP领域，ViT是第一个纯Transformer模型用于视觉任务；DeiT则在训练策略上进行了精巧的设计。还有一些其他工作，比如SwinTransformer使用基于窗口的SA模块来减少计算量但是效果也不错。
 Search Space
  人们普遍认为，一个好的搜索空间对NAS是至关重要的。对于CNN来说目前有基于cell的和基于mbconv的搜索空间，这些操作在搜索前就已经给定了；也有的工作尝试将搜索空间缩小从而寻找更加紧凑的网络模型；NSENet则是提出一种理解设计空间和设计原则的新范式，但是对Transformer这方面的探索还不多，本文是第一个从事这方面工作研究的。
   Search Algorithm 
   最近对NAS进行自动化的网络设计越来越感兴趣，早期的方法主要基于强化学习或进化算法，这些搜索方法一般需要从头训练数以千计的候选网络；近期更多的是按照one-shot的思想，训练一个过参数化的超网，所有子网会共享超网权重。 但是对于NAS改进Transformer结构的工作很少，目前主要有：
    HAT：提出硬件感知的Transformer在搜索过程汇总加入延迟约束来获得适应不同硬件平台的网络； 
    BossNAS则探索了基于block的自监督方法搜索CNN-Transformer混合框架。
     最近的一篇工作则是本文的前身——AutoFormer，基于weight-entanglement进行有效的搜索；本文则主要关注搜索空间的搜索。

Section VI Conclusion

本文提出S3-搜索Vision Transformer的搜索空间，核心思想是在使用权重共享的超网训练过程中基于E-T误差逐步进化搜索空间的不同维度；本文还对ViT的进化过程进行了分析，这将有助于理解Transformer各部分的结构和作用。
最终搜索到的S3模型优于目前主流的Transformer和Swin；并且在下游任务中也展现出良好的鲁棒性和泛化性。
 本文未来将进一步探索S3在CNN搜索空间设计中应用的可能性。

Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
PCL 点云高程渲染：实现点云高程信息的颜色渲染技术征服冒险 PCL
PCL点云高程渲染：实现点云高程信息的颜色渲染点云渲染在计算机视觉和图形学中具有重要的应用价值。在处理点云数据时，一种常见的需求是通过将高程信息映射到颜色空间，以实现对点云的可视化。本文将介绍如何使用PCL（PointCloudLibrary）库实现点云的高程渲染，并提供相应的源代码。引言在开始之前，我们首先需要了解点云的基本概念。点云是由大量的三维点组成的数据集合，每个点都具有X、Y和Z坐标。点
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
冒泡排序选择排序插入排序 2401_89791565 java 排序算法算法
packagecom.nobody.sort;/**@authorMr.nobody@Description插入排序@date2020/9/5*/publicclassCode01_InsertionSort{publicstaticvoidinsertionSort(int[]arr){//数组为空，或者数组长度小于2就没必要操作if(null==arr||arr.length=0&&arr[j
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
Android 后台线程氤氲息安卓原生学习 android
ExecutorServiceexecutor=Executors.newSingleThreadExecutor();executor.execute(newRunnable(){@Overridepublicvoidrun(){Bitmapbitmap=getBitmapFromUrl(url);//网络请求runOnUiThread(newRunnable(){@Overridepublic
Android Fragment 按键监听 weixin_44128558 android android android studio java
Fragment中是没有监听按键的方法的，但是Fragment是寄托于Activity的，只要在Activity中将监听到的按键传递给Fragment就行，网络上大部分都是让Fragment获得焦点，再添加一个按键监听器，这样就能监听到了@Nullable@OverridepublicViewonCreateView(@NonNullLayoutInflaterinflater,@Nullable
编程语言符号表的管理编译原理
首先为表中的符号,设置一个初始annote值的,其中size是长度,staticvoidsymtable_add_global(structsymtable*st){structsym*sym;sym=&st->table[st->len++];sym->annot.type=FS_INT;sym->annot.size=8;sym->name="@$";sym->size=sym->annot.
深度学习(1) 浅忆へ梦微凉深度学习人工智能深度学习学习方法 python
一、torch的安装基于直接设备情况，选择合适的torch版本，有显卡的建议安装GPU版本，可以通过nvidia-smi命令来查看显卡驱动的版本，在官网中根据cuda版本，选择合适的版本号，下面是安装示例代码GPU：pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
【视觉算法—视频目标跟踪】基于camshift实现视频目标实时追踪明月下视觉算法 opencv python 音视频
本文代码功能：1.获取摄像头，实时显示2.鼠标获取第一帧中的目标roi区域3.在视频中实时对目标进行追踪。4.两种目标追踪的方式：‘meanshift’，‘camshift’5.保存视频代码准备新建test.py，复制以下代码：importcv2ascvimportnumpyasnpglobalmin_y,height,min_x,width#1代表打开外置摄像头,外置多个摄像头可依此枚举0，1，
nlp培训重点-3 heine162 自然语言处理人工智能
1.文本匹配分类：loader:#-*-coding:utf-8-*-importjsonimportreimportosimporttorchimportrandomimportloggingfromtorch.utils.dataimportDataset,DataLoaderfromcollectionsimportdefaultdictfromtransformersimportBertT
深度学习常用格式转化脚本xml2yolo/coco2yolo/bdd2yolo/frame2video等 qq1309399183 计算机视觉实战项目集合深度学习人工智能格式转化脚本 voc2yolo格式转化数据集格式转换 xml2yolo coco2yolo
文章目录1.**数据集格式转换脚本**`coco2yolo.py`示例注释：注释说明：`xml2yolo.py`示例注释：注释说明：2.**数据集可视化与统计**`vis_yolo_files.py`示例注释：注释说明：3.**其他工具脚本**`frames2video.py`示例注释：注释说明：该项目提供了一系列用于深度学习的数据处理工具，主要功能包括：数据集格式转换：提供多种脚本，将不同格式的
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
全新 Hopper 架构的Transformer 引擎有什么特点？扫地的小何尚人工智能
Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。Transformer模型最初针对自然语言处理用例而开发，但因其通用性，现在逐步应用于计算机视觉、药物研发等领域。与此同时，模型大小不断呈指数级增长，现在已达到数万亿个参数。由于计算量巨大，
BERT详解 comli_cn 大模型笔记 bert 人工智能深度学习
1.背景结构1.1基础知识BERT（BidirectionalEncoderRepresentationsfromTransformers）是谷歌提出，作为一个Word2Vec的替代者，其在NLP领域的11个方向大幅刷新了精度，可以说是前几年来自残差网络最优突破性的一项技术了。论文的主要特点以下几点：使用了双向Transformer作为算法的主要框架，之前的模型是从左向右输入一个文本序列，或者将l
1.4走向不同：GPT 与 BERT 的选择——两大NLP模型的深度解析少林码僧 AI大模型应用实战专栏自然语言处理 gpt bert
走向不同：GPT与BERT的选择——两大NLP模型的深度解析在自然语言处理（NLP）领域，GPT（GenerativePretrainedTransformer）和BERT（BidirectionalEncoderRepresentationsfromTransformers）无疑是最具代表性和影响力的两个模型。它们都基于Transformer架构，但在设计理念、任务应用和训练方式等方面存在显著差
Kotlin Bytedeco OpenCV 图像图像55 图像透视变换深色風信子 kotlin opencv 透视变换 bytedeco
KotlinBytedecoOpenCV图像图像53图像透视变换1添加依赖2测试代码3测试结果1添加依赖4.0.0com.xuKotlinOpenCV1.02.0.0UTF-8official1.8mavenCentralhttps://repo1.maven.org/maven2/cn.hutoolhutool-all5.8.29org.apache.commonscommons-compres
第83期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
NVIDIA Hopper 架构深入 RZer 硬件工程架构 NVIDIA
在2022年NVIDIAGTC主题演讲中，NVIDIA首席执行官黄仁勋介绍了基于全新NVIDIAHopperGPU架构的全新NVIDIAH100TensorCoreGPU。文章目录前言一、NVIDIAH100TensorCoreGPU简介二、NVIDIAH100GPU主要功能概述1.新的流式多处理器（SM）具有许多性能和效率改进。主要新功能包括：2.新的transformer引擎结合使用软件和定制
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
使用神经网络拟合6项参数 Andrew_Xzw 神经网络人工智能深度学习开发语言机器学习 python
使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3.定义train脚本3.1loss和optimizer3.2train3.3predict1.数据预处理1.1添加参数解析为了方便管理模型和训练等参数，统一用参数解析。defparse_a
如何快速在Windows 10 + Anaconda 3 中使用Mxnet及gluon qianchess mxnet使用 mxnet win10 anaconda gluon 人工智能
如何快速在Windows10+Anaconda3中使用Mxnet及gluon网络上Mxnet的安装以及使用方法很多，自从其作者之一李沐推出了基于Mxnet的深度学习课程之后，我也尝试着去使用了一下Mxnet。首先第一步就是在自己的系统中安装Mxnet及其相关组建。现在的Mxnet常常会跟其虚拟环境Gluon结合在一起，所以下文就一起阐述一下，顺便记录一下自己踩的坑。注意本文的大部分内容都可以在官网
3D UNet和Swin-UNETR 学無芷境计算机视觉
3DUNet和Swin-UNETR都是用于医学图像分析的深度学习网络，它们对三维（3D）数据进行特征提取和分割。3DUNet3DUNet是UNet架构的一个变体，专门设计用于处理三维医学图像数据。UNet最初是为二维（2D）图像分割任务设计的，具有典型的编码器-解码器结构。3DUNet扩展了这种架构，以便更好地处理具有深度信息的体积数据，如CT或MRI扫描。主要特点：编码器：逐渐下采样图像，提取并
推荐3D UNet实现：深度学习3D体素数据语义分割的利器！滑辰煦Marc
推荐3DUNet实现：深度学习3D体素数据语义分割的利器！去发现同类优质开源项目:https://gitcode.com/在这个快速发展的深度学习时代，3DUNet已经成为3D图像处理领域中不可或缺的工具，尤其在医疗影像分析和3D物体识别等任务上展现出强大的潜力。这个开源项目为我们提供了一个高效、灵活的3DUNet实现，支持Tensorflow、PyTorch和Chainer三种主流深度学习框架。
Java ‘URL(java. lang. String)‘ 自版本 20 起已弃用空灵宫（Ethereal Palace） Java java 开发语言
在Java20及更高版本中，不推荐直接使用newURL(Stringspec)构造方法。官方建议通过更加安全和明确的方式来创建URL。下面示例给出两种常见替代方案：使用URI转化为URL，或使用多参数构造方法。原始写法（已弃用）publicclassUrlDemo{publicstaticvoidmain(String[]args){try{//自Java20起已弃用URLurl=newURL("
MATLAB语言的计算机基础疯狂小小小码农包罗万象 golang 开发语言后端
MATLAB语言的计算机基础引言在当今信息技术飞速发展的时代，编程能力已成为当代人士必备的一项基本技能。MATLAB（矩阵实验室）作为一种高级编程语言和环境，广泛应用于数据分析、算法开发、模型创建、数字图像处理和计算机视觉等多个领域。MATLAB以其强大的矩阵运算和可视化能力，成为了科研人员和工程师的重要工具，尤其在数学、物理、工程等学科中，它的应用不可或缺。本文将从MATLAB的基本概念、环境搭
锐捷路由器网关RG-NBR6135-E和锐捷交换机 Ruijie Reyee RG-ES224GC 电脑登录web方法 zh7314 硬件工程
2025年1月17日22:29:35最近淘了点东西，准备在家里搞一套深度学习的服务器，先把网关和交换机搞到了锐捷路由器网关RG-NBR6135-E电脑登录web方法在拿到机器的时候，如果不是全新建议拿根牙签，差入reset5-10秒,灯光会全部闪几下，重置机器，因为有些机器会配置的ip和网段无法访问默认的web服务ip，在机器上面的默认配置单配置参考：https://baijiahao.baidu
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include