AI 研习社

如何使用 Google 的 AutoAugment 改进图像分类器

本文为 AI 研习社编译的技术博客，原标题：
How to improve your image classifier with Google’s AutoAugment
作者 | Philip Popien
翻译 | 敬爱的勇哥编辑 | 王立鱼
原文链接：
https://towardsdatascience.com/how-to-improve-your-image-classifier-with-googles-autoaugment-77643f0be0c9

通过使用优化的数据增强方法，在CIFAR-10、CIFAR-100、SVHN和ImageNet上得到了目前最好的结果。您可以从这里找到和使用它们。

在ImageNet上得到的最好的增强效果，
源自：https://arxiv.org/abs/1805.09501v1

AutoML——使用机器学习来改进机器学习设计(如体系结构或优化器)的想法——已经来到了数据增强的领域。本文将解释什么是数据增强，谷歌AutoAugment如何搜索最佳增强策略，以及如何将这些策略应用到您自己的图像分类问题。

数据增强(Data Augmentation)

数据增强意味着在训练机器学习模型时，对输入数据随机的应用各种变换。这种人为地扩大训练数据，可以生成更多可能的输入数据。它还有助于防止过度拟合，因为网络几乎从来不会看到完全相同的两次输入然后仅仅记住它们。典型的图像数据增强技术包括从输入图像中随机裁剪部分，水平翻转，应用仿射变换，如平移、旋转或剪切等。

源自：https://github.com/aleju/imgaug

事实上，正如 AutoAugment 作者所指出的，近年来在ImageNet挑战赛上，人们为寻找更好的网络结构投入了大量的精力，但是数据增强技术，基本上与Krizhevsky等人在2012年为AlexNet设计的方法相同，或者只有一些微小的变化。

现状

选择使用哪些数据增强的通用做法，是首先提出适合对应数据集的不同假设，然后进行试验。你可以从随机剪切、随机调整大小或者水平翻转开始，因为它们几乎总是有效的，并且还可以尝试诸如小尺度的旋转等。由于重复训练带来的验证集性能的随机波动，很难确定这些增加的旋转是否提高了模型性能，因为您可以从两次不同的训练中获得随机的改进，而这些改进并不是因为使用了数据增强。

通常来说，由于我们实验的高度不确定性，并且也没有时间或资源来严格测试所有的可能组合，所以我们放弃了搜索最好的方法，或者坚持使用某些固定的增强策略，而不知道它们是否有很大的贡献。但是，如果有一种可以迁移有用数据的增强技术，就像我们在迁移学习中从预先训练的模型中迁移参数一样，那会怎样呢?

从数据中学习增强策略

AutoAugment的思想是在强化学习(RL)的帮助下学习给定数据集的最佳增强策略。由于在图片上应用和组合转换的方法非常多，所以它们对可选择的方法增加了一些限制。一个主要策略由5个子策略组成，每个子策略依次应用2个图像操作，每个图像操作都有两个参数:应用它的概率和操作的幅值(70%的概率执行旋转30度的操作)

这种策略在训练时是如何应用在图片上的呢?对于我们当前批次的每张图片，首先随机均匀地选择一个子策略，然后应用该子策略。让我们来看一个包含5个子策略的示例，这些子策略应用于SVHN数据集中的图片:

对SVHN图像应用一些最佳增强的例子。
源自：https://arxiv.org/abs/1805.09501v1

子策略1在x的方向上，以90%的概率执行力度为7的剪裁。然后，有20%的概率，对图像的颜色进行翻转。子策略4以90%的概率对图像进行颜色反转，然后在10次中有6次进行颜色直方图均衡化。操作的次数是固定的，但是由于子策略的随机性和操作存在的概率，对于单个图像也可能有很多的增强结果。

让我们看看AutoAugment RL模型的搜索空间。他们考虑了16种操作:14种来自Python图像库PIL，比如旋转、颜色反转和一些不太知名的操作，比如色调分离(减少像素位)和过度曝光(将颜色反转到某个阈值以上)，再加上裁剪和采样(类似于Mixup)这些数据增强领域的新方法。增加11个离散概率值(0.0,0.1,…,1)和从0到9共10个等间距的幅值，这相当于对某一个子策略有(16 * 11 * 10)²种可能性，如果同时有五个子策略，则共有(16 * 11 * 10)¹⁰≈2.9 * 10³²种可能。需要强化学习来帮忙了!

如何训练AutoAugment ?

AutoAugment像NASNet一样训练——一个源自Google的用于搜索最优图像分类模型结构的增强学习方法。它的训练方法如下：我们有一个控制器，它决定当前哪个增强策略看起来最好，并通过在特定数据集的一个子集上运行子实验来测试该策略的泛化能力。在子实验完成后，采用策略梯度法(Proximal policy Optimization algorithm, PPO)，以验证集的准确度作为更新信号对控制器进行更新。解释PPO超出了本文的范围，但是我们可以更详细地看看控制器和子模型实验。

控制器(controller)

控制器以Softmax输出要应用于哪个操作决策。然后，该决策作为输入传递到控制器的下一步，这是因为控制器是一个RNN(对于NASNet，使用了一个包含100个隐藏单元的LSTM)。然后控制器决定应用哪个幅值的操作。第三步是选择概率。因此，控制器拥有所有其他操作的上下文、早期的概率和幅值，以便做出最佳的下一个选择。(这是一个说明性的例子，因为这篇论文目前并没有告诉我们选择操作、大小和概率的顺序)。

控制器模型架构源自：https://arxiv.org/abs/1707.07012

总共有30个softmax预测值，因为有5个子策略，每个子策略需要在两个操作、大小和概率(5 * 2 * 3 = 30)中做出两个选择。

子模型(child model)

我们如何告诉控制器哪些策略选择得好，哪些没有真正提高性能(例如将亮度设为零)?为此，我们使用当前增强策略在子神经网络上进行泛化实验。实验结束后，对RNN控制器的权值进行更新，以验证集的准确度作为更新信号。当最后将整体最佳的5个策略(每个策略包含5个子策略)合并到最终策略(现在包含25个子策略)中时，共将执行15,000次迭代。最后的这个策略是用于该数据集所有数据的策略。

实验结果

正如副标题已经给出的那样，AutoAugment提升了CIFAR-10、CIFAR-100、SVHN、ImageNet等数据集上的最优结果。此外，还有一些特别有趣的细节:

CIFAR-10和ImageNet数据集上的最佳策略主要是基于颜色的转换。对于SVHN数据集，与CIFAR-10相比，AutoAugment选择了完全不同的转换:剪切图像和反转颜色，这对于门牌号是很有意义的。

CIFAR-10测试集上的错误率，越低越好，
源自：https://arxiv.org/abs/1805.09501v1

ImageNet验证集上Top-1/Top-5的错误率，越低越好，
源自：https://arxiv.org/abs/1805.09501v1

在数据很少的情况下，使用autoaugmented的效果会更好。这是数据增强技术的预期效果。
在CIFAR-10上发现的最佳增强策略可以将CIFAR-100的错误率从12.19%提高到10.67%。

CIFAR-100测试集的错误率，
源自：https://arxiv.org/abs/1805.09501v1

将ImageNet上的最终策略应用在5个不同的较难的数据集，可以显著提高最终的准确度。这是通过数据增强而不是权值的迁移学习得到的结果。这些结果是从零开始训练Inception v4，而不是从ImageNet微调权重时得到的。

FGVC测试集上Top-1错误率(%)。Inception v4是从零开始训练，没有应用最佳ImageNet增强策略。源自：https://arxiv.org/abs/1805.09501v1

两个迁移学习

如果我们想要解决图像分类问题，通常使用来自ImageNet预训练的权重初始化模型，然后对这些权重进行微调。我们刚刚看到，使用AutoAugment的最佳ImageNet策略，同时从零开始训练，也有类似的正效果。如果我们同时使用这两种方法：在使用ImageNet AutoAugment 策略时微调ImageNet的权重?这些优化的效果会叠加起来，为我们解决新的图像分类问题提供新的最佳方法吗?

为了回答这个问题，我使用了相同的5个FGVC数据集(Oxford 102 Flowers, Caltech-101, Oxford- iiit Pets, FGVC Aircraft和Stanford Cars)，对Inception v4进行微调，使用或不使用来自AutoAugment的ImageNet策略。

实验设置：

在GPU上以batch size为32训练一个Inception v4网络，SGD的momentum设为0.9，学习率设为0.01。
如果验证集的准确度在5个epoch内没有增加，则学习率减半。如果验证集上的准确度在3*5=15个周期内没有提高，就停止训练。
使用这个repo中预训练的ImageNet权值，只有最后的输出层被替换来表示数据集的不同类。从一开始，所有层都是可训练的。
如AutoAugment论文中所写的那样，输入图像的尺寸为448x448。
两种微调场景都使用随机水平翻转和随机大小裁剪作为基础数据增强。选择随机调整大小的最小剪切百分比，基于小的ResNet18验证集的效果而定。
ImageNet 的AutoAugment策略是在随机裁剪大小后施加。不过实验表明，在剪切前还是剪切后施加都无关紧要。
选择这些超参数后，最终的模型在训练集和验证集的组合上进行训练，并在测试集中进行测试。为了保证测试结果的稳定性，采用该方法训练了5个模型，并对测试结果进行平均。

对FGVC测试集上5次Top-1错误率结果进行平均。Inception v4通过对ImageNet权重进行微调，使用和不使用AutoAugment ImageNet策略。有趣的是，在5个数据集中，只有3个数据集的微调结果比从上面AutoAugment论文中从零开始训练的结果更好。正如在“Do Better ImageNet Models Transfer Better”中讨论的那样，微调似乎不会在所有情况下都提升模型性能。 https://arxiv.org/abs/1805.08974

将最佳的ImageNet增强策略应用于不同的数据集，可以将5个数据集中的3个的错误率平均降低18.7%。在另外两个数据集上，错误率平均增加了5.3%。

这些结果表明，当需要对ImageNet权重进行微调时，应该尝试额外应用ImageNet AutoAugment策略。通常情况下，基本上都可以额外获得显著的改进。

如何将AutoAugment策略应用于您的问题

我在本文附录中创建了一个包含最佳ImageNet、CIFAR-10和SVHN策略的repo。一些实现细节还不明确，但我正在与作者联系，一旦我知道更多细节，我将会在这个repo里及时更新。

将ImageNet策略的随机子策略通过PIL应用搭配图像上，可以如下:

要将它应用到PyTorch，您可以这样做:

结论

AutoML再次展现：对于给定数据集，最好的数据增强操作是可学习的，甚至可以迁移到类似的数据集中。这只是许多可能的自动优化数据增强方法中的一个。提高学习此类策略的效率是另一种令人兴奋的方法，目的是使任何人都能够使用这些技术(无需使用GPU服务器群)。ENAS表明这是可行的。

把这个新方法应用到你自己的问题上吧，祝你好运！如有错误和疑问，请发邮件至philip@popien.net联系我。

感谢Avinash C Mishra和Tom Voltz。

想要继续查看该篇文章相关链接和参考文献？

点击【如何使用 Google 的 AutoAugment 改进图像分类器】即可访问：

今日资源推荐：

cefsharp 加载完成_WinFrom 的 WebBrowser 替换为 CefSharp weixin_39672296 cefsharp 加载完成 cefsharp 加载网页慢 delphi webbrowser 对象不支持 python winform 类似 webbrowser 显示控件
一、WebBrowser是什么？WebBrowser是一种放在winform中的控件，控件可以实现相当于浏览器的功能，最终实现winform窗口中嵌套着一个网页，这样的效果。二、为什么放弃微软默认提供的WebBrowser呢？内核是IE7不支持HTML5新特性2.对触控支持不够好3.不稳定，据说容易闪退三、CefSharp是什么？CefSharp是一个使用谷歌浏览器/chrome内核的WebBro
Imagen原理与代码实例讲解 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Imagen原理与代码实例讲解1.背景介绍在人工智能领域中,图像生成一直是一个具有挑战性的任务。传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。随着深度学习技术的不断发展,生成式对抗网络(GenerativeAdversarialNetworks,GAN)等新型模型逐渐展现出了令人惊叹的图像生成能力。谷歌的Imagen就是一种基于大型视觉语言模型的全新图
科技早报 | B站崩了、小红书崩了上热搜；OpenSSH漏洞预警：无需用户交互，可提权至 root | 最新快讯最新科技快讯量子计算
本源量子与中国联通签署战略合作协议7月2日，本源量子计算科技（合肥）股份有限公司与中国联合网络通信有限公司签署了战略合作协议。根据协议，双方将携手探索中国自主量子算力在通信领域的应用，致力于推动中国通信事业的创新发展。这一合作标志着双方将在量子技术与通信行业的深度融合上展开实质性合作，共同加速相关技术成果转化和市场拓展。消息称谷歌TensorG5芯片已流片，预计采用3nm制摘要：谷歌下一代Tens
DeepSeek底层揭秘——Smallpond 9命怪猫 AI 人工智能大模型 ai
目录1.Smallpond是什么？(1)定义(2)核心功能2.对比传统数据处理框架3.技术要素(1)分布式数据加载(2)并行数据预处理(3)分布式缓存(4)数据流水线4.难点挑战（含解决方案）(1)数据I/O瓶颈(2)数据预处理复杂性(3)分布式缓存一致性(4)与3FS集成5.技术路径(1)需求分析与设计(2)原型开发与测试(3)系统优化与扩展(4)系统部署与维护6.应用场景(1)大规模图像分类(
无人机怎么设定航线_航拍测绘必学教程｜无人机航线设计流程 weixin_39568706 无人机怎么设定航线
航线设计是制作高质量影像图的关键，是航拍测绘必学教程之一。航线需要根据测区的地形地貌来进行设计，必须为内业正射影像图的制作提供足够的重叠率，因此，无人机航线设计需要综合考虑各方面因素，以保障飞行安全和获取影像满足要求。1明确航测范围航线规划软件（地面站）的参考底图数据大多来源于谷歌地图。规划航线之前，有必要在GoogleEarth中确定项目航飞范围，了解测区地貌，并进行合理的飞行架次划分，优化航飞
深度学习篇---Opencv中的机器学习和深度学习 Ronin-Lotus 深度学习篇图像处理篇深度学习 opencv 机器学习 python
文章目录前言一、OpenCV中的机器学习1.概述2.使用步骤步骤1：准备数据步骤2：创建模型步骤3：训练模型步骤4：预测3.优点简单易用轻量级实时性4.缺点特征依赖性能有限二、OpenCV中的深度学习1.概述图像分类（如ResNet、MobileNet）目标检测（如YOLO、SSD）语义分割（如DeepLab）人脸检测（如OpenFace）2.使用步骤步骤1：加载模型步骤2：准备输入数据步骤3：推
前端非框架类知识点汇总南川直树 JavaScript json html5 javascript jquery css
html单词库css引入图片标签：imgsrc=""title=""alt=""src属性是指图像文件路径alt属性是在图片加载不出来时替换成文本title属性是在鼠标悬停的时候显示srcset属性是在不同的屏幕上显示不同的图片srcset=“url2x，url3x”视频标签：video是一个双标签controls播放控件autoplay自动播放谷歌默认视频不自动播放需要添加禁音才能实现自动播放m
Triplet Loss原理及 Python实现 AIGC_ZY Diffusion Models python 深度学习机器学习
Tripletloss最初是谷歌在FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering论文中提出的，可以学到较好的人脸的embeddingTripletLoss是一种用于训练特征嵌入（featureembedding）的损失函数，广泛应用于人脸识别、图像检索等需要度量相似性的任务。其核心思想是通过学习将同类样本的嵌入距离拉近，不同类样本的
介绍 TensorFlow 的基本概念和使用场景。大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
TensorFlow是一个由谷歌开发的开源机器学习框架，广泛应用于深度学习领域。它提供了一个灵活的平台，可以用于构建各种机器学习模型，包括神经网络。TensorFlow的基本概念和使用场景如下：张量（Tensor）：TensorFlow中的基本数据结构就是张量，可以简单理解为多维数组。张量可以是标量（0维张量）、向量（1维张量）、矩阵（2维张量）等。在TensorFlow中，所有数据都以张量的形式
成为 Android 开发人员的最佳途径 – 完整路线图大门口的猴子 android应用 android
Android是一个开源操作系统，基于Linux内核，用于智能手机、平板电脑等移动设备。此外，它还为智能手表和AndroidTV开发。它们每个都有一个专门的界面。Android一直是智能手机最畅销的操作系统之一。Android操作系统由谷歌于2005年收购的AndroidInc.开发游戏、音乐播放器、相机等各种应用程序都是为这些智能手机构建的，可在Android上运行。GooglePlayStor
介绍常见的图片分类模型与算法萧鼎 python基础到进阶教程算法分类数据挖掘
介绍常见的图片分类模型与算法在机器学习和深度学习的领域中，图片分类任务是一个广泛的应用场景。随着深度学习技术的飞速发展，很多强大的图像分类算法和模型已经被提出，广泛应用于从医疗影像到自动驾驶、从人脸识别到图像检索等多个领域。本文将重点介绍多种用于图像分类的经典算法与模型，帮助你了解在图像分类任务中常用的技术。1.传统机器学习模型在深度学习崭露头角之前，传统的机器学习模型是图像分类的主流方法。这些模
美国AI圈破防了。。。强化学习曾小健 LLM大语言模型人工智能
美国AI圈破防了。。。原创HaFung覺Cha2025年01月25日17:46福建这一个月以来刷推很明显的感觉到英文技术社区对中国AI产业的进步速度处于一种半震惊、半懵逼的状态...应激来源➡来自中国的开源MoE模型DeepSeek-V3。DeepSeek在软件的原生地盘，把国外大模型厂商都给硬控住了。奥特曼被逼急了，卷起来！微软、Meta和谷歌等巨头正在将资源投入到庞大的10万GPU集群中进行人
YOLOv12改进之A2(区域注意力) 清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法
注意力回顾注意力机制作为深度学习领域的核心技术，已广泛应用于自然语言处理和计算机视觉等多个领域。在YOLOv12改进之A2中，注意力机制扮演着关键角色。已有研究成果包括：Transformer架构：引入了自注意力机制，有效捕捉输入序列中的长距离依赖关系。CBAM模块：提出了通道和空间注意力的结合，显著提升了图像分类和目标检测的性能。SENet：引入了通道注意力机制，通过自适应学习特征通道的重要性，
国外邮箱全攻略：注册、登录、购买及格式详解 html
随着互联网的普及，电子邮件已成为全球范围内重要的沟通工具。无论是日常交流、商务往来，还是注册国外网站，拥有一个稳定、可靠的国外邮箱显得尤为重要。然而，对于初次接触国外邮箱的用户来说，可能会面临注册、登录、购买以及格式方面的诸多疑问。本文将从这些方面为您详细解答，帮助您轻松掌握国外邮箱的使用技巧。一、什么是国外邮箱？国外邮箱是指由国外服务商提供的电子邮件服务，例如Gmail（谷歌邮箱）、Outloo
python数据增强——随机裁剪灰灰学姐数据增强 python 开发语言
importcv2importosimportrandominput_folder='JPEGImages'output_folder='images'ifnotos.path.exists(output_folder):os.makedirs(output_folder)#定义随机裁剪函数defrandom_crop(image,crop_size):h,w,_=image.shapeifh
深度学习进阶：TensorFlow实战指南 ELSON麦香包
本文还有配套的精品资源，点击获取简介：《TensorFlow实战Google深度学习框架》详细指导读者学习TensorFlow，涵盖基础概念、数据流图、API使用、张量和变量操作，深度学习基础如CNN和RNN，以及自定义层和优化算法。书中还提供使用TensorFlow构建和训练深度学习模型的实例，包括AlexNet、VGG、ResNet以及LSTM和GRU，并通过图像分类和文本情感分析等实战案例，
〖Python零基础入门篇(61)〗- Python 中的迭代器哈哥撩编程 #① -零基础入门篇 Python全栈白宝书 python 迭代器
>【易编橙·终身成长社群，相遇已是上上签！】-点击跳转～<哈哥撩编程（视频号、抖音、B站同名）图书作者：程序员职场效能宝典博客专家：全国博客之星第四名超级个体：COC上海社区主理人特约讲师：谷歌亚马逊分享嘉宾科技博主：极星会首批签约作者大家好,我是哈哥，
使用HTML，CSS和JavaScript创建Chrome扩展程序海拥✘ Google 100个前端优质项目 javascript css chrome
介绍谷歌浏览器是开发人员和普通用户最喜欢的浏览器之一。我在所有设备上都使用了GoogleChrome浏览器，它可以帮助我同步书签，浏览器历史记录，密码管理器等等。对于台式机，除了可以在Internet上浏览以外，您还可以做很多事情。您可以测试您的网页和全部。通过使用扩展程序，谷歌浏览器变得更加强大。因此，今天，我们将研究如何使用HTML，CSS和JavaScript创建您的第一个GoogleChr
解决watt toolkit/steam++加速后google能进，firefox进不了github（证书不信任）新时代先锋小技巧和疑难杂症 github
加速后想访问github，结果发现谷歌和Edge浏览器可以流畅访问，firefox显示证书不信任，firefox的安全做的太严格了，因此需要在firefox设置——隐私与安全——查看证书——导入证书确定后就可以流畅访问了~~~GitHub是一个全球最大的代码托管平台，广泛用于软件开发和版本控制。它允许开发者使用Git工具来管理项目的代码，还提供了一个社交网络功能，使得开发者可以与他人合作、分享代码
曝罗永浩挖走小米前50号员工要做AIOS；谷歌呼吁美国政府不要拆分公司；Copilot+PC能本地运行DeepSeek|极客头条极客日报资讯
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN（ID：CSDNnews）一分钟速览新闻点！AAAI2025杰出论文奖出炉，南大周志华团队获奖字节跳动以约3150亿美元估值启动新一轮股票回购计划消息称vivoOS部门新成立AI领域，大模型训练重心向端侧转移为“AIOS”招兵买马：消息称罗永浩挖来小
python-selenium控制浏览器多开窗口一晌小贪欢 Python自动化办公 selenium python selenium chrome
1、视频展示-多开5个百度页面目录结构只要在当前目录下放上自己所在的谷歌驱动器：谷歌驱动器如何下载，请参考博客：请点我奉上代码importtimefromseleniumimportwebdriver
探秘Mixup：数据增强的新利器荣正青
探秘Mixup：数据增强的新利器mixupImplementationofthemixuptrainingmethod项目地址:https://gitcode.com/gh_mirrors/mi/mixup项目简介是一个由HongyiZhang开发的Python库，它实现了机器学习中的数据增强策略——Mixup方法。这个项目的目标是通过混合不同样本的数据点生成新的训练样本，从而帮助模型更好地学习数
深度学习数据集封装-----目标检测篇科研小天才深度学习目标检测人工智能
前言在上篇文章中，我们深入探讨了图像分类数据集的制作流程。图像分类作为计算机视觉领域的一个基础任务，通常被认为是最为简单直接的子任务之一。然而，当我们转向目标检测任务时，复杂度便显著提升，尤其是在标注框的处理环节。不同的模型架构往往对标注框的处理方式有着各自独特的要求。以YOLO系列为例，它自有一套成熟且高效的方法来应对这一挑战。鉴于篇幅有限，本文暂不深入展开YOLO的相关内容，感兴趣的读者可以查
谷歌GMS认证——EDLA与MADA认证测试环境搭建指南：硬件要求与配置步骤深圳深光标准技术 GMS android GMS认证谷歌GMS认证
一、硬件要求测试电脑推荐安装Ubuntu24，硬件32G+1T起。Wi-Fi和IPv6CTS测试需要一个支持IPv4和IPv6的Wi-Fi网络，可以连接到互联网且具有适用于IPv4和IPv6的有效DNS，支持IP多播，并且可以将设备视为独立客户端。Wi-FiRTT大部分测试设备不支持此功能，可以不用配置。蓝牙LE信标如果被测设备支持蓝牙LE，请在DUT周围5米内放置至少三个蓝牙LE信标，以便进行蓝
计算机视觉｜ConvNeXt：CNN 的复兴，Transformer 的新对手紫雾凌寒 AI 炼金厂 #计算机视觉 #深度学习机器学习计算机视觉人工智能 transformer ConvNeXt 动态网络神经网络
一、引言在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetworks，简称CNN）长期以来一直是核心技术，自诞生以来，它在图像分类、目标检测、语义分割等诸多任务中都取得了令人瞩目的成果。然而，随着VisionTransformer（ViT）的出现，计算机视觉领域的格局发生了重大变化。ViT通过自注意力机制，打破了传统卷积神经网络的局部感知局限，能够捕捉长距离依赖关系，在图
下载谷歌浏览器（Chrome）重岳 chrome 前端
傻瓜操作即可，本文主要是提供一下谷歌浏览器下载网址GoogleChrome网络浏览器得益于Google智能工具，Chrome现在更易用、更安全、更快速。https://www.google.cn/intl/zh-CN/chrome/
推荐：Python Google Search API——无限制的搜索引擎工具箱舒京涌
推荐：PythonGoogleSearchAPI——无限制的搜索引擎工具箱项目地址:https://gitcode.com/gh_mirrors/py/python-gsearch在当今这个信息爆炸的时代，能够高效搜索信息至关重要。今天，我们为您推荐一个强大的开源工具——PythonGoogleSearchAPI，这是一款无需任何外部依赖即可直接使用的非官方谷歌搜索接口。无论是开发者、研究人员还是
探索AGI：谷歌开源的先进智能系统框架劳泉文Luna
探索AGI：谷歌开源的先进智能系统框架agiAndroidGPUInspector项目地址:https://gitcode.com/gh_mirrors/ag/agiAGI（ArtificialGeneralIntelligence）是谷歌开源的一个项目，旨在构建一个可广泛应用的、先进的智能系统框架。这个项目的目的是为开发者提供一个平台，用于研究和开发具有广泛理解和适应能力的人工智能模型。技术分析
ElasticSearch 回郭肉 java elasticsearch 搜索引擎
ElasticSearch基础学习目标理解什么是倒排索引理解什么是ES搜索引擎掌握ES搜索引擎的索引库操作掌握ES搜索引擎的类型映射掌握ES搜索引擎的文档操作1搜索技术搜索技术在我们日常生活的方方面面都会用到，例如：综合搜索网站：百度、谷歌等电商网站：京东、淘宝的商品搜索软件内数据搜索：我们用的开发工具，如Idea的搜索功能这些搜索业务有一些可以使用数据库来完成，有一些却不行。因此我们今天会学习一
DynamicSparse-MobileNet (DSMNet) 用于低功耗图像分类闲人编程人工智能实战教程—论文创新点分类人工智能数据挖掘 DSMNet 动态稀疏熵感知自适应
目录DynamicSparse-MobileNet(DSMNet)用于低功耗图像分类一、模型背景与动机二、模型创新点详细解析1.动态稀疏计算路径2.自适应通道缩放3.熵感知知识蒸馏三、数据集与预处理四、网络结构详解1.输入层与熵估计模块2.动态稀疏卷积块3.熵感知分类头五、模型优化策略1.优化器设计——Prodigy优化器2.动态计算损失3.损失函数设计4.正则化技术5.防止过拟合六、网络结构图与
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$