Datawhale

图像分类经典项目：基于开源数据集Fashion-MNIST的应用实践

Datawhale

作者：何新，Datawhale优秀学习者

简介：何新，武汉理工大学硕士

https://github.com/whut2962575697

图像分类是计算机视觉和数字图像处理的一个基本问题。传统的图像分类方法通过人工设计提取图像特征，而基于深度学习的图像分类方法能够自动提取特征，其中卷积神经网络(CNN)近年来取得了惊人的成绩。

本文收集并评估了一些高效有用的图像分类训练技巧。使用这些技巧，在开源Fashion-MNIST数据集上达到了96.21%的Acc，为大家提供了一个简单有效的深度卷积神经网络的图像分类Baseline。

简介

问题

针对Fashion-MNIST数据集，设计、搭建、训练机器学习模型，能够尽可能准确地分辨出测试数据的标签。

思路

近年来，虽然许多start-of-art的方法都是通过设计复杂高效的网络结构来实现的，但是有些文献中对一些高效的数据增强方法以及训练技巧都简略的带过。

本文并未提出新颖的网络结构或者数据增强方法，而是对标准的Baseline使用了一些数据增强和训练的技巧得到了一个强Baseline。

目标

将得到的强Baseline在开源的Fashion-MNIST数据集对这些技巧进行了评估，并取得了96.21%的Acc。针对不同阶段的学习者，阅读文章后的收获：

深度学习入门学习者：希望你对当前一些优秀tricks和models有一定的了解；
深度学习竞赛者，希望提供一个简单高效图像分类技巧的工具集；
深度学习研究者：希望提供一个强Baseline，作为取得更高准确率的一个基准；

Baseline详见：

https://github.com/whut2962575697/image_classification

Datawhale后台回复关键词图像分类可打包下载baseline及数据集

数据集

MNIST

相信大家对经典的MNIST数据集都不陌生，它包含了大量的手写数字，可谓是算法工作者的必测数据集之一。有人曾调侃道："如果一个算法在MNIST不work, 那么它就根本没法用；而如果它在MNIST上work, 它在其他数据上也可能不work！"

数据下载：http://yann.lecun.com/exdb/mnist/

Fashion-MNIST

2017年8月27日，Fashion-MNIST图片库在GitHub上开源。与MINST手写数据集相比，其不同点与相同点如下

不同点：Fashion-MNIST不再是抽象符号，而是更加具象化的人类必需品：服装，共10大类：

相同点：Fashion-MNIST克隆了MNIST的所有外在特征

10个类别；
每张图像28x28的分辨率；
60000张训练图像和对应Label；
10000张测试图像和对应Label；
4个GZ文件名称都一样；

对于已有的MNIST训练程序，只要修改下代码中的数据集读取路径，或者残暴的用Fashion-MNIST数据集文件将MNIST覆盖，替换就瞬间完成了。

数据下载：https://github.com/zalandoresearch/fashion-mnist

模型配置

本文使用了开源的深度卷积神经网络resnet34作为baseline backone；同时通过消融实验，设计了数据增强方法；经过实验调试，对比了不同的backbone网络的性能，以及各种超参数对实验结果的影响，最终选择了最优的模型。

网络结构

1. ResNet

自 AlexNet 以来，最先进的 CNN 架构已经越来越深。AlexNet 只有 5 个卷积层，而之后的 VGG 网络和 GoogleNet(代号 Inception_v1)分别有 19 层和 22 层。

但是，网络的深度提升不能通过层与层的简单堆叠来实现。由于梯度消失问题，深层网络很难训练。因为梯度反向传播到前面的层，重复相乘可能使梯度无穷小。结果就是，随着网络的层数更深，其性能趋于饱和，甚至开始迅速下降。

ResNet 的核心思想是引入一个所谓的恒等快捷连接（identity shortcut connection），直接跳过一个或多个层。考虑到Fashion-MNIST原始数据分辨率过小，过深过大的网络可能会导致发生过拟合(overfiting)现象，因此我们选择了一个参数量较少的深度模型resnet34作为此次的baseline backbone。其结构如下：

2. EfficientNet

为了获得更好的精度，放大卷积神经网络是一种广泛的方法。目前通用的几种方法是放大CNN的深度、宽度和分辨率，在之前都是单独放大这三个维度中的一个，尽管任意放大两个或者三个维度也是可能的，但是任意缩放需要繁琐的人工调参，同时可能产生的是一个次优的精度和效率。

EfficientNet系统地研究了模型缩放，并发现平衡网络深度，宽度和分辨率可以提高性能。相比resnet，它可以用更少的参数获得更好的精度。在本次任务中，为了避免过拟合，我们选用EfficientNet b0作为一个backbone。其结构图如下所示：

3. WideresNet

ResNet的跳连接，导致了只有少量的残差块学到了有用信息，或者大部分残差块只能提供少量的信息。WideResNet在ResNet的基础上减小深度，增加宽度。下图为其结构图，其中B(3,3)表示一个两个3x3卷积，k表示一个宽度因子，当k为1时卷积核个数和ResNetv2相等，k越大网络越宽。用WRN-n-k来表示一个网络，n表示卷积层的总数，k表示宽度因子。

数据增强与训练技巧

针对上面三个backbone网络，本文收集使用了一些开源的数据增强以及模型训练的技巧对baseline进行拓展。

1. Warmup Learning Rate&CosineAnnealingLR

WarmUp策略已被证明对许多任务有效。与常见的递减学习率策略不同，WarmUp使用逐渐增加的学习率来初始化网络，并逐渐将其初始化为一个更好的搜索空间。当batch size较大时，这种方法可以避免在初始训练期间出现过拟合。当使用带有CosineAnnealing学习速率衰减的WarmUp策略时，效果通常很好。

2. Ranger optimizer

Ranger优化器由RAdam和LookAhead机制组成。RAdam是经典Adam优化器的新变体。它会自动动态地调整自适应学习率，同时考虑到训练过程中的变化和动量的影响。它的性能优于传统的手动warmup。LookAhead减少了对大量超参数调整的需求，同时以最小的计算开销实现了针对不同深度学习任务的更快收敛。

3. RandomErasing

随机擦除随机选择图像中的矩形区域，并使用随机值擦除其像素。在此过程中，将生成具有各种遮挡级别的训练图像，这会降低过度拟合的风险，并使模型对遮挡具有鲁棒性。

4. AutoAugment

AutoAugment方法设计了一个数据增强搜索空间，其中一个策略由许多子策略组成，每个小batch aize中的每张图像都会随机选择一个子策略。同时，它基于搜索算法来找到最佳策略，以便神经网络对目标数据集产生最高的验证准确性。

5. MixUp

MixUp将训练集中随机两个样本的图像和标签进行某种方式混合。通过这样做，mixup相当于对神经网络进行了正则化，使其在训练过程中具有更好的鲁棒性。

6. CutMix

与Mixup的混合方式不同，cutmix在训练图像之间剪切并粘贴补丁，在该训练图像中，GT标签也按比例混合到补丁区域。通过有效地利用训练像素并保留区域丢失的正则化效果，CutMix优于最新的增强策略。

7. Test Time Augmentation(TTA)

测试时增强（test timeaugmentation, TTA），可将准确率提高若干个百分点，测试时将原始图像造出多个不同版本，包括不同区域裁剪和更改缩放程度等，并将它们输入到模型中；然后对多个版本进行计算得到平均输出，作为图像的最终输出分数。这种技术很有效，因为原始图像显示的区域可能会缺少一些重要特征，在模型中输入图像的多个版本并取平均值，能解决上述问题。

实验框架

针对上面的backbone和技巧，本文开源了一个简单高效的图像分类框架，其支持多种backbone网络，包括(resnet,densenet,efficiennet,wrn)等等，同时支持cpu/gpu/multi-gpu(sync bn)，包含完整的日志系统与可视化系统。

实现细节

1. 数据处理

由于原始数据为单通道图片，故有两种选择方案：

默认用1通道图片进行训练
将图片转换为3通道图片进行训练

使用默认的单通道图片进行训练无法使用预训练模型，所以比较好的方法是将图片转换为3通道图片进行训练。这样可以用到一些backbone在其他数据集上的预训练模型，这种迁移学习的方法能够加快网络收敛速度并在一定程度上提高性能。

2. 数据增强

通过实验对比，选择了一个如下数据增强方案：

Resize 36x36
RandomCrop(随机) 32x32
RandomHorizontalFlip(随机水平翻转)
RandomEreasing(随机擦除)
AutoAugment
CutMix
Normalation

3. 训练技巧

本文对比使用了两种不同的训练方式：

WarmUp + CosineAnnealingLR(Adam)
Ranger Optimizer

结果分析

本节将在开源的Fashion-MNIST数据集上评估我们的模型。将分类精度Acc与F1-Score作为评估指标。通过比较baseline与其它backone区别后，在此基础上加上了之前讨论的一些技巧，结果如下图所示：

1. Analysis of Backbone

评估了三个不同backbone resnet34, efficientnetb0与wrn40-4的性能。所有的模型均在Adam 优化器+warmup+ CosineAnnealingLR的机制下，数据增强方法均在标准的增强方法上加上RandomErasing ，AutoAugmnet以及CutMix。BatchSize均为128。由于resnet34与efficienntb0有开源的imagenet预训练模型，所以我们选择的resnet34,efficientnetb0均使用image net上的预训练模型进行迁移学习，而wrn40-4则从头开始训练。同时我们将wrn40-4中的激活函数换成Mish激活函数，发现对性能有提升。

2. Analysis of Data Augment

评估了各种较新数据增强技巧的性能，包括random erasing, mixup, cutmix,mixup, autoaugmnet, augmix。所有的增强方法均在标准的数据增强方法（Resized, RandomCrop,RandomHorizontalFlip, Normalization）的基础上进行的。使用标准的数据增强时我们将原始图片先转化成三通道RGB图片，然而将28*28分辨率的图像resize为36*36，然后RandomCrop出32*32大小的patch，再以0.5的概率使用RandomHorizontalFlip。在使用Random Erasing时我们设置的擦除概率为0.5，最大擦除比例为0.4。

3. Analysis of WarmUp+ CosineAnnealingLR

评估了Wramup 配合CosineAnnealingLR的学习方法对模型精度的影响。默认使用的优化器均为Adam,基础学习率为3e-4,warmup 10轮。

4. Analysis of Ranger Optimizer + CosineAnnealingLR

评估了Ranger Optimizer对模型性能的影像。由于Ranger优化器的lookahead机制，无需再在训练的开始阶段使用warmup。通过实验，我们发现Ranger优化器较Warmup+Adam收敛速度更快，同时精度更高。

结果讨论

通过实验比较与分析可以看出：

使用好的backbone能起到很好的作用，同时使用开源数据集预训练模型进行迁移学习能够加快收敛速度的同时提升精度。
数据增强方法同样重要，好的数据增强方法能够有效避免过拟合现象，让模型可以使用一些更强大的backbone，极其推荐CutMix方法。
训练策略也十分重要，在训练初始阶段使用WarmUp策略能够在开始阶段避免过拟合，这种方法对大部分视觉任务均有帮助，而采用LookAhead机制的Ranger在分类任务中能够更快的收敛，同时能够提升模型精度。

但是这种优化器不一定适用于所有的视觉任务，它在其他任务中的效果有待检验。

结论

本文收集了一些高效的数据增强与模型训练的技巧，并针对图像分类任务设计了一个强Baseline。为比较这些技巧在分类模型上的性能，设计了一系列的消融实验，最后在使用了一些比较好的数据增强方法和训练技巧后在Fashion Minist数据集上的ACC达到了96.21%。

当然，本文仅仅对一部分方法和技巧进行了评估，也将在此项工作的基础上对其他技巧进行后续评估。大家有哪些不错的数据增强与模型训练的技巧呢？请留言区和大家互动吧！

AI学习路线和优质资源，在后台回复"AI"获取

通过ShiftMediaProject生成ffmpeg的DLL和Lib的简要说明 jyl_sh webkit学习 C/C++图形化编程 c++ffmpeg 视频接口 chrome webkit
这是将FFmpeg构建为msvcDLL和lib文件的一个小步骤说明文档。项目包含静态库文件的发布和调试版本（调试/发布）以及动态共享dll文件（DebugDLL/ReleaseDLL）。选择符合您要求的项目配置。注意：FFmpeg需要C99支持才能编译。只有VisualStudio2013或更新的版本才需要C99的功能不支持旧版本。需要VisualStudio2013或更新版本。如果使用旧的不受支
《python基于时间序列分析的降雨量预测系统》毕业设计项目陈辰学长 python 课程设计开发语言
大家好，我是陈辰学长，一名在Java圈辛勤劳作的码农。今日要和大家分享的是一款《python基于时间序列分析的降雨量预测系统》毕业设计项目。项目源码以及部署相关事宜，请联系陈辰学长，文末会附上联系信息哦。作者：陈辰学长个人简介：在Java领域已沉浸十余年，对Java、微信小程序、Python、Android等技术颇为精通。若大家在这些领域有任何问题，欢迎一起交流探讨！各类成品Java毕业设计丰富多
K-means聚类：解锁数据隐藏结构的钥匙陈辰学长 kmeans 聚类机器学习
K-means聚类：解锁数据隐藏结构的钥匙在机器学习的广阔领域中，无监督学习以其独特的魅力吸引了众多研究者和实践者。其中，K-means聚类作为一种经典且实用的无监督学习算法，以其简单高效的特点，广泛应用于市场细分、图像分割和基因聚类等领域。本文将深入探讨K-means聚类的工作原理、应用实例及其在这些领域中的具体应用，旨在揭示其如何智能划分数据，解锁隐藏结构，为相关领域提供精准导航。一、K-me
Docker Image 详细讲解陈辰学长 docker 容器运维
DockerImage详细讲解DockerImage是Docker生态系统中的核心概念之一，它作为容器运行的基础，封装了应用运行所需的环境和依赖。本文将详细讲解DockerImage的定义、构建、存储、管理以及使用，帮助读者全面理解DockerImage。一、DockerImage概述DockerImage是一个轻量级、可执行的独立软件包，包含了运行某个软件所需要的所有内容，包括代码、运行时、库、
dlib库的whl文件下载杭林菲
dlib库的whl文件下载【下载地址】dlib库的whl文件下载dlib库的whl文件下载项目地址:https://gitcode.com/open-source-toolkit/f2aaf资源文件介绍本仓库提供了一个dlib库的whl文件下载，文件名为：dlib-19.7.0-cp36-cp36m-win_amd64.rar。该文件适用于Windows64位系统，Python版本为3.6。文件描
linux 搭建https 服务器（apache） gpstrive linux应用 apache https linux
一、安装准备1.安装Openssl要使Apache支持SSL，需要首先安装Openssl支持。这里使用的是openssl-0.9.8k.tar.gz下载Openssl：http://www.openssl.org/source/tar-zxfopenssl-0.9.8k.tar.gz//解压安装包cdopenssl-0.9.8k//进入已经解压的安装包./config//配置安装。推荐使用默认配置
ASP.NET Core Web API 模板项目推荐余怡桔Solomon
ASP.NETCoreWebAPI模板项目推荐aspnetcore-webapi-templateThisprojectisanWebAPIOpen-SourceBoilerplateTemplatethatincludesASP.NETCore5,WebAPIstandards,cleann-tierarchitecture,GraphQLservice,Redis,Mssql,Mongodat
ACNet：深度学习中的自适应卷积网络新星郎轶诺
ACNet：深度学习中的自适应卷积网络新星项目地址:https://gitcode.com/gh_mirrors/ac/ACNet在深度学习领域，卷积神经网络（CNN）一直是图像处理和计算机视觉任务的核心技术。然而，传统的固定大小的卷积核无法灵活适应不同区域的信息密度。针对这一问题，ACNet（AdaptiveConvolutionNetwork）项目应运而生，它引入了一种新型的自适应卷积层，旨在
Linux/Mac 命令行工具 tree 开发项目结构可以不用截图了更方便更清晰更全知楠行易 Software linux macos 运维
tree是一个命令行工具，用于以树形结构显示文件系统目录的内容。它可用于列出指定目录下的所有文件和子目录，以及它们的层次关系。tree命令在许多操作系统中都可用，包括Unix、Linux和macOS。效果如下：一、安装linux#Debian/Ubuntusudoapt-getinstalltree#RedHat/CentOSsudoyuminstalltreeMacbrewinstalltree
《一个月教你玩转C++》系列第十章：C++中的while循环 c++布丁 C++c++开发语言
第十章：C++中的while循环这一章，布丁将会介绍C++中的while循环，以及两个实用的运算符：++和--。这些工具能帮助我们更有效地控制程序的流程。while循环基本格式while循环是C++中实现重复执行的一种方式。它根据一个条件来决定是否继续执行循环体内的代码。这个条件可以是任何可以评估为真或假（真就是大于0的数，假就是0）的表达式哟！while循环的基本格式是这样的：while(条件)
chatgpt赋能python：用Python安装Jupyter：让数据科学变得更加高效！ aijinglingchat ChatGpt python chatgpt jupyter 计算机
用Python安装Jupyter：让数据科学变得更加高效！对于数据科学家而言，jupyter是不可或缺的工具之一。它是一个基于web的交互式计算环境，可以帮助我们在Python中以一种轻松、方便、可交互的方式进行编程和数据分析。今天，我们将向您介绍在Python中如何安装jupyter。安装Python要安装jupyter，首先需要安装Python。如果您已经安装了Python，请跳到下一步。您可
工作中常用springboot启动后执行的方法 begei spring boot java 后端
前言：工作中难免会遇到一些，程序启动之后需要提前执行的需求。例如：初始化缓存：在启动时加载必要的缓存数据。定时任务创建或启动：程序启动后创建或启动定时任务。程序启动完成通知：程序启动完成后通过邮件、短信等方式通知运维人员。外部系统同步：启动后与外部系统同步数据。下面介绍几种常见方式：1.使用@PostConstruct注解：使用@PostConstruct注解可以在Spring容器初始化bean之
wandb超算运行的问题 ajin_97 python 深度学习 pytorch
wandb:Networkerror(ConnectionError),enteringretryloop.wandb:ERRORRuninitializationhastimedoutafter90.0sec.这是因为wandb需要联网运行，超算无法联网关闭wandb或者wandb设置为offline模式即可importosimportwandbos.environ["WANDB_API_KEY
关于wandb: Network error的问题 Young_Tramp 一些小问题 linux
关于wandb:Networkerror的问题我的情况：vscode远程服务器，服务器才重启过，wandb之前一直正常，重启后就出现错误：wandb:Networkerror(ConnectionError),enteringretryloop.wandb:W&BAPIkeyisconfigured.Usewandblogin--relogintoforcereloginwandb:Network
ECMAScript 2016（ES7） - ECMAScript 2024(ES15)新特性全览孤影_ls JS javascript 前端 ES7-ES15
ECMAScript新特性w3shoolsECMAScript2016ECMAScript2024Es2022array.at获取数组的第N个元素时Object.hasOwn()替代Object.prototype.hasOwnProperty()使用“#”声明私有属性(方法，字段)不用下划线_为前缀了await不需要写asyncRegExp匹配索引/d允许我们指定我们想要获取给定字符串中RegE
解决登录wandb问题 Ambition_LAO python
选择不登录wandb来使用它，不过这意味着你将失去与wandb云平台的连接，因此不会有数据上传到wandb的服务器。仍然可以使用wandb进行本地日志记录或完全禁用它。以下是几种方式来避免登录：1.禁用wandb的联网功能：可以通过在代码中禁用wandb的网络功能，让它在本地运行而无需登录。在使用wandb.init()时设置mode参数为offline，这样wandb将在本地记录日志，而不会尝试
与机器学习的邂逅--自适应神经网络结构的深度解析想成为高手499 机器学习与人工智能机器学习神经网络人工智能
引言随着人工智能的发展，神经网络已成为许多应用领域的重要工具。自适应神经网络（AdaptiveNeuralNetworks，ANN）因其出色的学习能力和灵活性，逐渐成为研究的热点。本文将详细探讨自适应神经网络的基本概念、工作原理、关键技术、C++实现示例及其应用案例，最后展望未来的发展趋势。自适应神经网络的基本概念什么是自适应神经网络？自适应神经网络是一种能够根据输入数据的变化和环境的动态特性自动
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
MySQL知识大总结（进阶）神秘的t mysql 数据库
一，数据库的约束1，约束类型1notnull非空约束，标记这个字段不可以为空2unique唯一约束，标记这个字段的值是该列唯一的值，在这一列的其他行，不可以与该字段相等3default默认约束，在该字段没有赋值时，使用默认值填充该列4primarykey主键约束，相当于notnull+unique5foreignkey外键约束，与其他表的主键简历联系，在添加或修改数据是，会根据主外键关系检查数据是
JavaScript的那些不可不知的知识遇见~未来 JavaScript javascript 开发语言 ecmascript
目录JavaScript基础JavaScript高级JavaScript基础数据类型：JavaScript的数据类型分为基本数据类型和引用数据类型。基本数据类型包含number（数字）、string（字符串）、boolean（布尔值）、null（空值）、undefined（未定义）。而像array（数组）、function（函数）等则属于引用数据类型。在内存存储方面，基本类型是按值存储在栈中，引用
macOS查看当前项目的 tree 结构缘友一世 mac折腾记 macos
文章目录使用`tree`命令macOS系统默认不包含tree命令使用tree命令使用homebrew自动安装脚本/bin/zsh-c"$(curl-fsSLhttps://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"安装tree：brewinstalltree查看项目的tree结构：treeyang@MacdeMac-minigradle
国产编辑器EverEdit - 合并行彩虹小黑馬妙用编辑器编辑器 EverEdit EmEditor notepad++
1合并行1.1应用场景在编写代码或其他场景下，有时需要把多行的内容缩减成一行，或者纯粹减少行数进行合并，比如：下面的字典的定义，每个元素占了一行，有点浪费，现在需要把它们缩减行数。typeDict={"姓名":"name","出生日期":"passport_dob","职位":"job","手机号":"phone_number","身份证":"ssn","国家":"country","地址":
麒麟V10系统上安装Oracle 乙龙 oracle ffmpeg 数据库
以下是在麒麟V10系统上安装Oracle数据库的详细步骤：安装前准备检查系统版本：使用uname-a、cat/etc/os-release等命令检查服务器是麒麟V10系统。配置固定IP和本地yum源：挂载麒麟V10的iso文件到/mnt目录，如mount-oloopKylin-Server-10-SP1-Release-Build20-20210518-x86_64.iso/mnt。备份并修改/e
[dlib][python]dlib所有whl文件下载地址汇总 Xiao张不会深度学习 python 开发语言深度学习
dlib库的wheel文件3.7-3.12GitHub-z-mahmud22/Dlib_Windows_Python3.x:Dlibcompiledbinary(.whl)forPython3.7-3.12andWindowsx64这里存储了适用于python3.7-3.12的wheel文件下载wheel文件之后，比如：dlib-19.22.99-cp310-cp310-win_amd64.whl
Spring Boot中的响应与分层解耦架构陈辰学长 spring boot 架构后端
SpringBoot中的响应与分层解耦架构在SpringBoot框架中，响应与分层解耦架构是两个核心概念，它们共同促进了应用程序的高效性、可维护性和可扩展性。下面将详细探讨这两个方面，包括SpringBoot的响应机制、分层解耦的三层架构以及它们在实际开发中的应用。一、SpringBoot的响应机制SpringBoot的响应机制主要依赖于其内置的Servlet容器（如Tomcat）和SpringM
ASP.NET Core N-Tier 架构 Web API 项目教程蓬为宜
ASP.NETCoreN-Tier架构WebAPI项目教程aspnetcore.ntier.NETCoreN-TierarchitectureWebApisampleproject.项目地址:https://gitcode.com/gh_mirrors/as/aspnetcore.ntier项目介绍ASP.NETCoreN-Tier架构WebAPI项目是一个示例项目，展示了如何使用ASP.NETC
MCP（Model Context Protocol）模型上下文协议进阶篇4 - 发展计划 AIQL MCP(Model Context Protocol)MCP ai language model 开源协议人工智能
ModelContextProtocol（MCP）正在快速发展。这一章概述了2025年上半年关键优先事项和未来方向的当前思考，尽管这些内容可能会随着项目的进展而发生显著变化。目前MCP的主要内容，除实战篇外（包括理论篇、番外篇和进阶篇）均已进入收尾阶段。在官方未发布重大更新前，预计短期不会新增其他篇章。远程MCP支持（RemoteMCPSupport）我们的首要任务是启用远程MCP连接，允许客户端
自适应神经网络架构：原理解析与代码示例 chian-ocean 机器学习神经网络人工智能深度学习
个人主页：chian-ocean文章专栏自适应神经网络结构：深入探讨与代码实现1.引言随着深度学习的不断发展，传统神经网络模型在处理复杂任务时的局限性逐渐显现。固定的网络结构和参数对于动态变化的环境和多样化的数据往往难以适应，导致了过拟合或欠拟合的问题。自适应神经网络（AdaptiveNeuralNetworks,ANN）为此提供了一种新的解决方案，它可以根据数据特征和训练情况自动调整网络结构，从
Python剪辑视频小妙招（moivepy库）对不起，我辜负了你 python
起因最近一直在b站上投稿喜羊羊与灰太狼的视频，但是苦于需要手动裁剪视频的片头和片尾，裁剪的多了就发现喜羊羊与灰太狼的视频片头几乎都是1分25秒结束，也就是持续85秒，片尾也差不多是持续1分02秒差不多也就是62秒，于是开始思考有没有什么方法可以替代人类进行自动化批量裁剪？思路发展迭代与确定一开始是想使用Premier里面的预设来做的，结果发现Premier里面高版本的导出变成了各种网站的标准，相比
深度解析智能问答系统：如何打造精准、高效的AI对话架构？和老莫一起学AI 人工智能架构自然语言处理产品经理语言模型学习 ai
在人工智能的飞速发展中，智能问答系统（QA系统）逐渐成为了企业内部管理、客户服务、搜索引擎等多个领域中的关键技术。今天，我们将深入探讨一个基于大模型、自然语言处理、知识检索的智能问答系统的架构，详细介绍其技术原理、流程以及未来应用前景。一、系统整体概览在这个智能问答系统中，整个流程可以大致划分为两大部分：前端问答生成与后端离线数据处理。前端部分是用户交互的核心，通过用户的输入、关键词提取、检索和问
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

图像分类经典项目：基于开源数据集Fashion-MNIST的应用实践

简介

数据集

模型配置

实验框架

结论

你可能感兴趣的:(图像分类经典项目：基于开源数据集Fashion-MNIST的应用实践)