WhyNotFocus

初入领域自适应DomainAdaptation

15年的文章：Unsupervised Domain Adaptation by Backpropagation

雷郭出品

- DomainAdatation的定义
- 本文的领域自适应的独特之处
- 本文方法的梗概
- 本文的citing达到接近1900的原因（截至2020年11月初）
- 本文的GRL的作用
- 本文方法详情介绍
- 本文的最终目标
- 本文的框架图
- pytorch实现代码

DomainAdatation的定义

Learning a discriminative classifier or other predictor in the presence of a shift between training and test distributions is known asdomain adaptation(DA).
在训练分布和测试分布之间发生变化的情况下学习判别分类器或其他预测因子称为域适应（DA）。

领域自适应和迁移学习的关系

本文的领域自适应的独特之处

Unlike most previous papers on domain adaptation that worked with fixed feature representations, we focus on combining domain adaptation and deep feature learning within one training process (deep domain adaptation). Our goal is to embed domain adaptation into the process of learning representation, so that the final classification decisions are made based on features that are both discriminative and invariant to the change of domains, i.e. have the same or very similar distributions in the source and the target domains. In this way, the obtained feed-forward network can be applicable to the target domain without being hindered by the shift between the two domains.
不同于以往大多数关于领域适应的论文都使用固定的特征表示，我们专注于在一个训练过程（深层域适应）中结合领域适应和深层特征学习。我们的目标是将领域适应嵌入到学习表示的过程中，使得最终的分类决策的做出是基于对域的变化既有区别又不变（感觉这要求有点高）的特征，即在源域和目标域中具有相同或非常相似的分布。这样，所得到的前馈网络可以应用于目标域，而不受两个域之间的转变的阻碍。

本文方法的梗概

We thus focus on learning features that combine (i) discriminativeness and (ii) domain-invariance.This is achieved by jointly optimizing the underlying features as well as two discriminative classifiers operating on these features: (i) the label predictor that predicts class labels and is used both during training and at test time and (ii) the domain classifier that discriminates between the source andthe target domains during training.
While the parameters of the classifiers are optimized in order to minimize their error on the training set, the parameters of the underlying deep feature mapping are optimized in order to minimize the loss of the label classifier and to maximize the loss of the domain classifier. The latter encourages domain-invariant features to emerge in the course of the optimization.
两个分类器：类别分类和领域分类
两个分类器的参数都是来最小化各自的损失
特征提取层的参数既要最小化类别损失，又要最大化领域损失
正是这个特征提取层的既又使得领域不变性特征得以出现
个人感觉上面这一段好复杂（各种损失，各种最大最小），因为它是本文核心

本文的citing达到接近1900的原因（截至2020年11月初）

Crucially, we show that all three training processes(这里的三对应的是什么？有两种可能) can be embedded into an appropriately composed deep feed-forward network (Figure 1) that uses standard layers andloss functions, and can be trained using standard backpropagation algorithms based on stochastic gradient descent orits modifications (e.g. SGD with momentum).
Our approach is generic as it can be used to add domain adaptation to any existing feed-forward architecture that is trainable by backpropagation.
本文的算法很通用，可以嵌入到一般的神经网络（现在绝大多数的神经网络用的都是反向传播）当中

本文的GRL的作用

In practice, the only non-standard component of the proposed architecture is a rather trivial gradient reversal layer that leaves the input unchanged during forward propagation and reverses the gradient by multiplying it by a negative scalar during the back propagation.
GRL怎么做到前向传播保持输入不变？
后向传播反转梯度？

本文方法详情介绍

We now detail the proposed model for the domain adaptation. We assume that the model works with input samples x∈X, where X is some input space and certain labels (output) y from the label space Y. Below,we assume classification problems where Y is a finite set(Y={1,2,…L}), however our approach is generic and can handle any output label space that other deep feedforward models can handle. We further assume that there exist two distributions S(x,y) and T(x,y) on X⊗Y,which will be referred to as the source distribution and the target distribution (or the source domain and the target domain). Both distributions are assumed complex and unknown, and furthermore similar but different (in otherwords,S is “shifted” from T by some domain shift).
源域和目标域；既类似又不同（这个是对应前面的既又？）
At training time,we have an access to a large set of training samples{x1,x2,…,xN} from both the source and the target domains distributed according to the marginal distributions S(x) and T(x) .
训练的时候源域和目标域的样本都得使用
We denote with di the binary variable (domain label) for the ith example, which indicates whetherxicome from the source distribution (xi∼S(x) if di=0) orfrom the target distribution (xi∼T(x) if di=1). For the examples from the source distribution (di=0) the corresponding labels yi∈Y are known at training time. For the examples from the target domains, we do not know the labels at training time, and we want to predict such labels at test time.
di的取值（0或者1）：源域的样本di=0，目标域的样本di=1
但是由于目标域的样本的y标签不知道（因为本文的题目就是unsupervised domain adaptation）
（那目标域的样本在训练的时候可以用来干嘛，可用来算领域误差（因为目标域和源域都有di标签））
（我觉得目标域的标签肯定是有的，只是训练的时候不让网络知道，不然测试的时候怎么判断准确率）
We now define a deep feed-forward architecture that for each input x predicts its label y∈Y and its domain label d∈ {0,1}.
我的疑问是：训练的时候y标签和d标签自然都需要算出来，那测试的时候d标签还需要吗
我暂时觉得不需要
We decompose such mapping into three parts.We assume that the input x is first mapped by a mapping Gf(a feature extractor) to a D-dimensional feature vector f ∈R^D. The feature mapping may also include several feed-forward layers and we denote the vector of parameters of all layers in this mapping as θf, i.e.f=Gf(x;θf).Then, the feature vector f is mapped by a mapping Gy(label predictor) to the label y, and we denote the parameters of this mapping with θy. Finally, the same feature vector f is mapped to the domain label d by a mapping Gd(domain classifier) with the parameters θd.
输入x经过特征提取层得到D维向量，然后D维向量分别输入两个分支，即分类和领域分支。
然后注意这里的Gf,Gy,Gd分别对应三个局部网络
θf，θy，θd分别对应三个局部网络的参数
重点内容来了
During the learning stage, we aim to minimize the label prediction loss on the annotated part (i.e. the source part)of the training set, and the parameters of both the feature extractor and the label predictor are thus optimized in order to minimize the empirical loss for the source domain samples. This ensures the discriminativeness of the features f and the overall good prediction performance of the combination of the feature extractor and the label predictor on the source domain.
优化特征提取器和类别分类器的参数从而最小化源域的类别标签预测损失
At the same time, we want to make the features f domain-invariant.That is, we want to make the distributions S(f) ={Gf(x;θf)|x∼S(x)} and T(f) ={Gf(x;θf)|x∼T(x)} to be similar.
我觉得上面的S(f)和T(f)就是分别指代源域和目标域的样本经过特征提取层得到的向量
训练的目标是希望得到的特征提取层对源域和目标域的映射是相似的。
Under the covariate shift assumption, this would make the label prediction accuracy on the target domain to be the same as on the sourcedomain (Shimodaira, 2000).
这里的covariate shift assumption不懂
Measuring the dissimilarity of the distributions S(f) and T(f) is however non-trivial,given that f is high-dimensional, and that the distributions themselves are constantly changing as learning progresses
non-trival的意思就是significant；
然后这里说到：学习过程中分布会一直变化，好像是这么回事，因为映射在变化，从a分布到b分布。
One way to estimate the dissimilarity is to look at the loss of the domain classifier Gd, provided that the parameters θd of the domain classifier have been trained to discriminate between the two feature distributions in an optimal way.
估计差异性的一种方法是观察域分类器Gd的损失，前提是域分类器的参数θd已被训练以最佳方式区分两个特征分布。（域分类器这里说要区分，我在别的博客中看到要混淆。。）
This observation leads to our idea. At training time, in order to obtain domain-invariant features, we seek the parameters θf of the feature mapping that maximize the loss of the domain classifier (by making the two feature distributions as similar as possible（我觉得：当源域和目标域的样本经过特征提取层映射得到的向量分布相似的时候，由于领域标签是各自的0和1，所以此时的领域误差是最大的）), while simultaneously seeking the parameters θd of the domain classifier that minimize the loss of the domain classifier. （θd 要最小化领域损失的目的个人认为是训练出好的领域分类器，这里的θd 和θf的关系太像GAN中的生成器和辨别器；）In addition, we seek to minimize the loss of the label predictor.
（最后，类别分类器的损失自然是也是要最小化的）
下面的这个公式劝退

分析一下（2）和（3）
为什么这里的θf和θy组队
而θd就一个人
先把这个问题放一边
接下来考虑argmin和argmax的问题
θf是既想minimize类别损失，又想maximize领域损失
θy是想minimize类别损失，
θd是想minimize领域损失
（从上面的分析来看，好像也只能这样分组了）
对于（2）式来说，当θd已经固定为θd^时，我们只考虑类别损失，此时类别损失最小就是E最小
对于（3）式来说，当θf和θy已经别固定为θf^ 和 θy^时，我们只考虑领域损失，此时领域损失最小就是E最大（因为有个负号）
论文原文如下：
At the saddle point, the parameters θd of the domain classifier θd minimize the domain classification loss (since it enters into (1) with the minus sign) while the parameters θy of the label predictor minimize the label prediction loss. The feature mapping parameters θf minimize the label prediction loss (i.e. the features are discriminative), while maximizing the domain classification loss (i.e. the features are domain-invariant). The parameter λ controls the trade-off between the two objectives that shape the features during learning.
我想说的是这里的trade-off对应的two objectives应该是上面的argmin和argmax，即式2和式3
又或者是跟 θf 的maximize和minimize相关
感觉是后者，因为two objectives，极其对应上一句的θf的两个优化目标

我又有一种想法：
从：
θf是既想minimize类别损失，又想maximize领域损失
θy是想minimize类别损失，
θd是想minimize领域损失
如果θf不作妖，即目的只有一个，那E中的领域损失没必要弄个负号，直接正号就行了
但是实际θf非要作妖
加了负号之后，可以将θf的maximize（领域）转化为minimize（E）
所以θf在E中的作用就统一为minimize
θy也是minimize
所以它俩一队
但是此时却将θd的minmize（领域）转换为maxmize（E）
所以θd只能一个人
那具体这两个小分队是怎么求解的？一个要argminE，一个要argmaxE?

从4，5，6式来看
前面分析过所以θf在E中的作用就统一为minimize
所以θf的更新可以直接套用梯度下降，即如4式所示，括号内是E对θf的偏导数
同理θy也是如此，其更新如5式所示
θd则比较特殊，因为其要最大化E，所以用梯度上升，即θd+u*(E对θd的偏导数)
整理的θd+u * （负的lamuta * Ld对θd的偏导），括号去掉加号就变成了减号
但是疑惑的点是lamuta不见了，我觉得就是u和u*lamuta的差别仅仅是大小不一样（即更新的程度不一样），所以为了简便可以去掉
（这篇文章很多内容都是我的初步理解，可能理解的完全不对，但是总给把自己的观点和看法提出来）

现在我们已经能确定4，5，6式的合理性，
那如何将其与我们常用的反向传播结合起来
先来看看论文原文：
The updates (4)-(6) are very similar to stochastic gradient descent (SGD) updates for a feed-forward deep model that comprises（包括） feature extractor fed into the label predictor and into the domain classifier. The difference is the−λ factor in (4) (the difference is important, as without such factor stochastic gradient descent would try to make features dissimilar across domains in order to minimize the domain classification loss).
非常像SGD,唯一的区别就是λ，λ至关重要于领域不变性，所以只需要处理这个λ，本文引入GRL模块
Although direct implementation of (4)-(6) as SGD is not possible, it is highly desirable to reduce the updates (4)-(6) to some form of SGD, since SGD (andits variants) is the main learning algorithm implemented inmost packages for deep learning.
直接当成SGD不行，那就适当变形

14.Fortunately, such reduction can be accomplished by introducing a special gradient reversal layer(GRL) defined as follows. The gradient reversal layer has no parameters associated with it (梯度反转层没有相关参数，感觉是很重要的知识点)(apart from the meta-parameter λ, which is not updated by back propagation). During the forward propagation, GRL acts as an identity transform. During the back propagation though, GRL takes the gradient from the subsequent level, multiplies it by −λ and passes it to the preceding layer. Implementing such layer using existing object-oriented packages for deep learning is simple(使用现有的面向对象的包来实现这种层很简单), as defining procedures for forwardprop (identity transform),backprop (multiplying by a constant), and parameter update (nothing) is trivial(简单).
之前的non-trivial我是翻译成significant，事实上还有复杂的意思。
The GRL as defined above is inserted between the feature extractor and the domain classifier, resulting in the architecture depicted in Figure 1. As the back propagation process passes through the GRL, the partial derivatives of the loss that is downstream the GRL (i.e.Ld) w.r.t. the layerparameters that are upstream the GRL (i.e.θf) get multiplied by−λ(GRL下游的loss关于GRL上游的θf的偏导数乘以−λ), i.e.∂Ld/∂θf is effectively replaced with−λ*∂Ld/∂θf.Therefore, running SGD in the resulting model implements the updates (4)-(6) and converges to a saddle point of (1).Mathematically, we can formally treat the gradient reversal layer as a “pseudo-function” Rλ(x) defined by two (incompatible) equations describing its forward- and back propagation behaviour:

where I is an identity matrix. We can then define the objective “pseudo-function” （跟前一段的应该不是同一个东西，只是都叫伪函数）of (θf,θy,θd) that is being optimized by the stochastic gradient descent within our method：

但是当我们把Rλ代入到9式，感觉是不是前向传播的时候少了−λ
我觉应该是上一段说的Rλ的前向和后向incompatible所导致的，
假设compatible的话，那代入Rλ就应该是前向后向都满足
而这里只满足后向（我的看法：Ly和Ld本身在前向的时候没有变化，而在反向传播时E对参数的偏导也没有变化，所以参数的更新就不会有变化，前向的最终目的是为了后向，我直接后向不变，你前向变不变跟我没关系，所以感觉等价）
（两个E不完全相同，修改后的带波浪线）
那从数学上如何解释呢？？希望有人解惑。

比较一下原式：

小结
Running updates (4)-(6) can then be implemented as doing SGD for (9) and leads to the emergence of features that are domain-invariant and discriminative at the same time.After the learning, the label predictor y(x) =Gy(Gf(x;θf);θy) can be used to predict labels for samples from the target domain (as well as from the sourcedomain).

本文的最终目标

Our ultimate goal is to be able to predict labels y given the input x for the target distribution.
对于目标域也能做出正确的分类.

本文的框架图

注意上面图中的Otherwise，否则，也就是说实际不是这样。

pytorch实现代码

之后再添

言简意赅的博客
不明觉厉的知乎

AI绘画工具介绍编程小郭 ai作画
市面上AI绘画工具众多，它们利用深度学习和图像处理技术，为用户提供了丰富的创作体验和可能性。以下是对几款主流AI绘画工具的详细介绍及横向对比：一、主流AI绘画工具介绍Midjourney简介：Midjourney是一个独立的研究实验室，专注于人工智能绘图，被广泛应用于设计、艺术创作、广告制作等领域。特点：以其强大的图像生成能力和跨界融合的创新特点著称，能够根据文本描述和视觉输入生成兼具故事性与视觉
文心一言vsGPT-4全面对比编程小郭文心一言 chatgpt java python 人工智能 ai
文心一言和GPT-4都是当前非常先进的人工智能语言模型，它们各自具有独特的特点和优势。以下是对这两款工具的全面比较：文心一言是由百度开发的一款大型人工智能语言模型，它基于强大的深度学习技术和海量的数据资源，具备出色的语言理解和生成能力。文心一言在中文处理方面尤为出色，能够准确理解中文语境和语义，生成流畅、自然的中文文本。文心一言还具备丰富的知识库和推理能力，能够回答各种问题，提供有用的信息和建议。
基于深度学习的认知架构的AI SEU-WYL 深度学习dnn 人工智能深度学习架构
基于深度学习的认知架构的AI是一类模仿人类认知过程的人工智能系统，旨在模拟人类感知、学习、推理、决策等复杂的认知功能。认知架构的目的是创建一个能够理解和处理复杂环境、实现自我学习和适应的AI系统。结合深度学习技术，这类AI可以更好地应对动态和复杂的任务需求。1.基于深度学习的认知架构的组成一个典型的基于深度学习的认知架构包含多个关键模块：感知模块：负责从外部环境中获取数据，处理和提取特征。深度学习
什么是AI显卡，英伟达与AMD显卡的全面对比 wit_@ 人工智能 python 算法 deep learning 大数据网络
什么是AI显卡？AI显卡是专门为人工智能计算任务设计和优化的图形处理器（GPU）。相比传统显卡，AI显卡具备更强的计算能力、更高的并行处理效率以及针对深度学习、数据科学等领域的特殊硬件支持。在人工智能领域，尤其是深度学习中，训练和推理任务需要处理大量的矩阵运算，这正是GPU擅长的领域。AI显卡通过高度并行的架构，可以显著提升训练速度和模型性能，同时降低功耗和延迟。常见的AI显卡用途包括：深度学习模
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术 wit_@ cnn python 机器学习深度学习 scikit-learn
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术导语卷积神经网络（CNN）是现代深度学习领域中最重要的模型之一，特别在计算机视觉（CV）领域具有革命性的影响。无论是图像分类、目标检测，还是人脸识别、语音处理，CNN都发挥了举足轻重的作用。随着技术的不断发展，CNN已经成为了解决众多实际问题的核心工具。但对于许多人来说，CNN仍然是一个相对复杂的概念，尤其是初学者可能会被其背后的数学原
从零开始的 AI Infra 学习之路 SSS不知-道 MLSys 人工智能深度学习 pytorch
从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM五、AI编译&计算架构5.1CUDA5.2CANN六、AI硬件&体系结构6.1INVIDIAGPU6.2AscendNPU一、概述AIInfra（AI
【深度学习】Huber Loss详解小小小小祥深度学习人工智能算法职场和发展机器学习
文章目录1.HuberLoss原理详解2.Pytorch代码详解3.与MSELoss、MAELoss区别及各自优缺点3.1MSELoss均方误差损失3.2MAELoss平均绝对误差损失3.3HuberLoss4.总结4.1优化平滑4.2梯度较好4.3为什么说MSE是平滑的1.HuberLoss原理详解HuberLoss是一种结合了MSE（均方误差）与MAE（平均绝对误差）的损失函数，旨在克服两者的
【YOLOV8】YOLOV8模型训练train及参数详解小小小小祥 YOLO
介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。本指南旨在涵盖使用YOLOv8强大功能集训练自定义模型所需的所有细节，帮助你快速入门。为什么选择UltralyticsYOLO进行训练？高效性：无论是单GPU设置还是跨多个GPU扩展，都能充分利用你的硬件。多功能性：
【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小小小小小祥 YOLO 目标检测人工智能
问题描述：YOLOV8作为目前主流的深度学习网络，支持图像分类、目标检测、实例分割、姿态检测、旋转目标检测等功能。对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？YOLOV8官网：https://github.com/ultralytics/ultralyticsYOLOV8n/s/m/l/x信息
小猿口算自动PK脚本小黄编程快乐屋人工智能 python
大家好，我是小黄。近期，众多大学生炸鱼小猿口算APP,把一众小学生都快虐哭了，小黄听闻后，也跃跃欲试。对此小黄也参考网上的资料写了一个自动Pk的脚步。首先大家需要安装一个pytorch环境过程中，如果小伙伴对此不熟悉的话可以参考网上的相关教程。我们需要用到Tesseract-OCR文本识别。他的原理就是先截图，之后框选出比较大小的两个数字所在的区域，使用Tesseract-OCR识别出来后进行判断
ChatGPT4.0最新功能和使用技巧，助力日常生活、学习与工作！ WangYan2022 教程人工智能 chatgpt 数据分析 ai绘画 AI写作
熟练掌握ChatGPT4.0在数据分析、自动生成代码等方面的强大功能，系统学习人工智能（包括传统机器学习、深度学习等）的基础理论知识，以及具体的代码实现方法，同时掌握ChatGPT4.0在科研工作中的各种使用方法与技巧，以及人工智能领域经典机器学习算法（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）和热门深度学习方法（卷积神经网络、迁移学习、RNN与LSTM神经网络
深入解读ChatGPT的工作原理及底层逻辑 NAR_鱼丸 ChatGPT 程序人生
ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。通过预训练和微调，模型能够理解语言的语法和语义，并能够根据上下文生成符合语境的文本回复。基本原理ChatGPT是一种基于自然语言处理（NLP）和深度学习技术的聊天机器人。其基本原理是使用大量文本数据来训练深度神经网络模型
Pytorch详解-模型模块(RNN,CNN,FNN,LSTM,GRU,TCN,Transformer) qq742234984 rnn pytorch cnn
Pytorch详解-模型模块Module¶meterModule初认识forward函数ParameterPytorch中的权重、参数和超参数Module容器-ContainersSequentialModuleListModuleDictParameterList&ParameterDict常用网络层LSTM输入和输出GRUConvolutionalLayers卷积层的基本概念常见的卷积
厉害了，LSTM+Transformer王炸创新，精准度又高了！马拉AI LSTM transformer
【LSTM+Transformer】作为一种混合深度学习模型，近年来在学术界和工业界都受到了极大的关注。它巧妙地融合了长短期记忆网络（LSTM）在处理时序数据方面的专长和Transformer在捕捉长距离依赖关系上的优势，从而在文本生成、机器翻译、时间序列预测等多个领域取得了突破性的进展。这种创新的结合不仅提升了模型的预测精度，还优化了性能和训练效率，使其在序列分析任务中展现出卓越的能力。例如，最
算力平台环境搭建实操罗小黑的师傅目标检测深度学习人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、登录账号二、选择算力平台已有镜像或外部导入镜像创建开发环境三、配置环境1.修改算力平台密码2.配置代理（1）进入bashrc配置文件（2）在文本末尾添加（3）重新运行bashrc配置文件3.安装miniconda方法1：离线下载方法2：在线下载4.pip换源5.创建并激活虚拟环境6.安装pytorch7.额外包的安装，都可
构建高效GPU算力平台：挑战、策略与未来展望 Mr' 郑 gpu算力
引言随着深度学习、高性能计算和大数据分析等领域的快速发展，GPU（图形处理器）因其强大的并行计算能力和浮点运算速度而成为首选的计算平台。然而，随着模型规模的增长和技术的进步，构建高效稳定的GPU算力平台面临着新的挑战。本文旨在探讨这些挑战、应对策略以及对未来发展的展望。当前挑战算力分配与资源优化在多用户共享GPU集群的环境下，合理分配计算资源并确保每个任务能够高效运行是一项挑战。这不仅涉及到硬件资
详解深度学习中的Dropout nk妹妹深度学习深度学习人工智能
Dropout是一种在神经网络训练中常用的正则化技术，其操作是在每次训练迭代中随机“丢弃”一部分神经元（即将其输出置为零）。以下是对这一操作的详细解释：一、基本思想Dropout的基本思想是减少神经元之间的复杂共适应关系，迫使网络在训练过程中不依赖于特定的神经元子集。这有助于增加模型的泛化能力，防止过拟合。二、具体实现随机选择：在每次训练迭代中，以一定的概率p（通常设定为0.2到0.5之间）随机选
【机器学习实战中阶】音乐流派分类-自动化分类不同音乐风格精通代码大仙数据挖掘深度学习 python 机器学习分类自动化人工智能数据挖掘深度学习
音乐流派分类–自动化分类不同音乐风格在本教程中，我们将开发一个深度学习项目，用于自动化地从音频文件中分类不同的音乐流派。我们将使用音频文件的频率域和时间域低级特征来分类这些音频文件。对于这个项目，我们需要一个具有相似大小和相似频率范围的音频曲目数据集。GTZAN流派分类数据集是音乐流派分类项目中最推荐的数据集，并且它是为了这个任务而收集的。音乐流派分类器模型音乐流派分类关于数据集：GTZAN流派收
AI歌手会成为主流吗？网络安全我来了 IT技术人工智能
AI歌手会成为主流吗？在如今这个科技迅猛发展的时代，AI歌手渐渐走入我们的视野。或许你会想，AI真的能够唱歌，它的歌声能与真实歌手相媲美吗？让我们一起探索这个引人入胜的主题，看看AI歌手的发展现状、优缺点，以及它在音乐行业的未来前景。1.AI歌手的发展现状1.1技术背景我们处于一个机器学习和深度学习技术飞速发展的时代，AI歌手的诞生并非偶然。通过收集和分析大量的音乐数据，AI能够学习并模仿特定歌手
数据增强方法及其工具 cxr828 大数据
数据增强（DataAugmentation）是指在训练深度学习模型时，通过对现有数据进行一系列变换，从而生成新的样本。数据增强有助于增加数据的多样性，减少过拟合，提升模型的泛化能力，尤其是在数据量有限的情况下。数据增强可以应用于图像、文本、音频等多种类型的数据。以下是一些常见的、简单易行的图像数据增强方法及其具体实现步骤，这些方法也可以广泛应用于目标检测、图像分类、图像分割等任务。一、图像数据增强
基于深度学习CNN网络 mini-xception网络实现构建一个完整的人脸表情检测_识别分类系统，包括训练、评估、前端和服务端代码计算机c9硕士算法工程师卷积神经网络深度学习 cnn 分类
人脸表情检测该项目已训练好网络模型，配置好环境即可运行使用，效果见图像，实现图像识别、摄像头识别、摄像头识别/识别分类项目-说明文档-UI界面-cnn网络项目基本介绍：【网络】深度学习CNN网络mini-xception网络【环境】python>=3.5tensorflow2opencvpyqt5【文件】训练预测全部源代码、训练好的模型、fer2013数据集、程序算法讲解文档【类别】对7种表情检测
Python 潮流周刊#78：async/await 是糟糕的设计（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，1则音视频，全文2200字。以下是本期摘要：文章&教程①游乐场智慧：线程击败Async/Await②Python真的很慢吗？③DjangoAsync：准备好用于生
Python 潮流周刊#79：Python 的元数据困境（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2200字。以下是本期摘要：文章&教程①约束是好的：Python的元数据困境②TalkPython网站用Quart重写了③Python不仅是胶水
Python 潮流周刊#83：uv 的使用技巧（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2300字。以下是本期摘要：文章&教程①UV的使用技巧②用pyinfra和ChimeraLinux开发一个小型CDN③高效的Python开发者工
Python 潮流周刊#65：CSV 有点糟糕（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①CSV有点糟糕。DSV有点不错②用Scrapy和Playwright实现无限滚动页面的抓取③用Python作测试（第9
AI技术架构：从基础设施到应用 fuqinyijiu AI 人工智能架构
人工智能（AI）的发展，正以前所未有的速度重塑我们的世界。了解AI技术架构，不仅能帮助我们看懂AI的底层逻辑，还能掌握其对各行业变革的潜力与方向。一、基础设施层：AI技术的坚实地基基础设施层是AI技术架构的“地基”，为整个系统提供计算能力和存储保障。没有强大的基础设施，复杂的AI模型和应用无法落地。1.GPU（图形处理单元）：并行计算的核心GPU是深度学习的核心引擎，专为大规模并行计算设计。技术优
【深度学习】AMP（Automatic Mixed Precision，自动混合精度） shanks66 深度学习人工智能
@[toc]AMP（AutomaticMixedPrecision，自动混合精度）AMP在深度学习中，AMP（AutomaticMixedPrecision，自动混合精度）是一种通过混合使用单精度（FP32）和半精度（FP16）来加速训练并减少显存占用的技术。它能够在不显著损失模型精度的情况下，大幅提升训练速度和效率。1.什么是混合精度训练？混合精度训练是指在训练过程中同时使用两种不同的浮点数精度
智能化植物病害检测：使用深度学习与图像识别技术的应用机器懒得学习深度学习人工智能
植物病害一直是农业生产中亟待解决的问题，它不仅会影响作物的产量和质量，还可能威胁到生态环境的稳定。随着人工智能（AI）技术的快速发展，尤其是深度学习和图像识别技术的应用，智能化植物病害检测已经成为一种趋势，能够大幅提高病害检测的效率与准确性。本文将介绍如何使用深度学习和图像识别技术，通过Python编写的智能化病害检测程序，实现对植物叶片病害的自动识别与分类。1.项目背景与目标在农业领域，及时发现
深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型皮皮冰燃深度学习深度学习人工智能
文章目录1深度学习1.1神经网络和深度学习1.2神经网络的工作原理1.3神经网络的专业术语2LLM概述2.1大模型的"大"是指什么?2.2训练大模型有多烧钱？2.3如何入门大模型？2.4LLM的结构2.4.1Transformer2.4.2Prompts2.4.3FineTuning3本地跑大模型3.1Ollama运行开源LLM3.1.1启动并运行3.1.2使用api访问3.1.3设置外网访问3.
深度学习笔记——前向传播与反向传播、神经网络（前馈神经网络与反馈神经网络）、常见算法概要汇总好评笔记深度学习笔记深度学习笔记神经网络人工智能
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要介绍深度学习的前向传播与反向传播，以及前馈神经网络与反馈神经网络。文章目录前向传播与反向传播前向传播（ForwardPropagation）反向传播（BackPropagation）总结神经网络简介结构类型前馈神经网络（FeedforwardNeuralNetwork,FFNN）特点常见变体反馈神经网络（Feedb
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在