neronjust

《Deep learning for time series classification a review》笔记

《Deep learning for time series classification: a review》

1. 摘要

时间序列分类（TSC）是数据挖掘中一个重要且具有挑战性的问题。随着时间序列数据可用性的增加，已经提出了数百种TSC算法。在这些方法中，只有少数人考虑过深度神经网络（DNN）来执行这项任务。在本文中，我们简介TSC最新DNN架构，研究了TSC深度学习算法的当前最新性能。在此概述了在统一的TSN分类标准下，TSC中各个时间序列域中最成功的深度学习应用程序。

2. 时间序列分类

在介绍不同类型的神经网络架构之前，我们先介绍一下TSC的正式定义。

3. 基于深度学习的时间序列分类

In this review we focus on three main DNN architectures used for the TSC task: Multi Layer Perceptron (MLP), Convolutional Neural Network(CNN) and Echo State Network (ESN).

3.1 Multi Layer Perceptrons (多层感知器)

One impediment from adopting MLPs for time series data is that they do not exhibit any spatial invariance . In other words, each time stamp has its own weight and the temporal information is lost: meaning time series elements are treated independently from each other .

3.2 Convolutional Neural Networks (CNN)

在TSC问题中，卷积可以被视为在时间序列上应用和滑动滤波器。与图像不同的是，滤波器仅显示一个维度（时间）而不是两个维度（宽度和高度）the filters exhibit only one dimension (time) instead of two dimensions (width and height)。举个例子：如果我们将长度为3的滤波器与单变量时间序列进行卷积（相乘），则将滤波器值设置为等于[1/3,1/3,1/3]，卷积将导致应用具有长度为3的滑动窗口的移动平均值。一般形式：

下面这段话很重要：

其中C表示的是长度为T的单变量时间序列X和长度为l的滤波器ω上应用的卷积（点积）, 然后添加偏置b，最后输入到非线性激活函数例如整流线性单元（ReLU）中的结果。一个时间序列X上的卷积（一个滤波器）的结果可以被认为是经历滤波处理的另一个单变量时间序列C. 因此，在时间序列上应用多个滤波器将产生多变量时间序列，其维度等于所使用的滤波器的数量。在输入时间序列上应用多个过滤器的方法可以学习多个判别特征，这对分类任务有很大帮助。

上面是单变量时间序列，那么对于MTS（ M-dimensional ，多变量时间序列）呢？当考虑将MTS作为卷积层的输入时，滤波器不再具有一个维度（time），而且具有等于输入MTS的维度数量的维度。

在这里，pooling（max or average）的作用：采用输入时间序列并通过在其滑动窗口上聚合来减小其长度T. 值得注意的是，当池化的stride等于滑动窗口的size时，T的length会减小为T/size。

3.3 Echo State Networks(回声状态网络)

在这里，作者提到了Recurrent Neural Network（RNN），但他们发现：除了时间序列预测外，我们发现这些神经网络很少用于时间序列分类。原因主要有三个方面：

（1） the type of this architecture is designed mainly to predict an output for each element (time stamp) in the time series 被主要设计来预测每个时间stamp处的值

（2）RNNs typically suffer from the vanishing gradient problem due to training on long
time series 由于时间序列过长导致梯度消失问题

（3） RNNs are considered hard to train and parallelize which led the researchers to avoid using them for computational reasons 计算原因

基于以上原因或者说限制， Echo State Networks (ESNs) 出现了：a relatively recent type of recurrent architecture proposed for time series。ESNs 由 Jaeger和Haas 于2004年发明，最早用于 time series prediction in wireless communication channels。

具体网络结构参考链接： https://blog.csdn.net/minemine999/article/details/80861863

4.生成模型和判别模型

TSC的深度学习方法可以分为两大类：生成模型和判别模型。

4.1 生成模型

深度信念网络（DBNs）被用于以无监督的方式对潜在特征进行建模，然后利用这些特征对单变量和多变量时间序列进行分类：
http://downloads.hindawi.com/journals/mpe/2017/9549323.pdf
Ma等人（2016）使用自我预测建模进行时间序列分类，其中ESN首先用于重建时间序列，然后利用储层空间中的学习表示进行分类：
https://www.sciencedirect.com/science/article/pii/S0020025516306661
有关TSC的生成性ESN模型的更多细节，我们将感兴趣的读者引到最近的一项实证研究，该研究比较了多变量和单变量时间序列的储层和模型空间的分类：
https://link.springer.com/chapter/10.1007%2F978-3-319-46182-3_17

4.2 判别模型

已经提出了几种判别式深度学习架构来解决TSC任务，但是这种类型的模型可以进一步细分为两组：（1）具有手工设计特征的深度学习模型；（2）端到端的深度学习模型。

（1）手工工程方法中最常遇到的和计算机视觉启发的特征提取方法是，使用特定方法将时间序列转换为图像，如 Gramian fields 、 recurrence plots、 Markov transition fields等。

These features are first hand-engineered using some domain knowledge（需要领域知识）, then fed to a deep learning discriminative classifier. 举例来说，（Uemura等2018）从放置在外科医生手上的传感器数据中提取若干特征（例如速度），以便确定手术训练期间的技能水平。

（2）与特征工程相比，端到端的深度学习方法旨在在fine-tuning 分类器的过程中incorporate the feature learning process。在作者的研究过程中，发现CNN是TSC问题应用最广泛的架构，作者给出的解释是：这可能是由于它们的稳健性和与复杂架构（如RNN或MLP）相比相对较少的训练时间（ due to their robustness and the relatively small amount of training time）。下面这一段基本都是CNN的案例。

此外，还有一些CNN的混合结构：

如，CNN+GRU：https://ieeexplore.ieee.org/document/8169670

The proposed model contains a convolutional network component to extract high-level features and a recurrent network component to enhance the modeling of the temporal characteristics of TS data.

CNN+Attention：https://arxiv.org/pdf/1805.03908.pdf

The encoder is formed of a convolutional neural network whose temporal output is summarized by a convolutional attention mechanism

5 Approaches

本节详细描述了九种不同的深度学习架构及其相应的优点和缺点。

为什么选择判别式端到端方法来进行对比呢？

关于九种方法的选择：

没有选择尝试解决TSC问题的子任务的方法，例如在Geng和Luo（2018）中，其中CNN被修改以对不平衡的时间序列数据集进行分类。为了证明这一选择，我们强调不平衡的TSC问题可以通过数据增强和修改类权重等几种技术来解决。

另外，一个子任务是：early time series classification 可见：http://ceur-ws.org/Vol-1793/paper4.pdf

九种方法：

(多层感知器MLP、完全卷积神经网络FCN、残差网络ResNet、编码器Encoder、多尺度卷积神经网络MCNN、t-LeNet、多通道深度卷积神经网络MCDCNN、时间卷积神经网络Time-CNN、时不变回波状态网络TWIESN)

1. MLP

2. Fully Convolutional Neural Network

FCNs 的特点：

没有 local pooling layers 局部池化层，这意味着在整个卷积中时间序列的长度保持不变；
传统CNN中最后的FC层被一个 Global Average Pooling (GAP) layer 代替，这大大减少了神经网络中的参数数量。
所有conv 操作的stride=1、 zero padding

3. Residual Network

关于上述三种网络可见：
https://www.researchgate.net/publication/310611022_Time_Series_Classification_from_Scratch_with_Deep_Neural_Networks_A_Strong_Baseline

4 Encoder

5 Multi-scale Convolutional Neural Network

多尺度卷积神经网络

与传统的CNN网络结构相似
非常复杂，因为其 heavy data pre-processing step

Windows Slicing（WS）作为一种 data augmentation的方法：从输入时间序列中抽取subsequences，然后用这些子序列训练网络。在训练之前，子序列还要进行三步处理：（1） identity mapping；（2） down-sampling；（3）smoothing；现在子序列由 univariate 变为 multivariate

6 Time Le-Net

和MCNN一样，也 extracting subsequences to augment the training data。

6 实验数据集

6.1 Univariate archive

http://www.timeseriesclassification.com/index.php

6.2 Multivariate archive

7 实验

97个数据集（85Univariate +12Multivariate ）

9种deep learning models （每种model跑10次然后取平均accuracy，为了reduce the bias due to the weights’ initial values）

a cluster of 60 GPUs， sequential running（单GPU运行）是将近100天，60GPUs集群使得时间降到了一个月以内。

使用 Keras with the Tensorflow back-end

使用 mean accuracy measure averaged over the 10 runs on the test set

8 结果

8.1 Results for univariate time series

1. ResNet网络的优越性（the most accurate DNN of our study）：

The ResNet significantly outperforms the other approaches with an average rank of almost 2. ResNet wins on 50 problems out of 85 and significantly outperforms the FCN architecture.

作者给出的解释：

deeper neural networks are much more successful than shallower architectures ( 何凯明大神., 2016 ) 从2012到2016年，4年时间，神经网络从7层（AlexNet 2012）到了1000层（ ResNet 2016），这种深度网络一般需要大量的数据来进行训练以达到很好的泛化效果。 尽管与数十亿标记图像（如ImageNet 和 OpenImages）相比，实验中使用的数据集相对较小，但最深的网络在UCR/UEA上仍然能达到很高的准确度。

deep CNNs在TSC task上的high accuracies：

2. MCNN 和 t-LeNet==（平均最差表现）==

共同点：都采用了提取子序列以增加训练数据的方法，因此，模型从较短的子序列而不是整个序列中学习。这两种方法的平均最差表现表明，这种切片时间序列的特殊方法并不能保证时间序列中的判别信息不会丢失。（这种方法可能也是违反直觉的）。最近一些TSC算法的研究也表明，这种基于窗口切片（WS）的方法产生了最低的平均等级。

3. MCDCNN 和 Time-CNN（ low performance）

首先，MCDCNN 和 Time-CNN 最早被提出来是用于MTS数据分类，但作者也在univariate UCR/UEA archive 上做了评估。GAP pooling的重要性：

4. Encoder （ relatively high accuracy）

FCN vs Encoder ：superiority of the GAP layer compared to Encoder’s attention mechanism. 相比于Encoder的 attention，FCN的GAP更优越。

实验结果表明：ResNet（1st）和FCN（2nd）具有最好的效果。（GAP层的原因？）

Our empirical study strongly suggests to use ==ResNet ==instead of any other deep learning algorithm - it is the most accurate one with similar runtime to FCN(the second most accurate DNN）

8.1 Results for multivariate time series

尽管Time-CNN和MCDCNN是最初为MTS数据提出的架构，但它们的表现不如那三个深度CNN（ResNet，FCN和Encoder）。

注意，图9中描绘了相应的临界差异图，其中统计测试未能发现九个分类器之间的任何显着差异，这主要是由于与univariate time series classification archive相比， multivariate time series classification 数据集数量较少。与Fig7相比，MTS数据集添加到评估时，各个方法之间的差异没那么显著了（被稀释）。

8.2 dataset’s characteristics 与方法之间的联系

Dataset’s theme（数据集主题或者类型）

time series length（时间序列长度）

training size of datasets （训练数据大小）

Again, ResNet and FCN still dominate with not much of a difference。

值得注意的一点是，在DiatomSizeReduction数据集（只有16 training instances）上，ResNet and FCN achieved the worst accuracy (30%) on this dataset while Time-CNN reached the best accuracy (95%)，这说明 ResNet 和 FCN 非常容易在这个数据集上过拟合。

所以，训练一个DNN的时候，一个很大的数据集是非常有必要的，下图展示了 ResNet’s accuracy for the TwoPatterns dataset：

the number of classes in a dataset（数据集中类的数量）

大多DNN：categorical cross-entropy（分类交叉熵）作为代价函数和softmax

总结：

总的来说，平均而言，ResNet是最佳架构，FCN和Encoder分别为第二和第三。 ResNet表现得非常好，除了心电图数据集，其表现都优于FCN。 MCNN和t LeNet，其中时间序列被裁剪成子序列，是平均最差的。我们发现用FC层（MCDCNN，CNN）取代GAP层的方法之间的小差异，这也表现出与TWIESN和MLP类似的性能。

8.3 Effect of random initializations ( 随机初始化的影响 )

这里介绍随机初始化参数对ResNet和FCN的影响：

上图显示了使用三种不同函数（最小值，中值和最大值）处理10个随机初始化时的情况。

从图中可以看出：

首先，ResNet在大多数数据集中都具有比FCN更好的性能，这和之前的结论一致；
FCN的性能更加的不稳定，权重的初始值可以很容易地降低FCN的准确性，而ResNet在初始权重值较差时保持相对较高的准确度。
研究不同的权重初始化技术，例如利用预先训练的神经网络的权重，可以产生更好和更稳定的结果，如使用迁移学习：https://arxiv.org/abs/1811.01533 first training a base network on a source dataset, and then transferring the learned features (the network’s weights) to a second network to be trained on a target dataset.

9 可视化

Class Activation Mapping（CAM）：类激活映射出自论文《 Learning deep features for discriminative localization》

而在《Time series classification from scratch with deep neural networks:
A strong baseline》中提出了一种应用于TSC的一维CAM，关于这篇文章作者的评价是：

需注意的是：employing the CAM is only possible for the approaches with a GAP layer preceding the softmax classifier，这也是为什么作者只选了ResNet和FCN进行可视化。

关于CAM和GAP替代FC层： https://blog.csdn.net/weixin_40955254/article/details/81191896

什么是类激活映射呢？CAM是一个帮助我们可视化CNN的工具。

9.1 GunPoint dataset

该数据集涉及一个男性和一个女性演员执行两个动作（Gun-Draw和Point），这使其成为二元分类问题。对于Gun-Draw（下图中的Class-1），演员首先将他们的手放在他们的两侧，然后从髋部安装的枪套中取出一把枪，将其指向目标一秒钟，然后最后将枪放入皮套同时把他们的手放回原先位置。与Gun-Draw类似，对于Point（下图中的Class-2），演员遵循相同的步骤，但不是指枪，而是指食指。对于每个任务，跟踪了X和Y轴上的演员右手的质心并且看起来非常相关，因此数据集仅包含一个单变量时间序列：X轴。

9.2 Meat dataset

Meat是食品光谱仪数据集，通常用于化学计量学中以对食品类型进行分类。该数据集中有三个类别：鸡肉，猪肉和火鸡，分别对应于下图中的1,2和3类。这些数据是通过使用具有衰减全反射（ATR）采样的傅立叶变换红外（FTIR）光谱从60个独立样本中取得的。与GunPoint类似，此数据集易于可视化，并且不包含非常嘈杂的时间序列。此外，三个类便于理解和分析。与GunPoint数据集不同的是，两种方法ResNet和FCN在Meat上的结果达到了显着不同的结果，准确度分别为97％和83％。
下图中左边是 FCN’s CAM ，右边是 ResNet’s CAM ：

作者解释了为什么ResNet比FCN的精度高：

这里非常值得注意的一点是：

很明显，（c）和（e）图中右下角的红色部分是a non-discriminative part，因为在时间序列上，二者都检测到是一个bump。而在（d）和（f）中，这部分被过滤掉了。

10. 结论

End-to-end deep learning can achieve the current state-of-the-art performance for TSC with architectures such as Fully Convolutional Neural Networks and deep Residual Networks。
CAM可视化的使用可以展示输入时间序列中哪些部分对确定分类的贡献程度最大。
对于TSC的深度学习，仍然缺乏对 Data augmentation （数据增强）和 transfer learning（迁移学习）的全面研究。数据增强可见：
https://blog.csdn.net/lanmengyiyu/article/details/79658545 （主要是图像方面）
TSC领域一个重要挑战是，需要构建一个类似于计算机视觉中的大型数据集，如ImageNet。

008 【入门】算法和数据结构简介要天天开心啊算法专栏算法数据结构
算法与数据结构系统概览|[算法]-[基础]-[通用]一、算法分类与应用1.硬计算类算法|[算法]-[中级]-[通用]特点应用场景复杂度特征-精确求解问题-可能带来较高计算复杂度-大厂笔试/面试-ACM竞赛-所有程序员岗位必考⏱️通常为O(n)~O(n²)//[示例]快速排序算法-分治思想核心实现publicvoidquickSort(int[]arr,intleft,intright){if(le
【Pandas】pandas DataFrame resample liuweidong0802 DataFrame pandas
Pandas2.2DataFrameTimeSeries-related方法描述DataFrame.asfreq(freq[,method,how,…])用于**将时间序列数据转换为指定频率（resampletofrequency）**的方法DataFrame.asof(where[,subset])用于查找时间序列中最接近指定时间点的非NaN值的方法DataFrame.shift([period
【Pandas】pandas Series tz_convert liuweidong0802 Pandas Series pandas
Pandas2.2SeriesTimeSeries-related方法描述Series.asfreq(freq[,method,how,…])用于将时间序列数据转换为指定的频率Series.asof(where[,subset])用于返回时间序列中指定索引位置的最近一个非缺失值Series.shift([periods,freq,axis,…])用于将时间序列数据沿指定轴移动指定的周期数Serie
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
基于灰色马尔科夫模型预测人口数量，是一种结合灰色系统理论（处理少数据、不确定性）与马尔科夫链（描述随机波动）的融合预测方法
利用灰色模型捕捉人口变化的总体趋势，再通过马尔科夫链修正因随机因素导致的预测偏差，从而提高预测精度。一、模型理论基础灰色系统理论原理（核心：处理少数据、部分信息未知的系统）差异信息原理：系统内外的差异是信息源，人口数据的时间序列差异蕴含变化规律。解的非唯一性原理：信息不完全时，预测结果存在多个可能区间（与马尔科夫状态划分契合）。最小信息原理：仅需少量历史数据（通常≥4个）即可建模，适合人口统计资料
linux日志文件详解 MagnumOvO 云计算 linux 5G linux 运维 centos
目录一、日志文件的分类二、日志文件位置三、常见日志文件1.分析日志文件2.内核及系统日志四、日志消息等级五、日志文件分析1.用户日志2.程序日志六、日志分析注意事项一、日志文件的分类日志文件是用于记录Linux系统中各种运行消息的文件,相当于Linux主机的“日记”。不同的日志文件记载了不同类型的信息,如Linux内核消息、用户登录事件、程序错误等·日志文件对于诊断和解决系统中的问题很有帮助,因为
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
10招提升SQL性能的实战技巧快乐才是自己的 sql mysql sql mysql oracle database hadoop 大数据
SQL语句常见性能优化方案在数据库应用中，SQL性能优化是核心技术要点。以下是经过验证的优化策略，按关键维度分类：一、索引优化精准索引覆盖对高频查询的WHERE、JOIN、ORDERBY字段建立索引复合索引遵循最左前缀原则：索引(a,b,c)仅支持WHEREa=?或WHEREa=?ANDb=?示例：将SELECT*FROMordersWHEREstatus='shipped'改为CREATEIND
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
Linux 命令：ls
Linuxls命令详细教程一、ls命令概述ls是Linux系统中最常用的命令之一，全称“list”，用于列出目录下的文件和子目录。它不仅能显示文件基本信息，还能通过丰富的选项控制显示格式、排序方式、隐藏文件等，是文件管理的基础工具。资料已经分类整理好：https://pan.quark.cn/s/26d73f7dd8a7二、ls命令基本语法ls[选项][文件或目录]核心选项分类说明（常用选项需熟练
基于Python Anaconda环境，使用CNN-LSTM模型预测碳交易价格的完整技术方案神经网络15044 仿真模型算法机器学习 python cnn lstm
以下是一个基于PythonAnaconda环境，使用CNN-LSTM模型预测碳交易价格的完整技术方案。内容涵盖数据预处理、模型构建、训练优化、预测可视化和结果分析等核心环节，代码与文字说明共计超过6000字。基于CNN-LSTM的碳交易价格预测系统设计与实现一、项目背景与目标1.1碳交易市场概述碳交易作为应对气候变化的重要市场机制，其价格波动直接影响企业减排决策。准确预测碳价（CarbonEmis
MySQL索引分类有哪些？ java1234_小锋 mysql mysql
大家好，我是锋哥。今天分享关于【MySQL索引分类有哪些？】面试题。希望对大家有帮助；MySQL索引分类有哪些？超硬核AI学习资料，现在永久免费了！MySQL中的索引可以根据不同的分类标准分为以下几种类型：1.根据存储方式分类聚集索引（ClusteredIndex）：表中的数据行会按照索引顺序存储，即数据的物理顺序和索引顺序一致。每个表最多只能有一个聚集索引。在InnoDB存储引擎中，主键就是聚集
DAOS的组网（二层无损网络搭建） Flying Fish（HHH） DAOS相关的内容 DAOS的组网分布式
基于盛科E交换机搭建rdma网络配置（不同的交换机的配置操作不一样）一、交换机端配置：1、PFC配置（基于优先级的流量控制机制）配置qos类型的class-mappfc，进行流量分类，匹配dscpcs3#configureterminalEnterconfigurationcommands,oneperline.EndwithCNTL/Z.(config)#class-maptypeqospfc(
数据库技术演进史：从穿孔卡片到云原生小李独爱秋计算机那些事儿~数据库云原生 mysql
一、数据库的定义与核心地位数据库（Database）是“长期存储在计算机内、有组织的、可共享的统一管理数据集合”，与芯片、操作系统并称IT系统三大核心。其核心价值在于：结构化存储：通过数据模型组织信息，解决文件系统冗余问题；高效访问：支持并发查询与事务处理；安全共享：权限控制保障数据安全。分类维度全景图：分类维度类型代表产品数据模型关系型(SQL)MySQL,Oracle,PostgreSQL非关
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
顺序内聚是指模块内的处理元素密切相关，并且必须按照特定的顺序执行，前一个处理元素的输出是下一个处理元素的输入 Bol5261 JVM(Java Virtual Machine)JMM(Java Memory Model)JMS(Java Message Service)服务器
该模块的内聚类型为顺序内聚。顺序内聚是指模块内的处理元素密切相关，并且必须按照特定的顺序执行，前一个处理元素的输出是下一个处理元素的输入。这种内聚类型比功能内聚稍弱，但仍然具有较高的内聚性。根据模块内聚的分类标准，当模块中各个处理元素密切相关于同一功能，且必须顺序执行，前一处理元素的输出直接作为下一处理元素的输入时，这种内聚类型属于顺序内聚（SequentialCohesion）。模块内聚类型对比
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
大模型量化需要重新演唱大模型量化
大模型量化是一种优化技术，旨在减少深度学习模型的内存占用和提高推理速度，同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。以下是关于大模型量化的详细知识：目录1.量化基础1.1量化定义1.2量化优势1.3量化挑战2.量化方法2.1量化类型2.2量化粒度2.3量化算法3.量化实践3.1量化流程3.2量化工具4.量化案例4.1BERT量化4.2GPT-
macOS26 Tahoe召唤启动台教程華仔96 经验分享 macOS26 T Tahoe 启动台
苹果macOS26测试版已发布！代号为Tahoe经过update测试发现苹果将原来的启动台集成在聚焦搜索了，翻找软件并不能像以往点击启动台即可看到，现在变为聚焦搜索，且按下command+1也只是像iPhone上的资源库并不能自定义按需收纳软件分类。解决方案如上：1.先打开访达Finder，点击左侧的应用程序Application，在里面新建文件夹自定义归纳好软件。2.将访达Finder下的应用程
MySQL之锁机制详解:全局锁,表级锁,行级锁 AA-代码批发V哥 MySQL mysql 数据库
MySQL之锁机制详解:全局锁,表级锁,行级锁一、锁机制基础：从并发问题到锁分类1.1并发访问的三大问题1.2锁的核心作用1.3锁粒度分类二、全局锁：掌控整个数据库的"超级锁"2.1全局锁原理2.2全局锁语法与使用2.2.1显式加锁2.2.2隐式加锁（备份场景）2.3全局锁的双刃剑三、表级锁：粗粒度的高效控制3.1表级锁核心特性锁兼容性矩阵：3.2MyISAM表级锁实战3.2.1加锁示例3.2.2
从0开始学习计算机视觉--Day04--线性分类 Chef_Chen 学习计算机视觉分类
从宏观来看，卷积网络可以看做是由一个个不同的神经网络组件组合而成，就像积木一样通过不同类型的组件搭建形成，其中线性分类器是一个很重要的组件，在很多卷积网络中都有用到，所以了解清楚它的工作原理对我们后续的学习会有很大的帮助。线性分类器是参数模型中最简单，最基础的例子，下面我们用输入图片输出图片分类的模型的例子来更进一步地了解它。首先，我们输入一张图片到模型中，输入后我们就会得到f(x,W)，x指的是
pytorch 要点之雅可比向量积 AI大模型教程 pytorch 人工智能 python facebook 深度学习机器学习 webpack
自动微分是PyTorch深度学习框架的核心。既然是核心，就需要敲黑板、划重点学习。同时，带来另外一个重要的数学概念：雅可比向量积。PyTorch中的自动微分与雅可比向量积自动微分（AutomaticDifferentiation，AD）是深度学习框架中的关键技术之一，它使得模型训练变得更加简单和高效。且已知：PyTorch是一个广泛使用的深度学习框架，它内置了强大的自动微分功能。在本文中，我们将深
昇腾AI生态组件全解析：与英伟达生态的深度对比
随着人工智能技术的快速发展，国产AI芯片的崛起正在改变全球计算产业的格局。华为昇腾（Ascend）系列AI处理器凭借自主创新的达芬奇架构，构建了完整的软硬件生态体系。本文将从核心组件对比、显卡性能对标两个维度，深入剖析昇腾与英伟达（NVIDIA）生态的技术差异与适用场景。一、昇腾核心组件与英伟达对标分析1.推理引擎：MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
基于YOLOv8的桃子成熟度检测系统，支持图片、视频、摄像头输入，PyQt5界面检测。识别并分类桃子的成熟度（未熟、半熟、成熟） QQ67658008 YOLO 音视频 qt 桃子成熟水果成熟度检测系统
基于YOLOv8的桃子成熟度检测系统，支持图片、视频、摄像头输入，PyQt5界面检测。识别并分类桃子的成熟度（未熟、半熟、成熟）文章目录调用示例加载预训练模型开始训练加载训练好的模型在验证集上评估加载训练好的模型文字及代码仅供参考。桃子成熟度分类检测数据集，主要用于桃子成熟度分类检测应用任务数据背景：模拟实际田间条件，涵盖多种可能影响桃子检测准确性的因素，如变化的自然光照强度、多果粘连现象以及由枝
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end