何拙手

基于时域表示的序列数据分类方法（一）——基于距离度量的序列数据分类方法

基于传统机器学习的序列数据分类算法主要分为两个步骤，

第一步是特征提取
第二步是利用分类器在特征空间中划分决策边界，判别序列数据的类别

文章目录

基于时域表示的序列数据分类方法（一）——基于距离度量的序列数据分类方法
前言
KNN分类器
一、欧氏距离
二、DTW度量
三、加窗DTW度量-WCDTW
四、加权DTW-WDTW度量
五、LB距离法
六、DBA度量
七、DTW度量特征+现代分类器
- 1、GDTW-P-SVMs
- 2、LBF-SVMs
- 3、PS-AdaBoost
八、集成多种弹性距离度量的分类方法
- 1、EE
- 2、Proximity Forest
九、编辑距离度量(edit distance, ED)
- 1、LCSS 度量
- 2、EDR 度量
- 3、ERP 度量
- 4、MSM度量
- 5、其他弹性匹配度量方法

前言

基本思想是通过构建距离度量，衡量待分类序列数据与已知类别序列数据在时域表示空间上的距离。此方法的核心是如何构建一个合适的距离度量。根据不同的匹配方式，还可以分为 锁步度量 和弹性匹配度量。

锁步度量中最常使用的是欧氏距离。
弹性匹配度量则常用动态时间规整（DTW–Dynamic Time Warping）和编辑距离。

KNN分类器

邻近算法，或者说K最邻近（KNN，K-NearestNeighbor）分类算法是数据挖掘分类技术中最简单的方法之一，也是最简单的机器学习算法之一。

KNN算法比较适用于样本容量比较大的类域的自动分类，而那些样本容量较小的类域采用这种算法比较容易产生误分。（大样本分类）

总体来说，KNN分类算法包括以下4个步骤：

①准备数据，对数据进行预处理。
②计算测试样本点（也就是待分类点）到其他每个样本点的距离。
③对每个距离进行排序，然后选择出距离最小的K个点
④对K个点所属的类别进行比较，根据少数服从多数的原则，将测试样本点归入在K个点中占比最高的那一类

一、欧氏距离

“锁步”度量的代表
锁步”的距离度量：两条序列需要在时刻点上一一对应。对序列数据在时间维度上的扭曲、平移和幅度上的噪声、缩放非常敏感（效果差 or 压根处理不了）

对于n维的序列数据，计算其中两点X=（x1,x2,x3,）、Y=(y1,y2,y3,)的欧氏距离为

欧式距离计算复杂度低、时效好。

但是序列数据在实际应用中截断和采样率的差异无法保证具有相同长度。

因此对于长短不同的待测序列与模板序列、或者序列对应点在时刻上存在偏移时，无法有效计算欧氏距离。

二、DTW度量

弹性距离度量方法
该类方法在计算距离时不再要求两序列在时刻点上一一对应，适应序列数据在形状上的扭曲和缩放，克服了基于
锁步距离度量的分类方法的缺陷。

DTW 度量利用动态规划优化目标函数，考虑了序列数据 X 和 Y 在不同时刻 i 和 j 的距离，可以实现一对多的匹配，能处理序列数据之间的时刻偏移现象。

算法负责度大，需要依靠动态规划方法求解目标函数。且对序列的匹配路径没有额外约束，可能出现病态匹配——时间轴上相距很远的两个点也可能被匹配。

为抑制这种病态的、没有时间间隔约束的匹配情况，在DTW基础上进行改进，可以划分为基于加窗DTW度量和加权DTW度量。

除此以外，DTW度量的计算复杂度较高，每一次DTW的计算是 O(N^2 ) 的复杂度，而在搜索时间序列的时候需要进行M（M是被搜索的时间序列的长度）次的搜索，因此总的复杂度是 O(M*N^2) ，当时间序列很长的时候（M值很大）。

这个等待时间是非常可怕的。算法应用因此受到限制，为降低DTW度量的计算复杂度，提出了一些改进方法，包括：加窗法、下界距离法（Lower Bounding， LB）和DTW质心平均法（DTW Barycenter Averaging，DBA）。

三、加窗DTW度量-WCDTW

弹性距离度量方法

加窗DTW (window constrained DTW, WCDTW)
在原始DTW基础上引入约束窗的方式，减少匹配点对的搜索范围，可分为线性约束窗口和非线性约束窗口。

约束窗的存在让序列匹配点只能在窗的范围内进行。

约束窗的宽度越小，WCDTW 度量中匹配点对在时间轴上所允许的间隔就越小。

WCDTW依靠上述原理规避病态匹配，同时加窗截断了匹配计算路径，也就减少了距离计算量。

四、加权DTW-WDTW度量

弹性距离度量方法

加权 DTW(weighted DTW， WDTW)
WCDTW 加窗DTW度量只考虑了窗内匹配，直接舍弃了约束窗外点对的距离计算。WDTW认为WCDTW这种截断匹配路径的做法拒绝了个例情况。从而提出了更平滑的匹配路径约束思路。

WDTW度量保留了所有点对间的距离计算，并根据点对距离赋予加权值：

时间距离较远的匹配点对设置大权值最终距离值更大更易被淘汰
时间距离较近的匹配点对设置小权值最终距离值更小更易被选中

权值公式如下：

a是时间距离， wmax通常设为1， m为序列总长度， g控制扭曲的惩罚等级。

WDTW 度量可以被看作是一种软阈值的 DTW 度量。并没有减少匹配计算量。

五、LB距离法

LB_keogh包括两部分。

第一部分为Q的{U， L} 包络曲线（具体如图），给Q序列的每个时间步定义上下界。

U和L直观的理解是在原始序列的周围包装另一个“封套”。

第二部分：计算Q和C之间的LB_keogh实际上等效于下图的阴影部分的面积：

此过程即在计算待匹配序列与模板序列上下边界的距离，得到 LB-Keogh下界距离。

DTW(X，Y)>=LB-Keogh下界距离。

我们开始对序列Q进行匹配，先计算好一次DTW距离，存在一个叫“best-so-far”的变量里，表示目前为止最好（最小）的DTW距离，在后面的计算中，我们使用一种叫Lower Bounding（LB）的计算，并且这种计算一定满足Lower Bounding距离 < DTW距离，而且这种Lower

Bounding的复杂度是远低于DTW距离的（通常复杂度是）。这样如果在当前的匹配计算中发现Lower
Bounding已经大于当前的"best-so-far"距离，就可以立即排除，当前的计算不可能是最优的匹配。

LB-Keogh 距离的分类方法可以将原始 DTW 度量的计算复杂度由 O(n^2) 降低至O(n)，而不明显损失分类精度

六、DBA度量

DBA 将 K 均值聚类算法中的欧氏距离替换为 DTW 距离，从而增强算法对形
状动态扭曲的适应能力，并使用著名的动态质心平均技术[23] 寻找每个类的质心。
在测试时，待匹配序列只需与这些“原型序列”进行比对，从而大大降低算法的
计算复杂度。

该方法应用著名的动态质心平均技术寻找每个类的质心，这一技术将 K-means 聚
类算法中的欧氏距离替换为 DTW 距离，从而增强算法对形状动态扭曲的适应能力，此外， DBA也在类内求取多个质心以适应类内差异。

待更】

七、DTW度量特征+现代分类器

DTW 度量与最简单的 KNN 分类器的组合一直很难被击败。随着对 DTW 度量的改进逐渐遇到瓶颈，一个自然的思路是，利用 DTW 度量提取特征，并使用更先进的分类器替换 KNN 分类器

典型的改进工作包括：

基于高斯动态扭曲核 SVMs 的分类方法 (potential support vector machines with Gaussian dynamic time warping kernel, GDTW-P-SVMs)[28]、
基于 DTW下界距离特征的分类方法(DTW’s fast lower bound function feature classificationusing enhanced SVMs, LBFSVMs)
基于 AdaBoost 分类器的分类方法(prototypeselection with AdaBoost, PSAdaBoost)

1、GDTW-P-SVMs

使用SVM分类模型代替KNN（1nn）分类

GDTW-P-SVMs 最早尝试将 DTW 特征与更先进的分类器相结合；

该方法使用 DTW 度量替代高斯核 SVMs 核函数中的欧氏距离度量，然后训练多个二分类 SVM 分类器将多分类问题转化为多个二分类问题，最后通过投票融合各 SVM分类器的预测结果；

GDTW-P-SVMs 虽然保留了DTW 度量适应形状扭曲的优势和 SVMs 的出色分类性能，但该方法受限于 DTW 的计算复杂度而展现出高时间成本。

支持向量机（support vector machines, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；

SVM还包括核技巧，这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题。SVM的的学习算法就是求解凸二次规划的最优化算法。

参考：svm分类器_SVM算法

通俗来讲，SVM是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，即支持向量机的学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。

2、LBF-SVMs

在GDTW-P-SVMs基础上，使用LB下界算法改进DWT距离算法，降低计算复杂度

方法采用前文提到的 LB_Keogh 快速下界距离替代 GDTW-P-SVMs 使用的 DTW 距离构建分类特征；这种做法虽然导致分类准确率略有下降，但却极大地加速了训练和测试过程。

3、PS-AdaBoost

使用Adaboost 分类器代替KNN分类

PS-AdaBoost 引入了 Adaboost 分类器进行分类；

该方法在 DTW 特征的每一维均建立带权值的弱分类器，并通过训练优化每个分类器的权值，从而实现对分类器和各特征维度的筛选；

通过去除信息冗余， PS-AdaBoost 的分类效果和计算速度得到了提升。

Adaboost是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器（强分类器）。

算法原理：

（1）初始化训练数据（每个样本）的权值分布：如果有N个样本，则每一个训练的样本点最开始时都被赋予相同的权重：1/N。

（2）训练弱分类器。具体训练过程中，如果某个样本已经被准确地分类，那么在构造下一个训练集中，它的权重就被降低；相反，如果某个样本点没有被准确地分类，那么它的权重就得到提高。同时，得到弱分类器对应的话语权。然后，更新权值后的样本集被用于训练下一个分类器，整个训练过程如此迭代地进行下去。

（3）将各个训练得到的弱分类器组合成强分类器。各个弱分类器的训练过程结束后，分类误差率小的弱分类器的话语权较大，其在最终的分类函数中起着较大的决定作用，而分类误差率大的弱分类器的话语权较小，其在最终的分类函数中起着较小的决定作用。换言之，误差率低的弱分类器在最终分类器中占的比例较大，反之较小。

参考：adaboost分类器

八、集成多种弹性距离度量的分类方法

目前，TSC 领域涌现出了数目众多的弹性距离度量方法，但没有任何一种方法在分类精度和通用性两方面同时展现出明显优势。

因此，一些工作考虑集成多种弹性距离度量从而提升分类性能和泛化能力。

典型工作包括：

基于多种弹性距离度量集成的分类方法(ensembles ofelastic distance measures, EE)
以及基于接近森林的分类方法 Proximity Forest。

1、EE

EE 借助 1NN 分类器对包括 LCSS、 MSM、DTW 和 WDTW 等在内的 11 种常用的弹性距离度量开展了广泛的实验对比

EE发现这些距离度量在分类精度上并没有显著差异，且各自适用于不同的分类问题，因此,EE对这11 种方法进行决策层的加权融合；

虽然 EE 利用了诸多距离度量的互补性，但也带来了极大的计算量。

2、Proximity Forest

首先在分类树的每个节点构建 R 种分支策略，每种分支策略包含从 EE中随机选取的一种弹性距离度量以及从各类别中随机选取的序列数据原型，然后寻找每个节点
对应的最佳分支策略从而递归地生成分类树以及分类森林；

Proximity Forest 明显提升了 EE 的分类性能，加快了 EE 的运算速度，是目前性能最好的序列数据分类方法之一。

九、编辑距离度量(edit distance, ED)

编辑距离与 DTW 度量一样，也是为了处理不等长序列数据和时刻偏移而提
出的。

该类方法将字符串弹性匹配的思想引入序列数据分类，通过定义类似字符串匹配的操作进行相似性度量。主要的度量方法包括：

最长公共子序列距离度量 (Longest Common Subsequence, LCSS)
基于实序列的编辑距离度量 (EditDistance on Real Sequences， EDR)
基于实惩罚的编辑距离度量 (Edit Distance with RealPenalty, ERP)
基于移动-分割-融合的编辑距离度量(MoveSplit-Merge, MSM)

这些方法具有很强的渐进关系

与 DTW 度量最大的不同之处在于，编辑距离允许存在未匹配点，这在一定程度上抑制了噪声的影响。

1、LCSS 度量

在序列分类问题中，该方法通过设置距离阈值 θ 判断待考察序列中的点是否与模
板序列中的点相匹配，被判定匹配的点无需在位置上一一对应，从而 “弹性”地搜索两条序列中最长的公共子序列用于衡量两序列的相似度；

LCSS 度量量化了待考察序列与模板序列的共性，但未将两者之间的差异计入度量

2、EDR 度量

EDR度量改进了LCSS未将考察序列和模板序列之间的差异计入度量这一缺陷。

该方法参考了字符串匹配中编辑距离的思想，在设定匹配条件后，通过统计待考察序列通过替换、插入和删除三种操作完全匹配于模板序列所需的最少操作次数，从而得到序列间的距离；

EDR 度量同时考虑了两序列之间的共性和差异，但受到编辑距离的限制，无法量化点与点之间的距离，因此比较粗糙。

3、ERP 度量

对 EDR 度量进行了改进；

该方法不再统计转化操作次数，而是直接计算点对之间的欧氏距离，

当点对不匹配时，在待匹配点对应位置插入零值以示惩罚，最终累加转换后的两序列所有对应点之间的距离得到序列间的距离；

ERP 度量满足三角不等式，利用三角不等式可以大幅减少 ERP 度量的计算复杂度。

ERP 度量更加细致地量化了序列之间的距离，但零值惩罚的做法引入了较大的偏差。

4、MSM度量

MSM 是目前最先进的编辑距离度量；

该方法针对点对不匹配的情况进一步细化了惩罚方式，在待匹配点及其一近邻点中选取与模板点更近的点插入相应位置，然后计算转换后的两序列之间的距离；

在 MSM 度量中，每种操作的代价不仅与当前目标点有关，还与目标点的相邻点有关。
MSM 度量的优点是对于时间弯曲敏感，对平移操作具有不变性；缺点在于计算复杂度较高，与 DTW 度量相当。

事实上，这种做法与DTW 度量已经非常接近。

5、其他弹性匹配度量方法

除了上述几种弹性匹配度量外，目前已提出的弹性匹配度量还包括：

复杂度不变性距离（Complex Invariant Distance， CID）
导数 DTW（Derivative DTW，DD_DTW）
导数变换距离（Derivative Transform Distance， DTD_C）

CID在现有幅度不变性、偏置不变性、局部尺度不变性、全局尺度不变性、相位不变性和遮挡不变性的基础上，引入了复杂度不变性的概念。通过一阶差分提取序列数据的复杂度信息，将复杂度信息引入欧式距离度量，得到复杂度加权的欧式距离度量。

DD_DTW 通过一阶差分运算引入形状特征的比较，构造加权 DTW 度量对原始序列数据对和差分序列数据对之间的距离进行加权平均。

DTD_C 在形状特征比较的基础上更进一步，通过正弦变换、余弦变换和希尔伯特变换提取序列数据的高阶特征，构建了基于序列数据本身、序列数据的形状特征和高阶特征的加权 DTW 度量。

在职四战考研102day MM加油女孩
已完成今日想做之事：政治内容理解；英语研词学习；专业课划重点并进行绘制思维导图；听书《我不要稳定的活着》反思：通过近几天的学习，感觉自己的进度还是很慢的，尤其是英语跟专业课这一块，它们是必不可少而且最耗时的科目，通过自己的思考，我再次对自己的计划作出调整：第一，晚上进行第二天内容的听课，截屏下来，尤其是政治、研词、真题讲解都利用晚上时间来听完，还有就是划专业课的笔记；第二，次日，上午进行一个英语真
如何使用橙武低代码平台进行数据收集与分析：运营人员的月度报告生成实例橙武科技 AI deepseek 低代码低代码人工智能 ai
一、背景与目标假设我们有一个运营人员，他的任务是每月收集和整理分公司的月度订单数据，包括：订单量：每个分公司在该月的订单总数。总金额：该月订单的总销售金额。退单量：该月退货的订单数。退单金额：退货订单的总金额。退单原因Top1：退单中最常见的原因。这些数据需要运营人员手动从各个分公司的系统中收集，然后整合成一个月度报告，分析并发现潜在问题，如哪些分公司订单量下降、哪些退单原因需要关注。通过橙武低代
19、Java正则表达式与字符集详解杠精协会主席 Java NIO：革新I/O处理的新范式 Java 正则表达式 Pattern
Java正则表达式与字符集详解1.Java正则表达式相关类在JavaJ2SE1.4版本中，引入了一些期待已久的正则表达式类，下面为你详细介绍：-CharSequence：这是一个新的接口，由多个类实现，用于以抽象的方式描述字符序列。-Pattern：该类将正则表达式封装在一个不可变的对象实例中。可以通过编译表达式字符串来创建实例，同时还有一些静态实用方法用于一次性匹配。importjava.uti
FPGA和eeprom通信数学王子 fpga开发
本文有参考【精品博文】IIC通信协议的Verilog实现作者的一些思想，并尝试补充eeprom一端的代码，并不完美，主要是一eeprom完全按照scl上升沿或下降沿采取动作（写数据或读数据），很难在scl低电平中间点使sda线发生变化（似乎不太符合iic协议要求），二另外在FPGA放弃sda线控制权和eeprom取得sda线控制权之间会有一小段高阻态（衔接并不连续），以下代码`timescale1
达梦数据库-dm8的docker部署及其导入导出睡不醒的双眼皮数据库 linux 运维
#部署单节点dockerrun-d-p5236:5236--restart=always--name=dm8--privileged=true-eLD_LIBRARY_PATH=/opt/dmdbms/bin-ePAGE_SIZE=16-eEXTENT_SIZE=32-eLOG_SIZE=1024-eUNICODE_FLAG=1-eINSTANCE_NAME=dm8-v/dm8/data:/opt
2021-03-15成长 TCZ晨妈
成长幸福的家庭是相似的，不幸的家庭各有不同。妈妈在家庭关系里是重中之重，上有婆媳，下有亲子，中有夫妻。要怎么样才能获得幸福，过上自己想要的生活？要怎么样才能更好？那只有学习，也唯有学习，才能成长。在成长过程中，不仅提高经济地位、家庭地位，甚至话语权，更重要的是内心丰盈、精神富足，有睿智的头脑、坦荡的心胸；有足够的能力，将有些事放下，因为还有明天；不拿自己的情绪责怪别人，也不拿别人的错误惩罚自己；做
【PTA数据结构 | C语言版】查找根结点
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，根据给定信息构建森林，并找出给定结点所在树的根结点。输入格式：输入首先给出一个正整数n（0#defineMAX_N20intmain(){intn;scanf("%d",&n);intparent[MAX_N];chardata[MAX_N];//读取输入数据for(inti=0;i
盘点一个Python网络爬虫过程中中文乱码的问题皮皮_f075
大家好，我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫中文乱码的问题，提问截图如下：原始代码如下：importrequestsimportparselurl='https://news.p2peye.com/article-514723-1.html'headers={'Accept-Language':'zh-CN,zh;q=0.9','Accept':'a
种子实践计划第93天殷琴
目标:我可以轻松的实现在2019年1月份以后的每一个月的工资，将都是完完全全的属于我自己的，可以随意支配的了！动机：1我可以每个月安安心心的稳定的给妈妈和婆婆每人100元的孝顺金；感恩她们对子女的付出，希望可以让她们感受到更多的爱，和对金钱的安全感。2我有能力给孩子创造一个好的学习环境，给她一个快乐又充满智慧的童年！3自己也可以随心的购买自己想要的化妆品，衣服，等自己喜欢的东西，还可以存钱去上我一
我是家庭总动员 b66c6f1f6d41
收到消息，4月25日全国75个城市71场辟谷营开班，我动员了我爸和我二姐一起去参加这次辟谷营。二姐在江苏参加，我带爸爸在南宁参加，不过我们学习的内容都是一样的，因为上次学习了这些内容后收益匪浅，所以回家后和爸爸沟通了。图片发自App清明节回家扫墓，我和爸爸沟通一下，我说：“爸，你相信吸引力法则吗？”我爸一脸茫然，好吧，我知道我爸听不懂什么叫吸引力法则，于是给他解释了一通，然后还给他在优酷视频里能找
Python训练营Day2 linaloos python 开发语言
学习内容：在完成第一天任务后，你已经具备执行简单Python代码的能力了，只要有人给你提供正确的代码，你都能够执行。但是离看懂上面AI提供的代码还有一段举例，你需要掌握一些基础内容。编程语言中为什么要使用变量Python中如何定义变量，变量的命名有什么规则编程语言中，逻辑控制的三大支柱是什么Python中数字类型和字符串类型有什么区别Python中还有哪些类型。有些问题需要思考如何进行增删改查，所
如何辨别一个女生是不是喜欢你承凯Boy
当你喜欢上一个女孩，但是不确定她是否也对你有好感。怎么办？让我们一起来学习一下如何辨别一个女生是不是喜欢你1.观察她在你身边时的姿势：如果她喜欢你，在你身边时她会有意地挺肩收腹。你可以更机灵一点，看她走开你身边或者不知道你在她身边时是什么姿势。2.注意她的脚：有些心理学家认为，脚的动作最能透露人们的内心想法，因为我们最不能意识到的就是脚部动作。看他脚是不是总冲着你，因为人喜欢人就会经常冲向谁。3.
SAP GR（Group Reporting）配置篇（二）产品日记 Group Reporting配置篇 SAP SAP GR Group Reporting
1.2主数据1.2.7定义细分类别菜单路径组报表的SAPS4HANA>主数据>定义细分类别事务代码
SAP GR（Group Reporting）合并报表内容及功能简介（三）产品日记 Group Reporting SAP Group Reporting SAP GR
目录管理细分类别和子项目细分类别和子项目交易类型功能范围总结附加主数据和自定义字段附加主数据总结自定义字段（codingblock）管理细分类别和子项目细分类别和子项目细分类别：将FS项目执行合并任务所需的子分配进行分类对于每个FS项目，细分类别确定哪些子分配必须记录在ACDOCU表中。如果源记录不包含合并交易类型，则会根据细分类别允许派生该类型。将交易数据过账到ACDOCU时的细分类别（BDC）
通俗易懂循环神经网络（RNN）指南
本文用直观类比、图表和代码，带你轻松理解RNN及其变体（LSTM、GRU、双向RNN）的原理和应用。什么是循环神经网络循环神经网络（RecurrentNeuralNetwork,RNN）是一类专门用于处理序列数据的神经网络。与前馈神经网络不同，RNN具有“记忆”能力，能够利用过去的信息来帮助当前的决策。这使得RNN特别适合处理像语言、语音、时间序列这样具有时序特性的数据。类比：你在阅读一句话时，会
2023-02-21 初心倩萦
2023.2.21周二P22-P24碎片化时间，我们可以做哪些安排呢？第22页到23页给了我们答案。书中提到了还可以用碎片时间来学习新技能和开展第二职业。比如说，学习的新技能，像学习新的语言，新的计算机操作技巧及办公软件技能、了解一些未知领域的新知识。其中，“通勤路上听与专业有关的新闻”这句话提醒了我。其实我在上学和刚上班的时候，都面临着较长时间等公交车和坐公交车的车程。之前的这段时间，要么思考一
2/7 关于正念冥想的几点注意方知方行
这是得到课程《怎样学会正念冥想》的部分学习笔记，把平时我在冥想的桑侯没有注意和意识到的问题总结下，以备后续练习实践：1有意的关注（平时练习时，通过调整赞成注意力的方式在做）。2非评判的态度（这里的意思并不是说不评判，而是意识到到评判，不要被自己的评判牵着走。产生评判是自然的。我之前的认知是：不能产生评判）。3理解当下（“当下”是我们身心所体验到的一切。大体分为两类：一类是发生在我们的内在体验，也可
2022-6-17晨间日记饼饼是逊啦
今天是周五起床：9:02就寝：未知天气：热心情：目前愉悦叫我起床的不是闹钟是梦想年度目标及关键点：无本月重要成果：无成功日志-记录三五件有收获的事务财务检视存款5w啦，小白加油！人际的投入暂无开卷有益-学习/读书/听书呜呜呜，在重温《欢乐颂1》健康与饮食今日步数：骑车今日锻炼：提肛运动3次50/次今日饮食：早上-苹果；中午:小饼干一袋；晚饭:待定好习惯打卡多笑一笑，心态摆正！不强求，以后晚上10点
Python 并行新思路：不移除 GIL 的多核并发之道清水白石008 python Python题库 python 服务器开发语言
Python并行新思路：不移除GIL的多核并发之道引言大家好，我是[您的名字]，一位在Python领域深耕多年的软件专家。今天，我们来探讨一个Python开发者经常面临的挑战：全局解释器锁(GIL)以及如何在它的限制下，充分利用多核CPU的并行计算能力。GIL，这个Python语言的“老朋友”，长期以来一直备受争议。它确保了在CPython解释器中，同一时刻只有一个线程执行Python字节码。这简
2021-2-21晨间日记客归呀
今天是什么日子起床：8.30就寝：12.00天气：晴心情：充满阳光纪念日：第一天加入任务清单昨日完成的任务，最重要的三件事：写小说3000字，剪视频，和亲人聊天改进：小说字数字数加，视频录制习惯养成：每天坚持写小说周目标·完成进度百分之七十学习·信息·阅读做题，头条文章阅读健康·饮食·锻炼每天一瓶牛奶人际·家人·朋友和家人朋友聊天，教亲朋好友一些手机操作工作·思考写随笔最美好的三件事1.每天进步2
雨天日更、学习与提升，生字游戏
首先应该注明，致自己，说成小心眼最合适，因文化成度低有些文字的词语难易运用好，所以才有如此的霞小的心思，说自私不为过只是想找个提升自己满足心理的需求，致自己安慰一翻。艺多不压身、是有意还是无意进入写的提升之门。应该说无意事实是有意的，只能说好心之人常善有，介绍进入了这个写的程序。经过看到写群里的人于事才发现、自己走进一辉煌时代年青人群里，这是他们年青人的摇蓝梦想之地，但我也仿佛佣有了一个青年人的梦
python学智能算法（二十四）|SVM-最优化几何距离的理解
引言前序学习过程中，已经对几何距离的概念有了认知，学习链接为：几何距离这里先来回忆几何距离δ的定义：δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delta=\min_{i=1...m}y_{i}(\frac{w}{\left\|w\right\|}\cdotx_{i}+\frac{b}{\left\|w\right\|})δ=i=1...mminyi(∥w∥w⋅xi+∥w∥b)对上
一次奖励慢时光慢慢闪光
下午第第节课做正式作业本上的作业。做作业之前先把上一次作业的情况说了一下，重点表扬加分的孩子，请他们站起来，让大家为他们鼓掌。理由是，上一次作业是在家里写的，能在不在老师监督下认真的同学都是很对自己严格要求的，真正自律的孩子，一来奖励自律，二来鼓励下一次在家里做作业要向这些孩子学习，偶尔正式作业本上的作业在学校里完不成，带回家做容易写字潦草，应付任务，通过奖励能激励不认真的孩子。奖励方式采取随机抽
Kotlin flow实践总结 Android技术圈
Flow是什么按顺序发出多个值的数据流。本质就是一个生产者消费者模型，生产者发送数据给消费者进行消费。冷流：当执行collect的时候（也就是有消费者的时候），生产者才开始发射数据流。生产者与消费者是一对一的关系。当生产者发送数据的时候，对应的消费者才可以收到数据。热流：不管有没有执行collect（也就是不管有没有消费者），生产者都会发射数据流到内存中。生产者与消费者是一对多的关系。当生产者发送
链路两段不同网段怎么通信_eNSP小实验：不同网段直连接口如何互通？ weixin_39662263 链路两段不同网段怎么通信
小实验：不同网段直连接口如何互通？1.当两个路由器不同网段的直连接口封装的链路层协议为PPP协议时：由于在PPP链路协商时彼此可以学习到对方的IP地址，并且自动将对端不在同一个网段的主机路由加到直连路由表中。故只要双方在接口配置了IP地址就可彼此ping通。AR1配置：#sysnameAR1#interfacePos4/0/0link-protocolpppipaddress100.1.1.125
树莓派i2c通信C语言,基于I2C的STM32与树莓派通信茶话股经树莓派i2c通信C语言
传统的串口通信会丢失数据，不可靠，故采用I2C(同步串行总线)通信。树莓派上使用python脚本，后期将使用c或java重写，目前没有需求。树莓派作主机(Master)，stm32作从机(Slave)。特别需要注意的是，I2C的通信虽然只需要两根线就能通信，但是需要第三根线接地GND(提供判断低电位的能力)，否则不能正常识别stm32从机使用ArduinoIDE编程以下是STM32的代码：#inc
公用表表达式（CTE）详解：针对 MySQL 和 SQL Server 数据库
公用表表达式（CTE，CommonTableExpressions）是一种在SQL中定义临时结果集的方法，该结果集在单个查询的执行过程中可以被引用。CTE提高了查询的可读性和结构化，特别适用于复杂的子查询和递归查询。本文将详细介绍CTE的概念和用法，并分别针对MySQL和SQLServer数据库进行说明。什么是公用表表达式（CTE）CTE是一个命名的临时结果集，它在查询的执行范围内有效。CTE的定
如何提高JPA项目的扩展性：模块解耦的实践与策略
在企业级开发中，JPA（JavaPersistenceAPI）因其对象关系映射的强大能力，常被用于构建业务层与数据层之间的桥梁。然而，随着项目复杂度增加，JPA项目常常面临模块之间强依赖、跨模块实体耦合、难以演进等问题，严重影响系统的可扩展性和可维护性。相比之下，MyBatis项目由于其“SQL即服务”的特性，天然具备更强的解耦性。本文将分析JPA项目中常见的模块依赖问题，探讨其背后的原因，并提供
每日复盘分享 Collue
3-90/Day47/有效学习，从每日复盘分享开始【2021.9.4团队管理篇】开好月度启动会的方法【一】收获新知一、公司要开月度启动会的原因1、因为上月目标完成，大家的心力、体力都有些疲惫；大家的状态有所回落。然而每个月的目标又都很高，所以要开启动会议，正式宣布战役的开启，让大家进入战斗状态。2、一个公司是否有效率取决于管理者是否有效率，管理者是否有效率，取决于管理者有没有良好的工作习惯。每个月
有效快速记忆五十音方法和技巧蓝色的枕头12
日语学习之五十音图记忆法：日语发音以五十音图为基础，一定学好五十音图，通过文章内教授的一些记忆法，知道日语是怎样发音，才能学好日语。日语发音以五十音图为基础，比中文的拼音还要重要，一定学好五十音图，才知道日语是怎样发音。日语小知识①先是竖着记=（*称为行）あaかkaさsaたなはまやらわんいiきkiしxiうuくkuすsiえeiけkeiせseiおouこkoそsou②竖着记好后，衡着记（*称为段）あaか
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

基于时域表示的序列数据分类方法（一）——基于距离度量的序列数据分类方法

基于时域表示的序列数据分类方法（一）——基于距离度量的序列数据分类方法

文章目录

前言

KNN分类器

一、欧氏距离

二、DTW度量

三、加窗DTW度量-WCDTW

四、加权DTW-WDTW度量

五、LB距离法

六、DBA度量

七、DTW度量特征+现代分类器

1、GDTW-P-SVMs

2、LBF-SVMs

3、PS-AdaBoost

八、集成多种弹性距离度量的分类方法

1、EE

2、Proximity Forest

九、编辑距离度量(edit distance, ED)

1、LCSS 度量

2、EDR 度量

3、ERP 度量

4、MSM度量

5、其他弹性匹配度量方法

你可能感兴趣的:(序列数据分类学习,算法,python)