Chauncy__xu

时间序列聚类算法论文《k-Shape: Efficient and Accurate Clustering of Time Series》

ABSTRACT

聚类是最流行的数据挖掘方法之一。这不仅仅是因为聚类问题具有很强的探索性，还因为它可以作为其他技术的预处理步骤或子过程。本文提出一种的新的时间序列聚类算法——K-shape算法。该算法依赖于一个可度量的迭代优化过程，创建同构的、分割良好的群簇。K-shape聚类算法依赖使用了规范化之后的互相关系数作为距离的度量，在每次迭代中使用它来更新聚类对聚类时间序列的分配。

1. INTRODUCTION

聚类是应用非常广泛的一项技术，因为它不需要监督和数据标注。
大多数时间序列分析技术，包括聚类在内，都依赖于距离测度的选择。由于无法对形状进行精准的描述，所以人们提出了几十种距离测度的方法。已有的研究表明提供振幅和相位不变性的距离测度表现非常好，所以这些距离测度被用于基于形状的聚类。
一般认为，距离测度的选择比聚类算法本身更重要。所以，时间聚类终于依赖于经典的聚类算法，要么用更适合的实际序列的距离测度代替默认的距离测度，要把时间序列转化为平稳数据，然后使用现有的聚类算法。聚类算法的选择会影响到：(1)准确性(2)效率，也就是计算成本。
本文提出了一种的新的时间序列聚类算法K-shape，该算法高效而且与序列的领域无关，该算法是基于一种可度量的迭代优化过程，类似于K-means算法，具体来说，K-shape使用了与K-means不同的距离测度和聚类中心的计算方法。K-shape试图在比较时间序列时保持形状，所以，K-shape需要一个对缩放和移动保持不变性的距离测度。本文展示了(1)如何推导出保持缩放不变性和唯一不变性的时间序列距离测度(2)如何有效地计算这个距离
结果显示，我们的结果优于欧氏距离，与cDTW获得了相似的结果，而且不需要对数据做任何调整，运行速度比cDTW快了一个数量级。
&emsp: 本文认为，聚类算法的选择与距离测度的选择同样重要。

2. PRELIMINARIES

2.1 理论背景

聚类的难度以K-means聚类为例，找到一个分割方案，使得类内的序列与聚类中心之间的距离平方和最小

在欧氏空间中，当 $k\geq 2$ 即使时间序列的长度为2这是一个NP-hard问题。所以K-means算法常常是去寻找局部最优解。
K-means算法通过一个包含两个步骤的局部最优算法，第一步是分配部分，把时间序列分配到距离自己最近的聚类中心；第二步是改进部分，更新聚类中心，使聚类中心反映聚类成员的变化。算法结束的标志是算法收敛或者达到最大的迭代步数。
Steiner’s sequence 聚类中心的计算过程就是寻找一个时间序列使得类内距离平方和最小

当使用欧式距离时，聚类中心的计算具有算术平均的性质。在很多情况下，需要对观测的序列进行对齐，这个问题也被称为多序列对齐问题，这个问题是NP-complete.

2.2 时间序列不变性

缩放和转换不变性一个序列x变成 $y = a x + b$ ，其中a和b是常数，所以y应该保持x的相似性
平移不变性当两个序列相似但相位不同或当序列的某些区域是对齐的（局部对齐），我们可能仍然认为它们是相似地
均匀缩放不变性长度不同的序列需要对较短的序列进行拉伸对较长的序列进行收缩，以便对其进行有效的比较。
遮挡不变性 当缺少子序列时，仍然可以忽略不匹配的子序列进行比较
复杂度不变性当序列具有相似的形状但不同的复杂性时，我们希望根据实际的应用场景是他们具有低或高的相似性。

2.3 时间序列距离测度

两种最先进的时间序列比较方法首先对序列进行Z归一化。最广泛使用的距离测度是欧氏距离：对于长度为m的x和y序列，得到： $ED(x,y)=\sqrt {\Sigma_{i=1}^m(x_i-y_i)^2}$ 另外一个流行的距离测度是DTW。DTW可以看作是ED的扩展，它提供了局部（非线性）对齐。用x和y中的任意两个序列的欧氏距离构造一个 $m * m$ 的方阵，则“扭曲的迹” $W={w_1,w_2,...,w_k}, k\geq m$ 是一组连续的矩阵元素，定义了在若干约束条件下x和y之间一种映射。 $DTW(x,y)=min\sqrt{\Sigma_{i=1}^k w_i}$ 这个路径可以通过动态规划的方法进行计算，递归表达式为 $\gamma(i.j)=ED(i,j)+min{\gamma(i-1,j-1),\gamma(i-1,j),\gamma(i,j-1)}$

通常的做法是该路径仅访问矩阵m上的一个单元格子集，这个子集矩阵的形状成为频带，频带的宽度称为扭曲窗口。

2.4 时间序列聚类算法

所有的聚类算法通常会修改现有的算法，要么用更适合比较时间序列的距离测度替换默认的，要么将时间序列数据转换为扁平数据，然后用经典的算法进行解决。

2.5 聚类中心的计算

计算聚类中心严重依赖序列之间的距离测度。这块有点复杂，以后再补。

2.6 问题的定义

本文在给定集群个数的情况下解决了与领域无关、精确的、可度量的时间序列聚类算法。即使不同领域的数据可能需要不同的数据扭曲不变性，我们专注于采用适当的距离测度来提供序列的缩放和移动不变性。此外，为了方便的使用这种距离度量，我们重点分析未经处理的时间序列。

3. K-shape聚类算法

我们的目标是开发一个时间序列聚类的算法，该算法可以不受序列性质的影响，该算法中的距离测度不受序列缩放和移动的影响。具体来说，我们首先讨论距离测度，它是基于互相关的一种测度，基于这种测度我们提出了一种计算时间序列聚类中心的方法。

3.1 时间序列的形状相似

获取形状的相似性需要能够处理振幅和相位畸变的距离测度。然而，能够满足这种要求的距离测度如DTW计算代价太大。互相关是一种对时滞信号相似度的度量，广泛应用于信号和图像处理。不正确地使用互相关，会使得它的实现像DTW一样慢，由于这些缺点，互相关没有被广泛采用作为时间序列的距离测度。
互相关测度互相关是一种统计度量，我们可以用它来确定x和y两个序列的相似性，即使它们没有正确对齐。为了实现平移不变性，计算互相关时保持y序列不变，并将x在y上滑动，计算x的每一个位移s的内积。明确记法： $x=(x_1,x_2,...,x_m)$ $y= (y_1,y_2,...,y_m)$
但考虑所有的移动时可以得出 $CC_w(x,y)=(c_1,c_2,...,c_w)$ ，得到的互相关序列长度为 $2 m - 1$ ，定义如下： $CC_w(x,y)=R_{w-m}(x,y), w\in {1,2,...,2m-1}$ $R_{w-m}(x,y)$ 计算方式如下：
我们的目标就是计算出使得 $CC_w(x,y)$ 最大的 $w$ 。得到最优的 $w$ 之后就可以得出x相对于y的最佳移动： $s = w - m$
对于不同的领域或应用，可能会需要不同的归一化，最=常用的就是这三种，分别是有偏估计、无偏估计、相关系数。

时间序列可能还需要归一化来消除固有的畸变，图三可以看出，独立于相似度计算的归一化会影响到最终的结果。

基于形状的距离（SBD） $SBD(x,y)=1-max_w\left(\frac{CC_w(x,y)}{\sqrt{R_0(x,x)*R_0(y,y)}}\right)$ 取值范围为 $[0, 2]$ ，0表示两个时间序列最相似
高效计算SBD从这个式子可以看出 $CC_w(x,y)=R_{w-m}(x,y), w\in {1,2,...,2m-1}$ 可以看出 $CC_w(x,y)$ 的时间复杂度是 $O(m^2)$ 其中 $m$ 是时间序列的长度。因为互相关的计算过程与卷积的计算过程非常类似，所以根据卷积定理，两个时间序列的卷积可以计算为单个时间序列的离散傅里叶变换（DFT）的乘积的离散傅里叶反变换(IDFT)，其中DFT为： $F(x_k)=\Sigma_{r=0}^{|x|-1}x_r e^{\frac{-2jrk\pi}{|x|}},k=0,1,...,|x|-1$
IDFT： $F^{-1}(x_r)=\frac{1}{|x|}\Sigma_{k=0}^{|x|-1}F(x_k)e^{\frac{2jrk\pi}{|x|}},r=0,1,...,|x|-1$
其中 $j=\sqrt{-1}$ .如果一个序列在时间上首先反转180度，则互相关的计算就是两个时间序列的卷积，就相当于在频域中取复共轭（用*表示）。则
$CC_w(x,y)=R_{w-m}(x,y), w\in {1,2,...,2m-1}$ 可以用以下的方式进行计算： $CC(x,y)=F^{-1}\{F(x)*F(y)\}$
然而DFT和IDFT的计算仍然需要 $O(m^2)$ 的时间。通过使用快速傅里叶变换算法，时间复杂度可以变为 $O (m l o g (m))$ 。递归算法通过将FFT划分为2的幂次块来计算FFT，因此，为了进一步提高FFT的计算性能，当 $C C (x, y)$ 不是精确的2的幂时，我们可以在x和y之间填充0使得在 $2 m - 1$ 之后依然是的2的幂次的长度。
算法的流程如下：

3.2 时间序列形状提取

时间序列分析中的许多任务依赖于通过一个序列有效地总结一组时间序列的方法。这个摘要序列通常被称为平均序列，或者，在聚类中，被称为质心。
从一组序列中提取平均序列的最早的方法是计算所有序列对应坐标的算术平均值作为平均序列。K-means算法就是采用的这种方式。图4可以看出这种方式计算的质心没有很好地捕捉这类序列的特征。

为了避免这种问题，我们把质心计算视为一个优化问题，其目标是找到与类内所有其他时间序列之间距离平方和的最小值。因此就变为一个优化问题： $\mu_k=argmax_{\mu_k}\Sigma_{x_i\in P_k}NCC_c(x_i,\mu_k)^2\ =argmax_{\mu_k}\Sigma_{P_k}\left( \frac{max_wCC_w(x_i,\mu_k)}{\sqrt{R_0(x_i,x_i).R_0(\mu_k,\mu_k)}}\right)^2$
该式需要对类内所有的时间序列计算一个最佳的偏移。因为我们在这里提到的方法是用在迭代聚类当中，所以我们把前一次计算得到的聚类中心作为参考并把所有的序列与这个参考的序列对齐。把前一次的聚类中心作为参考是合理的，m
省略上式的分母得到： $\mu_k=argmax_{\mu_k}\Sigma_{x_i\in P_k}\left(\Sigma_{l\in[1,m]}x_{il}.\mu_{kl} \right)$
为了简单起见，我们用向量表示此方程，并假设序列已经进行了Z归一化处理序列的振幅差。得到：
$\mu_k=argmax_{\mu_k}\Sigma_{x_i\in P_k}(x_i^T.\mu_k)^2=argmax_{\mu_k}\mu_k^T.\Sigma_{x_i\in P_k}(x_i.x_i^T).\mu_k$
在上面的式子中，我们没有对 $\mu_k$ 进行Z正则化。为了归一化数据，我们令 $\mu_k=\mu_k.Q$ ，其中 $Q=I-\frac{1}{m}O$ ，其中I是单位矩阵，O是全幺矩阵，用S代替 $\Sigma_{x_i\in P_k}(x_i.x_i^T)$ ，可以得到： $\mu_k=argmax_{\mu_k}\frac{\mu_k^T.Q^T.S.Q.\mu_k}{\mu_k^T.\mu_k}=argmax_{\mu_k}\frac{\mu_k^T.M.\mu_k}{\mu_k^T.\mu_k}$
其中 $M=Q^T.S.Q$
最新的 $\mu_k$ 求解是一个著名的Rayleigh Quotient最大化问题。我么可以找到最大值 $\mu_k$ 作为特征向量，它对应于实对称矩阵M的最大特征值。算法二展示了如何提取最具代表性的序列形状。

3.3 基于形状的时间序列聚类

我们提出的算法可以在保证缩放不变性、平移不变性和转换不变性的同时高效地比较序列和计算序列中心。在每次迭代中，K-shape算法执行两个步骤：(1)在分配步骤中，算法通过将每个时间序列与所有计算出地质心进行比较，并将每个时间序列分配给最接近质心地聚类来更新聚类中的成员关系; (2)在细化步骤中，更新聚类中心以反映前一步中聚类成员的变化。算法重复这两个步骤，直到集群成员没有变化，或者达到允许的最大迭代次数。在赋值步骤中，算法主要依赖于3.1中的距离测度，在细化步骤中，主要依赖于聚类中心的计算方法。
时间复杂度 $n$ 表示时间序列的个数， $k$ 是集群的个数， $m$ 是时间序列的长度。在分配步骤中，聚类算法利用SBD计算n个时间序列到k个聚类中心的相似性，需要时间为 $O (m . l o g (m))$ ，所以这一步的时间复杂度就是 $O (n . k . m . l o g (m))$ 。在每一个集群的细化步骤中，聚类算法计算矩阵M，需要 $O(m^2)$ 的时间，对M执行特征值分解，需要 $O(m^3)$ 的时间。所以这一步的总时间为 $O(max\{ n.m^2,k.m^3\})$ 。所以，总的来说K-shape算法每次迭代需要的时间复杂度为 $O(max\{n.k.m.log(m),n.m^2,k.m^3\})$ 。可以看出该算法的时间复杂度与时间序列的数量有现行的关系，大部分的计算代价取决于时间序列的长度。但是时间序列的长度通常比时间序列的数量小得多，因此对m的依赖并不是瓶颈。在m非常大的情况下，可以使用分割或降维的方法来充分减少序列的长度。
K-shape算法：

PX4飞控之位置控制（1）整体架构 Felix_ZL px4飞控 PX4 位置控制架构
位置控制是无人机飞控的核心算法之一，一方面根据commander中的flag标志位和Navigator中提供的航点信息进行控制（自主模式下），另一方面得到期望姿态角（setpoint）的四元数信息，给到姿态控制模块进行姿态控制。本文重点PX4飞控的位置控制的代码整体架构（mc_pos_control）,具体的控制算法将在后续文章中陆续奉上。位置控制模块的主函数：task_main()1.订阅结构体
C++徒手造国密SM算法！码农の头发消失术实录 skyksksksksks C++个人杂记物联网国密算法国密算法密码学 c++开发语言
【开场暴击：程序员的修仙之路】各位在秃头边缘疯狂试探的代码战士！今天我们要挑战史诗级成就——用纯C++手搓国家密码管理局钦定的SM2/SM3/SM4算法！没有现成库！没有外挂！只有头铁和即将离你而去的头发！(ง•̀_•́)ง【SM2加密：和椭圆曲线谈恋爱の玄学】这玩意儿就像追女神——你永远猜不透她的心思！来看加密の奥义三连：SM2加密vs追妹子对比表行为SM2加密流程追妹子流程第一步生成随机数k制
C++ 用ECC算法 Curve为EC_NIST_FP_521写个示例签名和验签。PCI认证小黄人软件经验分享 ssl 学习
以下是一个使用OpenSSL实现ECC(椭圆曲线密码)签名和验签的C++示例，曲线使用secp521r1（即NISTP-521）。这个程序：生成NISTP-521曲线的EC密钥。使用SHA-512进行哈希并签名数据。验证签名的正确性。编译：g++-oecc_signecc_sign.cpp-lssl-lcrypto运行：./ecc_sign你可以试试看，看看签名和验签是否成功！
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
每日一题一一Leetcode128. 最长连续序列 - 力扣 Blue.ztl 写写算法 leetcode 算法数据结构
每日一题一一Leetcode128.最长连续序列-力扣作者：blue时间：2025.3.14128.最长连续序列-力扣（LeetCode）本题的要求是：给定一个未排序的整数数组nums，找出其中数字连续的最长序列（不要求序列元素在原数组中连续）的长度。本题用排序加遍历的方法非常容易解决，但是算法的效率太低。本题正真的解题思路如下，首先，数组中是有可能出现重复的数字，但是重复的数字其实并不影响我们找
DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码强化学习曾小健2 大语言模型LLM 算法
DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码机器之心2025年03月02日11:54北京选自GitHub作者：AndriyBurkov机器之心编译GRPO（GroupRelativePolicyOptimization）是DeepSeek-R1成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek用的GRPO占用大量内存？有人给出了些破解方法》。简单来说，GR
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
DAY33 贪心算法Ⅱ Useee 贪心算法算法
122.买卖股票的最佳时机II-力扣（LeetCode）想到把整体利润分解为每天的利润，就豁然开朗了。classSolution{public:intmaxProfit(vector&prices){intresult=0;for(inti=1;i&nums){intcover=0;if(nums.size()==1)returntrue;for(inti=0;i=nums.size()-1)re
众数(masses)（c++）羊蜜不是羊 c++算法数据结构
题目描述由文件给出N个1到30000间无序数正整数，其中1≤N≤10000，同一个正整数可能会出现多次，出现次数最多的整数称为众数。求出它的众数及它出现的次数。输入描述输入文件第一行是正整数的个数N，第二行开始为N个正整数。输出描述输出文件有若干行，每行两个数，第1个是众数，第2个是众数出现的次数。（两个数之间由一个空格间隔，行末无多余空格）样例输入12242325372343输出2434来源算法
简单密码破解（c++）羊蜜不是羊 c++算法开发语言
题目描述密码是我们生活中非常重要的东东，我们的那么一点不能说的秘密就全靠它了。哇哈哈.接下来渊子要在密码之上再加一套密码，虽然简单但也安全。假设渊子原来一个BBS上的密码为zvbo941987,为了方便记忆，他通过一种算法把这个密码变换成YUANzi1987，这个密码是他的名字和出生年份，怎么忘都忘不了，而且可以明目张胆地放在显眼的地方而不被别人知道真正的密码。他是这么变换的，大家都知道手机上的字
HTML语言的贪心算法宇瞳月包罗万象 golang 开发语言后端
HTML语言的贪心算法：理论与实践引言在编程和算法研究中，贪心算法是一种广泛应用的解决问题的方法。它通过对每一阶段选择最优解的方式来构建整个问题的解决方案。贪心算法不一定能在所有情况下得到最优解，但在许多实际问题中，它能够提供一个足够好的近似解。本文将探讨贪心算法的基本概念、典型应用、优缺点，并结合HTML语言的特点，提出一些具体的实现示例和思考。一、贪心算法的基本概念贪心算法是一种求解最优化问题
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
《Hello 算法》火了！！！一本写给算法初学者的入门算法书籍遇码分享算法 hello hello算法算法书籍
曾经也放出豪言壮语，决心要刷遍力扣上的所有算法题目。然而现实就很快啪啪的打脸。不知道多少人和我有过一样的经历。在读到《Hello算法》的序中，作者靳宇栋给了我们一个“台阶”。随后就表达了针对我们的现状，他特地写了《Hello算法》这本书，代表广大算法初学者表示感激涕零。《Hello算法》为什么适合入门动画图解、一键运行的数据结构与算法教程全书采用动画图解，内容清晰易懂、学习曲线平滑，引导初学者探索
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
Matlab实现SSA-HKELM麻雀算法（SSA）优化混合核极限学习机多变量回归预测的详细项目实例 nantangyuxi MATLAB 算法 matlab 回归人工智能数据挖掘开发语言深度学习
目录Mstlsb实她TTS-HKFLM麻雀算法（TTS）优化混合核极限学习机多变量回归预测她详细项目实例1项目背景介绍...1项目目标她意义...1目标...1意义...2项目挑战及解决方案...2挑战...2解决方案...3项目特点她创新...3创新点...3特点...4项目应用领域...4应用领域...4项目效果预测图程序设计及代码示例...5项目模型架构...6数据预处理...6混合核极限学
客服机器人怎么才能精准的回答用户问题？玩人工智能的辣条哥 AI面试机器人客服机器人
环境：客服机器人问题描述：客服机器人怎么才能精准的回答用户问题？解决方案：客服机器人要精准回答用户问题，需综合技术、数据和用户体验等多方面因素。以下是关键策略和步骤：1.精准理解用户意图自然语言处理（NLP）技术分词与实体识别：提取关键词（如“订单号”“退货”）和实体（如时间、地点）。意图分类：通过机器学习模型（如BERT、Transformer）将问题归类（如“售后”“支付”）。上下文理解记录对
群体智能优化算法-爱情进化算法 (Love Evolution Algorithm, LEA，含Matlab源代码） HR Zhou 算法 matlab 开发语言群体智能优化优化
摘要爱情进化算法（LEA）是一种基于心理学刺激-价值-角色理论（Stimulus-Value-RoleTheory）所提出的新型元启发式算法。该算法将“恋爱中的人”抽象为种群个体，通过对个体“幸福度（Happiness）”的定义和动态更新，模拟了从“相遇->价值交流->角色平衡”三个阶段不断逼近全局最优解的过程。LEA在高维连续优化与工程应用等场景下可实现对搜索空间的充分探索与精细开发。本文结合算
灰狼优化算法（Grey Wolf Optimization, GWO）及其 Python 代码追蜻蜓追累了算法 python github pycharm jupyter matlab numpy
灰狼优化算法（GreyWolfOptimization,GWO）是一种基于灰狼社会行为觅食过程而设计的优化算法。其基本原理是模拟灰狼群体中个体的协作和竞争行为，以迭代更新的方式寻找最优解。灰狼优化算法涉及三种灰狼的角色：alpha（α）、beta（β）和delta（δ），它们分别代表群体中的优势个体。算法包括初始化灰狼位置、计算适应度值、更新灰狼位置等步骤。以下是一个简单的Python示例代码，实
25. 策略模式智想天开设计模式详解策略模式 bash 开发语言
原文地址:策略模式更多内容请关注：智想天开1.策略模式简介策略模式（StrategyPattern）是一种行为型设计模式，它定义了一系列算法，将每一个算法封装起来，并使它们可以相互替换。策略模式让算法的变化独立于使用算法的客户。通过引入策略模式，可以在不修改客户端代码的情况下，动态地更改对象的行为。关键点：算法封装：将不同的算法封装到独立的策略类中。互换性：策略类可以相互替换，客户端可以根据需要选
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
java队列实现限流_如何使用队列实现微服务限流算法？纽太普 java队列实现限流
队列在平时开发中可能是出现频率最高的数据结构之一了，但是大部分情况下，我们都是用别人已经实现好的，比如kafka，比如redis里的list，以至于让人怀疑为什么还要去学习队列呢？希望今天的内容可以给你一些启发。什么是队列为了整个文章的完整性，我们还是来介绍一下什么是队列。我们举个生活中常见的案例，假设你在周杰伦的奶茶店买奶茶，由于人很多，为了保持公平和秩序，你被要求排队，最先来的人排到最前面，这
YOLOV11|YOLO12改进系列指南魔鬼面具 YOLO
基于Ultralytics的YOLO11|YOLO12改进目前自带的一些改进方案(持续更新)为了感谢各位对本项目的支持,本项目的赠品是yolov5-PAGCP通道剪枝算法.具体使用教程专栏改进汇总YOLO11系列二次创新系列ultralytics/cfg/models/11/yolo11-RevCol.yaml使用(ICLR2023)ReversibleColumnNetworks对yolo11主
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f