哎呦-_-不错

时间序列-ARIMA模型调参检验实战

文章目录

- - - 1.数据格式
    - 2.理论补充
    - 3.代码
    - 4.总结

1.数据格式

2.理论补充

关于截断与拖尾如何选择模型
参考：博客

剩余部分代码中都有

3.代码

#!usr/bin/env python
# -*- coding:utf-8 _*-
"""
@author: liujie
@software: PyCharm
@file: ArmaModel(2,2)or(0,1).py
@time: 2020/11/6 17:33
"""
'''
模型的介绍:
AR、MA、ARMA、ARIMA模型 参考：https://blog.csdn.net/u010687164/article/details/86010154
1.自回归模型AR(p)模型:利用时间序列前期数值与后期数值的相关关系，建立一个包含前后期数值的自变量回归方程
2.移动平均MA(q)模型:t 时间点的序列值为白噪声 u_t 的加权之和
3.自回归滑动平滑ARMA(p,q)模型:移动平均方程是对自回归模型的一个补充.这种模型综合了AR与MA两种模型的优势,解决了随机变动项的求解问题。
4.ARIMA(p,q,d)模型:AR/MA/ARMA用于分析平稳时间序列，接下来所说的ARIMA通过差分可以用于处理非平稳时间序列。参数d为差分的次数。
  相比于ARMA模型，该模型需要将不平稳数据进行d次差分形成一个稳定的时间序列数据，然后采用ARMA模型
'''
import warnings
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels as sm
from datetime import datetime
# 作qq图
from statsmodels.graphics.api import qqplot
# 作ADF单方根检验
from statsmodels.tsa.stattools import adfuller as ADF
# 自相关、偏自相关
from statsmodels.tsa.stattools import acf, pacf
# ARMA模型
from statsmodels.tsa.arima_model import ARMA
# ARIMA模型
from statsmodels.tsa.arima_model import ARIMA
# 季节性分解
from statsmodels.tsa.seasonal import seasonal_decompose
# 作自相关图与偏自相关图
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
# SciPy的stats模块提供了大约80种连续随机变量和10多种离散分布变量
from scipy import stats
# D-W检验
from statsmodels.stats.stattools import durbin_watson
from sklearn.metrics import mean_squared_error


class ArimaModelTest:
    '''
    ARIMA建模的基本步骤：
        1.获取被观测的时间序列数据
        2.对时序数据进行平稳化处理，利用差分寻找最佳的d值
        3.根据平稳化处理后的时序数据自相关、偏相关图选择合适的p，q值，并对ARIMA模型进行AIC,BIC,HQIC准则验证
        4.检查残差序列：分别用自相关、偏自相关、D-W检验，正态分布检验、qq图检验、Ljung-Box检验
        5.最后进行数据预测
    '''

    # 参数初始化
    def __init__(self, lags):
        self.lags = lags

    # 第一步：平稳性检验
    '''
    时序数据平稳性是进行时间序列分析的前提条件，为什么需要满足平稳性要求呢？在大数定理与中心极限定理中要求样本同分布
    （这里的同分布等价于时间序列中的平稳性），我们在建模过程中有很多是建立在大数定理与中心极限定理条件下的，如果它不满足，
    得到的很多结论都不可靠
    平稳性检验一般采用观察法与检验法
    python判断时序数据的稳定性
        有两种方法:1.Rolling statistic--即每个时间段内的数据均值与标准差情况
                 2.ADF单方根检验
                    Dickey-Fuller Test 在一定的置信水平下，对于时间序列数据假设Null hypothesis：非稳定 
                    如果检验值小于临界值，则拒绝null hypothesis，即数据是稳定的，反之是非稳定的
                 查看结果参考:https://blog.csdn.net/qq_18999357/article/details/85097797
                 p值越小越好，p值要求小于给定的显著水平，p值要小于0.05，等于0是最好的。
    '''

    def test_stationarity(self, timeseries, window):

        # 移动平均图
        rol_mean = timeseries.rolling(window=window).mean()
        rol_std = timeseries.rolling(window=window).std()
        fig = plt.figure(facecolor='white')
        fig.add_subplot()
        plt.plot(timeseries, 'r-', label='Original')
        plt.plot(rol_mean, 'b-', label='rolling_mean')
        plt.plot(rol_std, 'g-', label='rolling_std')
        plt.legend(loc='best')
        plt.title('Rolling Mean', fontsize=20)
        plt.show(block=False)

        # Dickey-Fuller Test
        print('Results of Dickey-Fuller Test:')
        # dftest的输出前几项依次为检测值、p值、滞后数、使用的观测数、各个置信度下的临界值
        dftest = ADF(timeseries, autolag='AIC')
        # print(dftest)
        dfoutput = pd.Series(dftest[0:4],
                             index=['Test Statistic', 'p-value', 'Lags Used', 'Number of Observations Used'])
        # 打印各个置信度下的临界值
        for key, value in dftest[4].items():
            dfoutput['Critical value (%s)' % key] = value
        print(dfoutput)

        # 第二步:对时间序列做平稳化处理(一般使用差分)
        # 数据不稳定的原因主要有两个：１.趋势－数据随着时间变化，比如升高或者降低　　２.季节性－数据在特定的时间段内变动
        # 检测与去除趋势，一般有三种方式：
        '''
        1.聚合：将时间轴缩短，以一段时间内星期、月、年的均值作为数据值，使不同时间段内的值差距缩小
        2.平滑：以一个滑动窗口内的均值代替原来的值，为了使值之间的差距缩小
        3.多项式过滤：用一个回归模型来拟合现有数据，使得数据更平滑
        
        平滑一般有移动平均与指数加权移动平均
        移动平均是将所有时间平等看待
        指数加权平均是认为越近的时刻越重要，多了一个半衰期指定衰减
        '''
        # 检测与去除季节性，一般有两种方式：
        '''
        1.差分化:与特定滞后数目的时刻的值作差
        2.分解：对趋势与季节性分别建模然后再移除它们
        '''

    def set_stable_plot(self, timeseries, target, diff=1):
        # global关键字的作用是可以修改全局变量的值
        global data
        # 由于原数据值域范围比较大，为了缩小值域，同时保留其他信息，常用的方法是对数化，取log
        data = np.log(timeseries)
        data = data.diff(diff)
        data.dropna(inplace=True)

    # 第三步：选择合适的p、q,做自相关图ACF与偏自相关图PACF
    '''
    参考博客：https://blog.csdn.net/weixin_41013322 见判断模型表格
            https://blog.csdn.net/xianyuhenxian/article/details/60602828
            https://blog.csdn.net/Jasminexjf/article/details/94993362
    自相关函数 (ACF):延迟为 k 时，这是相距 k 个时间间隔的序列值之间的相关性。
    偏自相关函数 (PACF):延迟为 k 时，这是相距 k 个时间间隔的序列值之间的相关性，同时考虑了间隔之间的值。
    
    截尾是指时间序列的自相关函数（ACF）或偏自相关函数（PACF）在某阶后均为0的性质（比如AR的PACF）；
    拖尾是ACF或PACF并不在某阶后均为0的性质（比如AR的ACF）。
    
    截尾：在大于某个常数k后快速趋于0为k阶截尾
    拖尾：始终有非零取值，不会在k大于某个常数后就恒等于零(或在0附近随机波动)
    '''
    '''
    ACF图与PACF图分析:
    可以看到ACF呈现1阶截尾，PACF呈现拖尾，所以选用MA(1)模型
    '''

    def p_q_choice(self, timeseries):
        # 直接得出最优模型,同时使AIC与BIC最小
        res = sm.tsa.stattools.arma_order_select_ic(timeseries, ic=['aic', 'bic', 'hqic'],trend='nc')
        print('AIC:', res.aic_min_order)
        print('BIC:', res.bic_min_order)
        print('HQIC:', res.hqic_min_order)

        fig = plt.figure(figsize=(12, 6))
        ax1 = fig.add_subplot(211)
        # lags表示滞后阶数
        fig1 = plot_acf(timeseries, lags=self.lags, ax=ax1)
        ax2 = fig.add_subplot(212)
        fig2 = plot_pacf(timeseries, lags=self.lags, ax=ax2)
        plt.show()

    # 第四步：利用ARMA模型的AIC准则，找出最优模型
    def model_eval(self, timeseries, order):

        global arma_model
        arma = ARMA(timeseries, order=order)
        arma_model = arma.fit(disp=-1)  # disp<0:不输出过程
        print(u'----------ARMA模型-------------')
        print('AIC:', arma_model.aic)
        print('BIC:', arma_model.bic)
        print('HQIC:', arma_model.hqic)

    # 第五步：检查残差序列，D-W(德宾-沃夫)检验
    '''
    参考：https://blog.csdn.net/dingming001/article/details/73823376
        https://blog.csdn.net/robert_chen1988/article/details/106158129
    在考虑多元自回归的模型的残差独立性时提出的一个自相关检验统计量,我们把它借鉴过来进行时间序列的残差自相关检验
    如果检验结果显示残差序列自相关性不显著，说明回归模型对信息的提取比较充分，可以停止分析。
    如果检验结果显示残差序列自相关性显著，说明回归模型对信息的提取不充分，可以考虑对残差序列拟合自回归模型。
    这样的模型叫做残差自回归模型。
    
        D-W: 2.0146543495411566
        该统计量值越接近 2 越好，一般在 1~3 之间说明没问题，小于 1 这说明残差存在自相关性(有临界值表可以查)
    '''

    def check_rasid_DW(self):
        dw = durbin_watson(arma_model.resid.values)
        print('D-W:', dw)

    # 第六步:对残差做正态分布检验
    def check_normal_qq(self):
        # normaltest用于做正态分布检验
        # 输出结果中第一个为统计量，第二个为P值（注：p值大于显著性水平0.05，认为样本数据符合正态分布
        norm = stats.normaltest(arma_model.resid)
        print('normal:', norm)

        fig = plt.figure()
        ax = fig.add_subplot(111)
        # 如果fit为真，则用dist分布自动拟合dist的参数。由标准化的数据减去拟合的loc，再除以拟合的scale，得到分位数。
        # line=’q‘表示一条线适合通过四分位
        figqq = qqplot(arma_model.resid, ax=ax, fit=True, line='q')
        plt.show()

    # 第七步：残差Ljung-Box检验(Q检验)-白噪声检验
    '''
    参考:https://robjhyndman.com/hyndsight/ljung-box-test/
    当p-value<0.05（一般都用1%, 5%, 10%）, 拒绝原假设H0，结果显著，序列相关；
    当p-value>0.05，接受原假设H0，结果不显著，序列不相关，认为是白噪序列。
    如何判定滞后lag——m值？
    当数据没有季节性，那么我们lag就取10 【Box.test(data,lag=10)】，
    当数据有季节性，那么lag就取period的2倍
    '''

    def check_q(self):
        # 利用squeeze（）函数将表示向量的数组转换为秩为1的数组即Series格式
        # qstat=True含义：如果为真，返回每个自相关系数的Ljung-Box q统计量
        r, q, p = acf(arma_model.resid.squeeze(), qstat=True)
        data1 = np.c_[range(1, 41), r[1:], q, p]
        frame = pd.DataFrame(data1, columns=['Lags', 'AC', 'Q', 'Prob(>Q)'])
        frame = frame.set_index('Lags')
        pct = len(frame[frame['Prob(>Q)'] > 0.05]) / len(frame)
        print(frame)
        print('pct:', pct)

    # 第八步:平稳模型预测
    def predict_target(self):
        # 切分数据集，测试集大小设置为100
        test_size = 100
        rolling_size = 120
        value = np.log(data1['data'][-test_size])
        test = data[-test_size:]

        pre = []            # 用来存放预测值
        for i in range(len(test)):
            if i % 20 ==0:
                print(i)
            train = data[-(test_size + rolling_size - i):-(test_size - i)]
            model = ARMA(train,order=order)
            model_fit = model.fit(disp=-1)
            forecast = model_fit.forecast()[0]
            # print(forecast)
            pre.append(forecast)
        return pre,value

    # 第九步:将预测值还原到原来的形式,并计算RMSE
    def restore_style_plot(self, predict=None, values = None):
        # 还原
        test = data1[-100:]
        predict = pd.Series(predict,index=test.index)
        # 累加diff，即变成与第一个月的差分
        predict_cumsum = predict.cumsum()
        predict_value = pd.Series(value,index=test.index)
        predict_log = predict_value.add(predict_cumsum,fill_value = 0)
        predict_original = predict_log.apply(lambda x : np.exp(x))
        print('predict_original:\n',predict_original)
        # rmse
        rmse = np.sqrt(mean_squared_error(predict_original,test))

        # 作图对比
        fig = plt.figure()
        fig.add_subplot(111)
        plt.plot(test, 'r-', label='test_Oringial')
        plt.plot(predict_original[:100], 'b-', label='predictions')
        plt.legend(loc='best')
        plt.title('RMSE : %.4f'%rmse)
        plt.show()


if __name__ == '__main__':
    warnings.filterwarnings(action='ignore')
    # 1.利用pandas获取时序数据，并进行处理
    # pd.read_csv(filepath,sep,header,index_col,squeeze,parse_dates,date_parser,encoding)
    # 常用参数含义
    '''
    filepath:文件名
    sep:分隔符，默认’，‘
    header:用作列名的行号,一般header=0
    index_col:作为DataFrame的行标签的列，以字符串名称或列索引的形式给出。如果给定一个int / str序列，则使用一个多索引;index_col=False可以用来强制panda不使用第一列作为索引
    squeeze:默认False，如果解析后的数据只包含一列，则返回一个Series。
    parse_dates:数据格式为bool或列表，把某一列或某几列解析为时间索引；对于非标准日期时间解析，在pd.read_csv()后使用pd.to_datetime()
    date_parser:函数，用于将字符串列序列转换为日期时间实例数组
    encoding:编码格式
    '''
    # 返回：以逗号分隔的值(csv)文件被返回为带有标记轴的二维数据结构(DataFrame)
    date_parser = lambda dates: datetime.strptime(dates, '%Y/%m/%d')
    data1 = pd.read_csv('../data/Data.csv', header=0, parse_dates=['month'], date_parser=date_parser, index_col='month')
    # 将DataFrame对象转变成Series对象
    data = data1['data']

    arima = ArimaModelTest(lags=40)
    # 对原数据进行平稳性检验
    arima.test_stationarity(data,window=30)

    # 对原数据做平稳化处理,比较一阶差分与二阶差分效果，找出最适合的差分次数d
    arima.set_stable_plot(data, target='data', diff=1)
    # arima.set_stable_plot(data,target='data',diff=2)

    # 对处理后的数据进行平稳化检验
    arima.test_stationarity(data, window=30)

    # 通过自相关图与偏自相关图找到ARIMA模型中合适p、q
    arima.p_q_choice(data)

    # 拟合，找出最佳模型,
    # 这里直接调用sm.tsa.stattools.arma_order_select_ic，并利用aic_min_order属性得出最优模型是(2,2)
    order = (2, 2)  # (0,1)
    arima.model_eval(data, order=order)

    # 检查残差序列，D-W(德宾-沃夫)检验
    arima.check_rasid_DW()
    # D-W: 2.0146543495411566，结果表明不存在自相关性

    # 观察是否符合正态分布，这里用qq图
    arima.check_normal_qq()
    # 结果表明残差值不符合正态分布

    # Ljung-Box检验
    arima.check_q()
    # pct: 1.0表明p-value>0.05，接受原假设H0，结果不显著，序列不相关，认为是白噪序列

    # 平稳模型预测-对未来100天进行预测
    predict,value = arima.predict_target()
    # print(predict)
    # 将预测值还原到原始格式
    arima.restore_style_plot(predict=predict,values = value)

预测结果：

4.总结

效果没有auto-arima那么好，原因没找到，害

下一节，ＢＰ网络做神经预测，敬请期待！！！

Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
Prometheus运维六 PromQL查询语言详解及操作安顾里 Prometheus 监控类大数据 kubernetes 运维 linux
海阔凭鱼跃，天高任鸟飞Prometheus官网：https://prometheus.io/文章目录1.什么是PromQL?2.PromQL的基本使用2.1时间序列选择器2.1.1瞬时向量选择器2.2区间向量选择器2.2.1范围向量选择器2.2.2时间位移操作2.2.3使用聚合操作2.3标量和字符串3.PromQL操作符4.内置常用函数5.HTTPAPI操作PromQL6.使用建议1.什么是Pro
基于Prometheus和Grafana的现代服务器监控体系构建 golove666 运维 prometheus grafana 服务器
构建一个基于Prometheus和Grafana的现代服务器监控体系涉及多个步骤。以下是大体的流程和步骤说明：1.Prometheus监控系统Prometheus是一个开源的系统监控和报警工具，专门设计用于抓取时间序列数据。1.1Prometheus的安装Docker安装Prometheusdockerrun-d--name=prometheus-p9090:9090prom/prometheus
平滑法时间序列模型原理及Python实践 AI智博信息数据分析与挖掘 python 人工智能
平滑法时间序列模型原理主要涉及通过一定的算法对时间序列数据进行平滑处理，以消除或减弱数据中的随机波动和噪声，从而揭示出数据中的长期趋势和季节性变化，进而对未来数据进行预测。以下是平滑法时间序列模型的详细原理：一、基本原理平滑法时间序列模型基于对历史数据的平滑处理，通过对数据的平均或加权平均，去除数据中的随机波动，使得时间序列数据更加平滑，便于分析和预测。这种方法能够帮助我们更好地理解数据的长期趋势
Pandas教程：详解Pandas数据清洗旦莫 Python Pandas python pandas 数据分析
目录1.引言2.Pandas基础2.1安装与导入2.2创建一个复杂的DataFrame3.数据清洗流程3.1处理缺失值3.1.1删除缺失值3.1.2填充缺失值3.2数据去重3.3数据类型转换4.数据处理与变换4.1添加与删除列4.2数据排序5.数据分组与聚合6.其他数据清洗方法6.1字符串处理6.2时间序列处理6.3数据类型转换1.引言数据清洗是数据科学和数据分析中的一个重要步骤，旨在提升数据的质
时序预测|基于粒子群优化支持向量机的时间序列预测Matlab程序PSO-SVM 单变量和多变量含基础模型机器不会学习CL 智能优化算法时间序列预测支持向量机 matlab 算法
时序预测|基于粒子群优化支持向量机的时间序列预测Matlab程序PSO-SVM单变量和多变量含基础模型文章目录一、基本原理1.问题定义2.数据准备3.SVM模型构建4.粒子群优化（PSO）5.优化与模型训练6.模型评估与预测7.流程总结8.MATLAB实现概述二、实验结果三、核心代码四、代码获取五、总结时序预测|基于粒子群优化支持向量机的时间序列预测Matlab程序PSO-SVM单变量和多变量含基
R语言自学笔记-2内置数据集实验室长工
#b站视频——R语言入门与数据分析#内置数据集#固定格式的数据（矩阵、数据框或一个时间序列等）#统计建模、回归分析等试验需要找合适的数据集#R内置数据集，存储在，通过help(package="datasets")#通过data函数访问这些数据集data()#得到新窗口前面：数据集名字后面：内容#包含R所有用到的数据类型，包括：向量、矩阵、列表、因子、数据框以及时间序列等#直接输入数据集的名字就可
数据分析-18-时间序列分析的季节性检验皮皮冰燃数据分析数据分析
1什么是时间序列时间序列是一组按时间顺序排列的数据点的集合，通常以固定的时间间隔进行观测。这些数据点可以是按小时、天、月甚至年进行采样的。时间序列在许多领域中都有广泛应用，例如金融、经济学、气象学和工程等。时间序列的分析可以帮助我们理解和预测未来的趋势和模式，以及了解数据的周期性、趋势、季节性等特征。常用的时间序列分析方法包括平滑法、回归分析、ARIMA模型、指数平滑法和机器学习方法等。1.1时间
时间序列分析技巧（二）：ARIMA模型建模步骤总结小墨&晓末时间序列分析算法机器学习人工智能程序人生
CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍:研一｜统计学｜干货分享擅长Python、Matlab、R等主流编程软件累计十余项国家级比赛奖项，参与研究经费10w、40w级横向文章目录1目的2ARIMA模型建模流程图解3ARIMA模型建模实操1目的该篇为针对时间序列ARIMA模型建模系列技巧：ARIMA模型
网络安全最新SARIMA季节项时间序列分析流程+python代码 2401_84301389 程序员 python 人工智能机器学习
文章目录数据流程流程分割1画图2季节项和周期项的去除3平稳性检验4白噪声检验5模型拟合6模型定阶AIC/BIC准则7检查残差是否通过检验7.1若通过检验7.2若未通过检验8模型的预测9模型的评价画图均方差等总的代码参考数据数据网站：NationalAeronauticsandSpaceAdministrationGoddardInstituteforSpaceStudies主要分析的是北美陆地表面
Python强化学习，基于gym的马尔可夫决策过程MDP，动态规划求解，体现序贯决策 baozouxiaoxian python gym qlearning python 强化学习 mdp 动态规划求解马尔科夫决策过程
决策的过程分为单阶段和多阶段的。单阶段决策也就是单次决策，这个很简单。而序贯决策指按时间序列的发生，按顺序连续不断地作出决策，即多阶段决策，决策是分前后顺序的。序贯决策是前一阶段决策方案的选择，会影响到后一阶段决策方案的选择，后一阶段决策方案的选择是取决于前一阶段决策方案的结果。强化学习过程中最典型的例子就是非线性二级摆系统，有4个关键值，小车受力，受力方向，摆速度，摆角，每个状态下都需要决策车的
【论文阅读】Mamba:选择状态空间模型的线性时间序列建模（二） syugyou Mamba状态空间模型论文阅读
文章目录3.4一个简化的SSM结构3.5选择机制的性质3.5.1和门控机制的联系3.5.2选择机制的解释3.6额外的模型细节A讨论：选择机制C选择SSM的机制Mamba论文第一部分Mamba:选择状态空间模型的线性时间序列建模(一)3.4一个简化的SSM结构如同结构SSM，选择SSM是单独序列变换可以灵活地整合进神经网络。H3结构式最知名SSM结构地基础，其通常包括受线性注意力启发的和MLP交替地
时空地理加权回归_成果案例 | 中国交通碳排放及影响因素时空异质性 weixin_39930557 时空地理加权回归
中国地域辽阔，不同省域经济发展、资源禀赋、交通基础设施存在显著差异，导致交通碳排放水平差异很大。然而，以往关于交通碳排放规律的研究多是基于时间序列的全局分析，忽略了研究单元之间的相互作用及空间异质性。因此，本研究选取30个省级行政区作为空间单元，利用自上而下法计算省域交通碳排放量，采用探索性空间数据分析方法对2000年至2015年交通碳排放时空分布格局进行研究。同时考虑空间单元的差异性，构建地理加
机器学习-神经网络：循环神经网络（RNN）详解刷刷刷粉刷匠机器学习机器学习神经网络 rnn
引言在当今人工智能（AI）和深度学习（DL）领域，循环神经网络（RNN）作为一种专门处理序列数据的模型，具有不可忽视的重要性。RNN的设计目标是模拟和处理序列中的时间依赖关系，使其成为许多应用场景的理想选择，如自然语言处理（NLP）、时间序列预测和语音识别等。它不仅能处理固定长度的数据输入，还能应对输入长度不一的序列，从而为各种复杂的时序数据任务提供了强有力的支持。1.RNN的起源与发展循环神经网
基于Prometheus和Grafana的现代服务器监控体系构建不会代码的小林服务器
在当今的IT基础设施中，监控是确保系统性能和稳定性的关键组成部分。Prometheus和Grafana是两个广受欢迎的开源工具，它们可以共同构建一个功能全面、可视化强的监控系统。Prometheus是一个开源的监控系统和时间序列数据库，适用于记录实时的度量指标。它不仅提供了多维数据模型和强大的PromQL查询语言，还支持服务发现和HTTP拉取模型。这些特性使得Prometheus特别适合在微服务和
2024年MathorCup高校数学建模挑战赛（C题）深度剖析_建模完整过程+详细思路+代码全解析 Unicorn建模数学建模 python 算法
问题1本问题属于时间序列预测问题，其目标是对未来一段时期内的信息进行预测。因此可以采用基于时间序列的回归模型进行货量预测。具体而言，将首先分析时间序列的性质，然后构建回归模型，最后利用模型对未来30天每天及每小时的货量进行预测。【算法原理】（1）时间序列的性质时间序列实际上是一种随时间变化的连续数据，其特点主要体现在两个方面：趋势性和周期性。趋势性是指时间序列数据在长期内呈现出的增长或减小的趋势，
数据分析-13-时间序列异常值检测的类型及常见的检测方法皮皮冰燃数据分析数据分析
参考时间序列异常值的分类及检测参考异常值数据预警分析1时间序列异常的类型时间序列异常检测是数据处理和分析的重要环节，广泛应用于量化交易、网络安全检测、自动驾驶汽车和大型工业设备日常维护等领域。在时间序列数据中，异常通常指的是与正常数据模式显著不同的数据点，可能由系统故障、错误或外部干扰引起。异常数据，也称为离群点，是指在数据集中与其他数据点明显不同的样本。这些数据点往往不符合预期的模式或行为，可能
2024 数学建模国赛 C 题模型及算法（无废话版）不染53 数学建模数学建模算法 python
目录写在开始需要掌握的数学模型/算法评价体系/评价类问题时间序列处理数据降维聚类问题（无监督）分类问题（有监督）集成学习（Bagging/Boosting）回归问题关联分析统计学方法/统计模型智能优化算法需要掌握的Python专业库需要掌握的软件/工具写在开始本人获2023年数学建模国赛C题国家级一等奖，备赛期间专攻C题。本文总结了在备赛期间总结的模型和算法，足以应对90%国赛C题中涉及到的问题。
探索未来：LLMTime——大型语言模型的零样本时间序列预测器褚知茉Jade
探索未来：LLMTime——大型语言模型的零样本时间序列预测器在这个数字化的时代，时间和数据是推动世界前进的关键因素。LLMTime是一个创新性的开源项目，它揭示了大型语言模型（LLMs）在时间序列预测中的惊人潜力。无需针对特定任务进行训练，仅通过将数值转化为文本并采样可能的扩展，LLMTime就能超越传统的时间序列方法。项目介绍LLMTime提出了一种名为"零样本时间序列预测"的方法，其核心在于
Time-LLM 开源项目使用教程袁菲李
Time-LLM开源项目使用教程Time-LLM[ICLR2024]Officialimplementationof"Time-LLM:TimeSeriesForecastingbyReprogrammingLargeLanguageModels"项目地址:https://gitcode.com/gh_mirrors/ti/Time-LLM项目介绍Time-LLM是一个用于时间序列预测的框架，通过
Python数据分析详解（适合新手的详细教程）码农必胜客 Python零基础入门 python 数据分析开发语言
前言这篇文章主要介绍了Python中的数据分析详解,对数据进行分析。数据分析是指根据分析目的，用适当的统计分析方法及工具，对收集来的数据进行处理与分析，提取有价值的信息，发挥数据的作用。目录数据分析概述python在数据分析方面有哪些优势数据的导入和导出导入数据导出数据数据预处理数据的选择和运算数据分类汇总和统计时间序列数据可视化数据分析概述python在数据分析方面有哪些优势Python不受数据
基于Prometheus和Grafana的现代服务器监控体系构建小绵羊不怕大灰狼 prometheus grafana
1.安装PrometheusPrometheus是一个开源的监控系统和时间序列数据库，适用于记录实时的度量指标。•下载并安装Prometheus：•前往Prometheus官方网站下载适用于您操作系统的版本。•解压并配置prometheus.yml文件，定义抓取目标（targets），如服务器、应用程序等。•配置Prometheus：•编辑prometheus.yml文件，添加您要监控的服务器地址
Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting———PRELIMINARIES six.学长 Mambaformer transformer 深度学习人工智能
ProblemStatement在长短期时间序列预测问题中，给定历史时间序列样本的回溯窗口L=(x1,x2,..,xL)L=(x_1,x_2,..,x_L)L=(x1,x2,..,xL)，长度为LLL，其中每个时间步ttt的样本xt∈RMx_t\in\mathbb{R}^Mxt∈RM，包含MMM个变量，我们的目标是预测未来的FFF个值，即F=(xL+1,xL+2,..,xL+F)F=(x_{L+1
Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting————4 METHODOLOG six.学长 Mambaformer transformer 深度学习人工智能
4METHODOLOGY图解Mambaformer模型结合了Mamba和Transformer的元素，旨在进行时间序列预测。以下是Mambaformer模型的各个组成部分和流程的详细说明：嵌入层（EmbeddingLayer）TokenEncoding（令牌编码）：这个部分将输入数据编码成向量表示，以捕捉输入特征的语义含义或特征。TemporalEncoding（时间编码）：这部分加入时间信息，例
推荐开源项目：Fluxter - Elixir连接InfluxDB的高效桥梁江奎钰
推荐开源项目：Fluxter-Elixir连接InfluxDB的高效桥梁fluxterHigh-performanceandreliableInfluxDBwriterforElixir项目地址:https://gitcode.com/gh_mirrors/fl/fluxter项目介绍Fluxter是一款专为Elixir社区打造的轻量级工具，旨在简化与InfluxDB——高性能的时间序列数据库之间
【Python】Pandas：数据分析 T0uken 数据分析 python pandas
Pandas是Python中功能强大的数据分析工具，用于处理和分析结构化数据。本文将通过分步骤的方式，详细介绍如何使用Pandas进行数据分组、重塑、透视表、时间序列处理、类别型数据管理以及数据可视化。这些知识点将帮助初学者快速上手并掌握Pandas的核心功能。数据分组（Grouping）数据分组是数据分析中的常见操作，Pandas的groupby()方法允许我们按列对数据进行分组，然后对每个组执
InfluxDB和OpenTSDB两种时序数据库应用场景 CodeMaster_37714848 opentsdb 时序数据库数据库
InfluxDB概述：InfluxDB是一个开源的高性能时序数据库，专门用于处理大量的时间序列数据。它由InfluxData开发，支持高写入吞吐量和灵活的查询。特点：高性能写入和查询：设计上注重高写入速度和低延迟查询。SQL-like查询语言：使用类似SQL的InfluxQL或Flux查询语言，简化了复杂查询的编写。数据压缩：提供高效的数据压缩机制，减少存储需求。集成和工具：支持与Grafana等
数学建模强化宝典（11）时间预测模型 IT 青年建模强化栈数学建模数据预测模型编程
前言时间预测模型，即时间序列预测模型，是一类专门用于分析和预测时间序列数据的模型。时间序列数据是指将某一变量在不同时间点的观测值按时间先后顺序排列而成的序列。这类模型在金融、经济、气象、工业控制等多个领域都有广泛的应用。以下是一些常见的时间序列预测模型：1.朴素法（NaiveMethod）原理：预测值等于实际观察到的最后一个值。它假设数据是平稳且没有趋势性与季节性的。适用场景：数据变化不大或仅作为
Prometheus与Grafana入门：从安装到基础监控的完整指南勤劳兔码农 prometheus grafana
Prometheus与Grafana入门：从安装到基础监控的完整指南Prometheus和Grafana是现代监控系统的黄金组合。Prometheus作为一个开源的监控系统和时间序列数据库，以其强大的指标收集和查询能力广泛应用于云原生环境。而Grafana则是一个用于数据可视化和监控的开源平台，能够将Prometheus收集的数据以图表的形式展现出来，帮助用户更直观地理解系统的运行状态。本指南将从
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

时间序列-ARIMA模型调参检验实战

文章目录

1.数据格式

2.理论补充

3.代码

4.总结

你可能感兴趣的:(时间序列,ARIMA,时间序列)