Socihuo

R语言实现时间序列分析

一、时间序列分析导论图：

处理方式：

1.对于原始数据进行季节性处理和差分，以形成平稳序列；期间如果遇到了随机序列，则停止时间序列建模

2.对于给定的序列进行自相关函数和偏自相关函数分析（在不同的滞后k值下的值），绘制自相关函数图和偏自相关函数图，看是否是AR、MA或ARMA模型

AR(p)模型对应的偏自相关函数是以p步截尾的，对应的自相关函数是拖尾的，呈正弦波（或指数衰减）并趋于0

MA(q)模型对应的自相关函数是以q步截尾的，对应的偏自相关函数是拖尾的，呈正弦波（或指数衰减）并趋于0

ARMA(p,q)模型对应的自相关函数和偏自相关函数都是截尾的

3.判定好AR、MA或ARMA模型后，去寻找p和q值

二、时间序列基本概念：

时间序列：对于一个变量Y在不同时间点上的取值Y1、Y2……YT的一个序列，它的索引是等间距的时间点序列

随机过程：由一种随机机制（和确定性机制相反）所产生的一个随机变量的序列

时间步骤：当我们说道时间步骤t时，就是指的，在已有的时间序列和它的等间距时间差之间，按照这个时间差第t个时间索引所对应的变量值

三、时间序列的摘要函数：

首先，我们将时间序列中时间里的每个点视作一个随机变量，且该时间序列在某个时间索引t上的值是Yt

均值函数：某个时间序列在某个时间索引t上的期望值：

协方差：描述两个变量变化的相似程度。

你变大，同时我也变大，说明两个变量是同向变化的，这时协方差就是正的。

你变大，同时我变小，说明两个变量是反向变化的，这时协方差就是负的。

协方差的数值越大，两个变量同向程度也就越大。反之亦然。

很多时候X，Y的运动是不规律的，比如：

这时，很可能某一时刻的值与的值乘积为正，另外一个时刻的值与的值乘积为负。

将每一时刻与的乘积加在一起，其中的正负项就会抵消掉，最后求平均得出的值就是协方差，通过

协方差的数值大小，就可以判断这两个变量同向或反向的程度了。

相关系数：一种剔除了两个变量量纲影响、标准化后的特殊协方差

- 反映两个变量变化时是同向还是反向，如果同向变化就为正，反向变化就为负。
- 它消除了两个变量变化幅度的影响，而只是单纯反应两个变量每单位变化时的相似程度。
- 反应的就是两个变量每单位变化时的情况。
- 只能在＋1到－1之间变化
- 当变量X与Y的相关系数为1时，说明两个变量变化时的正向相似度最大，即，你变大一倍，我也变大一倍；你变小一倍，我也变小一倍。也即是完全正相关，呈线性关系
- 当变量X与Y的相关系数为0时，两个变量的变化过程没有任何相似度，也即两个变量无关。
- 当变量X与Y的相关系数为－1时，说明两个变量变化的反向相似度最大，即，你变大一倍，我变小一倍；你变小一倍，我变大一倍。也即是完全负相关，呈线性关系

标准差：——描述了变量在整体变化过程中偏离均值的幅度

每一时刻变量值与变量均值之差再平方，求得一个数值，再将每一时刻这个数值相加后求平均，再开方。其中是偏离均值的幅度；做平方的原因是因为有时候变量值与均值是反向偏离的（见下图），是个负数，平方后，就可以把负号消除了。这样在后面求平均时，每一项数值才不会被正负抵消掉，最后求出的平均值才能更好的体现出每次变化偏离均值的情况；最后又开平方的原因是因为刚才为了消除负号影响，取了一次平方，最后肯定要把求出的均值开方，将这个偏离均值的幅度还原回原来的量级。

自协方差函数：——衡量时间序列中的随机变量在不同时间点上相互的线性依赖性

当两个时间索引相同时，自协方差函数就是方差：

单位是原始时间序列的随机变量的平方，并且自协方差函数是对称的，转换t1和t2的位置其值不变

自相关函数（ACF函数）——衡量时间序列中的随机变量在不同时间点上相互的线性依赖性

自相关函数是对称的，转换t1和t2的位置其值不变；无单位，取值在-1到+1之间，+1和-1时为完全线性依赖，0时为在这两个时间索引下的变量值无关
当用在两个相等的时间索引对应变量上时，值为1

三、基本的时间序列

1.白噪声

白噪声（离散白噪声）：在一个白噪声时间序列中，产生出来的随机变量都是具有均值0和有限且相等的方差，并且不同时间步骤的随机变量是互相之间不相关的。同时也要求独立同分布（IID）

IID（独立同分布）:要求每个随机变量来自于完全相同的分布，例如某个均值和标准差都相同的正态分布；要求来自不同时间序列步骤的两个变量不仅互相不相关，而且还是独立的。

ps：两个相互独立的变量必然不相关，但是两个不相关的变量不一定相互独立

高斯白噪声：从正态分布中抽取的白噪声时间序列

构建白噪声时间序列模型关键变量：方差

白噪声时间序列的显著性检验：

运用R语言中acf（）函数绘制相关图，本方法是对于步长为k的时间步骤的配对进行估算。其中结果的横轴为k（延迟）的不同值，纵轴为ACF函数的值，虚线为在给定的例如95%置信区间下，对应的ACF值最大值（超过这个就认为是显著了，没有发现超过的话，则认为不具有统计显著性），结果中所有的k=0时都会对应一个ACF值，为1（相当于对于一个k=n而言，会取原点的变量值和与它相隔n个时间间隔的变量值去求ACF函数值）。由于抽样的偏误性，ACF函数在不同的k值上应该不会正好为0.

2.随机漫步

随机漫步的时间序列：指某一个时间序列的某一变量在连续时间点之间的差异是白噪声

前提条件：

规定递归关系：

首先，递归关系是指这个时间序列中，每一个时间步骤上的某个变量值都会被定义为这个时间序列上之前的时间步骤上这个变量的值和某个增量的函数（如第一个函数）；其次，规定一个该时间序列第一个项的初始状态值

这里，第一个方程规定了在指定的时间步骤为t的某个变量的值上，通过加入项，来跟他往后措一个时间步骤的这个变量的值产生联动；第二个方程规定了该随机漫步时间序列的起始条件（即第一个项）是一个白噪声序列的第一个项。

- 根据一个并行的白噪声序列产生的每一个单个的正或负的数值（即白噪声时间序列中的项）对于它自己的当前值进行调整的一种序列
- 在时间步骤t，随机漫步的对应项实际就是t个均值为0，方差都为独立同分布变量之和，这些变量都是白噪声序列的项。可以推断随机漫步（不带有漂移的随机漫步序列）的均值函数对于所有的时间点都是0，方差是t✖️得出，故方差会随着时间序列的增长而变大

构造随机漫步：

对一个白噪声随机序列进行累计求和，利用R语言cumsum（）函数来做

拟合随机漫步：

计算所给的时间序列的连续差值，用R语言的diff（）函数；再用白噪声检测去检验，只要符合白噪声序列就可以推断为随机漫步。

带有漂移的随机漫步序列：

在Yt和Yt-1的差值上，给序列中的每个点加上了一个常数项a，这个常数项a被称作为漂移。若我们先得到一个随机漫步，把它改作一个带有漂移项的随机漫步，那么改变后的序列的方差和改变之前是相同的，但是改变之后的序列的均值是实时变化的，为t*a五、平稳性假设

1.几个概率的区分：

联合概率：在多元的概率分布中多个随机变量分别满足各自条件的概率。假设X和Y都服从正态分布，那么P{X<4,Y<0}就是一个联合概率，表示X<4,Y<0两个条件同时成立的概率。表示两个事件共同发生的概率。A与B的联合概率表示为 P(AB) 或者P(A,B),或者P（A∩B）。

边缘概率：是某个事件发生的概率，而与其它事件无关。

条件概率：指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为：P（A|B），读作“在B条件下A的概率”。

2.时间序列预测建模假设：

平稳性假设：一个时间序列的概率表现不会随着时间的流逝而改变，即对时间平移的不变性做了假设——重要但有限制性的假设（即对同一个小的时间段内，不能时间往后推移了，这个小的时间段的变化就出现天壤之别）

严格平稳（强平稳）：（即在一个时间长河中，对于同一个小的时间段，它的变化幅度需要一模一样，不管这个时间段大小如何）

从时间t起始的一个点序列的联合概率分布和从时间T起始的另一个点时间列的联合概率分布相同，其中T=t+k。在这里，我们的n指的是所有可能的一个时间间隔；k指的是时间延迟，说明在整个时间推移上这个规律都是通用的。

当我们选择极端情况n=1时，说明序列中每个点的概率分布都是相同的（单变量概率），证明了在一个严格平稳的时间序列中，均值函数是不随时间变化的常数，方差也是不随时间变化的常数。

但这个在现实中很难实现，不好验证。

弱平衡：（平稳随机过程、平稳时间序列）（即在一个时间长河中，对于同一个小的时间段，它的变化幅度总体是趋向一个标准的，但是允许对于不同的时间段出现不同的波动）

均值函数是常数函数，不随时间变化；协方差函数仅与时间差相关，依赖于序列中两点之间的时间延迟。表示为，其中表示为时间步骤为t+k与时间步骤为t所形成的时间段的变化幅度。

说白了，不管是严格平衡还是弱平衡都要求对于指定的时间段，在时间长河上的这个段内的差异表现（均值）是相同的，只不过严格平衡还要求不管这个时间段取多大，他们所体现出来的协方差还要相同（统一的）；而弱平衡只要求每个具体的时间段在时间长河上所体现的方差是相同的就好，意味着不同的时间段k体现出的协方差可以是不同的

3.平稳时间序列

平稳时间序列的均值函数、自协方差和自相关性如下：

其中延迟为0的自协方差（即）就是方差。

白噪声是一个平稳过程（强平稳），他的均值是一个常数，方差也是一个常数；随机漫步的均值是常数（带有漂移的随机漫步并不是）但是方差是随着时间的变化而不同的，它是不平稳的

六、平稳时间序列模型

1.移动平均模型MA

模型建立

移动平均MA过程是一个随机过程，其中在时间步骤t的随机变量是一个白噪声过程的（时间上）最近的项（具体到最近的哪几项这个值为q）的线性组合，表示如下，其中q是这个时间步骤t能用前面的几项来描述，为系数（常数值）：

或者是，其中相当于是线性关系中的常数项，加不加都行，且e表示的各项是均值为0、方差为的白噪声随机变量。

对上一个式子进行改进，以用这个量去表示时间步骤t的变量值，引入后算因子这个概念，当后算因子用于一个随机过程中在时间t的随机变量时，会产生前一个时间步骤t-1的随机变量，如下：

通过这样，可以通过连续用后算因子来获得时间更早的随机变量，我们可以看出，代表运用后移算子两次即后移了两个时间步骤。最终以用这个量去表示时间步骤t的变量值，改造成：

(这里默认了为1)

这个包含了一个后移算子B的 q阶多项式称作MA过程的特征多项式，如下：

这里我们首先将后移算子B换成了x，不管MA过程的系数或者阶数q如何选择，他都会是平稳的（因为e是一个白噪声序列）。回到特征多项式上，对于这个多项式的根，如果绝对值大于1，那么这个MA过程称作是可逆的，一个ACF图对应的可逆MA过程是唯一的，但是这个ACF图对应的不可逆MA过程则不是唯一的。

统计学性质：

由于每个e项都是一个白噪声随机变量，所以MA过程的均值恒为0，方差如下（是一个常数），我们定义为1（这么做纯粹是为了写出后面的求和公式）(这个公式也说明，向前推q个过程的q不影响整个时间序列的均值，但是印象它的方差)

由于MA过程的阶数是通过自相关函数求的，于是将自相关函数给出如下：

核心是MA过程的ACF（自相关函数）对于小于该过程的阶数q的延迟是非0值，之后就都等于0（这里涉及到一个显著性问题，所以在图上如果都在虚线内就认为是0了）（用人话来讲，就是先做出MA过程关于延迟的ACF函数，找到在某个k值之前的ACF函数值都是非0值但是之后的都是0值的，这个k值就是q的取值）这个过程用于判别MA过程（画ACF看看到底能不能用MA模型）并且估算MA过程的阶数（确定MA模型之后看它的阶数q是多少是有用的），在这里，我们把具有统计学显著性的非0值得最大延迟数作为它的阶数

R语言中经常用arima.sim()函数模拟MA（和其他过程）过程，指定n参数为序列的长度（时间区间的长度），model参数为要模拟的序列的参数（包括ma属性中设置了系数的取值，是一个向量，sd属性中设置了白噪声项的标准差（即e的标准差））。这个函数的返回值中ts（一个特殊的时间序列对象）包括了模拟结果，用来追踪一个时间序列的某些基本信息和支持专门用于时间序列分析的绘图。

2.自回归模型AR

模型建立

自回归模型AR源自让一个简单的模型根据过去有限窗口时间里（也就是说，我们站在时间步骤t上，看看之前的窗口（如果是p）内包含的p个时间步骤的值，如何去解释现在时间步骤t的值）解释某个时间序列当前值的想法。一个p阶AR模型的方程是：

或，其中可以看做是线性关系中的常数项。

再次引入后移算子这个东西，变成用这个量去表示时间步骤t的变量值，得到：

或（这里默认了为1）

与MA不同，AR不一定总是平稳的，先看AR的特征方程（其中还是用x换掉了B）：

或

当且仅当方程的根都大于1，AR过程才是平稳的。方程的根都大于1的必要（非充分条件）为：

这个AR的特征方程经常用来发现非平稳的AR过程，例如随机漫步就是非平稳的，因为第一个系数就是1

统计学性质

AR没有像MA过程里的那种所有大于MA过程阶数q的延迟值对应的ACF都是0的分段性质，它的ACF更体现出一种指数型衰减（不像MA那种一下掉下来（显著性为0的带子里）），所以我们改用偏自相关函数PACF图去看。时间延迟k的偏自相关定义为在消除了小于k的延迟中存在的任何相关性影响下所产生的相关性，即p阶AR过程仅仅依赖于过去恰好p个单位时间的过程的值。

判断方法：对于所有大于p的延迟，PACF图会出现0值，把PACF延迟项k呈现了统计学显著性（非0值）的最大时间延迟数（即在这个最大的k值前不出现统计学显著性非0值）当做AR过程的阶数。

3.自回归移动平均模型ARMA

把移动平均和自回归模型合并成一个兼具移动平均过程和自回归模型的元素的模型，定义为移动平均自回归ARMA模型。一个ARMA(p，q)过程（具有p阶自回归项和q阶移动平均项的ARMA过程）的一般方程如下：

其中我们默认了和这种常数项就不考虑了。

一个纯移动平均过程MA(q)可以写成ARMA过程ARMA(0，q)

一个纯自回归过程AR(p)可以写成ARMA过程ARMA(p，0)

ARMA过程平稳的前提是在它的AR成分的特征方程（即）存在绝对值大于1的根

ARMA过程是可逆的前提是在它的MA成分特征方程（即）存在绝对值大于1的根

ARMA过程是唯一的前提是MA和AR成分的特征方程没有共同的因式，因为共同的因式会互相抵消，让我们得到一个相等的但更低阶的ARMA过程

4.ARMA、AR、MA过程的处理过程（以ARMA为例）：

第一，通过找出p和q来判别ARMA过程的阶数

第二，尝试估算AR和MA成分的系数值（即和）——可以通过观测到的序列和估算的序列之间误差平方和最小化去卡这个系数值，或者通过AIC去判断

八、非平稳时间序列模型

解决的方案要不就是从原始数据上派生出一个平稳模型，要不就是对它的非平稳表现进行建模

1.基础概念：

差值序列：对于原始序列而言，通过求解连续点Yt和Yt+1之间的差DYt，构成了一个新的时间序列模型

二阶差值序列：对于差值序列，再次对于它的连续点取差值，得到的那个序列叫做二阶连续差值

d阶差值：通过重复d次计算连续项的差值，从某个原始序列Yt得到一个新的点序列Wt，方程为：

2.ARIMA模型：

ARIMA模型（整合自回归移动平均过程）：组成这个时间序列的项是d阶差值Wt，这个d阶差值是一个平稳的ARMA过程。一个ARIMA(p,d,q)过程要求d阶差值，具有q阶的MA成分，以及p阶的AR成分。一个普通的ARMA(p,q)过程就等于一个ARIMA(p,0,q)过程

拟合过程：

第一步，确定适当的d值，即我们需要取差值的次数

平稳性检验——平稳即代表没有明显趋势且波动范围有限

检验方法：

时序图检验：根据平稳时间序列的均值和方差都为常数的性质，平稳序列的时序图显示该序列值始终在一个常数附近随机波动，而且波动的范围有界；如果有明显的趋势性或者周期性，那它通常不是平稳序列（直接把数据画在图上，看看他是不是平稳在某个值附近而且波动是有限的）
自相关图检验：平稳序列具有短期相关性，这个性质表明对平稳序列而言通常只有近期的序列值对现时值得影响比较明显，间隔越远的过去值对现时值得影响越小。随着延迟期数k的增加，平稳序列的自相关系数会比较快的衰减趋向于零，并在零附近随机波动，而非平稳序列的自相关系数衰减的速度比较慢。（对于一个平稳序列而言，其k值较小时ACF图的值可以很大，但是随着k值变大，ACF图的值应该是迅速减小并衰减至0）
单位根检验。指的是是否存在单位根，如果存在单位根，即为非平稳时间序列

用的最多的就是扩展Dickey-Fuller（ADF）检验，创建的回归模型如下：

其中，k代表模型中能容许的最大时间延迟数量，第一项来自于AR模型，最后一项来自于MA模型。

ADF的零假设（原假设）是：当前时间序列是非平稳的——回归模型预测一个近似于0的系数

当拒绝原假设时：当前时间序列是平稳的——回归模型预测的系数就会小于0

R语言中调用adf.test()函数，这个函数会默认k值（因为拿到一个数据时候，不知道数据所建立的模型能容许的最大时间延迟数量是多少）等于不超过待检

验时间序列长度的立方根的最大整数。返回的结果是一个p值，默认的置信度下，它的阈值是0.05，即小于0.05表明被检验的时间序列是平稳的，大于0.05

表示被检验的时间序列是不平稳的

附：单位根检验方法及方式：

扩展Dickey-Fuller检验（ADF）——原假设为时间序列非平稳，p值小于0.05时时间序列被证明是平稳的，大于0.05为非平稳

Philips-Perron检验（Philips-Perrontest）——原假设为时间序列非平稳，p值小于0.05时时间序列被证明是平稳的，大于0.05为非平稳

Kwiatkowski-Phillips-Schmidt-Shin检验（KPSS）——原假设为时间序列平稳，p值小于0.05时时间序列被证明是非平稳的，大于0.05为平稳

第二步，重复ARMA模型处理过程

3.ARCH模型

当通过季节性变化和查分后，还不能用ARIMA模型解释时，这样的非平稳时间序列建模可以通过做出一个假设：假设数据非平稳的原因是该模型的方差会以一种可预见的方式随时间变化。基于这个假设，我们可以对方差随时间的变化建模为一个自回归过程（AR），这种模型也被称为自回归条件异方差（ARCH）。异方差性是描述常熟方差的同方差性的反义词。

p阶ARCH模型的方程为：

序列项的均值为0，其方差计算方式如下；为白噪声序列项（在这里我们假设白噪声过程的方差为1，均值为0，为了强调该过程是自回归过程；如果方差不是1，只会在结果中引入一个常数的乘数因子，但是不会改变模型的自回归本质）：

可以看出ARCH模型在对于序列项在时间步骤t的方差是离它最近的过去的p个时间步骤所对应的方差的线性加权和。通过这样的过程，我们得到了一个可是别的p阶AR过程。

4.GARCH模型

GARCH模型称作广义自回归条件异方差模型，等于一个ARCH模型增添了移动平均方差成分，ARCH（p）等价于 GARCH（p,0）

GARCH（p，q）过程的一般形式如下：

你可能感兴趣的:(统计预测,时间序列,预测模型)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
进销存小程序源码 PHP网络版ERP进销存管理系统全开源可二开摸鱼小号 php
可直接源码搭建部署发布后使用：一、功能模块介绍该系统模板主要有进，销，存三个主要模板功能组成，下面将介绍各模块所对应的功能；进：需要将产品采购入库，自动生成采购明细台账同时关联财务生成付款账单；销：是指对客户的销售订单记录，汇总生成产品销售明细及回款计划；存：库存的日常盘点与统计，库存下限预警、出入库台账、库存位置等。1.进购管理采购订单：采购下单审批→由上级审批通过采购入库；采购入库：货品到货>
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
从门氏元素周期表看三皇五帝在关中论霜叶红似二月花y
世间所有物质，都是由不同元素组成的，科学家们”认识物质初期，所有元素也是多年逐一认识的。著名的俄罗斯化学家门捷列耶夫(DmitriMendeleev1834－1907)，在1869年首创的元素周期表，想必大家都很熟悉。他是怎么发现元素周期规律并制成表的？最权威的说法是他自己笔记中所记载的，是他做梦所得。门氏元素周期表这个表开始并不完善，但已经有个雏形了。当时只有已知的63种元素。但门氏预测应该有1
3.1 损失函数和优化：损失函数做只小考拉
用一个函数把W当做输入，然后看一下得分，定量地估计W的好坏，这个函数被称为“损失函数”。损失函数用于度量W的好坏。有了损失函数的概念后，就可以定量的衡量W到底是好还是坏，要找到一种有效的方法来从W的可行域里，找到W取何值时情况最不坏，，这个过程将会是一个优化过程。损失函数L_i定义：通过函数f给出预测的分数和真实的目标（或者说是标签y），可以定量的描述训练样本预测的好不好，最终的损失函数是在整个数
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
新媒体运营小白，有哪些书籍可以推荐？ y耳朵
为了转行运营，我曾花了3个月的时间，看了不下百本书，可以说市面上大部分跟运营有关的书籍，我都看过了，因此关于书的推荐也有一些自己的小见解。看书不一定要多，但一定要****精，我根据豆瓣评分、推荐热度和自己的转行经历，挑出了13本值得运营小白看的书，收藏好这份书单，不需要你浪费时间去找书了。先看下统计好的书单：整理不易，看完记得点个赞哦！感谢你的支持。入门篇：1.《运营之光》（豆瓣评分：8.0)推荐
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
向着明亮那方12.7 向着明亮那方的我们
【水晶泥的妙用】在地上捡到一滩水晶泥，本想扔进垃圾桶，发现水晶泥上附着了些许蓝色钢笔墨水。我脑洞大开，水晶泥可不可以用来处理钢笔墨渍呢？正好垃圾桶那面瓷砖墙上有蓝色钢笔水痕迹，我用水晶泥沾了沾墨迹，很轻易地把墨色粘了下来，好干净。【长跑报名】我让同学们自愿报名参加冬季长跑比赛，课间将名字报给班长。班长把名字统计在本子上，把本子拿来给我看：“老师，我晚上回去给你做张电子表，发给你。”看来班长又学了新
python编写直方图和饼图 2301_80421078 python 开发语言
1.直方图#直方图的绘制#语法格式：plt.hist(x,bins),其中x:数据集；bins:统计数据的分布区间importmatplotlib.pyplotaspltimportpandasaspd#导入文件excel=pd.read_excel('成绩.xlsx')#print(excel)#避免乱码plt.rcParams['font.sans-serif']=['SimHei']x=ex
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
跟着黑马学mysql（5）小杜不吃糖 mysql 数据库
17.DQL-聚合函数DQL-聚合函数介绍将一列数据作为一个整体，进行纵向计算。常见聚合函数函数功能count统计数量max最大值min最小值avg平均值sum求和语法SELECT聚合函数(字段列表)FROM表名;注意：所有的null值不参与聚合函数的运算18.DQL-分组查询语法SELECT字段列表FROM表名[WHERE条件]GROUPBY分组字段名[HAVING分组后的过滤条件];where
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
淘宝优惠券返利app 软件？淘宝返利app哪个佣金高日常购物小技巧
今天有朋友问莉莉：淘宝优惠券返利app软件？淘宝返利app哪个佣金高目前市面上出现越来越多的淘客返利APP，比如花桃、粉象生活、花生日记、好省、高佣联盟、美逛、芬香、蜜源、果冻宝盒、悦拜等等。据不完全统计，可能已经多达上千家了。那面对众多的返利软件，作为用户，我们该如何选择呢？其实返利APP的主要功能就是查券和返利，而券可以说每个平台也都是一样的，如果有那都有，如果没有，那么都没有。所不同的就是返
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
Github 2024-09-12 Go开源项目日报Top10 老孙正经胡说 github golang 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-09-12统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10C项目1Terraform：基础设施即代码的开源工具创建周期：3626天开发语言：Go协议类型：OtherStar数量：40393个Fork数量：9397次关注人数：40393人贡献人数：358人OpenIssues数量：1943个Git
Sentinel实时监控不展示问题朱杰jjj sentinel sentinel
问题官方插件Endpoint支持，可以实时统计出SpringBoot的健康状况和请求的调用信息在使用Endpoint特性之前需要在Maven中添加spring-boot-starter-actuator依赖，并在配置中允许Endpoints的访问。SpringBoot1.x中添加配置management.security.enabled=false。暴露的endpoint路径为/sentinelS
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
认识世界陈陈_19b4
9月16日，雨。阅读书目:《真相》。作者:瑞典统计学家和医学教授汉斯·罗斯林，他的儿子奥拉·罗斯林，google公共数据团队的负责人。汉斯·罗斯林还是一位全球知名的教育家，是世界健康组织和联合国儿童基金会的顾问。他与儿子儿媳共同创办了Gapminder基金会，开发了Trendalyzer软件，将国际统计数据转化成交互式的生动有趣的图表，帮助人们以事实为基础来观察世界，被称为“可视化数据之父”。图片
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
10月16日学习健身抖音定投一乐日记
一乐日记今天以下是每天定投数据：第一项：学习数据今天学习理论法5小时。第二项：健身数据今天走路微信统计5124步。另外抱着一乐在房子走路有2000步，因为没有带手机，所以没统计上去。俯卧撑40个，仰卧起坐30个。第三项：快手数据每天发一幅图片配文字今日更新数据：（发布后24小时数据）播放140次，点赞0次，总粉丝数8个。………………………………特别说明：关注一乐日记，免费领取书籍！每天更新一篇文章
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
mysql查询统计聚合函数三小皮 mysql 数据库
业务中用户统计报表使用，查询字段使用聚合函数+条件，快速实现报表统计。SELECTMIN(s.org_name)ASorgName,s.way_nameASwayName,COUNT(s.id)ASwaybillTotal,SUM(s.take_weight)AStakeWeightTotal,SUM(s.revert_weight)ASrevertWeightTotal,SUM(s.settle
Chat GPT带来的几点思考淡定的胡萝卜
OpenAI公司推出的ChatGPT引起了广泛关注，网上出现各类专家开始预测随着ChatGDP的普及，将会有哪些行业的人面临失业，引发人们的焦虑。不可否认它会给我们的教育行业、媒体行业、学术界等众多行业产生影响，面对这些影响，我们该如何看待呢？近期我阅读了不少相关文章，引发的几点思考，想与大家分享。ChatGPT将会倒逼传统教育的改革。中国传统教育是教师对知识点的传授、学生对知识点的掌握，不仅量多
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数